切换语言为:繁体

如何使用 pandas 和 Polars 在 Python 中调用和使用时间戳列

  • 爱糖宝
  • 2024-07-17
  • 2123
  • 0
  • 0

    有效处理时间戳列对许多数据科学和工程任务等要求精确时间场景的需求至关重要。时间戳列通常需要特定的操作,如解析、格式化和基于时间的过滤。在本文中,我们将探讨如何使用三种不同方法和库调用和操作时间戳列的优秀代码示例。

在 Python 中调用时间戳列名 

    在 Python 中,可以使用 Pandas 和 Polars 等库通过各种方法访问时间戳列。让我们看看使用这些方法的几个不同示例,以便更好地理解这一概念。

    使用 Pandas 

    Pandas 是一个流行的数据操作库,它为时间戳数据处理提供了强大的支持。下面,我们将演示如何使用 Pandas 调用和操作时间戳列。 在这个示例中,我们首先创建一个带有时间戳列的 pandas DataFrame。 然后,我们使用 pd.to_datetime() 将 "时间戳 "列转换为日期时间。 最后,我们通过调用 df['timestamp']来访问时间戳列。

import pandas as pd
# Create a pandas DataFrame with a timestamp column
data = {
    "timestamp": ["2023-01-01 10:00:00", 
                  "2023-01-02 11:30:00", 
                  "2023-01-03 14:45:00"],
    "value": [10, 20, 30]
}
df = pd.DataFrame(data)
# Convert the column to datetime
df['timestamp'] = pd.to_datetime(df['timestamp'])
# Access the timestamp column
timestamp_col = df['timestamp']
print(timestamp_col)

输出结果:

0   2023-01-01 10:00:00 
1   2023-01-02 11:30:00 
2   2023-01-03 14:45:00 
Name: timestamp, dtype: datetime64[ns]

    使用 Select 

在本例中,我们将使用 Python Polars 模块。 df.select("timestamp") 只选择 DataFrame df 中的 "timestamp "列。 该方法在 select 方法中明确指定了列名,这在您想通过列名获取特定列时非常方便。

import polars as pl
# Create a Polars DataFrame with a timestamp column
data = {
    "timestamp": ["2023-01-01 10:00:00", 
                  "2023-01-02 11:30:00", 
                  "2023-01-03 14:45:00"],
    "value": [10, 20, 30]
}
df = pl.DataFrame(data)
# Select the timestamp column using the select method
timestamp_col = df.select("timestamp")
print(timestamp_col)

输出结果:

如何使用 pandas 和 Polars 在 Python 中调用和使用时间戳列

使用 Polars 进行基于时间的筛选 

在本示例中,我们首先创建一个 Polars DataFrame,其中的 "timestamp "列包含日期时间值的字符串表示。 然后,使用指定格式的 str.strptime() 函数将 "时间戳 "列转换为日期时间格式。 最后,访问并打印转换后的 "时间戳 "列。

import polars as pl
# Create a Polars DataFrame with a timestamp column
data = {
    "timestamp": ["2023-01-01 10:00:00", 
                  "2023-01-02 11:30:00", 
                  "2023-01-03 14:45:00"],
    "value": [10, 20, 30]
}
df = pl.DataFrame(data)
# Convert the column to datetime
df = df.with_columns(
    pl.col("timestamp").str.strptime(pl.Datetime, format="%Y-%m-%d %H:%M:%S")
)
# Access the timestamp column
timestamp_col = df["timestamp"]
print(timestamp_col)

输出结果:

shape: (3,)
Series: 'timestamp' [datetime[μs]]
[
    2023-01-01 10:00:00
    2023-01-02 11:30:00
    2023-01-03 14:45:00
]

结论 

    处理时间戳列是数据处理和分析中的常见要求。 像 pandas 和 Polars 这样的 Python 库提供了高效处理和访问时间戳数据的强大工具。 在本文中,我们演示了如何使用 pandas 和 Polars 在 Python 中调用和处理时间戳列的三个优秀代码示例。 这些示例涵盖了基本访问、日期时间转换和基于时间的筛选,为在项目中处理时间戳数据打下了坚实的基础。

0条评论

您的电子邮件等信息不会被公开,以下所有项均必填

OK! You can skip this field.