切換語言為:簡體

如何使用 pandas 和 Polars 在 Python 中呼叫和使用時間戳列

  • 爱糖宝
  • 2024-07-17
  • 2124
  • 0
  • 0

    有效處理時間戳列對許多資料科學和工程任務等要求精確時間場景的需求至關重要。時間戳列通常需要特定的操作,如解析、格式化和基於時間的過濾。在本文中,我們將探討如何使用三種不同方法和庫呼叫和操作時間戳列的優秀程式碼示例。

在 Python 中呼叫時間戳列名 

    在 Python 中,可以使用 Pandas 和 Polars 等庫透過各種方法訪問時間戳列。讓我們看看使用這些方法的幾個不同示例,以便更好地理解這一概念。

    使用 Pandas 

    Pandas 是一個流行的資料操作庫,它為時間戳數據處理提供了強大的支援。下面,我們將演示如何使用 Pandas 呼叫和操作時間戳列。 在這個示例中,我們首先建立一個帶有時間戳列的 pandas DataFrame。 然後,我們使用 pd.to_datetime() 將 "時間戳 "列轉換為日期時間。 最後,我們透過呼叫 df['timestamp']來訪問時間戳列。

import pandas as pd
# Create a pandas DataFrame with a timestamp column
data = {
    "timestamp": ["2023-01-01 10:00:00", 
                  "2023-01-02 11:30:00", 
                  "2023-01-03 14:45:00"],
    "value": [10, 20, 30]
}
df = pd.DataFrame(data)
# Convert the column to datetime
df['timestamp'] = pd.to_datetime(df['timestamp'])
# Access the timestamp column
timestamp_col = df['timestamp']
print(timestamp_col)

輸出結果:

0   2023-01-01 10:00:00 
1   2023-01-02 11:30:00 
2   2023-01-03 14:45:00 
Name: timestamp, dtype: datetime64[ns]

    使用 Select 

在本例中,我們將使用 Python Polars 模組。 df.select("timestamp") 只選擇 DataFrame df 中的 "timestamp "列。 該方法在 select 方法中明確指定了列名,這在您想透過列名獲取特定列時非常方便。

import polars as pl
# Create a Polars DataFrame with a timestamp column
data = {
    "timestamp": ["2023-01-01 10:00:00", 
                  "2023-01-02 11:30:00", 
                  "2023-01-03 14:45:00"],
    "value": [10, 20, 30]
}
df = pl.DataFrame(data)
# Select the timestamp column using the select method
timestamp_col = df.select("timestamp")
print(timestamp_col)

輸出結果:

如何使用 pandas 和 Polars 在 Python 中呼叫和使用時間戳列

使用 Polars 進行基於時間的篩選 

在本示例中,我們首先建立一個 Polars DataFrame,其中的 "timestamp "列包含日期時間值的字串表示。 然後,使用指定格式的 str.strptime() 函式將 "時間戳 "列轉換為日期時間格式。 最後,訪問並列印轉換後的 "時間戳 "列。

import polars as pl
# Create a Polars DataFrame with a timestamp column
data = {
    "timestamp": ["2023-01-01 10:00:00", 
                  "2023-01-02 11:30:00", 
                  "2023-01-03 14:45:00"],
    "value": [10, 20, 30]
}
df = pl.DataFrame(data)
# Convert the column to datetime
df = df.with_columns(
    pl.col("timestamp").str.strptime(pl.Datetime, format="%Y-%m-%d %H:%M:%S")
)
# Access the timestamp column
timestamp_col = df["timestamp"]
print(timestamp_col)

輸出結果:

shape: (3,)
Series: 'timestamp' [datetime[μs]]
[
    2023-01-01 10:00:00
    2023-01-02 11:30:00
    2023-01-03 14:45:00
]

結論 

    處理時間戳列是數據處理和分析中的常見要求。 像 pandas 和 Polars 這樣的 Python 庫提供了高效處理和訪問時間戳資料的強大工具。 在本文中,我們演示瞭如何使用 pandas 和 Polars 在 Python 中呼叫和處理時間戳列的三個優秀程式碼示例。 這些示例涵蓋了基本訪問、日期時間轉換和基於時間的篩選,為在專案中處理時間戳資料打下了堅實的基礎。

0則評論

您的電子郵件等資訊不會被公開,以下所有項目均必填

OK! You can skip this field.