Pandas系列(十六)快速进行日期处理

  Pandas日期处理的作用:将2018-01-011/1/2018等多种日期格式映射成统一的格式对象,在该对象上提供强大的功能支持,能够简单地对日期进行处理。

  几个概念

  • pd.to_datetimepandas的一个函数,能将字符串、列表、series变成日期形式。对单个日期字符串处理会得到Timestamp, 对日期字符串列表处理会得到DatetimeIndex
  • Timestamppandas表示日期的对象形式。
  • DatetimeIndexpandas表示日期的对象列表形式。DatetimeIndexTimestamp的列表形式。

  用图表可表示为如下形式:

Pandas系列(十六)快速进行日期处理

读取天气数据到dataframe

Pandas系列(十六)快速进行日期处理

将日期列转换成pandas的日期

  set_index()方法将索引设置为日期形式,此时索引的类型已经变成了datetime64的格式:

Pandas系列(十六)快速进行日期处理

方便的对DatetimeIndex进行查询

  这种格式的index可以很方便地进行查询数据:

  1. 筛选固定的某一天

Pandas系列(十六)快速进行日期处理

  1. 日期区间

Pandas系列(十六)快速进行日期处理

  1. 按月份前缀筛选

Pandas系列(十六)快速进行日期处理

  1. 按月份列表筛选

Pandas系列(十六)快速进行日期处理

  1. 按年份前缀筛选

Pandas系列(十六)快速进行日期处理

方便的获取周、月、季度

  TimestampDatetimeIndex支持大量的属性可以获取日期分量:https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#time-date-components

Pandas系列(十六)快速进行日期处理

统计每周、每月、每个季度的最高温度

  如果想要对每周,每月,每个季度的数据进行处理的话,可以采用以下方式:

  1. 统计每周的数据

Pandas系列(十六)快速进行日期处理

  1. 统计每个月的数据

Pandas系列(十六)快速进行日期处理

  1. 统计每个季度的数据

Pandas系列(十六)快速进行日期处理

日期索引的缺失

  首先利用set_index()df的索引变成日期索引:

Pandas系列(十六)快速进行日期处理

使用pandas.reindex填充缺失的索引

Pandas系列(十六)快速进行日期处理

使用pandas.resample方法

Pandas系列(十六)快速进行日期处理