时序数据

时序的创建

一、四类时间变量
时序数据
二、时间点的创建
1.to_datetime方法

对于DataFrame而言，如果列已经按照时间顺序排好，则利用to_datetime可自动转换

2.时间精度与范围限制

Timestamp的精度可以最小到纳秒ns，它带来范围的代价就是只有大约584年的时间点是可用的
时序数据
3.date_range方法
一般来说，start/end/periods（时间点个数）/freq（间隔方法）是该方法最重要的参数，给定了其中的3个，剩下的一个就会被确定

其中freq参数有许多选项
bdate_range是一个类似与date_range的方法，特点在于可以在自带的工作日间隔设置上，再选择weekmask参数和holidays参数
它的freq中有一个特殊的’C’/‘CBM’/'CBMS’选项，表示定制，需要联合weekmask参数和holidays参数使用
时序数据
三、 DateOffset对象
1.DataOffset与Timedelta的区别
Timedelta绝对时间差的特点指无论是冬令时还是夏令时，增减1day都只计算24小时
DataOffset相对时间差指，无论一天是23\24\25小时，增减1day都与当天相同的时间保持一致
2.增减一段时间
DateOffset的可选参数包括years/months/weeks/days/hours/minutes/seconds
时序数据
3.各类常用offset对象

4.序列的offset操作
（1）利用apply函数
（2）直接使用对象加减
（3）定制offset，可以指定weekmask和holidays参数

时序的索引及属性
一、索引切片
二、子集索引
三、时间点的属性
1.采用dt对象可以轻松获得关于时间的信息
2.利用strftime可重新修改时间格式
3.对于datetime对象可以直接通过属性获取信息

重采样
所谓重采样，就是指resample函数，它可以看做时序版本的groupby函数
一、 resample对象的基本操作
采样频率一般设置为上面提到的offset字符
二、采样聚合
三、采样组的迭代
采样组的迭代和groupby迭代完全类似，对于每一个组都可以分别做相应操作

窗口函数
一、 Rolling
1.常用聚合
所谓rolling方法，就是规定一个窗口，它和groupby对象一样，本身不会进行操作，需要配合聚合函数才能计算结果
时序数据
min_periods参数是指需要的非缺失数据点数量阀值

2.rolling的apply聚合
使用apply聚合时，只需记住传入的是window大小的Series，输出的必须是标量即可
3.基于时间的rolling
二、Expanding
1.expanding函数
普通的expanding函数等价与rolling(window=len(s),min_periods=1)，是对序列的累计计算
2.几个特别的Expanding类型函数
cumsum/cumprod/cummax/cummin都是特殊expanding累计计算方法
shift/diff/pct_change都是涉及到了元素关系
①shift是指序列索引不变，但值向后移动
②diff是指前后元素的差，period参数表示间隔，默认为1，并且可以为负
③pct_change是值前后元素的变化百分比，period参数与diff类似

仅作学习打卡使用

相关推荐