时序数据

时序的创建

一、 四类时间变量
时序数据
二、 时间点的创建
1.to_datetime方法
时序数据
对于DataFrame而言,如果列已经按照时间顺序排好,则利用to_datetime可自动转换
时序数据
2.时间精度与范围限制
时序数据
Timestamp的精度可以最小到纳秒ns,它带来范围的代价就是只有大约584年的时间点是可用的
时序数据
3.date_range方法
一般来说,start/end/periods(时间点个数)/freq(间隔方法)是该方法最重要的参数,给定了其中的3个,剩下的一个就会被确定
时序数据
其中freq参数有许多选项
bdate_range是一个类似与date_range的方法,特点在于可以在自带的工作日间隔设置上,再选择weekmask参数和holidays参数
它的freq中有一个特殊的’C’/‘CBM’/'CBMS’选项,表示定制,需要联合weekmask参数和holidays参数使用
时序数据
三、 DateOffset对象
1.DataOffset与Timedelta的区别
Timedelta绝对时间差的特点指无论是冬令时还是夏令时,增减1day都只计算24小时
DataOffset相对时间差指,无论一天是23\24\25小时,增减1day都与当天相同的时间保持一致
2.增减一段时间
DateOffset的可选参数包括years/months/weeks/days/hours/minutes/seconds
时序数据
3.各类常用offset对象
时序数据
4.序列的offset操作
(1)利用apply函数
(2)直接使用对象加减
(3)定制offset,可以指定weekmask和holidays参数

时序的索引及属性
一、 索引切片
二、子集索引
三、时间点的属性
1.采用dt对象可以轻松获得关于时间的信息
2.利用strftime可重新修改时间格式
3.对于datetime对象可以直接通过属性获取信息

重采样
所谓重采样,就是指resample函数,它可以看做时序版本的groupby函数
一、 resample对象的基本操作
采样频率一般设置为上面提到的offset字符
二、 采样聚合
三、采样组的迭代
采样组的迭代和groupby迭代完全类似,对于每一个组都可以分别做相应操作

窗口函数
一、 Rolling
1.常用聚合
所谓rolling方法,就是规定一个窗口,它和groupby对象一样,本身不会进行操作,需要配合聚合函数才能计算结果
时序数据
min_periods参数是指需要的非缺失数据点数量阀值
时序数据
2.rolling的apply聚合
使用apply聚合时,只需记住传入的是window大小的Series,输出的必须是标量即可
3.基于时间的rolling
二、Expanding
1.expanding函数
普通的expanding函数等价与rolling(window=len(s),min_periods=1),是对序列的累计计算
2.几个特别的Expanding类型函数
cumsum/cumprod/cummax/cummin都是特殊expanding累计计算方法
shift/diff/pct_change都是涉及到了元素关系
①shift是指序列索引不变,但值向后移动
②diff是指前后元素的差,period参数表示间隔,默认为1,并且可以为负
③pct_change是值前后元素的变化百分比,period参数与diff类似

仅作学习打卡使用