数据挖掘实践(资金流入流出预测)--Task3时间序列模型
数据挖掘实践(资金流入流出预测)–Task3时间序列模型
赛题解读
赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction
数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information
阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和转出金额。是一个回归问题。
时间序列是指将同一统计量的数值按其发生的时间先后顺序排列而成的数列
常用按时间顺序排列的一组随机变量
????_1,????_2,⋯????_????,⋯
表示一个随机事件的时间序列,简记为 {????_????}
时间序列的各种变化都可以归纳成四大类因素的综合影响
长期趋势(trend):会导致序列出现明显的长期趋势
循环波动(circle):会导致序列呈现出周期性波动
季节性变化(season): 会导致序列呈现出和季节变化相关的稳定的周期波动.
随机波动(immediate): 纯随机、与时间无关
季节变动视为一种特殊的循环波动
为什么选择R语言
Python 3.7不能正确显示PACF图和ACF图
Python 3.5可正确显示,但没有一些包
R语言正常,且工具包多、强大
使用jupyter notebook编辑器写R语言程序
不建议用anaconda3里的R
建议装好R环境后,再关联jupyter与R环境
见参考资料中的链接:https://blog.****.net/ICERON/article/details/82743930
运行baseline,提交结果为:135