天池竞赛-资金流入流出预测总结
天池竞赛-资金流入流出预测总结
竞赛背景
蚂蚁金服作为一家拥有上亿会员的金融服务集团,业务场景中每天都涉及大量的资金流入和流出,面对如此庞大的用户群,资金管理压力非常大。在既保证资金流动性风险最小,又满足日常业务运转的情况下,精准地预测资金流入流出情况变得尤为重要。
对货币基金而言,资金流入意味着申购行为,资金流出为赎回行为。以余额宝用户为例,在把握用户的申购赎回数据基础上,充分考虑余额宝的收益情况和银行间拆借利率表,结合收益的显示时间,准确预测未来每日的资金流入流出情况。
基本数据
用户个人信息主要包括用户性别、所在城市、以及星座。余额宝用户的操作包括余额、余额购买量、银行卡购买量、消费量、转出量等信息,构成申购和赎回两个部分,并记录时间,统计用户每日的申购赎回总量。根据申购赎回总量每日的变化,分析不同时间的资金流入流出情况。结合用户个人信息、余额宝收益情况和银行间拆借利率表,找出与资金流入流出之间的关系。
基础准备:
- 时间序列图:便于观察数据特点,找出是否具有周期性、以及数据的变化幅度等。
- 直方图、密度曲线图、箱型图、小提琴图:将数据具体化、可视化,便于找出数据间的对比差异、数据的可行区间等。
- 独立性分析/检验:变量可以分为连续性和离散型。例:设有x连续变量,y离散变量,考虑x、y之间是否独立存在。设置两种情况????0:X与Y独立;????1:X与Y不独立,定义????(????)=????(????≤????),????r (????)=????(????≤????|????=????????)
预测过程:
- 导入工具包
2. 读取数据文件
3. 添加时间信息并统计每日申购赎回总量
4. 绘制时序图