DW数据挖掘学习笔记-02时序预测规则及模型

时序预测规则

A. 时间序列规则

由过去推测未来,是典型的时间序列问题,如:支付数据、客流量数据、交通数据等,具有明显的周期性(周/月)。从预测的角度来说,周期性是核心,当数据呈周期性波动的时候,预测的核心任务就是准确的提取这种周期。

周期性因子分析非缺点是没有考虑节假日和突发事件等。

基于周期因子的时间序列预测

Step1:获得周期因子

法一:

  • 数据除以周均值,得到一个比例
  • 按列取中位数 ->得到一组鲁棒的周期因子
    • 做预测的时候,只要将周期因子,乘以一个base,就可以做下一周的预测了

法二:

  • 季节指数的计算方式
  • 获得每日(工作日或周末)均值,再除以整体均值

Step2:预测

见法一2.1

优化:

  • 针对周期因子的优化
    • 按列取中位数是一种简单而有效的提取周期因子的方法。
    • 中位数十分鲁棒,不受极端值的影响,但是中位数损失了很多信息。
    • 实践中,可以在此基础上进一步优化,比如提取一个均值和一个中位数,然后将均值和中位数融合,融合的比例按照测试集的表现来确定,也可以根据与预测周的时间距离来赋予不同的权重。
  • 针对base的优化
    • 直接使用最后一周的数据作为base并不一定是最好的办法,也许最后三天或五天的均值能够更好的反映最新的情况,但是我们不能直接对最后三天的数值取均值(因为可能存在最后三天是周末的情况,这样取的base就会偏大或者偏小)。
    • 需要去掉周期性因素后,再取均值,具体做法就是用最后三天的真实数据除以周期因子(即周期因子的中位数)。
    • 这样再取最后三天数据的平均值作为base

https://www.jianshu.com/p/31e20f00c26f 时间序列规则法快速入门

B. 时间序列模型

a. 模型概述

  1. 时间序列的不同分类

时间序列是按照时间顺序排列的、随时间变化且相互关联的数据序列。时间序列根据所研究的依据不同,可有不同的分类:

  • 按所研究的对象的多少分,有一元时间序列和多元时间序列
  • 按时间的连续性可将时间序列分为离散时间序列和连续时间序列
  • 按序列的统计性特征分,有平稳的时间序列和非平稳的时间序列。如果一个时间序列的概率分布与t无关,则称该序列为严格的(狭义的)平稳时间序列;如果序列的一、二阶距存在,而且对任意时刻t满足:
    • 均值为常数
    • 协方差为时间间隔T的函数。则称该序列为宽平稳时间序列,也叫广义平稳时间序列。我们以后所研究的时间序列主要是宽平稳时间序列
  • 按时间序列的分布规律来分,有高斯型时间序列和非高斯型时间序列
  1. 确定性时间序列分析方法概述

时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化趋势。一个时间序列往往是以下几类变化形式的叠加或耦合。我们常认为一个时间序列可以分解为以下四大部分:

  • 长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势。
  • 季节变动
  • 循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相似的波动。
  • 不规则变动。通常它分为突然变动和随机变动
  1. 三种时间序列模型

DW数据挖掘学习笔记-02时序预测规则及模型

如果在预测时间范围以内,无突然变动且随机变动的方差 DW数据挖掘学习笔记-02时序预测规则及模型 较小,并且有理由认 为过去和现在的演变趋势将继续发展到未来时,可用一些经验方法进行预测。

https://blog.****.net/qq_29831163/article/details/89440215 时间序列模型 (一):模型概述