时间序列分析个人学习笔记2

时间序列分析方法的依据
时间序列描述:n个随机变量在任意n个时间点t1,t2,,tn的集合
一个时间序列有联合分布函数,定义如下:
Ft1,t2,tnc1c2,,cn)=Pr(xt1c1,xt2c2,,xtncn).
但是只有随机变量的联合分布正常,才可以这么写,大多数情况下写不出联合分布函数,联合分布函数用于时间序列分析很不方便:因为n元,所以任何相应的多变量密度函数的绘图实际上都是不可能的。


如果我们想测量边际行为呢?
边际分布函数:Ft(x)=P{xtx}
边际密度函数:ft(x)=Ft(x)x
除此之外还有mean function

mean fuction
μxt=E(xt)=xft(x)dx
不产生误解时,可把μxt记作μt


例13 Mean Function of a Moving Average Series
wt是white noise,μwt=E(wt)=0,对于所有的t成立,在white noise的图中就可以看到,曲线在0附近变动。
vt是Moving Average Series的,μvt=E(vt)=13[E(wt1)+E(wt)+E(wt+1)]=0


例14 Mean Function of a Random Walk with Drift
我们知道如果xt是Random Walk with Drift的,就有:
xt=σt+j=1twj,t=1,2,
μxt=E(xt)=σt+j=1tE(wj)=σt
画出来是一条斜率为σ的直线。


例15 Mean Function of Signal Plus Noise
现实中的许多应用都可以看成是一个信号波加上一个期望为0的噪声。
μxt=E(xt)=E[Acos(wt+ϕ)+wt]=E(Acos(wt+ϕ))+E(wt)
=Acos(wt+ϕ)


假设xt是有限的,有如下定义
Autocovariance Function:(用来评价一个序列中两个不同时间点的线性相关性)

γx(s,t)=cov(xs,xt)=E[(xsμs)(xtμt)],对于任意的s,t。

注:

  • cov是用来评价xt,xs之间的独立性关系的。
  • “光滑”的序列,就算t和s相距很远,AF也会很大;
    “曲折”的序列,t,s相距很远的时候,AF几乎为0.
  • 统计术语:γx(s,t)=0, xt,xs不是线性相关,但是他们可能还有其他的关系;如果xt,xs服从二元正态分布,那么他们γx(s,t)=0就代表相互独立。
    证明:
    时间序列分析个人学习笔记2
  • 如果s=t,那么AF就变成了方差:γx(t,t)=E[(xtμt)2]=var(xt)

例16 Autocovariance of White Noise
γw(s,t)=cov(ws,wt)=

  • s=t, =σw2
  • st,=0

例17 Autocovariance of a Moving Average
γv(s,t)=cov(vs,vt)=cov{13(ws1+ws+ws+1),13(wt1+wt+wt+1)}.

  • s=t,
    γv(t,t)=19cov{ws1+ws+ws+1,wt1+wt+wt+1}=13σw2

  • s=t+1,or s=t1
    γv(s,t)=29σw2

  • otherwise
    γv(s,t)=0

他的Autocovariance只跟s和t的距离有关。


例18 Autocovariance of a Random Walk
xt=j=1twj
γ(s,t)=cov(xt,xs)=cov(j=1twj,j=1swj)=min{s,t}σ2


Autocorrelation fuction(ACF):
ρ(s,t)=γ(s,t)γ(s,s)γ(t,t)
如果xsxt之间是线性关系,|ρ(s,t)|=1


考虑两个时间序列ytxs:
cross-covariance function:
γxy(s,t)=cov(xs,yt)=E[(xsμxs)(ytμyt)]


cross-correlation funtion(CCF):(比例显示的cross-covariance function)
ρxy(s,t)=γxy(s,t)γx(s,s)γy(t,t)


大于两个时间序列的cross-covariance function:
多元时间序列(一共有r个):
xt1,xt2,,xtr,
γjk(s,t)=E[(xsjμsj)(xtkμtk)]  j,k=1,2,,r.
当s,t历遍整个序列的时候,上述值在改变。


在例17中,可以看到,ACF只跟s和t的距离有关系。只要s和t之间的距离是h,那么s和h的具体位置并不重要。当平均值不变时,这个概念称为弱平稳性(weak stationarity)。

Strictly Stationary Time Series
一个时间序列中任意可能出现的变量集{xt1,xt2,,xtk}等同于{xt1+h,xt2+h,,xtk+h},这就意味着:
Pr{xt1c1,,xtkck}=Pr{xt1+hc1,,xtk+hck}
对于任意的k=1,2,,任意的时间点t1,t2,,tk,任意的数c1,c2,,ck,以及任意的时间变换h=0,±1,±2,.

也就是说:变量子集的所有多变量分布函数必须与移位集合(对应于任意移位参数h)的变量的多元分布函数一致。

  • 假设k=1,Pr(xsc)=Pr(xtc),任意s,t都是成立的。
    简单来说,就是一个时间序列在下午一点和晚上10点的值是一样的。如果mean function存在,假设是μt,那就代表μt=μs,对于任意的t,s都是成立的,这就说明这个时间序列的mean function是一个常数。所以, random walk with drift就不是严格稳定的。
  • 当k=2的时候,有Pr{xt1c1,xt2c2}=Pr{xt1+hc1,xt2+hc2},对于任意的s,t,h。我么可以知道这两个时间序列的AF就是:
    γ(s,t)=γ(s+h,t+h)

    这就说明他们的AF只跟时间差有关,跟s,t无关。

Weakly Stationary:
一个时间序列xt,满足:

  • mean function μt,是常数跟时间t无关;、
  • AF,γ(s,t)只跟s和t的距离有关。
    (后面用Stationary代表Weakly Stationary)

注:
- 如果一个时间序列是Gaussian(序列里面所有有限的分布都是Gaussian)那么从Stationarity就可以推出Strictly Stationary。
- μt固定,记为μ
- s=t+hγ(t+h,t)=cov(xt+h,xt)=cov(xh,x0)=γ(h,0)
改写γ(s,t)γ(h)


AF of a stationary time series:
γ(h)=cov(xt+h,xt)=E[(xt+hμ)(xtμ)]

ACF of a stationary time series:
ρ(h)=γ(t+h,t)γ(t+h,t+h)γ(t,t)=γ(h)γ(0)

由Cauchy-Schwarz不等式知道:1ρ(h)1,对于任意的h。


例19 Stationary of WN

  • μwt=0;
  • h=0,γw(h)=cov(wt,wt)=σw2
    h0,γw(h)=0

  • ρw(0)=1,ρw(h)=0,when h0

所以WN是stationary,如果WN还是Gaussian分布,那么WN还是Strictly Stationary,还可以知道他们还是相互独立(iid)的.


例20 Stationary of Moving Average
由例13和例17知道,Moving Average也是stationary。

  • μ=0
  • h=0,γ(h)=39σw2ρ(h)=1;
  • |h|=1,γ(h)=29σw2ρ(h)=23;
  • |h|=2,γ(h)=19σw2ρ(h)=13;
  • |h|>2,γ(h)=0ρ(h)=0.

例21 Random Walk is Not Stationary
因为γ(s,t)=min{s,t}σw2跟时间有关,同时μxt=δt


Trend Stationarity
考虑xt=α+βt+yt, 其中yt是Stationary:

  • μx,t=E(xt)=α+βt+μy,与时间有关。
  • γx(h)=cov(xt+h,xt)=E[(xt+hμx,t+h)(xtμx,t)]=E[(yt+hμy)(ytμy)]=γy(h).

该模型可被视为具有线性趋势的Stationary,被称作trend stationary。


AF of a stationary process 有哪些性质呢?

  1. γ(h)是非负的,任意的n1,常数a1,,an,

    0var(a1x1++anxn)=j=1nk=1najakγ(jk)

  2. γ(0)=E[(xtμ)2],由cauchy-schwarz不等式知道:

    |γ(h)|γ(0)

  3. γ(h)=γ(h),理由:

    γ((t+h)t)=cov(xt+h,xt)=cov(xt,xt+h)=γ(t(t+h))

  4. 图像关于0对称
    时间序列分析个人学习笔记2

jointly stationary:
xt,yt都是时间序列,而且都是stationary,他们的cross-covariance有如下性质:

γxy(h)=cov(xt+h,yt)=E[(xt+hμx)(ytμy)]
只跟h有关,那他们就是jointly stationary的。


cross-correlation function(CCF)
xt,yt是jointly stationary的,CCF定义如下:

ρxy(h)=γxy(h)γx(0)γy(0)

  • 这个值被-1和1界定。
  • CCF并不关于0对称,因为cov(x2,y1)cov(x1,y2)不一定相等。
  • ρxy(h)=ρyx(h)

例24 Prediction Using Cross-Correlation
考虑确定两个序列之间可能的前导或滞后关系的问题:
yt=Axtl+wt

  • l>0,xt is leading yt
  • l<0,xt is lagging yt

    我们希望知道他们之间是leading还是lagging的,从而就可以从xt中预测出yt,假设噪音wtxt序列之间是不相关的,那么CCF就是:

    γyx(h)=cov(yt+h,xt)=cov(Axt+hl+wt+h,xt)

    =cov(Axt+hl,xt)=Aγx(hl)

    由Cauchy-Schwarz公示知道,γx(hl)的最大值是γx(0),此时h=l.
    when l=5:
    时间序列分析个人学习笔记2


Linear Process
white noise:wt
xt=μ+j=ψjwtj,   j=|ψj|<
我们还可以计算出他的AF:

γx(h)=σw2j=ψj+hψj,  for all h0

注:

  • γx(h)=γx(h);
  • j=ψj2<,就知道xt有方差;
  • 大多数模型(causal linear process),都有ψj=0, for j<0.

Gaussian process:
一个时间序列{xt},对于任意的n,任意n个时间点t1,t2,,tnx=(xt1,xt2,,xtn)T都是多元正态分布的。

E(x)=μ=(μt1,,μtn)Tn×n的方差矩阵var(x)=Γ={γ(ti,tj);i,j=1,,n},假设都是正的,那么多元正态密度函数就可以写成:

f(x)=(2π)n2|Γ|12exp{12(xμ)TΓ1(xμ)},

注:

  • 如果一个Gaussian时间序列是weakly stationary,那么他的μtγ(ti,tj)都是和时间差有关,而和具体的时间没有关系,由f(x)的表达式可以知道,f(x)也只是和时间差有关和真正的时间无关,所以这个时间序列还是strictly stationary。
  • Wold Decomposition:A Stationary non-deterministic time series is a causal linear process.
    Gaussian time series 一定是 causal linear process, wt iid N(0,σw2)
  • 边缘分布是高斯分布的序列不一定是高斯的,这样的情况很常见,XY是正态分布的,但是(X,Y)不是二元正态分布的。举例:X,Z是相互独立且成正态分布的,当XZ>0, Y=Z,当XZ0, Y=Z.