时间序列分析方法的依据:
时间序列描述:n个随机变量在任意n个时间点t1,t2,…,tn的集合
一个时间序列有联合分布函数,定义如下:
Ft1,t2,⋯,tn(c1,c2,…,cn)=Pr(xt1≤c1,xt2≤c2,…,xtn≤cn).
但是只有随机变量的联合分布正常,才可以这么写,大多数情况下写不出联合分布函数,联合分布函数用于时间序列分析很不方便:因为n元,所以任何相应的多变量密度函数的绘图实际上都是不可能的。
如果我们想测量边际行为呢?
边际分布函数:Ft(x)=P{xt≤x}
边际密度函数:ft(x)=∂Ft(x)∂x
除此之外还有mean function
mean fuction:
μxt=E(xt)=∫∞−∞xft(x)dx
不产生误解时,可把μxt记作μt
例13 Mean Function of a Moving Average Series
wt是white noise,μwt=E(wt)=0,对于所有的t成立,在white noise的图中就可以看到,曲线在0附近变动。
vt是Moving Average Series的,μvt=E(vt)=13[E(wt−1)+E(wt)+E(wt+1)]=0
例14 Mean Function of a Random Walk with Drift
我们知道如果xt是Random Walk with Drift的,就有:
xt=σt+∑tj=1wj,t=1,2,…
μxt=E(xt)=σt+∑tj=1E(wj)=σt
画出来是一条斜率为σ的直线。
例15 Mean Function of Signal Plus Noise
现实中的许多应用都可以看成是一个信号波加上一个期望为0的噪声。
μxt=E(xt)=E[Acos(wt+ϕ)+wt]=E(Acos(wt+ϕ))+E(wt)
=Acos(wt+ϕ)
假设xt是有限的,有如下定义
Autocovariance Function:(用来评价一个序列中两个不同时间点的线性相关性)
γx(s,t)=cov(xs,xt)=E[(xs−μs)(xt−μt)],对于任意的s,t。
注:
- cov是用来评价xt,xs之间的独立性关系的。
- “光滑”的序列,就算t和s相距很远,AF也会很大;
“曲折”的序列,t,s相距很远的时候,AF几乎为0.
- 统计术语:γx(s,t)=0, xt,xs不是线性相关,但是他们可能还有其他的关系;如果xt,xs服从二元正态分布,那么他们γx(s,t)=0就代表相互独立。
证明:
- 如果s=t,那么AF就变成了方差:γx(t,t)=E[(xt−μt)2]=var(xt)
例16 Autocovariance of White Noise
γw(s,t)=cov(ws,wt)=
-
s=t, =σ2w
-
s≠t,=0
例17 Autocovariance of a Moving Average
γv(s,t)=cov(vs,vt)=cov{13(ws−1+ws+ws+1),13(wt−1+wt+wt+1)}.
s=t,
γv(t,t)=19cov{ws−1+ws+ws+1,wt−1+wt+wt+1}=13σ2w
s=t+1,or s=t−1
γv(s,t)=29σ2w
- otherwise
γv(s,t)=0
他的Autocovariance只跟s和t的距离有关。
例18 Autocovariance of a Random Walk
xt=∑tj=1wj
γ(s,t)=cov(xt,xs)=cov(∑tj=1wj,∑sj=1wj)=min{s,t}σ2
Autocorrelation fuction(ACF):
ρ(s,t)=γ(s,t)γ(s,s)γ(t,t)√
如果xs,xt之间是线性关系,|ρ(s,t)|=1
考虑两个时间序列yt和xs:
cross-covariance function:
γxy(s,t)=cov(xs,yt)=E[(xs−μxs)(yt−μyt)]
cross-correlation funtion(CCF):(比例显示的cross-covariance function)
ρxy(s,t)=γxy(s,t)γx(s,s)γy(t,t)√
大于两个时间序列的cross-covariance function:
多元时间序列(一共有r个):
xt1,xt2,…,xtr,
γjk(s,t)=E[(xsj−μsj)(xtk−μtk)] j,k=1,2,…,r.
当s,t历遍整个序列的时候,上述值在改变。
在例17中,可以看到,ACF只跟s和t的距离有关系。只要s和t之间的距离是h,那么s和h的具体位置并不重要。当平均值不变时,这个概念称为弱平稳性(weak stationarity)。
Strictly Stationary Time Series:
一个时间序列中任意可能出现的变量集{xt1,xt2,…,xtk}等同于{xt1+h,xt2+h,…,xtk+h},这就意味着:
Pr{xt1≤c1,…,xtk≤ck}=Pr{xt1+h≤c1,…,xtk+h≤ck}
对于任意的k=1,2,…,任意的时间点t1,t2,…,tk,任意的数c1,c2,…,ck,以及任意的时间变换h=0,±1,±2,….
也就是说:变量子集的所有多变量分布函数必须与移位集合(对应于任意移位参数h)的变量的多元分布函数一致。
- 假设k=1,Pr(xs≤c)=Pr(xt≤c),任意s,t都是成立的。
简单来说,就是一个时间序列在下午一点和晚上10点的值是一样的。如果mean function存在,假设是μt,那就代表μt=μs,对于任意的t,s都是成立的,这就说明这个时间序列的mean function是一个常数。所以, random walk with drift就不是严格稳定的。
- 当k=2的时候,有Pr{xt1≤c1,xt2≤c2}=Pr{xt1+h≤c1,xt2+h≤c2},对于任意的s,t,h。我么可以知道这两个时间序列的AF就是:
γ(s,t)=γ(s+h,t+h)
这就说明他们的AF只跟时间差有关,跟s,t无关。
Weakly Stationary:
一个时间序列xt,满足:
- mean function μt,是常数跟时间t无关;、
- AF,γ(s,t)只跟s和t的距离有关。
(后面用Stationary代表Weakly Stationary)
注:
- 如果一个时间序列是Gaussian(序列里面所有有限的分布都是Gaussian)那么从Stationarity就可以推出Strictly Stationary。
- μt固定,记为μ
- s=t+h,γ(t+h,t)=cov(xt+h,xt)=cov(xh,x0)=γ(h,0)
改写γ(s,t)为γ(h)
AF of a stationary time series:
γ(h)=cov(xt+h,xt)=E[(xt+h−μ)(xt−μ)]
ACF of a stationary time series:
ρ(h)=γ(t+h,t)γ(t+h,t+h)γ(t,t)√=γ(h)γ(0)
由Cauchy-Schwarz不等式知道:−1≤ρ(h)≤1,对于任意的h。
例19 Stationary of WN
-
μwt=0;
h=0,γw(h)=cov(wt,wt)=σ2w
h≠0,γw(h)=0
ρw(0)=1,ρw(h)=0,when h≠0
所以WN是stationary,如果WN还是Gaussian分布,那么WN还是Strictly Stationary,还可以知道他们还是相互独立(iid)的.
例20 Stationary of Moving Average
由例13和例17知道,Moving Average也是stationary。
-
μ=0
-
h=0,γ(h)=39σ2w,ρ(h)=1;
-
|h|=1,γ(h)=29σ2w,ρ(h)=23;
-
|h|=2,γ(h)=19σ2w,ρ(h)=13;
-
|h|>2,γ(h)=0,ρ(h)=0.
例21 Random Walk is Not Stationary
因为γ(s,t)=min{s,t}σ2w跟时间有关,同时μxt=δt
Trend Stationarity
考虑xt=α+βt+yt, 其中yt是Stationary:
-
μx,t=E(xt)=α+βt+μy,与时间有关。
-
γx(h)=cov(xt+h,xt)=E[(xt+h−μx,t+h)(xt−μx,t)]=E[(yt+h−μy)(yt−μy)]=γy(h).
该模型可被视为具有线性趋势的Stationary,被称作trend stationary。
AF of a stationary process 有哪些性质呢?
-
γ(h)是非负的,任意的n≥1,常数a1,…,an,
0≤var(a1x1+⋯+anxn)=∑j=1n∑k=1najakγ(j−k)
-
γ(0)=E[(xt−μ)2],由cauchy-schwarz不等式知道:
|γ(h)|≤γ(0)
-
γ(h)=γ(−h),理由:
γ((t+h)−t)=cov(xt+h,xt)=cov(xt,xt+h)=γ(t−(t+h))
- 图像关于0对称
jointly stationary:
xt,yt都是时间序列,而且都是stationary,他们的cross-covariance有如下性质:
γxy(h)=cov(xt+h,yt)=E[(xt+h−μx)(yt−μy)]
只跟h有关,那他们就是jointly stationary的。
cross-correlation function(CCF):
xt,yt是jointly stationary的,CCF定义如下:
ρxy(h)=γxy(h)γx(0)γy(0)‾‾‾‾‾‾‾‾‾√
- 这个值被-1和1界定。
- CCF并不关于0对称,因为cov(x2,y1)和cov(x1,y2)不一定相等。
-
ρxy(h)=ρyx(−h)
例24 Prediction Using Cross-Correlation
考虑确定两个序列之间可能的前导或滞后关系的问题:
yt=Axt−l+wt
-
l>0,xt is leading yt
-
l<0,xt is lagging yt
我们希望知道他们之间是leading还是lagging的,从而就可以从xt中预测出yt,假设噪音wt和xt序列之间是不相关的,那么CCF就是:
γyx(h)=cov(yt+h,xt)=cov(Axt+h−l+wt+h,xt)
=cov(Axt+h−l,xt)=Aγx(h−l)
由Cauchy-Schwarz公示知道,γx(h−l)的最大值是γx(0),此时h=l.
when l=5:
Linear Process:
white noise:wt;
xt=μ+∑∞j=−∞ψjwt−j, ∑∞j=−∞|ψj|<∞
我们还可以计算出他的AF:
γx(h)=σ2w∑j=−∞∞ψj+hψj, for all h≥0
注:
-
γx(h)=γx(−h);
-
∑∞j=−∞ψ2j<∞,就知道xt有方差;
- 大多数模型(causal linear process),都有ψj=0, for j<0.
Gaussian process:
一个时间序列{xt},对于任意的n,任意n个时间点t1,t2,…,tn,x=(xt1,xt2,…,xtn)T都是多元正态分布的。
E(x)=μ=(μt1,…,μtn)T,n×n的方差矩阵var(x)=Γ={γ(ti,tj);i,j=1,…,n},假设都是正的,那么多元正态密度函数就可以写成:
f(x)=(2π)−n2|Γ|−12exp{−12(x−μ)TΓ−1(x−μ)},
注:
- 如果一个Gaussian时间序列是weakly stationary,那么他的μt和γ(ti,tj)都是和时间差有关,而和具体的时间没有关系,由f(x)的表达式可以知道,f(x)也只是和时间差有关和真正的时间无关,所以这个时间序列还是strictly stationary。
- Wold Decomposition:A Stationary non-deterministic time series is a causal linear process.
Gaussian time series 一定是 causal linear process, wt∼ iid N(0,σ2w)
- 边缘分布是高斯分布的序列不一定是高斯的,这样的情况很常见,X,Y是正态分布的,但是(X,Y)不是二元正态分布的。举例:X,Z是相互独立且成正态分布的,当XZ>0, Y=Z,当XZ≤0, Y=−Z.