1. Cholesky分解
(1) LDU分解
设A=(aij)是n阶矩阵,则当且仅当A的顺序主子式Δk=0(k=1,2,...,n−1)时,A可唯一的分解为A=LDU,其中L为单位下三角矩阵,U为单位上三角矩阵,D为对角阵。
证明:对矩阵A做初等行变换变成一个上三角矩阵,其变换矩阵就是一个单位下三角矩阵,设PA=U1,令D=diag(d1,...,dn),其中di,1≤i≤n为U1的对角线元素,则存在一个单位上三角阵U使得U1=DU,令L=P−1仍是一个单位下三角阵,即有A=LDU。
(2) Cholesky分解
设A=(aij)是n阶对称正定矩阵,则存在一个下三角矩阵G,使得A=GG′。
证明:A是n阶对称正定矩阵,Δk>0(k=1,2,...,n),有唯一的LDU分解A=LDU,其中D=diag(d1,...,dn)且di>0(i=1,2,...,n)(事实上,di=Δi−1Δi),令D~=diag(d1,...,dn),则有A=LD~2U。
由A′=A得,LD~2U=U′D~2L′,
再由分解的唯一性得:L=U′,U=L′,
令G=LD~,则G为下三角阵,且有A=LD~2L′=(LD~)(LD~)′=GG′。
(3) Cholesky分解的统计应用
对任意的k×1维向量μ、k×k维对称正定矩阵V,设V有Cholesky分解V=GG′,则可通过以下方式产生一个服从k为正态分布N(μ,V)的k维随机向量:ξ=μ+Lη,其中η为服从标准正态分布的随机向量。
2. 特征值分解
对任意的n×n对称矩阵A,A具有n个线性无关的特征向量,则存在一个正交阵T使得A=TDT′,其中D=diag(λ1,λ2,...,λn),λ1,λ2,...,λn为A的特征值。
证明:设A的对应于{λ1,λ2,...,λn}的n个线性无关的单位特征向量{v1,v2,...,vn},令T=[v1,v2,...,vn],则T为正交阵,
AT=[Av1,...,Avn]=[λv1,...,λvn]=[v1,...,vn]diag(λ1,λ2,...,λn)=Tdiag(λ1,λ2,...,λn)
A=Tdiag(λ1,λ2,...,λn)T−1=Tdiag(λ1,λ2,...,λn)T′
(1) 矩阵的幂次
对任意的非负定矩阵A及数r∈[0,1],可定义Ar=Tdiag(λ1r,...,λnr)T′。特别地,当r=1/2时,D1/2=diag(λ11/2,...,λn1/2),称A1/2=TD1/2T′为矩阵A的平方根。
(i)(A1/2)2=A,记(A−1)1/2为A−1/2,有A−1/2=(A1/2)−1。
(ii)Lo¨wner−Heinz不等式
对任意的满足A≥B≥0的矩阵A、B,数r∈[0,1],有Ar≥Br。
证明:
(iii)(simultaneously diagonalizable)设有n阶矩阵A、B,若存在正交矩阵S使得A=SDS′、B=SES′,则称矩阵A、B可同时对角化。可对角化矩阵A、B可交换当且仅当A、B可同时对角化。
证明:假设A、B可同时对角化,即存在正交矩阵S使得A=SDS′、B=SES′,
AB=SDS′SES′=SDES′=SEDS′=SES′SDS′=BA
假设矩阵A、B可交换,设A=SDS′、B=TET′,令B1=S′AS,由A、B可交换推知D、B1可交换,倘若说明D、B1可同时对角化,则可推知A、B可同时对角化,因此不妨假设A为对角阵。
设B=[bij],λ1,λ2,...,λn为A的特征值,由AB=BA知λibij=bijλj,即有(λi−λj)bij=0,进而推知当λi=λj时,bij=0。设A具有如下分块形式:
A=⎣⎢⎢⎡λ1I10...00λ2I2...0............00...λkIk⎦⎥⎥⎤
相应的B具有如下形式:
B=⎣⎢⎢⎡B10...00B2...0............00...Bk⎦⎥⎥⎤
由矩阵B可对角化知存在正交阵Ti使得Bi=TiEiT′,令
T=⎣⎢⎢⎡T10...00T2...0............00...Tk⎦⎥⎥⎤,E=⎣⎢⎢⎡E10...00E2...0............00...Ek⎦⎥⎥⎤
则有B=TET′,A=TT′,即A、B可同时对角化。
(2) 统计应用
对任意的k×1维向量μ、k×k维对称正定矩阵V,可通过以下方式产生一个服从k为正态分布N(μ,V)的k维随机向量:ξ=μ+V1/2η,其中η为服从标准正态分布的随机向量。
3. 特征值
(1) 对任意正整数p,矩阵Ap的特征值为λ1p,...,λnp;因此当A≥0时,λmax(Ap)={λmax(A)}p,λmin(Ap)={λmin(A)}p。
(2) tr(A)=λ1+...+λn。
(3)∣A∣=λ1...λn。
证明:多项式∣λE−A∣的常数项为(−1)n∣A∣,而由多项式根与系数的关系知,多项式的常数项为(−1)nλ1...λn,故得证。
(4)乘积矩阵的特征值:
(i)矩阵A、B均为n阶方阵:
若A、B均为对称阵,则∣AB−λE∣=∣(AB−λE)′∣=∣B′A′−λE∣,所以AB与BA有相同的特征值;
若A、B至少有一个矩阵可逆,不妨设A可逆,则∣AB−λE∣=∣A−1∣∣AB−λE∣∣A∣=∣A−1(AB−λE)A∣=∣BA−λE∣,AB与BA有相同的特征值;
若A、B均不可逆,
所以∣λE−AB∣=∣λE−BA∣,AB与BA有相同的特征值;
(ii)矩阵A、B均不是方阵,设A为m×n阶矩阵,B为n×m阶矩阵:
(5)(Weyl’s perturbation theorem)设对称矩阵A、B的特征值分别为λ1≥...≥λk、μ1≥...≥μk,则有:
1≤i≤kmax∣λi−μi∣≤∣∣A−B∣∣
Weyl’s perturbation theorem的一个应用:
设有对称矩阵序列An满足∣∣An−A∣∣→0,n→∞,其中A为对称阵,则当n→∞时,An的特征值趋于A的特征值。