在某些教材上,讨论在某一数域F下n级矩阵的特征值时,规定特征值必须是数域F中的数。例如,在实数域下讨论n级矩阵的特征值,则特征值一定都是实数,若某实矩阵没有实的特征值,就说该矩阵在实数域下没有特征值。这样做是严谨的,但并不是说没有这样做的教材就是不严谨的。实际上,很多教材在讨论特征值时,都默认是在复数域下讨论。在复数域下,n级矩阵恰好有n个特征值,这是由于复数域是代数封闭的域,而实数域、有理数域都不是代数封闭域,所以一个有理数矩阵不一定有有理数特征值。
本文遵循这样的约定:即使你拿一个有理数矩阵A∈Qn×n,我们也说A恰好有n个特征值,这是因为我们只在复数域下讨论特征值,这样有理数矩阵A就被视作复数域下的一个矩阵。在讨论特征值时,任意数域F下的矩阵都被视作是复数域中的矩阵。
-
定义:设A∈Cn×n,若∃λ∈C,x∈Cn,x=0使得Ax=λx,或者等价地(λI−A)x=0,则称λ是A的一个特征值,x是A的对应于λ的一个特征向量
-
定义:(特征值的集合)设A∈Cn×n,用σ(A)表示A的所有特征值的集合
-
定理:λ是n阶方阵A的特征值的充要条件为det(λI−A)=0
证:
由特征值的定义,λ是n阶方阵A的特征值的充要条件为齐次线性方程组(λI−A)x=0有非零解,而有非零解的充要条件为系数矩阵λI−A不可逆,从而充要条件为det(λI−A)=0。
【注】det(λI−A)=0是关于λ的一元n次方程,这个定理揭示了特征值与一元n次方程的关系。在复数域下,一元n次方程方程恰好有n个根(重根按重数算),因此n阶方阵有n个特征值(重特征值按重数算)。
-
定义:det(λI−A)=0称为A的特征方程;关于λ的一元n次多项式det(λI−A)称为A的特征多项式;若λ是A的特征值,则齐次线性方程组(λI−A)x=0的解空间(也就是系数矩阵λI−A的零空间N(λI−A))称为λ的特征子空间
【注】关于矩阵特征多项式的展开式,请参考矩阵论(补充知识):特征多项式的展开式。
-
定义:若方阵A的特征值λ是A的特征方程的k重根,则称k是λ的代数重数;λ对应的特征子空间的维数称为λ的几何重数
-
定理:n阶方阵A的全部不同特征值的代数重数之和为n
证:
由复数域的代数封闭性以及代数重数的定义可得。
-
定理:方阵A的任意特征值的几何重数小于等于代数重数
证:
法1:利用基的扩充和相似(相似矩阵的内容见后文)
设λ是A的一个特征值,λ对应的特征子空间N(λI−A)的维数为s,即λ的几何重数为s。取N(λI−A)的一组基x1,x2,...,xs,由扩充定理知可将它扩充为Cn的一组基x1,x2,...,xn。令P=[x1x2⋯xn],则P为可逆矩阵,由P−1P=I并根据分块矩阵乘法可得P−1[x1x2⋯xs]=[IsO]。令B=P−1AP,则B=P−1[Ax1⋯Axs∗]=P−1[λx1⋯λxs∗]=[λP−1[x1x2⋯xs]∗]=[λIsO∗∗]通过对上面这个分块矩阵的特征多项式进行拉普拉斯展开就得知,λ是B的特征值且其代数重数至少为s。因为B与A相似,故B的特征值λ的代数重数与A的特征值λ的代数重数相等,故A的特征值λ的代数重数不小于s,即不小于其几何重数。得证。
法2:利用矩阵分解(schur分解,具体证明见矩阵论(二):矩阵分解—从Schur分解、特征值分解EVD到奇异值分解SVD)
-
定理:设A∈Cn×n的n个特征值分别为λ1,λ2,...,λn,则μI+A,μ∈C的n个特征值为μ+λ1,μ+λ2,...,μ+λn
证:
μI+A的特征多项式为det(λI−(μI+A))=det((λ−μ)I−A),由已知特征方程det(λI−A)的n个根为λ1,λ2,...,λn,显然特征方程det((λ−μ)I−A)=0的n个根为μ+λ1,μ+λ2,...,μ+λn,得证。
【注】该结论是一个比较明显的结论,也十分常用。注意,结论蕴含着“若λi是A的k重特征值(此处指代数重数),则μ+λi是μI+A的k重特征值”。
-
定理:设λ1,λ2,⋯,λs是A的互不相同的特征值,xi1,xi2,⋯,xiji是A关于λi的线性无关的特征向量,则x11,⋯,x1j1,x21,⋯,x2j2,⋯,xs1,⋯,xsjs是线性无关的
证明:(数学归纳法)
当s=1时,显然命题成立。
假设当s=i时,命题成立,则当s=i+1时,设k11x11+⋯+k1j1x1j1+k21x21+⋯+k2j2x2j2+⋯+ks1xs1+⋯+ksjsxsjs=0
用A左乘两端并整理得:λ1(k11x11+⋯+k1j1x1j1)+⋯+λs(ks1xs1+⋯+ksjsxsjs)=0由以上两式消去ks1xs1+⋯+ksjsxsjs得(λs−λ1)(k11x11+⋯+k1j1x1j1)+⋯+(λs−λs−1)(k(s−1)1x(s−1)1+⋯+k(s−1)js−1x(s−1)js−1)=0由特征值互不相等及假设知k11=⋯=k1j1=⋯=k(s−1)1=⋯=k(s−1)js−1=0故ks1xs1+⋯+ksjsxsjs=0,由题设知ks1=⋯=ksjs=0,故命题对s=i+1时也成立。故由归纳假设,原命题成立。得证。
-
特征值与迹、行列式的关系
(注意,以下结论通过特征多项式的展开式可以得到)
设n阶方阵A的特征值是λ1,λ2,⋯,λn(重特征值按重数算),则
- det(A)=λ1λ2⋯λn
- tr(A)=λ1+λ2+⋯+λn
-
特殊矩阵的特征值与特征向量
-
λ是对角矩阵A的特征值的充要条件为λ在A的主对角线上,且A的每个特征值的代数重数等于其在主对角线上出现的次数
-
λ是上(下)三角矩阵A的特征值的充要条件为λ在A的主对角线上,且A的每个特征值的代数重数等于其在主对角线上出现的次数
- 酋矩阵的特征值的模长都是1
证明:
设U是一个酋矩阵,λ是U的一个特征值,Ux=λx,x=0,则(Ux)H(Ux)=(λx)H(λx),即xHUHUx=xHx=∣λ∣2xHx,因为x=0所以xHx>0,所以∣λ∣2=1,即∣λ∣=1。
- n阶对角矩阵A有n个线性无关的特征向量
证明:
设A=diag(a1,a2,...,an),In=[e1e2⋯en]是n阶单位矩阵。计算可得任意i=1,2,...,n有Aei=aiei,由于ei=0,故ei是A的特征向量。这就证明了单位矩阵In的列向量均为A的特征向量,由于单位矩阵In的列向量组是线性无关的,故A有n个线性无关的特征向量。
- 分块矩阵的特征值
设A∈Cm×m,B∈Cn×n,A的m个特征值依次为λ1,λ2,⋯,λm,B的n个特征值依次为λm+1,λm+2,⋯,λm+n,则分块矩阵[AO∗B]和[A∗OB]的m+n个特征值依次为λ1,λ2,⋯,λm+n。
证:(以[AO∗B]为例)
根据拉普拉斯展开式计算上述分块矩阵的特征多项式:det(λIm+n−[AO∗B])=det[λIm−AO∗λIn−B]=det(λIm−A)det(λIn−B)可见特征方程的根为λ1,λ2,⋯,λm+n,证毕。
-
A,AT,AH的特征值的关系
只要找到A,AT,AH的特征多项式的关系,就能得到下面两个结论,读者自证不难^_^。
-
σ(A)=σ(AT)且A与AT的同一特征值的代数重数相等
-
A与AH的特征值互为共轭且A的特征值λ的代数重数与AH的特征值λˉ的代数重数相等
-
AAH和AHA的特征值的关系(注意AAH和AHA的阶数不一定相同)
-
AAH和AHA的特征值均为非负实数
证明:
考虑特征方程AAHx=λx,用xH左乘两端得xHAAHx=(AHx)H(AHx)=λxHx,即∣∣AHx∣∣2=λ∣∣x∣∣2,故AAH的特征值均为非负实数。同理可证AHA的特征值均为非负实数。
-
σ(AHA)−{0}=σ(AAH)−{0}(即AAH和AHA有相同的非零特征值)
证明:
考虑AAH的特征方程AAHx=λx,λ=0,x=0,设y=AHx,由∣∣AHx∣∣2=λ∣∣x∣∣2知∣∣AHx∣∣>0,故y=0。用AH左乘AAHx=λx两端得AHAy=λy,可见λ也是AHA的特征值。同理可证AHA的非零特征值都是AAH的特征值。得证。
【推广】设A∈Cm×n,B∈Cn×m,则σ(AB)−{0}=σ(BA)−{0}
证:
设ABx=λx,其中λ=0,x=0,则有Bx=0(若Bx=0,则λx=ABx=0与λ=0,x=0矛盾)。用B左乘式的两端,得B(ABx)=BA(Bx)=B(λx)=λ(Bx),故λ是BA的一个特征值。同理可证BA的非零特征值都是AB的特征值。
【注】实际上有更强的结论:不但AB与BA有相同的非零特征值,而且AB与BA的同一非零特征值的代数重数也是相等的,证明详见后文的Sylvester定理。
-
AAH和AHA的同一个非零特征值的几何重数相等
证明:
该结论实际上可推广为AB和BA的同一非零特征值的几何重数相等,下面证明推广后的结论。
【推广】设A∈Cm×n,B∈Cn×m,则AB和BA的同一非零特征值的几何重数相等
证:
设λ是AB和BA的一个非零特征值,AB的特征子空间N(λI−AB)的维数为s。取N(λI−AB)的一组基x1,x2,⋯,xs,则易验证Bx1,Bx2,⋯,Bxs都是BA关于λ的特征向量,有Bx1,Bx2,⋯,Bxs∈N(λI−BA)。设k1Bx1+⋯+ksBxs=0,用A左乘该式两端得λ(k1x1+⋯+ksxs)=0,由于λ=0,所以k1x1+⋯+ksxs=0,由于x1,x2,⋯,xs线性无关,故k1=⋯=ks=0,故Bx1,Bx2,⋯,Bxs是线性无关的。这说明dimN(λI−BA)⩾s=dimN(λI−AB)。同理可证dimN(λI−AB)⩾dimN(λI−BA)。故dimN(λI−AB)=dimN(λI−BA),得证。
-
AAH和AHA的同一个非零特征值的代数重数相等
证明:由后文Sylvester定理直接可得。
【注】以上结论都限定在特征值非零的情况下,这是因为可能AAH和AHA两者中一个有零特征值,而另一个没有零特征值。例如,设A是m×n矩阵,当m>n且A列满秩时,容易证明0一定是AAH的一个特征值,而一定不是AHA的一个特征值。