幂法

含义

幂法是计算矩阵的按模最大的特征值和相应特征向量的一种向量迭代法

适用于大型稀疏矩阵

基础知识

求矩阵A特征值问题等价于求A的特征方程。

$|\lambda E-A| = \left[ \begin{matrix} \lambda-a_{11} & -a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda-a_{22} & \cdots & -a_{2n} \\ \cdots & \cdots & \cdots & \cdots \\ \lambda-a_{n1} & -a_{n2} & \cdots & \lambda-a_{nn} \\ \end{matrix} \right] = 0$
求A的属于特征值\lambda的特征向量等价求
$(\lambda E -A)x =0$ 的非零解
$设\lambda 为A\in R^{x*n}的特征值，x称为A的与特征值\lambda 相对应的一个特征向量，即Ax = \lambda x,（x\neq0）,则有：$
（１） $cx（c\neq0）也是A的与特征值\lambda 相对应的一个特征向量,即Acx = \lambda cx$
（２） $\lambda ^k为A^k的特征值，A^kx=\lambda ^kx$

思想

任取非零向量 $x_0 =(x_1^{(0)},x_x^{(0)},\cdots,x_n^{(0)})$
特征向量构成n维空间的一组基.任取的初始向量X(0)由它们的线性组合给出
$x_0 =a_1v_1+a_2v_2+…+a_nv_n$
$假设a_1\neq0,由此构造向量序列x_k = Ax_{k-1}，k=1,2,3...$
其中， $x_1=Ax_0=a_1Av_1+a_2Av_2+...+a_nAv_n=$
$＝a_1\lambda_1v_1+a_2\lambda_2v_2+...+a_n\lambda_nv_n$

$x_2=Ax_1=a_1\lambda_1Av_1+a_2\lambda_2Av_2+...+a_n\lambda_nAv_n=$
$＝a_1\lambda_1^2v_1+a_2\lambda_2^2v_2+...+a_n\lambda_n^2v_n$

得到向量序列：
$x_1＝a_1\lambda_1v_1+a_2\lambda_2v_2+...+a_n\lambda_nv_n$
$x_2= a_1\lambda_1^2v_1+a_2\lambda_2^2v_2+...+a_n\lambda_n^2v_n$
$\dots$
$x_k= a_1\lambda_1^kv_1+a_2\lambda_2^kv_2+...+a_n\lambda_n^kv_n$

下面按模最大特征值λ1是单根的情况讨论:
$x_k= a_1\lambda_1^kv_1+a_2\lambda_2^kv_2+...+a_n\lambda_n^kv_n=\lambda_1^k[a_1v_1 +a_2(\frac{\lambda_2}{\lambda_1})^kv_2+...+a_n(\frac{\lambda_n}{\lambda_1})^2v_n]=\lambda_1^k(a_1v_1+\varepsilon_k)$

$\varepsilon_k=a_2(\frac{\lambda_2}{\lambda_1})^kv_2+...+a_n(\frac{\lambda_n}{\lambda_1})^2v_n$
由于 $|\lambda_1|>|\lambda_2|>...>|\lambda_n|　　故|\frac{\lambda_j}{\lambda_1}|<1(j=2,3,...n),故：$
$\lim_{k\rightarrow+\infty}\varepsilon_k=0　　则有\lim_{k\rightarrow+\infty}\frac{1}{\lambda_1^k}x_k=\lim_{k\rightarrow+\infty}\frac{\lambda_1^k(a_1v_1+\varepsilon_k)}{\lambda_1^k}=a_1v_1$

$\lim_{k\rightarrow+\infty}\frac{1}{\lambda_1^k}x_k=a_1v_1 就是\lambda_1对应的特征向量$
$用向量x_{k+1}的第i个分量与向量x_k的第i个分量之比的极限：$
$\lim_{k\rightarrow+\infty}\frac{(x_{k+1})_i}{(x_k)_i}=\lim_{k\rightarrow+\infty}\frac{\lambda_1^{k+1}(a_1v_1+\varepsilon_{k+1})_i}{\lambda_1^k(a_1v_1+\varepsilon_k)_i}=\lim_{k\rightarrow+\infty}\frac{\lambda_1[a_1(v_1)_i+(\varepsilon_{k+1})_i]}{a_1(v_1)_i+(\varepsilon_k)_i}=\lambda_1$

得到两个极限：
$\lim_{k\rightarrow+\infty}\frac{1}{\lambda_1^{k}}x_k=a_1v_1　　　\lim_{k\rightarrow+\infty}\frac{(x_{k+1})_i}{(x_k)_i}=\lambda_1$

因此当k趋近无穷时，就能近似得到按模最大的特征值和对应的特征向量：
$\lambda_1 \approx \frac{(x_{k+1})_i}{(x_k)_i} 　　　x_k\approx\lambda_1^k a_1v_1$

因此得幂方法的迭代公式： $x_k = Ax_{k-1}　　k=1,2,...$
当k充分大时，有：
$\begin{cases} \lambda_1 \approx \frac{(x_{k+1})_i}{(x_k)_i} \\ x_k\approx\lambda_1^k a_1v_1 \end{cases}$

存在的问题是：当 $|\lambda_1|>1时，x_k中不为0的分量会随着k\rightarrow \infty而趋于 \infty，计算机计算时会造成溢出，当$ |\lambda_1|<1时,x_k中的分量会随着k\rightarrow \infty而趋于0$，

实际计算时，为了避免计算过程中出现绝对值过大或过小的数参加运算，通常在每步迭代时，将向量“归一化”即用的按模最大的分量。
修改计算公式：
$\begin{cases} y_k=Ax_{k-1}\\ m_k=max(y_k) & (k=1,2,...)\\ x_k=y_k/m_k \end{cases}$
上式中 $m_k是向量y_k中绝对值最大的一个分量，这时x_k分量的模最大为1$
当k充分大时，有：
$\begin{cases} \lambda_1 \approx m_k \\ v_1 \approx x_k \end{cases}$

实例

求矩阵
$\left[ \begin{matrix} 2 &3 & 2 \\ 10 & 3 & 4 \\ 3 & 6 & 1 \end{matrix} \right] 的主特征值和其对应的特征向量$
根据迭代公式：
$\begin{cases} y_k=Ax_{k-1}\\ m_k=max(y_k) & (k=1,2,...)\\ x_k=y_k/m_k \end{cases}$
取 $x_0=(0,0,1)^T,则有：$
$y_1 = (2,4,1)^T，m_1 = 4，x_1=\frac{1}{m_1}y_1=(0.5,1,0.25)^T$
直到k=8
幂法求解矩阵特征值及特征向量

Python实现

#-*- coding:utf-8 -*-
#@author：whs
#@time: 2019/3/2111:25

import numpy as np


def Solve(mat, max_itrs, min_delta):
    """
    mat 表示矩阵
    max_itrs 表示最大迭代次数
    min_delta 表示停止迭代阈值
    """
    itrs_num = 0
    delta = float('inf')
    N = np.shape(mat)[0]
    # 所有分量都为1的列向量
    x = np.ones(shape=(N, 1))
    #x = np.array([[0],[0],[1]])
    while itrs_num < max_itrs and delta > min_delta:
        itrs_num += 1
        y = np.dot(mat, x)
        #print(y)
        m = y.max()
        #print("m={0}".format(m))
        x = y / m
        print("***********第{}次迭代*************".format(itrs_num))
        print("y = ",y)
        print("m={0}".format(m))
        print("x^T为：",x)
        print(
            "===================================")


IOS = np.array([[2, 3, 2],
                [10, 3, 4],
                [3, 6, 1]], dtype=float)
Solve(IOS, 10, 1e-10)

输出：

***********第1次迭代*************
y =  [[ 7.]
 [17.]
 [10.]]
m=17.0
x^T为： [[0.41176471]
 [1.        ]
 [0.58823529]]
===================================
***********第2次迭代*************
y =  [[5.        ]
 [9.47058824]
 [7.82352941]]
m=9.470588235294118
x^T为： [[0.52795031]
 [1.        ]
 [0.82608696]]
===================================
***********第3次迭代*************
y =  [[ 5.70807453]
 [11.58385093]
 [ 8.40993789]]
m=11.58385093167702
x^T为： [[0.49276139]
 [1.        ]
 [0.72600536]]
===================================
***********第4次迭代*************
y =  [[ 5.43753351]
 [10.83163539]
 [ 8.20428954]]
m=10.831635388739945
x^T为： [[0.50200485]
 [1.        ]
 [0.75743775]]
===================================
***********第5次迭代*************
y =  [[ 5.5188852 ]
 [11.04979951]
 [ 8.2634523 ]]
m=11.049799514875502
x^T为： [[0.49945569]
 [1.        ]
 [0.74783731]]
===================================
***********第6次迭代*************
y =  [[ 5.49458599]
 [10.98590609]
 [ 8.24620437]]
m=10.985906091381928
x^T为： [[0.50014864]
 [1.        ]
 [0.75061668]]
===================================
***********第7次迭代*************
y =  [[ 5.50153064]
 [11.00395312]
 [ 8.2510626 ]]
m=11.003953118800313
x^T为： [[0.49995948]
 [1.        ]
 [0.74982713]]
===================================
***********第8次迭代*************
y =  [[ 5.49957322]
 [10.99890329]
 [ 8.24970556]]
m=10.998903290037243
x^T为： [[0.50001105]
 [1.        ]
 [0.75004801]]
===================================
***********第9次迭代*************
y =  [[ 5.50011813]
 [11.00030258]
 [ 8.25008117]]
m=11.000302582696586
x^T为： [[0.49999699]
 [1.        ]
 [0.74998675]]
===================================
***********第10次迭代*************
y =  [[ 5.49996747]
 [10.99991685]
 [ 8.24997771]]
m=10.999916852432536
x^T为： [[0.50000082]
 [1.        ]
 [0.75000364]]
===================================

幂法求解矩阵特征值及特征向量

文章目录

幂法

含义

基础知识

思想

实例

Python实现

相关推荐