矩阵论基础

矩阵是数学中的一个重要的基本概念,是代数学的一个主要研究对象,也是数学研究和应用的一个重要工具。“矩阵”这个词是由西尔维斯特首先使用的,他是为了将数字的矩形阵列区别于行列式而发明了这个述语。而实际上,矩阵这个课题在诞生之前就已经发展的很好了。从行列式的大量工作中明显的表现出来,为了很多目的,不管行列式的值是否与问题有关,方阵本身都可以研究和使用,矩阵的许多基本性质也是在行列式的发展中建立起来的。

1855 年,埃米特(C.Hermite,1822~1901)证明了别的数学家发现的一些矩阵类的特征根的特殊性质,如现在称为埃米特矩阵的特征根性质等。后来,克莱伯施(A.Clebsch,1831~1872)、布克海姆(A.Buchheim)等证明了对称矩阵的特征根性质。泰伯(H.Taber)引入矩阵的迹的概念并给出了一些有关的结论。 在矩阵论的发展史上,弗罗伯纽斯(G.Frobenius,1849-1917)的贡献是不可磨灭的。他讨论了最小多项式问题,引进了矩阵的秩、不变因子和初等因子、正交矩阵、矩阵的相似变换、合同矩阵等概念,以合乎逻辑的形式整理了不变因子和初等因子的理论,并讨论了正交矩阵与合同矩阵的一些重要性质。 1854 年,约当研究了矩阵化为标准型的问题。1892年,梅茨勒(H.Metzler)引进了矩阵的超越函数概念并将其写成矩阵的幂级数的形式。傅立叶、西尔和庞加莱的著作中还讨论了无限阶矩阵问题,这主要是适用方程发展的需要而开始的。

矩阵

矩阵类型

向量的类型根据元素的实际意义不同可以分为,

  1. 物理向量

    泛指既有幅值,又有方向的物理量,如速度、加速度、位移等。

  2. 几何向量

    为了将物理向量可视化,常用带方向的线段表示。这种有向线段出称为几何向量。

  3. 代数向量

    几何向量可以用代数形式表示。例如,若平面上的几何向量v=abv=\vec{ab}中点a的坐标为(a1,a2)(a_1,a_2),点b的坐标为(b1,b2)(b_1,b_2),则该几何向量可以表示为代数形式[b1a1b2a2]\begin{bmatrix} b_1-a_1\\ b_2-a_2\\ \end{bmatrix} ​

其中,根据元素的类型不同,代数向量又可以分为以下三种,

  1. 常数向量

    向量中的元素为实数或复数

  2. 函数向量

    向量中的元素包含函数值,如x=[1,x,x2,...,xn]T\mathbf{x}=[1,x,x^2,...,x^n]^T

  3. 随机向量

    向量中的元素为随机变量或随机过程,如x=[x1(n),x2(n),...,xm(n)]T\mathbf{x}=[x_1(n),x_2(n),...,x_m(n)]^T,其中x1(n),x2(n),...,xm(n)x_1(n),x_2(n),...,x_m(n)mm个随机过程或随机信号

矩阵运算

转置、共轭、共轭转置、加法、乘法和求逆

矩阵的基本运算包括矩阵的转置、共轭、共轭转置、加法、乘法和求逆
A=[a11a12a1ma21a22a2mam1am2amm] A=\begin{bmatrix}{a_{11}} & {a_{12}} & {\cdots} & {a_{1 m}} \\ {a_{21}} & {a_{22}} & {\cdots} & {a_{2 m}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}} & {a_{m 2}} & {\cdots} & {a_{m m}}\end{bmatrix}

  1. 矩阵AA转置记为ATA^T,其元素定义为[AT]ij=aji[A^T]_{ij}=a_{ji}

AT=[a11a21am1a12a22am2a1ma2mamm] A^T=\begin{bmatrix}{a_{11}} & {a_{21}} & {\cdots} & {a_{m1}} \\ {a_{12}} & {a_{22}} & {\cdots} & {a_{m2}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}} & {a_{2m}} & {\cdots} & {a_{m m}}\end{bmatrix}

  1. 矩阵AA共轭记为AA^*,其元素定义为[A]ij=aij[A^*]_{ij}=a_{ij}^*

A=[a11a12a1ma21a22a2mam1am2amm] A^*=\begin{bmatrix}{a_{11}^*} & {a_{12}^*} & {\cdots} & {a_{1 m}^*} \\ {a_{21}^*} & {a_{22}^*} & {\cdots} & {a_{2 m}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}^*} & {a_{m 2}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix}

  1. 矩阵AA共轭转置记为AHA^H,其元素定义为[AH]ij=aji[A^H]_{ij}=a_{ji}^*

AT=[a11a21am1a12a22am2a1ma2mamm] A^T=\begin{bmatrix}{a_{11}^*} & {a_{21}^*} & {\cdots} & {a_{m1}^*} \\ {a_{12}^*} & {a_{22}^*} & {\cdots} & {a_{m2}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}^*} & {a_{2m}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix}
共轭转置又被称为Hermitian伴随、Hermitian转置或Hermitian共轭,A=ATA=A^T的实方阵称为对称矩阵,A=AHA=A^H的复方阵称为Hermitian矩阵

  1. 方阵AA逆矩阵记为A1A^{-1}A1A^{-1}被定义为满足以下关系AA1=AA1=IAA^{-1}=AA^{-1}=\mathbf{I}

  2. 加法与乘法

    • 两个m×nm\times n矩阵ABA、B加法[A+B]ij=aij+bij[A+B]_{ij}=a_{ij}+b_{ij}

    • m×nm\times n大小的矩阵AA1×n1\times n大小的向量x=[x1,...,xn]x=[x_1,...,x_n]相乘,[Ax]i=j=1naijxj,i=1,...,m[Ax]_i=\sum_{j=1}^na_{ij}x_j,\quad i=1,...,m

    • m×nm\times n​大小的矩阵AA​n×rn\times r​大小的矩阵BB​相乘,[AB]ij=k=1naikbkj,i=1,...,m;j=1,...,r[AB]_{ij}=\sum_{k=1}^na_{ik}b_{kj},\quad i=1,...,m;j=1,...,r​

    需要注意的是,一般来说,矩阵乘积是不满足交换律的

性质

关于矩阵中转置、共轭、共轭转置、求逆的性质

  1. 分配律

    (A+B)=A+B,(A+B)T=AT+BT,(A+B)H=AH+BH(A+B)^*=A^*+B^*,\quad (A+B)^T=A^T+B^T,\quad (A+B)^H=A^H+B^H​

  2. 矩阵乘积中转置、共轭转置、求逆的性质

    (AB)T=BTAT,(AB)H=BHAH,(AB)1=B1A1(AB)^T=B^TA^T,\quad (AB)^H=B^HA^H,\quad (AB)^{-1}=B^{-1}A^{-1}​

  3. 转置、共轭、共轭转置与求逆交换

    (A)1=(A1),(AT)1=(A1)T,(AH)1=(A1)H(A^*)^{-1}=(A^{-1})^*,\quad (A^T)^{-1}=(A^{-1})^T,\quad (A^H)^{-1}=(A^{-1})^H

矩阵函数

除了上述矩阵的基本运算之外,还有矩阵函数

  1. 三角函数
    sin(A)=n=0(1)nA2n+1(2n+1)!=A13!A3+15!A5cos(A)=n=0(1)nA2n(2n)!=I12!A2+14!A4 \begin{aligned} \sin (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n+1}}{(2 n+1) !}=\boldsymbol{A}-\frac{1}{3 !} \boldsymbol{A}^{3}+\frac{1}{5 !} \boldsymbol{A}^{5}-\cdots \\ \cos (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n}}{(2 n) !}=\boldsymbol{I}-\frac{1}{2 !} \boldsymbol{A}^{2}+\frac{1}{4 !} \boldsymbol{A}^{4}-\cdots \end{aligned}

  2. 指数函数
    eA=n=01n!An=I+A+12A2+13!A3+eA=n=01n!(1)nAn=IA+12A213!A3+eAt=I+At+12A2t2+13!A3t3+ \begin{aligned} \mathrm{e}^{A} &=\sum_{n=0}^{\infty} \frac{1}{n !} \boldsymbol{A}^{n}=\boldsymbol{I}+\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}+\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{-\boldsymbol{A}} &=\sum_{n=0}^{\infty} \frac{1}{n !}(-1)^{n} \boldsymbol{A}^{n}=\boldsymbol{I}-\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}-\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{\boldsymbol{A} t} &=\boldsymbol{I}+\boldsymbol{A} t+\frac{1}{2} \boldsymbol{A}^{2} t^{2}+\frac{1}{3 !} \boldsymbol{A}^{3} t^{3}+\cdots \end{aligned}

  3. 对数函数
    ln(I+A)=n=1(1)n1nAn=A12A2+13A3 \ln (I+A)=\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n} A^{n}=A-\frac{1}{2} A^{2}+\frac{1}{3} A^{3}-\cdots

  4. 矩阵导数
    dAdt=A˙=[da11dtda12dtda1ndtda21dtda22dtda2ndtdam1dtdam2dtdamndt] \frac{\mathrm{d} \boldsymbol{A}}{\mathrm{d} t}=\dot{\boldsymbol{A}}=\left[ \begin{array}{cccc}{\frac{\mathrm{d} a_{11}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{12}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{1 n}}{\mathrm{d} t}} \\ {\frac{\mathrm{d} a_{21}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{22}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{2 n}}{\mathrm{d} t}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\frac{\mathrm{d} a_{m 1}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{m 2}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{m n}}{\mathrm{d} t}}\end{array}\right]

  5. 矩阵积分
    Adt=[a11dta12dta1ndta21dta22dta2ndtam1dtam2dtamndt] \int \boldsymbol{A} \mathrm{d} t=\left[ \begin{array}{cccc}{\int a_{11} \mathrm{d} t} & {\int a_{12} \mathrm{d} t} & {\cdots} & {\int a_{1 n} \mathrm{d} t} \\ {a_{21} \mathrm{d} t} & {\int a_{22} \mathrm{d} t} & {\cdots} & {\int a_{2 n} \mathrm{d} t} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\int a_{m 1} \mathrm{d} t} & {\int a_{m 2} \mathrm{d} t} & {\cdots} & {\int a_{m n} \mathrm{d} t}\end{array}\right]

特殊矩阵

对角矩阵、零矩阵、单位矩阵

幂等矩阵

幂等矩阵AA具有以下性质:

矩阵论基础

幂单矩阵

又被称为对合矩阵,若A2=AA=IA^2=AA=\mathbf{I}​,若AA​为幂单矩阵,则函数f()f(\cdot)​具有以下性质:
f(sI+tA)=12[(I+A)f(s+t)+(IA)f(st)] f(s \boldsymbol{I}+t \boldsymbol{A})=\frac{1}{2}[(\boldsymbol{I}+\boldsymbol{A}) f(s+t)+(\boldsymbol{I}-\boldsymbol{A}) f(s-t)]
其中,幂等矩阵和幂单矩阵也有关系,矩阵AA是幂单矩阵,当且仅当12(A+I)\frac{1}{2}\boldsymbol({A}+\boldsymbol{I})

幂零矩阵

方阵AA被称为幂零矩阵,若A2=AA=OA^2=AA=\boldsymbol{O},若AA为幂单矩阵,则函数f()f(\cdot)具有以下性质:
f(sI+tA)=If(s)+tAf(s) f(s \boldsymbol{I}+t \boldsymbol{A})=\boldsymbol{I}f(s)+t\boldsymbol{A}f^{\prime}(s)


Source from: 《矩阵分析与应用》,张贤达