线代的部分知识点梳理

学习最优化导论过程中做的一点笔记,就当梳理知识点.

向量空间与矩阵

1.1 向量与矩阵

1.1.1 定义

nn 维向量 : 含有 nn个数的数组,如:

a=[a1a2a3an] \vec a= \begin{bmatrix} a_1\\ a_2\\ a_3\\ \vdots\\ a_n \end{bmatrix}

aia_i表示向量 a\vec a的第 ii个元素,定义 RR为全体实数组成的集合,那么实数组成的 nn维向量可表示为 RnR^n

nn 维行向量记为:
a=[a1,a2,,an] \vec a= \begin{bmatrix} a_1, a_2,\cdots, a_n \end{bmatrix}


1.1.2 运算及性质

向量加减:
a+b=[a1+b1,a2+b2,,an+bn] \vec a +\vec b= \begin{bmatrix} a_1+b_1, a_2+b_2,\cdots, a_n+b_n \end{bmatrix}

具有以下性质:
a+b=b+a(a+b)+c=a+(b+c):0=[0,0,0,,0]T,使a+0=a \vec a+ \vec b=\vec b+\vec a\\ \quad\\ (\vec a+ \vec b)+\vec c=\vec a+(\vec b+\vec c)\\ \quad\\ 存在零向量:\textbf{0}=\begin{bmatrix} 0,0,0,\cdots,0 \end{bmatrix}^T,使得\vec a+\textbf{0}=\vec a

向量乘积——与标量 α\alpha R\in R 的乘积

αa=[αa1,αa2,,αan,]\alpha \vec a=\begin{bmatrix} \alpha a_1,\alpha a_2,\cdots,\alpha a_n, \end{bmatrix}

具有以下的性质:
α(a+b)=αa+αbα(a+b)=αa+αbα(βa)=(αβ)a \alpha(\vec{a}+\vec{b})=\alpha\vec{a}+\alpha\vec{b}\\ \alpha(\vec{a}+\vec{b})=\alpha\vec{a}+\alpha\vec{b}\\ \alpha(\beta\vec{a})=(\alpha\beta)\vec{a}\\

1.1.3 线性相关与线性组合

① 如果方程
α1a1+α2a2++αnan=0 \alpha_1\vec{a}_1+\alpha_2\vec{a}_2+\cdots+\alpha_n\vec{a}_n=0\\
其中 αi(i=1,,k)\alpha_i(i=1,\cdots, k)都等于0,那么 向量集 {a1,a2,,an\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_n}是 线性无关的 ,反之称为线性相关。(实际上,包含0向量的集合都是线性相关的)

② 给定向量 a\vec{a}, 如果存在标量 α1,α2,,αk\alpha_1,\alpha_2,\cdots,\alpha_k,使得
a=α1a1+α2a2++αnak \vec{a}=\alpha_1\vec{a}_1+\alpha_2\vec{a}_2+\cdots+\alpha_n\vec{a}_k\\

aa1,a2,,ak\vec{a}为\vec{a}_1, \vec{a}_2, \cdots, \vec{a}_k的线性组合

结合①和②给出一个命题:

向量集 {a1,a2,,ak\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k}是线性相关的,当且仅当集合中的一个向量可以被视为其他向量的线性组合。

线代的部分知识点梳理

进一步来观察一下线性相关和线性无关,现在我们给出两个二维的向量集(R2R^2):
a=[2,32,3]b=[1,63,4] \vec{a}= \begin{bmatrix} 2,3\\ 2,3\\ \end{bmatrix} \qquad \vec{b}= \begin{bmatrix} 1,6\\ 3,4\\ \end{bmatrix}
线代的部分知识点梳理线代的部分知识点梳理

a\vec{a}b\vec{b}的每一个向量都画出来:

在向量 a\vec{a}的图中,a1,a2\vec{a}_1,\vec{a}_2 共线,二者的线性组合只能表示同样在这条线上的向量,不能完全表示整个二维平面,并且
3a12+1a2=0 \frac{-3\vec{a}_1}{2}+1\vec{a}_2 =0

在向量 b\vec{b}的图中,b1,b2\vec{b}_1,\vec{b}_2 的线性组合可以表示整个二维平面的所有向量。

线性相关——至少有一对向量共线;线性无关——不存在一组共线向量


1.1.4 生成空间

① 假定a1,a2,,ak\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_kRnR^n中的任意向量,他们的所有线性组合的集合称为a1,a2,,ak\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k 张成的子空间:
span[a1,a2,,ak]={i=1kαiai:α1,,αkR} span[\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k]= \{\sum_{i=1}^{k} \alpha_i\vec{a}_i:\alpha_1,\cdots,\alpha_k \in R \}

如果 a\vec{a} 能够被表示为 a1,a2,,ak\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k的线性组合,那么有
span[a1,a2,,ak]=span[veca1,a2,,ak,a] span[\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k]=span[vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k,\vec{a}]

② 给定一个子空间,如果存在线性无关的向量集合 {a1,a2,,ak}\{\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k\} 使得 子空间=span[a1,a2,,ak]span[\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k] ,那么这组向量就是子空间的一组基。所有基都包含同样数量的向量,这个数量称为子空间的维数,记为dimVdim V.

给出一命题:
如果 {a1,a2,,ak}\{\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k\}是子空间的一组基,那么子空间中的任意向量 a\vec{a}都可以唯一的表示为:
a=α1a1+α2a2++αnak \vec{a}=\alpha_1\vec{a}_1+\alpha_2\vec{a}_2+\cdots+\alpha_n\vec{a}_k
其中,αiR,i=1,2,,k\alpha_i\in R,i=1,2,\cdots,k
线代的部分知识点梳理

RnR^n 的标准基:

e1=[10000]e2=[01000]e2=[00100]en=[00001] \vec{e}_1= \begin{bmatrix} 1\\ 0\\ 0\\ \vdots \\ 0\\ 0\\ \end{bmatrix} \quad \vec{e}_2=\begin{bmatrix} 0\\ 1\\ 0\\ \vdots\\ 0\\ 0\\ \end{bmatrix} \quad \vec{e}_2=\begin{bmatrix} 0\\ 0\\ 1\\ \vdots\\ 0\\ 0\\ \end{bmatrix} \cdots \vec{e}_n=\begin{bmatrix} 0\\ 0\\ 0\\ \vdots\\ 0\\ 1\\ \end{bmatrix}

在标准基下,向量 x\vec{x}可表示为:
x=[x1x2x3xn]=x1e1+x2e2++xnen \vec{x}=\begin{bmatrix} x_1\\ x_2\\ x_3\\ \vdots\\ x_n\\ \end{bmatrix} =x_1\vec{e}_1+x_2\vec{e}_2+\cdots+x_n\vec{e}_n

1.1.5 矩阵

矩阵是指行列数组,通常用大写粗体字母表示(AA)。mmnn列矩阵称为m×nm\times n矩阵,记为:
A=[a11a12a1na21a22a2nam1am2amn] A=\begin{bmatrix} a_{11}& a_{12}&\cdots&a_{1n}\\ a_{21}& a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{m1}& a_{m2}&\cdots&a_{mn}\\ \end{bmatrix}

转置记为:
AT=[a11a21am1a12a22am2a1na2namn] A^T=\begin{bmatrix} a_{11}& a_{21}&\cdots&a_{m1}\\ a_{12}& a_{22}&\cdots&a_{m2}\\ \vdots&\vdots&\ddots&\vdots\\ a_{1n}& a_{2n}&\cdots&a_{mn}\\ \end{bmatrix}
kk列用ak\vec{a}_k表示:
vecen=[a1ka2kamk] vec{e}_n=\begin{bmatrix} \vec{a}_{1k}\\ \vec{a}_{2k}\\ \vdots\\ \vec{a}_{mk} \end{bmatrix}

Rm×nR^{m\times n} 表示所有 m×nm\times n矩阵组成的集合

矩阵的秩记作 rankArank ArankArank A其实就是 span[a1,a2,,ak]span[\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_k]的维数。

以下情况,矩阵AA的秩不会繁盛变化:
①矩阵AA的某个(些)列乘以非零标量 ②矩阵内部交换次序 ③矩阵中加入一列,该列是其他列的线性组合。


如果矩阵 AA的行数等于列数,称之为 方阵

行列式是每个方阵对应的一个标量,记作 detAdetAA|A|。方阵的行列式是个列的函数,具有以下性质

1、对于任意的 αβR\alpha\beta\in Rak1,ak2R\vec{a}_{k}^{1},\vec{a}_{k}^{2}\in R

det[a1,,ak1,,αak(1)+βak(2),ak+1,,an]=αdet[a1,,ak1,,ak(1),ak+1,,an]+βdet[a1,,ak1,,ak(2),ak+1,,an] det [\vec{a}_1,\cdots,\vec{a}_{k-1,},\alpha\vec{a}_{k}^{(1)}+\beta\vec{a}_{k}^{(2)},\vec{a}_{k+1},\cdots,\vec{a}_n]\\ =\alpha det[\vec{a}_1,\cdots,\vec{a}_{k-1,},\vec{a}_{k}^{(1)},\vec{a}_{k+1},\cdots,\vec{a}_n]\\ +\beta det[\vec{a}_1,\cdots,\vec{a}_{k-1,},\vec{a}_{k}^{(2)},\vec{a}_{k+1},\cdots,\vec{a}_n]\\

2、如果对于某个 kk,有 ak=ak+1\vec{a}_k=\vec{a}_{k+1},那么有 detA=0detA=0

3、RnR^n的标准基组成的矩阵,det=1det=1

方阵行列式的具体知识点之后慢慢补充


1.2 线性方程组

1.2.1 基础概念

给定包含 nn个未知量的 mm个方程:
a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=b1 \begin{aligned} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n&=b_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n&=b_2\\ &\vdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n&=b_1\\ \end{aligned}
可写成矩阵模式:
Ax=b Ax=b
AA为系数矩阵:
A=[a1,a2,,an] A=[a_1,a_2,\cdots,a_n]
增广矩阵定义为:
[A,b]=[a1,a2,,an,b] [A,b]=[a_1,a_2,\cdots,a_n,b]
未知数向量:
x=[x1x2xn] \textbf{x}= \begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{bmatrix}


1.2.2 方程解的情况

①、方程组 Ax=bAx=b有解,当且仅当
rankA=rank[A,b] rankA=rank[A,b]
线代的部分知识点梳理

换个角度想,mm个列向量表示在坐标系中的 mm个不同的方向,x1,,xnx_1,\cdots,x_n表示对应的列向量在自身方向上移动的距离,bb就是最终要到达的向量,如果在一个三维空间中,要表示空间中的任意一点,需要三个不共线的向量组合才能实现,这就要求提供方向的向量子空间要包含目标向量。

②、考虑方程Ax=bAx=b,其中ARm×nA \in R^{m\times n}rankA=mrankA=m.可以通过对 nmn-m个未知数赋任意值并求解其他未知数从而获得解。

rankA=mrankA=m我们可以得知它是一个满秩矩阵,系数矩阵的子空间覆盖了整个RmR^{m};选取 mm个线性无关的向量,并把剩下 nmn-m项的移项:
a1x1+a2x2++anxm=bam+1xm+1xnan a_{1}x_1+a_{2}x_2+\cdots+a_{n}x_m=b-a_{m+1}x_{m+1}-\cdots-x_na_n\\
xm+1,,xnx_{m+1},\cdots,x_n赋值,并将左边的向量组整合为方阵 BB,可写成:
B[x1x2xm]=[bam+1xm+1xnan] B\begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_m\\ \end{bmatrix} =[b-a_{m+1}x_{m+1}-\cdots-x_na_n]
明显 detB0detB\ne 0,所以左乘B1B^{-1}:
[x1x2xm]=B1[bam+1xm+1xnan] \begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_m\\ \end{bmatrix} =B^{-1}[b-a_{m+1}x_{m+1}-\cdots-x_na_n]


1.3 內积和范数

1.3.1 实数

实数 aa的绝对值记为a|a|,定义为:
a={aa0aa<0 |a|=\begin{cases} a&a\geq0\\ -a&a<0 \end{cases}
有以下公式成立:

1. a=a|a|=|-a|

2. aaa-|a|\leq a\leq|a|

3. a+ba+b|a+b|\leq |a|+|b|

4. ababa+b||a|-|b||\leq |a-b|\leq |a|+|b|

5. ab=ab|ab|=|a||b|

6. 如果 ac|a|\leq cbd|b|\leq d,那么有a+bc+d|a+b|\leq c+d

7. 不等式 a<b|a|<b等价于 b<a<b-b<a<b

8. 不等式 a>b|a|>b,等价于 a>ba>b或者 a>b-a>b


1.3.2 內积

对于 x,yRnx,y\in R^n,定义欧式內积为:
<x,y>=i=1nxiyi=xTy <\vec x,\vec y>=\sum_{i=1}^{n} x_iy_i=x^Ty
內积是一个实值函数<,>:Rn×RnR<\cdot,\cdot >:R^n\times R^n \to R,具有以下性质:

1. 非负性:<x,x>0<x,x>\geq 0, 当且仅当 x=0x=0时,<x,x>=0<x,x>=0

2. 对称性:<x,y>=<y,x><x,y>=<y,x>

3. 可加性:<x+y,z>=<x,z>+<y,z><x+y,z>=<x,z>+<y,z>

4. 齐次性:对于任意 rRr\in R,总有<rx,y>=r<x,y><rx,y>=r<x,y>成立

给定向量 x,yx,y,如果 <x,y>=0<x,y>=0, 那么 xxyy是正交的。(直观反映就是垂直)


1.3.3 范数

向量 xx的欧式范数定义为:
x=<x,x>=xTx ||x||=\sqrt {<x,x>}=\sqrt {x^Tx}
柯西-施瓦茨不等式:对于 RnR^n任意两个向量 xxyy<x,y>xy|<x,y>|\leq ||x||||y||

线代的部分知识点梳理

向量 xx的欧式范数x||x||具有如下性质:

1. 非负性:x0||x||\geq 0, 当且仅当x=0x=0时, x=0||x||=0

2. 齐次性:rx=rx,rR||rx||=|r| ||x||,r\in R

3. 三角不等式:x+y+x+y||x+y||\leq+||x||+||y||

欧式范数是通用向量范数的一个特例,通用向量范数是满足非负性、齐次性和三角不等式的任意函数。

pp范数:

xp={(x1p++xnp)1/p1p<max{x1,,xn}p= ||x||_p=\begin{cases} (|x_1|^p+\cdots+|x_n|^p)^{1/p}&1\leq p<\infty\\ max\{|x_1|,\cdots,|x_n|\}&p=\infty \end{cases}
(欧式范数就是2范数)

用范数定义连续函数。如果对于所有的 ε>0\varepsilon>0, 都存在一个 δ>0\delta>0,使得yx<δf(y)f(x)<ε||y-x||<\delta\Rightarrow||f(y)-f(x)||<\varepsilon, 那么函数 f:RnRm\textbf{f}:R^n\to R^m,在点 xx是连续的。

复数空间 CnC^n的內积定义 i=1nxiyˉi\sum_{i=1}^{n}x_i\bar{y}_i,上划线表示共轭,CnC^n上的內积是一个复值函数,具有以下性质:

1. <x,x>0<x,x>\geq0,当且仅当 x=0x=0时,<x,x>=0<x,x>=0

2. <x,y>=<y,x><x,y>=<y,x>

3. <x+y,z>=<x,z>+<y,z><x+y,z>=<x,z>+<y,z>

4. <rx,y>=r<x,y><rx,y>=r<x,y>,其中rCr\in C

利用性质1至性质4,可以推出其他的一些性质,如:
<x,r1y+r2y>=r1ˉ<x,y>+r2ˉ<x,z><x,r_1y+r_2y>=\bar{r_1}<x,y>+\bar{r_2}<x,z>
其中r1,r2Cr_1,r_2\in C


变换

2.1 linear map——线性映射

给定函数 ζ:RnRm\zeta :R^n \to R^m,如果

    1. 对于任意 xRnx\in R^naRa\in R,都有 ζ(ax)=aζ(x)\zeta(ax)=a\zeta(x)
    1. 对于任意 x,yRnx,y\in R^n,都有ζ(x+y)=ζ(x)+ζ(y)\zeta(x+y)=\zeta(x)+\zeta(y)

那么称函数 ζ\zeta为一个linear map(这部分的翻译有些问题,以英文为主)

接下来我们分别为 RnR^nRmR^m指定一组基,,令 y=ζ(x)y=\zeta(x),那么上述的 linearmaplinear\quad map就可以使用矩阵表示:
x=x1e1++xneny=y1e1++ymemy=[A1,1A1,2A1,nA2,1A2,2A2,nAm,1Am,2Am,n]x x'=x_1e_1+\cdots+x_ne_n\\ y'=y_1e_1+\cdots+y_me_m\\ \qquad\\ y' =\begin{bmatrix} A_{1,1}&A_{1,2}&\cdots&A_{1,n}\\ A_{2,1}&A_{2,2}&\cdots&A_{2,n}\\ \vdots&\vdots&\ddots&\vdots\\ A_{m,1}&A_{m,2}&\cdots&A_{m,n}\\ \end{bmatrix} x'
当两个向量空间指定的都是标准基,那么矩阵 AA满足:
ζ(x)=Ax \zeta(x)=Ax
矩阵 AA就是 ζ\zeta 的变换矩阵


上面一部分我们考虑的是从RnRmR^n\to R^m的线性变换(线性映射),接下来我们讨论在自身向量空间 RnRnR^n\to R^n中的变换。

我们先看一个例子:

给定一个linear map:ζ(x)=8x\zeta(x)=8x,n=2
ζ(x)=5x=[8008]x \zeta(x)=5x= \begin{bmatrix} 8&0\\ 0&8 \end{bmatrix} x
xx的每个标准基都进行变换然后合成一个矩阵,这样就确定了一个变换矩阵。

首先,令{e1,e2,,en}\{e_1,e_2,\cdots,e_n\}{e1,e2,,en}\{e_1^{'},e_2^{'},\cdots,e_n^{'}\}RnR^n中的两组基。定义矩阵 TT
T=[e1,e2,,en]1[e1,e2,,en] T=[e_1^{'},e_2^{'},\cdots,e_n^{'}]^{-1}[e_1,e_2,\cdots,e_n]
那么 TT称为从{e1,e2,,en}\{e_1,e_2,\cdots,e_n\}{e1,e2,,en}\{e_1^{'},e_2^{'},\cdots,e_n^{'}\}的转换矩阵,显然有:
[e1,e2,,en]=[e1,e2,,en]T [e_1,e_2,\cdots,e_n]=[e_1^{'},e_2^{'},\cdots,e_n^{'}]T
TT 的第 ii 列是 eie_i 关于{e1,e2,,en}\{e_1^{'},e_2^{'},\cdots,e_n^{'}\}的坐标向量,可以证明x=Txx'=Tx(后续补充证明过程)

考虑线性变换
ζ:RnRn \zeta:R^n\to R^n
AAζ\zeta关于{e1,e2,,en}\{e_1,e_2,\cdots,e_n\} 的矩阵表示,B为其关于{e1,e2,,en}\{e_1^{'},e_2^{'},\cdots,e_n^{'}\}的矩阵表示,令y=Axy=Axy=Bxy'=Bx',因此有y=Ty=TAx=Bx=BTxy'=Ty=TAx=Bx'=BTx,从而可得TA=BTA=T1BTTA=BT或A=T^{-1}BT

给定两个矩阵 ABA、B,如果存在一个非奇异矩阵 TT,使得A=T1BTA=T^{-1}BT,那么称 AABB是相似的。在不同的基下,相似矩阵对应的线性变换是相同的。