学习最优化导论过程中做的一点笔记,就当梳理知识点.
向量空间与矩阵
1.1 向量与矩阵
1.1.1 定义
n 维向量 : 含有 n个数的数组,如:
a=⎣⎢⎢⎢⎢⎢⎡a1a2a3⋮an⎦⎥⎥⎥⎥⎥⎤
ai表示向量 a的第 i个元素,定义 R为全体实数组成的集合,那么实数组成的 n维向量可表示为 Rn。
n 维行向量记为:
a=[a1,a2,⋯,an]
1.1.2 运算及性质
向量加减:
a+b=[a1+b1,a2+b2,⋯,an+bn]
具有以下性质:
a+b=b+a(a+b)+c=a+(b+c)存在零向量:0=[0,0,0,⋯,0]T,使得a+0=a
向量乘积——与标量 α ∈R 的乘积
αa=[αa1,αa2,⋯,αan,]
具有以下的性质:
α(a+b)=αa+αbα(a+b)=αa+αbα(βa)=(αβ)a
1.1.3 线性相关与线性组合
① 如果方程
α1a1+α2a2+⋯+αnan=0
其中 αi(i=1,⋯,k)都等于0,那么 向量集 {a1,a2,⋯,an}是 线性无关的 ,反之称为线性相关。(实际上,包含0向量的集合都是线性相关的)
② 给定向量 a, 如果存在标量 α1,α2,⋯,αk,使得
a=α1a1+α2a2+⋯+αnak
称a为a1,a2,⋯,ak的线性组合
结合①和②给出一个命题:
向量集 {a1,a2,⋯,ak}是线性相关的,当且仅当集合中的一个向量可以被视为其他向量的线性组合。
![线代的部分知识点梳理 线代的部分知识点梳理](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzE4MS85ZTFmZjkwZjAzN2Q5ZTM5YzA3NjI3YzY3NGYyNmExZC5wbmc=)
进一步来观察一下线性相关和线性无关,现在我们给出两个二维的向量集(R2):
a=[2,32,3]b=[1,63,4]
![线代的部分知识点梳理 线代的部分知识点梳理](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzUyMy85MTJiZWNjOWFiZGJlYzA3NDc2Mzc4MmE3Mjc0ZTMwYi5wbmc=)
![线代的部分知识点梳理 线代的部分知识点梳理](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzIwNi84ZjU5OTBhYTI5ZjAzMjAzYTBkYmQ4MWVmOWY5NmI3ZS5wbmc=)
把 a和 b的每一个向量都画出来:
在向量 a的图中,a1,a2 共线,二者的线性组合只能表示同样在这条线上的向量,不能完全表示整个二维平面,并且
2−3a1+1a2=0
在向量 b的图中,b1,b2 的线性组合可以表示整个二维平面的所有向量。
线性相关——至少有一对向量共线;线性无关——不存在一组共线向量
1.1.4 生成空间
① 假定a1,a2,⋯,ak 是 Rn中的任意向量,他们的所有线性组合的集合称为a1,a2,⋯,ak 张成的子空间:
span[a1,a2,⋯,ak]={i=1∑kαiai:α1,⋯,αk∈R}
如果 a 能够被表示为 a1,a2,⋯,ak的线性组合,那么有
span[a1,a2,⋯,ak]=span[veca1,a2,⋯,ak,a]
② 给定一个子空间,如果存在线性无关的向量集合 {a1,a2,⋯,ak} 使得 子空间=span[a1,a2,⋯,ak] ,那么这组向量就是子空间的一组基。所有基都包含同样数量的向量,这个数量称为子空间的维数,记为dimV.
给出一命题:
如果 {a1,a2,⋯,ak}是子空间的一组基,那么子空间中的任意向量 a都可以唯一的表示为:
a=α1a1+α2a2+⋯+αnak
其中,αi∈R,i=1,2,⋯,k。
![线代的部分知识点梳理 线代的部分知识点梳理](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzExOS9lM2FkOTcxMGM3MmEyYjU0MjliZTBkMTY3YTRhNWE1Ny5wbmc=)
Rn 的标准基:
e1=⎣⎢⎢⎢⎢⎢⎢⎢⎡100⋮00⎦⎥⎥⎥⎥⎥⎥⎥⎤e2=⎣⎢⎢⎢⎢⎢⎢⎢⎡010⋮00⎦⎥⎥⎥⎥⎥⎥⎥⎤e2=⎣⎢⎢⎢⎢⎢⎢⎢⎡001⋮00⎦⎥⎥⎥⎥⎥⎥⎥⎤⋯en=⎣⎢⎢⎢⎢⎢⎢⎢⎡000⋮01⎦⎥⎥⎥⎥⎥⎥⎥⎤
在标准基下,向量 x可表示为:
x=⎣⎢⎢⎢⎢⎢⎡x1x2x3⋮xn⎦⎥⎥⎥⎥⎥⎤=x1e1+x2e2+⋯+xnen
1.1.5 矩阵
矩阵是指行列数组,通常用大写粗体字母表示(A)。m 行n列矩阵称为m×n矩阵,记为:
A=⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎥⎥⎥⎤
转置记为:
AT=⎣⎢⎢⎢⎡a11a12⋮a1na21a22⋮a2n⋯⋯⋱⋯am1am2⋮amn⎦⎥⎥⎥⎤
第 k列用ak表示:
vecen=⎣⎢⎢⎢⎡a1ka2k⋮amk⎦⎥⎥⎥⎤
Rm×n 表示所有 m×n矩阵组成的集合
矩阵的秩记作 rankA,rankA其实就是 span[a1,a2,⋯,ak]的维数。
以下情况,矩阵A的秩不会繁盛变化:
①矩阵A的某个(些)列乘以非零标量 ②矩阵内部交换次序 ③矩阵中加入一列,该列是其他列的线性组合。
如果矩阵 A的行数等于列数,称之为 方阵
行列式是每个方阵对应的一个标量,记作 detA或 ∣A∣。方阵的行列式是个列的函数,具有以下性质
1、对于任意的 αβ∈R 和 ak1,ak2∈R
det[a1,⋯,ak−1,,αak(1)+βak(2),ak+1,⋯,an]=αdet[a1,⋯,ak−1,,ak(1),ak+1,⋯,an]+βdet[a1,⋯,ak−1,,ak(2),ak+1,⋯,an]
2、如果对于某个 k,有 ak=ak+1,那么有 detA=0
3、Rn的标准基组成的矩阵,det=1
方阵行列式的具体知识点之后慢慢补充
1.2 线性方程组
1.2.1 基础概念
给定包含 n个未知量的 m个方程:
a11x1+a12x2+⋯+a1nxna21x1+a22x2+⋯+a2nxnam1x1+am2x2+⋯+amnxn=b1=b2⋮=b1
可写成矩阵模式:
Ax=b
A为系数矩阵:
A=[a1,a2,⋯,an]
增广矩阵定义为:
[A,b]=[a1,a2,⋯,an,b]
未知数向量:
x=⎣⎢⎢⎢⎡x1x2⋮xn⎦⎥⎥⎥⎤
1.2.2 方程解的情况
①、方程组 Ax=b有解,当且仅当
rankA=rank[A,b]
![线代的部分知识点梳理 线代的部分知识点梳理](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzY4NC82NjkwNTIzODVkNjAyZGQwZjY0Mjk1YTU3OWVkMTA5NC5wbmc=)
换个角度想,m个列向量表示在坐标系中的 m个不同的方向,x1,⋯,xn表示对应的列向量在自身方向上移动的距离,b就是最终要到达的向量,如果在一个三维空间中,要表示空间中的任意一点,需要三个不共线的向量组合才能实现,这就要求提供方向的向量子空间要包含目标向量。
②、考虑方程Ax=b,其中A∈Rm×n且rankA=m.可以通过对 n−m个未知数赋任意值并求解其他未知数从而获得解。
由 rankA=m我们可以得知它是一个满秩矩阵,系数矩阵的子空间覆盖了整个Rm;选取 m个线性无关的向量,并把剩下 n−m项的移项:
a1x1+a2x2+⋯+anxm=b−am+1xm+1−⋯−xnan
对 xm+1,⋯,xn赋值,并将左边的向量组整合为方阵 B,可写成:
B⎣⎢⎢⎢⎡x1x2⋮xm⎦⎥⎥⎥⎤=[b−am+1xm+1−⋯−xnan]
明显 detB=0,所以左乘B−1:
⎣⎢⎢⎢⎡x1x2⋮xm⎦⎥⎥⎥⎤=B−1[b−am+1xm+1−⋯−xnan]
1.3 內积和范数
1.3.1 实数
实数 a的绝对值记为∣a∣,定义为:
∣a∣={a−aa≥0a<0
有以下公式成立:
1. ∣a∣=∣−a∣
2. −∣a∣≤a≤∣a∣
3. ∣a+b∣≤∣a∣+∣b∣
4. ∣∣a∣−∣b∣∣≤∣a−b∣≤∣a∣+∣b∣
5. ∣ab∣=∣a∣∣b∣
6. 如果 ∣a∣≤c且 ∣b∣≤d,那么有∣a+b∣≤c+d
7. 不等式 ∣a∣<b等价于 −b<a<b
8. 不等式 ∣a∣>b,等价于 a>b或者 −a>b
1.3.2 內积
对于 x,y∈Rn,定义欧式內积为:
<x,y>=i=1∑nxiyi=xTy
內积是一个实值函数<⋅,⋅>:Rn×Rn→R,具有以下性质:
1. 非负性:<x,x>≥0, 当且仅当 x=0时,<x,x>=0
2. 对称性:<x,y>=<y,x>
3. 可加性:<x+y,z>=<x,z>+<y,z>
4. 齐次性:对于任意 r∈R,总有<rx,y>=r<x,y>成立
给定向量 x,y,如果 <x,y>=0, 那么 x和 y是正交的。(直观反映就是垂直)
1.3.3 范数
向量 x的欧式范数定义为:
∣∣x∣∣=<x,x>=xTx
柯西-施瓦茨不等式:对于 Rn任意两个向量 x和 y:∣<x,y>∣≤∣∣x∣∣∣∣y∣∣
![线代的部分知识点梳理 线代的部分知识点梳理](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzU2MC81NzViM2E5ZmY2MTRjNzY1YzVmNWQxYmM3ZmY5NTdlOC5wbmc=)
向量 x的欧式范数∣∣x∣∣具有如下性质:
1. 非负性:∣∣x∣∣≥0, 当且仅当x=0时, ∣∣x∣∣=0
2. 齐次性:∣∣rx∣∣=∣r∣∣∣x∣∣,r∈R
3. 三角不等式:∣∣x+y∣∣≤+∣∣x∣∣+∣∣y∣∣
欧式范数是通用向量范数的一个特例,通用向量范数是满足非负性、齐次性和三角不等式的任意函数。
p范数:
∣∣x∣∣p={(∣x1∣p+⋯+∣xn∣p)1/pmax{∣x1∣,⋯,∣xn∣}1≤p<∞p=∞
(欧式范数就是2范数)
用范数定义连续函数。如果对于所有的 ε>0, 都存在一个 δ>0,使得∣∣y−x∣∣<δ⇒∣∣f(y)−f(x)∣∣<ε, 那么函数 f:Rn→Rm,在点 x是连续的。
复数空间 Cn的內积定义 ∑i=1nxiyˉi,上划线表示共轭,Cn上的內积是一个复值函数,具有以下性质:
1. <x,x>≥0,当且仅当 x=0时,<x,x>=0
2. <x,y>=<y,x>
3. <x+y,z>=<x,z>+<y,z>
4. <rx,y>=r<x,y>,其中r∈C
利用性质1至性质4,可以推出其他的一些性质,如:
<x,r1y+r2y>=r1ˉ<x,y>+r2ˉ<x,z>
其中r1,r2∈C
变换
2.1 linear map——线性映射
给定函数 ζ:Rn→Rm,如果
-
- 对于任意 x∈Rn和 a∈R,都有 ζ(ax)=aζ(x)
-
- 对于任意 x,y∈Rn,都有ζ(x+y)=ζ(x)+ζ(y)
那么称函数 ζ为一个linear map(这部分的翻译有些问题,以英文为主)
接下来我们分别为 Rn和Rm指定一组基,,令 y=ζ(x),那么上述的 linearmap就可以使用矩阵表示:
x′=x1e1+⋯+xneny′=y1e1+⋯+ymemy′=⎣⎢⎢⎢⎡A1,1A2,1⋮Am,1A1,2A2,2⋮Am,2⋯⋯⋱⋯A1,nA2,n⋮Am,n⎦⎥⎥⎥⎤x′
当两个向量空间指定的都是标准基,那么矩阵 A满足:
ζ(x)=Ax
矩阵 A就是 ζ 的变换矩阵
上面一部分我们考虑的是从Rn→Rm的线性变换(线性映射),接下来我们讨论在自身向量空间 Rn→Rn中的变换。
我们先看一个例子:
给定一个linear map:ζ(x)=8x,n=2
ζ(x)=5x=[8008]x
对 x的每个标准基都进行变换然后合成一个矩阵,这样就确定了一个变换矩阵。
首先,令{e1,e2,⋯,en} 和{e1′,e2′,⋯,en′}是 Rn中的两组基。定义矩阵 T为
T=[e1′,e2′,⋯,en′]−1[e1,e2,⋯,en]
那么 T称为从{e1,e2,⋯,en} 到{e1′,e2′,⋯,en′}的转换矩阵,显然有:
[e1,e2,⋯,en]=[e1′,e2′,⋯,en′]T
即 T 的第 i 列是 ei 关于{e1′,e2′,⋯,en′}的坐标向量,可以证明x′=Tx(后续补充证明过程)
考虑线性变换
ζ:Rn→Rn
A为ζ关于{e1,e2,⋯,en} 的矩阵表示,B为其关于{e1′,e2′,⋯,en′}的矩阵表示,令y=Ax且y′=Bx′,因此有y′=Ty=TAx=Bx′=BTx,从而可得TA=BT或A=T−1BT
给定两个矩阵 A、B,如果存在一个非奇异矩阵 T,使得A=T−1BT,那么称 A和 B是相似的。在不同的基下,相似矩阵对应的线性变换是相同的。