MIT公开课18.06 Gilbert Strang 线性代数 笔记

相关链接

课程链接

B站:https://www.bilibili.com/video/av15463995?p=1&share_medium=android&share_source=copy_link&bbid=PgppX2ZRaAtpWz9bJ1sninfoc&ts=1552297094709

网易公开课:http://open.163.com/newview/movie/free?pid=M6V0BQC4M&mid=M6V29E773

mit open course ware:https://ocw.mit.edu/courses/mathematics/18-06sc-linear-algebra-fall-2011/index.htm

线性代数的本质(简易版课程):https://www.bilibili.com/video/BV1ys411472E?p=2

作业:https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/assignments/

推荐笔记链接

github ApacheC 笔记书:https://linalg.apachecn.org/#/docs/chapter01

**** 博主:https://blog.****.net/a352611

第一讲:方程组的集合解释

1. 从方程组到矩阵

MIT公开课18.06 Gilbert Strang 线性代数 笔记

矩阵的诞生是为了用一种简洁的方式表达线性方程组
个人理解来说就是为了更好的描述和解决 Ax = b
从系统的角度来理解:
A:系统
x:输入
b:输出

2. Ax = b解法1:row picture 行图像

矩阵分为行row和列column
row picture 关注矩阵行部分
MIT公开课18.06 Gilbert Strang 线性代数 笔记

将行所代表的方程以直线形式画出,求出交点即可得到行图像,从而得到方程的解

三维时的解法:求出三个平面的交点

3. Ax = b解法2:column pircture 列图像

column picture关注列的部分,我们视一列为一个向量vector

MIT公开课18.06 Gilbert Strang 线性代数 笔记

求出合适的线性组合(linear combination),使得 Ax = b

数形结合:

数:

1[21]+2[12]=[03](1)1 \begin{bmatrix} 2 \\-1 \end{bmatrix} + 2\begin{bmatrix} -1 \\2\end{bmatrix} = \begin{bmatrix} 0 \\3 \end{bmatrix} \qquad \qquad \qquad (1)

A:等式左边的两个常数列向量拼接成的常矩阵
x:两个变量x,y组成的向量 (注意x的含义区分:前者为向量,后者为组成该向量的一个变量)
b:目标向量
x = 1,y = 2时,Ax = b

形:

MIT公开课18.06 Gilbert Strang 线性代数 笔记
1倍的列向量1 和 2倍的列向量2 进行矢量和,可得目标向量

三维时的解法:求出三个三维向量的线性组合,得到目标向量
(维度三维及以上时,列图像解法更具优势)

4.问题:于任意的b,是否都能求解Ax=b?用列向量线性组合的观点阐述就是,列三维情况下,向量的线性组合能否覆盖整个三维向量空间?

答:如果三个向量在同一个平面上,问题就出现了——他们的线性组合也一定都在这个平面上。举个例子,如果col3=col1 + col2 ,那么不管怎么组合,这三个向量的结果都逃不出这个平面,因此当b在平面内,方程组有解,而当b不在平面内,这三个列向量就无法构造出b。在后面的课程中,我们会了解到这种情形称为奇异、矩阵不可逆

下面我们推广到九维空间,每个方程有九个未知数,共九个方程,此时已经无法从坐标图像中描述问题了,但是我们依然可以从求九维列向量线性组合的角度解决问题,仍然是上面的问题,是否总能得到bb?当然这仍取决于这九个向量,如果我们取一些并不相互独立的向量,则答案是否定的,比如取了九列但其实只相当于八列,有一列毫无贡献(这一列是前面列的某种线性组合),则会有一部分bb无法求得。

5. 矩阵乘法方法

5.1 向量内积

A=[a1,1a1,2a1,3a2,1a2,2a2,3]B=[b1,1b1,2b2,1b2,2b3,1b3,2]C=AB=[a1,1b1,1+a1,2b2,1+a1,3b3,1,a1,1b1,2+a1,2b2,2+a1,3b3,2a2,1b1,1+a2,2b2,1+a2,3b3,1,a2,1b1,2+a2,2b2,2+a2,3b3,2] \begin{array}{l} A=\left[\begin{array}{lll} a_{1,1} & a_{1,2} & a_{1,3} \\ a_{2,1} & a_{2,2} & a_{2,3} \end{array}\right] \\ B=\left[\begin{array}{ll} b_{1,1} & b_{1,2} \\ b_{2,1} & b_{2,2} \\ b_{3,1} & b_{3,2} \end{array}\right] \\ C=A B=\left[\begin{array}{ll} a_{1,1} b_{1,1}+a_{1,2} b_{2,1}+a_{1,3} b_{3,1}, & a_{1,1} b_{1,2}+a_{1,2} b_{2,2}+a_{1,3} b_{3,2} \\ a_{2,1} b_{1,1}+a_{2,2} b_{2,1}+a_{2,3} b_{3,1}, & a_{2,1} b_{1,2}+a_{2,2} b_{2,2}+a_{2,3} b_{3,2} \end{array}\right] \end{array}
左矩阵的所有行向量与右矩阵的所有列向量分别相乘并求和

5.2 列向量的线性组合

[2513][12]=1[21]+2[53]=[127]\begin{bmatrix} 2 & 5\\1 & 3\end{bmatrix}\begin{bmatrix} 1 \\2\end{bmatrix} = 1\begin{bmatrix} 2 \\1 \end{bmatrix} + 2 \begin{bmatrix} 5 \\3 \end{bmatrix} =\begin{bmatrix} 12\\7 \end{bmatrix}
将Ax看作A各列的线性组合
教授更推荐次方法,当数据量较大时更有优势

第二讲:矩阵消元

1.高斯消元法

1.1消元步骤

MIT公开课18.06 Gilbert Strang 线性代数 笔记

对该方程消元:
[121381041] row2-3row 1[121022041] \left[\begin{array}{lll} \underline{1} & 2 & 1 \\ 3 & 8 & 1 \\ 0 & 4 & 1 \end{array}\right] \stackrel{\text { row2-3row }_{1}}{\longrightarrow}\left[\begin{array}{ccc} \underline{1} & 2 & 1 \\ 0 & 2 & -2 \\ 0 & 4 & 1 \end{array}\right]
2.以y为主元,在第三个方程中消去y项
[121022041] row 32row2[121022005] \left[\begin{array}{ccc} \underline{1} & 2 & 1 \\ 0 & \underline{2} & -2 \\ 0 & 4 & 1 \end{array}\right] \stackrel{\text { row } 3-2 \mathrm{row} 2}{\longrightarrow}\left[\begin{array}{ccc} \underline{1} & 2 & 1 \\ 0 & \underline{2} & -2 \\ 0 & 0 & \underline{5} \end{array}\right]
3.回代:
MIT公开课18.06 Gilbert Strang 线性代数 笔记

1.2 消元失效

主元不能为0,否则需要交换行,使主元不为0
若有一行全部为0,则消元失效,矩阵也不可逆

2.新视角看矩阵乘法

旧角度

以矩阵中的元素为基本单位
AB:第i行A的所有元素 与 第j列B的所有元素 对应相乘的和,为AB的第i行,第j列元素

新角度

以向量为基本单位

从列向量角度

MIT公开课18.06 Gilbert Strang 线性代数 笔记

该矩阵有三个列向量,分别乘以三个系数 3 4 5,再求和,得到一个 3×1 的列向量

从行向量角度

MIT公开课18.06 Gilbert Strang 线性代数 笔记

该矩阵有三个行向量,分别乘以三个系数 1 2 7, 再求和,得到一个 1×3 的行向量

3.以矩阵运算角度描述高斯消元

要求1:第二行减去 3倍的第一行,其余行都不变
MIT公开课18.06 Gilbert Strang 线性代数 笔记
步骤:
第一行,不变,所以是1倍的第一行
第二行,-3倍的第一行 + 1倍的第二行 + 0倍的第三行,得到行向量[0,2,-2]
第三行,不变,所以是1倍的第三行

这个消元矩阵记为E21E_{21}(E是指初等矩阵elementary matrix,由单位矩阵经过一次初等变换得到的矩阵;21是指使第2行,第1列元素为0)

要求2:第三行减去2倍的第二行,其余行不变
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HMR9iqOx-1597991355771)(./1597558951965.png)]

对于矩阵乘法,结合律有效:E32(E21A)=(E32E21)A=EA=UE_{32}(E_{21}A)=(E_{32}E_{21})A=EA=U这意味着问题变成了如何找到一个矩阵E 使得EA=U矩阵E就是一堆初等矩阵elementary matrix的积。

4. 置换矩阵

MIT公开课18.06 Gilbert Strang 线性代数 笔记
要对矩阵进行行变换:左乘一个矩阵
要对矩阵进行列变换:右乘一个矩阵

5.矩阵的逆

引申:我要如何才能由U变回A呢?由此引入矩阵的逆,即我们知道EA=U,那么有矩阵S使得SU=A,矩阵S即为矩阵E的逆。
MIT公开课18.06 Gilbert Strang 线性代数 笔记

第三讲:乘法和逆矩阵

1.矩阵乘法

矩阵能相乘的条件: 左矩阵的列数 = 右矩阵的行数(m×n和n×p)

1.1 一般性法则

cij=rowicolumnj=k=inaikbkjc_{ij}=row_i\cdot column_j=\sum_{k=i}^na_{ik}b_{kj}

1.2 整列相乘

MIT公开课18.06 Gilbert Strang 线性代数 笔记

  1. B可以看作多个列向量
  2. C中的第一列是A中的所有列的线性组合
  3. B的第一列告诉我们是怎样的一个线性组合

1.3 整行相乘

MIT公开课18.06 Gilbert Strang 线性代数 笔记

  1. A可以看作多个行向量
  2. C中的第一行是B中的所有行的线性组合
  3. A的第一行告诉我们是怎样的一个线性组合

1.4 列乘以行

定义:A的列 × B的行
MIT公开课18.06 Gilbert Strang 线性代数 笔记

C的每一行都是B的倍数,和B是同一方向,这是行空间(即行所有可能的线性组合,在此处是指[1,6]这条直线,C的所有行都在此直线上)
C的每一列都是A的倍数,和A是同一方向,这是列空间(即列所有可能的线性组合,在此处是指[2,3,4]这条直线,C的所有列都在此直线上)
MIT公开课18.06 Gilbert Strang 线性代数 笔记

矩阵形式:A的列分别乘以B的行,并求和

1.5 分块乘法

[A1A2A3A4][B1B2B3B4]=[A1B1+A2B3A1B2+A2B4A3B1+A4B3A3B2+A4B4]\left[\begin{array}{c|c}A_1&A_2\\\hline A_3&A_4\end{array}\right]\left[\begin{array}{c|c}B_1&B_2\\\hline B_3&B_4\end{array}\right]=\left[\begin{array}{c|c}A_1B_1+A_2B_3&A_1B_2+A_2B_4\\\hline A_3B_1+A_4B_3&A_3B_2+A_4B_4\end{array}\right]

2.逆(方阵)

若存在逆,对于方阵,左逆右逆是相等的,非方阵则不等

矩阵存在逆:可逆的,非奇异的

矩阵不存在逆:不可逆的,奇异的

2.1证明不可逆

MIT公开课18.06 Gilbert Strang 线性代数 笔记

方法一:线性组合
若存在B,使A×B = I,因为结果I中的每一列都是A中的每一列的线性组合,且这两列共线,所以不可能得到单位矩阵的第一列[1,0]
方法二:存在非零向量x,使Ax=0
MIT公开课18.06 Gilbert Strang 线性代数 笔记

证明:如果对于非零的xx仍有Ax=0Ax=0,而AA有逆A1A^{-1},则A1Ax=0A^{-1}Ax=0,即x=0x=0,与题设矛盾,得证。

2.2若矩阵有逆,求逆的方法(高斯·若尔丹Gauss-Jordan法)

MIT公开课18.06 Gilbert Strang 线性代数 笔记

求逆实质上就是解方程
MIT公开课18.06 Gilbert Strang 线性代数 笔记

分解成两个方程
Gauss-jordan:同时求解多个方程

  • 构造这样一个矩阵[13102701]\left[\begin{array}{cc|cc}1&3&1&0\\2&7&0&1\end{array}\right],接下来用消元法将左侧变为单位矩阵;
  • [13102701]row22row1[13100121]row13row2[10730121]\left[\begin{array}{cc|cc}1&3&1&0\\2&7&0&1\end{array}\right]\xrightarrow{row_2-2row_1}\left[\begin{array}{cc|cc}1&3&1&0\\0&1&-2&1\end{array}\right]\xrightarrow{row_1-3row_2}\left[\begin{array}{cc|cc}1&0&7&-3\\0&1&-2&1\end{array}\right]
  • 于是,我们就将矩阵从[AI]\left[\begin{array}{c|c}A&I\end{array}\right]变为[IA1]\left[\begin{array}{c|c}I&A^{-1}\end{array}\right]

证明:高斯-若尔当法的本质是使用消元矩阵EE,对AA进行操作,E[AI]E\left[\begin{array}{c|c}A&I\end{array}\right],利用一步步消元有EA=IEA=I,进而得到[IE]\left[\begin{array}{c|c}I&E\end{array}\right],其实这个消元矩阵EE就是A1A^{-1},而高斯-若尔当法中的II只是负责记录消元的每一步操作,待消元完成,逆矩阵就自然出现了。