多变量微积分笔记(1)——向量和矩阵

本博客对应我博客中的多变量微积分目录下的第一章,向量和矩阵。

1.向量和矩阵(Vectors and Matrices)——开启多变量函数和多变量微积分大门的钥匙

在单变量微积分中用得最多的应该只是坐标,如果想要进入三维的世界,就需要引入向量,甚至是矩阵来简化我们的运算过程,例如,一个函数在坐标轴的三个基底向量上都是随自变量变化的函数,那么每一次运算都把他们单独写出来是肯定很麻烦的,这时候不妨试试用一个位置向量(接下来会写到)来整合所有信息。

1.1 向量的定义

在进行基本向量运算之前,一定要明确向量的定义。向量是有大小和有方向的量。 常用箭头来表示向量,箭头的大小表示该向量的大小,箭头的方向代表向量的方向。向量一般被表示成 A\boldsymbol AA\vec A。这一系列的我还是选择用加粗格式来表示。其中 A|\boldsymbol A| 表示向量的模长(即大小),用单位向量AA\frac{\boldsymbol A}{|\boldsymbol A|}来表示其方向。向量的坐标表示这一系列博客会遵循上课用的记法,<a1,a2a_1, a_2>;(a1,a2a_1, a_2) 代表坐标点。
下图表示向量 u=&lt;1.76,0.94&gt;\boldsymbol u=&lt;-1.76,-0.94&gt;
多变量微积分笔记(1)——向量和矩阵

1.2 向量的基本运算

缩放,加减法

向量的缩放(Scaling):cAc\boldsymbol A
向量的加减法:
遵循平行四边形法则,这个就不再赘述了。注意向量的减法得到的向量是指向被减向量的(也就是第一个向量),加法就是首尾相连。

向量“乘法”——点乘和叉乘

向量运算中最重要的就是点乘和叉乘了,这两位也会贯穿整个课程。向量的点乘运算几何上等同于数乘一个向量的映射,而从代数式子的角度来看等同于矩阵乘法(矩阵的相关知识会在后面写到),结果是一个数;而叉乘得到了一个垂直于初始两向量的向量。

向量点乘:

如果 A=&lt;a1,a2&gt;\boldsymbol A= &lt;a_1,a_2&gt;, B=&lt;b1,b2&gt;\boldsymbol B= &lt;b_1,b_2&gt;,则AB=a1a2+b1b2\bold A\cdot \bold B=a_1a_2+b_1b_2
另外一种写法是AB=a1a2+b1b2=ABcosθ\bold A\cdot \bold B=a_1a_2+b_1b_2=|\bold A| \cdot|\bold B|\cos \theta
多变量微积分笔记(1)——向量和矩阵
如果 0θ&lt;π/20\leq\theta&lt;\pi/2,即夹角为锐角,则 AB&gt;0\bold A\cdot\bold B&gt;0
如果 π/2θ&lt;π\pi/2\leq\theta&lt;\pi,即夹角为钝角,则 AB&lt;0\bold A\cdot\bold B&lt;0
如果 θ=π/2\theta=\pi/2,即夹角为直角,则 AB=0\bold A\cdot\bold B=0
反之也成立。
**特殊情况:**假设u^\hat \bold u是平面内任意一个单位向量,那么平面内任意一个向量与它的点乘就是向量A\bold A在单位向量上的投影。如下图
多变量微积分笔记(1)——向量和矩阵

向量叉乘

如果 A=&lt;a1,a2&gt;, B=&lt;b1,b2&gt;\bold A=&lt;a_1,a_2&gt;,\ \bold B=&lt;b_1,b_2&gt;,则
A×B=det(A, B)=a1a2b1b2=a1b1a2b2|\bold A\times\bold B|=\text{det}(\bold A,\ \bold B)=\begin{vmatrix}a_1&amp;a_2\\b_1&amp;b_2\end{vmatrix}=\begin{vmatrix}a_1&amp;b_1\\a_2&amp;b_2\end{vmatrix}
新向量的方向 dir(A×B)\text{dir}(\bold A\times\bold B)垂直于A\bold AB\bold B构成的平面,并遵循右手定则。(四指指向第一个向量,并向第二个向量弯曲,大拇指的方向就是叉乘结果的方向)
两个二维向量的叉乘本质上是求两向量构成的矩阵的行列式,也就是构成的平行四边形的面积

三维的两个向量的叉乘也是根据矩阵的行列式而来:
det(A,B,C)=a1a2a3b1b2b3c1c2c3=Volume by A,B,C\text{det}(\bold A, \bold B, \bold C)=\begin{vmatrix}a_1&amp;a_2&amp;a_3\\b_1&amp;b_2&amp;b_3\\c_1&amp;c_2&amp;c_3\end{vmatrix}=\text{Volume by} \ \bold A, \bold B, \bold CA×B=det(b,A,B)=ijka1a2a3b1b2b3where b=i+j+k\bold A\times\bold B=\text{det}(\bold b,\bold A,\bold B)=\begin{vmatrix}\bold i &amp;\bold j &amp;\bold k\\a_1&amp;a_2&amp;a_3\\b_1&amp;b_2&amp;b_3\end{vmatrix}\quad\text{where}\ \bold b=\bold i+\bold j+\bold k(A×B)C=det(A,B,C)=Volume(\bold A\times\bold B)\cdot \bold C=\text{det}(\bold A, \bold B, \bold C)=\text{Volume}
三维向量的叉乘本质上也是求两向量构成的矩阵的行列式,即所构成的平行四边形的面积
需要注意的一点是矩阵的转置不改变行列式的值

点乘和叉乘的求导

点乘和叉乘的求导是针对向量函数的,向量函数简单来说就是
r(t)=&lt;x(t),y(t),z(t)&gt;\bold r(t)=&lt;x(t), y(t), z(t)&gt;向量函数点乘和叉乘的求导与函数的乘法法则类似:
ddt(rs)=rdsdt+sdrdt\frac{d}{dt}(\bold r\cdot\bold s)=\bold r\cdot\frac{d\bold s}{dt}+\bold s\cdot\frac{d\bold r}{dt}ddt(r×s)=r×dsdt+s×drdt\frac{d}{dt}(\bold r\times\bold s)=\bold r\times\frac{d\bold s}{dt}+\bold s\times\frac{d\bold r}{dt}

向量的这些基本运算其实是代数乘法与加减法的结合,这完全符合矩阵的定义(本质上还是属于线性系统),学习矩阵也是必须的,当然这一系列只涉及非常基本的内容,详细的有关内容请参考线性代数笔记,我会在多变量微积分之后慢慢补上。

1.3 矩阵的一些基本知识

为什么会有矩阵

矩阵的出现源于求解线性方程组:
{a11x+a12y+a13z=b1a21x+a22y+a23z=b2a31x+a32y+a33z=b3\begin{cases}a_{11}x+a_{12}y+a_{13}z=b_1\\a_{21}x+a_{22}y+a_{23}z=b_2\\a_{31}x+a_{32}y+a_{33}z=b_3\end{cases}
x,y,zx,y,z前面的系数全部提取出来就得到了系数矩阵也可以看成由三个列向量组成 AA,方程组就变成了Ax=bA\bold x=\bold b(加粗的代表向量)

矩阵的定义

m×nm\times n 矩阵的明确定义是具有mmnn列的矩形数组。其中每一个元素的记法为:aij, (1im, 1jm)a_{ij},\ (1\leq i\leq m,\ 1\leq j\leq m)

矩阵的常见运算

  1. 数乘:cA=c(aij)cA=c(a_{ij})
  2. 加法:A+B=(aij+bij)A+B=(a_{ij}+b_{ij})
  3. 转置:AT=(aji)A^T=(a_{ji})
  4. 矩阵乘法:
    Am×nBn×p=Cm×p\underset{m\times n}{A}\cdot\underset{n\times p}{B} = \underset{m\times p}{C}
    Element-wise:
    cij=i=1naikbkjc_{ij}=\sum_{i=1}^na_{ik}\cdot b_{kj}

如何理解Ax=bA\bold x=\bold b

从线性代数角度来讲,Ax=bA\bold x=\bold b中矩阵AA相当于一个函数,一种映射,或是一种线性变换,在输入向量x\bold x之后,得到了输出向量b\bold b。还有一种解释是:向量b\bold b是矩阵AA中的列向量所张成(span)的列空间里的一个线性组合(linear combination)。方程组的解有多种可能性:只有一个,无数个(当一些列向量是其他某些列向量的线性组合),也有可能没有解(1=2这类形式)。之后会写到3×33\times3情况下方程组解的讨论和几何意义。

逆矩阵求解Ax=bA\bold x=\bold b

从上面的内容我们已经知道了线性方程组的矩阵形式,因为18.02这门课毕竟不是线性代数课程,所以这里给出一个直接的求法,即求解逆矩阵从而得到方程组的解。(线性代数课程不会一上来就讲矩阵的逆,而是从最基本的运算法则来求解该方程)

已知 Ax=bA\bold x=\bold b,求解x\bold x。先定义一个矩阵使得A1A=IA^{-1}A=I,可以得到A1Ax=x=A1bA^{-1}A\bold x=\bold x=A^{-1}\bold b,只有当矩阵AA存在逆矩阵的时候,即AA是可逆的,该式子才是方程的解。

矩阵AA是可逆的条件是detA  0\text{det}A\ \ \neq 0,反之,如果detA=0\text{det} A=0,那么矩阵AA不可逆。

计算 3×33\times3 逆矩阵:
A1=1Aadj A=1A[A11A21A31A12A22A32A13A23A33]A^{-1}=\frac{1}{|A|}\text{adj}\ A=\frac{1}{|A|}\begin{bmatrix}A_{11}&amp;A_{21}&amp;A_{31}\\A_{12}&amp;A_{22}&amp;A_{32}\\A_{13}&amp;A_{23}&amp;A_{33}\end{bmatrix}
其中adj A\text{adj}\ A是矩阵AA的伴随矩阵,可以通过以下几个步骤得到:

  1. 计算AijA_{ij},即去掉i,ji,j所在行列之后的行列式。
  2. 添加正负号,模式如下
    [+++++]\begin{bmatrix}+&amp;-&amp;+\\-&amp;+&amp;-\\+&amp;-&amp;+\end{bmatrix}
  3. 将所的矩阵转置得到伴随矩阵。

1.4 矩阵与向量运算之间的关系

平面方程

本质上可以说向量就是矩阵,只不过行向量的维度是1×n1\times n,而列向量的维度是n×1n\times 1。如果单独看线性方程组的一个方程,可以发现该方程可以通过向量的点乘得到。
a11x+a12y+a13z=b1[a11a12a13][xyz]=b1a_{11}x+a_{12}y+a_{13}z=b_1\quad\to\begin{bmatrix}a_{11}\\a_{12}\\a_{13}\end{bmatrix}\cdot\begin{bmatrix}x\\y\\z\end{bmatrix}=b_1
上面的式子也可以整理为:
[a11a12a13][xx0yy0zz0]=0\begin{bmatrix}a_{11}\\a_{12}\\a_{13}\end{bmatrix}\cdot\begin{bmatrix}x-x_0\\y-y_0\\z-z_0\end{bmatrix}=0
从中可以看出向量[a11,a12,a13][a_{11},a_{12},a_{13}]与向量[xx0,yy0,zz0][x-x_0,y-y_0,z-z_0]垂直。
[a11a12a13][xx0yy0zz0]=a11(xx0)+a12(yy0)+a13(zz0)=0\begin{bmatrix}a_{11}\\a_{12}\\a_{13}\end{bmatrix}\cdot\begin{bmatrix}x-x_0\\y-y_0\\z-z_0\end{bmatrix}=a_{11}(x-x_0)+a_{12}(y-y_0)+a_{13}(z-z_0)=0
这也就是平面的一般方程,其中平面的法向量为&lt;a11,a12,a13&gt;&lt;a_{11},a_{12},a_{13}&gt;,平面上任意一个向量为 PP0=&lt;xx0,yy0,zz0&gt;\bold {PP_0}=&lt;x-x_0,y-y_0, z-z_0&gt;,其中某一点 P0P_0(x0,y0,z0)(x_0,y_0,z_0),平面上任意一点 PP 的坐标就是(x,y,z)(x,y,z)

P0P_0 为原点(0,0,0)(0,0,0)时,方程就会化简为a11x+a12y+a13z=0a_{11}x+a_{12}y+a_{13}z=0,即过原点的一个平面,其他方程也同理,这样就可以得到方程Ax=0A\bold x=\bold 0,这个方程也被称为齐次系统(Homogeneous System),其余情况为非齐次系统(Inhomogeneous System)

定理

AAn×nn\times n 的矩阵,

  1. 如果detA   0\text{det} A\ \ \ \neq0Ax=bA\bold x=\bold b 有唯一解,即x=A1b\bold x=A^{-1}\bold b
  2. 如果detA   0\text{det} A\ \ \ \neq0Ax=0A\bold x=\bold 0 只有平凡解(trivial solutions),即x=0\bold x=0
  3. 如果detA=0\text{det} A=0Ax=0A\bold x=\bold 0 有非平凡解(解不为0)
  4. 如果detA=0\text{det} A=0Ax=bA\bold x=\bold b 无解(向量b\bold b不在矩阵AA张成的低维列空间里);也有可能有唯一解(向量b\bold b恰好在矩阵AA的张成的低维列空间里,这时候就有无数解了,无穷多中线性组合)

从几何角度理解线性方程组Ax=bA\bold x=\bold b的解

这一部分的讨论只关注3×33\times 3矩阵,即三元一次方程组解的几何意义。

对于二元一次方程组来说,求解的几何意义就是找两条直线是否有交点(平行的时候方程组无解),同理,对于一个三元一次方程组来说,几何意义是求三个给定平面的交集,可能会出现以下几种情况:

  1. 三个平面相交于一点(唯一解)
    多变量微积分笔记(1)——向量和矩阵
  2. 三个平面相交于一条直线(无穷多个解)
    2.a 两个平面相交,另外一个平面包含它的交线。
    2.b 两个平面重合,并与另外一个平面相交。
  3. 三个平面相交于平面(无穷多个解)——也就是三个平面完全相同
  4. 三个平面没有任何交点或交线(无解)
    4.a 三个平面互相平行
    4.b 三个平面中有两个是平行的,且与另外一个平面相交
    4.c 三个平面互相相交,但是每两个平面的交线都与另外的一条交线平行
    4.d 三个平面有两个平面是相同的,与另外一个平面平行

下图展示了平面相交的二维示意图。
多变量微积分笔记(1)——向量和矩阵

1.5 补充内容:直线和一般曲线的参数方程

一般曲线的参数方程(Parametric Equations)

给定某一点的位置(x,y,z)(x,y,z)和一个独立的变量tt(物理中通常是指时间),因为某一点的位置与参数tt有关,所以每一个坐标分量都可以写成如下形式:
{x=x(t)y=y(t)z=z(t)\begin{cases}x=x(t)\\y=y(t)\\z=z(t)\end{cases}

直线的参数方程

设直线上的某一点为P0=(x0,y0,z0)P_0=(x_0, y_0,z_0),任意一点为P=(x,y,z)P=(x,y,z),方向向量为v=&lt;v1,v2,v3&gt;\bold v=&lt;v_1, v_2,v_3&gt;
那么,
P0P=&lt;xx0,yy0,zz0&gt;=tv=&lt;tv1,tv2,tv3&gt;\bold{P_0P}=&lt;x-x_0,y-y_0,z-z_0&gt;=t\bold v=&lt;tv_1,tv_2, tv_3&gt;直线的参数方程为:{x=x0+tv1y=y0+tv2z=z0+tv3\begin{cases}x=x_0+tv_1\\y=y_0+tv_2\\z=z_0+tv_3\end{cases}
多变量微积分笔记(1)——向量和矩阵

位置向量(Position Vector)

定义

在参数方程的基础上引入向量就可以得到位置向量了。
位置向量的定义:r(t)=x(t)i+y(t)j+z(t)k=&lt;x(t),y(t),z(t)&gt;\bold r(t)=x(t)\bold i+y(t)\bold j+z(t)\bold k=&lt;x(t),y(t),z(t)&gt;
位置向量就是从原点出发到某一移动点位置的向量。
多变量微积分笔记(1)——向量和矩阵

速度、加速度、速率和弧长

在给定位置矢量之后,我们可以对它求一阶导数,甚至是二阶导数。本节以二维平面下的位置矢量为例。

i. 速度和速率
已知位置矢量为 r(t)=x(t)i+y(t)j\bold r(t)=x(t)\bold i+y(t)\bold j,且速度为位置矢量的导数,那么速度的表达式就是
velocity=v(t)=drdt=dxdti+dydtj=&lt;x,y&gt;\text{velocity}=\bold v(t)=\frac{d\bold r}{dt}=\frac{dx}{dt}\bold i+\frac{dy}{dt}\bold j=&lt;x&#x27;,y&#x27;&gt;
速率为速度的大小
speed=drdt\text{speed}=\big |\frac{d\bold r}{dt}\big |
速度的单位向量(切向向量) T\bold T 也就可以表达为:
T=vv\bold T=\frac{\bold v}{|\bold v|}

ii. 弧长
弧长也就是曲线在某一定义域内曲线的长度(单变量微积分有涉及如何计算弧长),通常用ss表示。
speed=dsdt=v\text{speed}=\frac{ds}{dt}=|\bold v|dsdtT=vTdrdt=v\frac{ds}{dt}\bold T=|\bold v|\bold T\quad\to \frac{d\bold r}{dt}=\bold vdr=Tdsd\bold r=\bold Tds

iii. 加速度
加速度为速度的一阶导数,位置矢量的二阶导数
a(t)=d2rdt=dvdt=d2xdti+d2ydtj=&lt;x,y&gt; \bold a(t)=\frac{d^2\bold r}{dt}=\frac{d\bold v}{dt}=\frac{d^2x}{dt}\bold i+\frac{d^2y}{dt}\bold j=&lt;x&#x27;&#x27;,y&#x27;&#x27;&gt;

位置矢量的微元 drd\bold r

摆线(Cycloid)

摆线就是圆上的某一点随着圆(在无滑动的条件下)滚动所产生的轨迹,如图所示:
多变量微积分笔记(1)——向量和矩阵
摆线参数方程推导方法:
多变量微积分笔记(1)——向量和矩阵
从图中可以看出,要求的位置矢量是OP\bold{OP},用走过的角度 θ\theta 作为参数OP\bold{OP}又可以表示成:
OP=&lt;x(θ),y(θ)&gt;=&lt;aθ,0&gt;+&lt;0,a&gt;+CP\bold{OP}=&lt;x(\theta),y(\theta)&gt;=&lt;a\theta,0&gt;+&lt;0,a&gt;+\bold{CP}CP=&lt;asinθ,acosθ&gt;\bold{CP}=&lt;-a\sin\theta,-a\cos\theta&gt;
联立两个式子可以得到:
OP=&lt;x(θ),y(θ)&gt;=&lt;aθasinθ,aacosθ&gt;\bold {OP}=&lt;x(\theta),y(\theta)&gt;=&lt;a\theta-a\sin\theta,a-a\cos\theta&gt;x(θ)=a(θsinθ),y(θ)=a(1cosθ)x(\theta)=a(\theta-\sin\theta), \quad y(\theta)=a(1-\cos\theta)
还要分析以下摆线在0处的极限值,否则不能保证每一个周期都没有重叠部分。分析如下:
ddθx(θ)=a(1cosθ),ddθy(θ)=asinθ\frac{d}{d\theta}x(\theta)=a(1-\cos\theta),\quad \frac{d}{d\theta}y(\theta)=a\sin\thetadydx=dydθ/dxdθ=sinθ1cosθ\frac{dy}{dx}=\frac{dy}{d\theta}/\frac{dx}{d\theta}=\frac{\sin\theta}{1-\cos\theta}limθ0sinθ1cosθ=limθ0cosθsinθ=10=\lim_{\theta\to0}\frac{\sin\theta}{1-\cos\theta}=\lim_{\theta\to0}\frac{\cos\theta}{\sin\theta}=\frac{1}{0}=\infty
可以得出结论,每一个周期后曲线在起始处都是相切的。
多变量微积分笔记(1)——向量和矩阵

参考

MIT 18.02多变量微积分及其讲义:
https://ocw.mit.edu/courses/mathematics/18-02sc-multivariable-calculus-fall-2010/