矩阵与线性变换

这是线性代数系列的第二篇,国内外一般的课程与教材都是从线性方程组开始讲线性代数,从高斯消元、高斯约旦这些方法入门线性代数也是对新手比较友好的。这个系列的文章可能会比国内的教材更接近线代的本质(博主自以为 ),所以对做题、套路之类的涉及不多,主要参考的是Meyer的《Matrix Analysis and Applied Linear Algebra》和Manolis的youtobe频道,还有3Blue1Brown的bilibili频道

矩阵与线性变换

线性变换是线代另一个无比重要的概念,我觉得理解线性变换才算开始理解线代了,而不是仅仅受限于做题。这篇文章会先介绍线性变换(linear transformation)的定义,再把它和我们熟悉的矩阵联系起来,再讲一些常见的定理与线性变换的一个应用,最后也会稍微讲一讲矩阵的本质和矩阵乘法的来源。为了便于理解,特意省去了关于抽象代数的一些知识,感兴趣的读者请看这一个视频

线性变换定义

给定两个实数域的向量空间 U,VU,V,从 UUVV 的线性变换是一个函数 τ:UV\tau: U\to V,并且满足:a1,a2R,u1,u2U:τ(a1u1+a2u2)=a1τ(u1)+a2τ(u2)\forall a_1,a_2\in \mathbb{R}, \forall u_1,u_2\in U: \tau(a_1u_1+a_2u_2) = a_1\tau(u_1)+a_2\tau(u_2)
大家都清楚,函数本质上是一种映射关系(mapping),所以这个 τ\tau 也就是从空间 UUVV 的一个映射,其中 UU 是它的定义域,VV 是它的值域。上面的那条等式是在说:定义域中任何向量的线性组合的映射,都等于其映射的线性组合。然后 τ\tau 的像,就是 UU 中所有向量的映射的集合,记为 im(τ)=τ(U)={vVv=τ(u) for uU}im(\tau) = \tau(U) = \{v\in V| v=\tau(u)\ for\ u\in U \},所以τ(U)V.\tau(U)\subseteq V.

线性变换的矩阵表示

看完上面的定义可能大部分读者只有一个懵懂的认识,不能真正理解,所以接下来我们具体的告诉大家,线性变换在现实中长什么样子。

任何矩阵ARm×nA\in R^{m\times n} 都可以看做一个线性变换(重点!),为 τA:RnRm\tau_A: R^n\to R^m,且 τA(u)=Au\tau_A(u)=Au,通常用RnARmR^n \overset{ A }{\rightarrow} R^m 来表示这个映射。而实际上每一个线性映射也都有其对应的矩阵形式,也就是说任意线性变换 τ:RnRm\tau: R^n\to R^m 一定要满足 τ=τA, with ARm×n\tau = \tau_A,\ with\ A\in R^{m\times n},而且 A=[τ(e1) τ(e2)  τ(en)]A = [\tau(e_1)\ \tau(e_2)\ \cdots\ \tau(e_n)],其中 eie_iRnR^n 的一组标准基,只有第 i 个元素为1,其余元素均为0。
下面给大家证明这一点
uRn,τ(u)=τ(i=1nαiei)=i=1nαiτ(ei)=[τ(e1) τ(e2)  τ(en)][α1α2αn]=Au \begin{aligned} \forall u\in R^n, \tau(u) &= \tau(\sum_{i=1}^n \alpha_i e_i)\\ &= \sum_{i=1}^n \alpha_i \tau(e_i) \\ &= \begin{bmatrix} \tau(e_1)\ \tau(e_2)\ \cdots\ \tau(e_n) \end{bmatrix} \begin{bmatrix} \alpha_1\\ \alpha_2\\ \vdots \\ \alpha_n \end{bmatrix}\\ &= Au \end{aligned}
第一个等号是把 uu 写成基的线性组合,第三个等式是把多项式用矩阵乘法表示,之后发现后面那个向量就是 uu,所以根据 τA(u)=Au\tau_A(u)=Au 得出 A=[τ(e1) τ(e2)  τ(en)]A = [\tau(e_1)\ \tau(e_2)\ \cdots\ \tau(e_n)]

此外还要引入一个重要概念,ker(τ)={uUτ(u)=0}ker(\tau) = \{ u\in U| \tau(u) = 0 \},中文名应该是线性变换的。这一概念读者可以与矩阵的零空间类比,基本一样。留个小例题,证明:ker(τ)=0τker(\tau)=0 \Leftrightarrow \tau是单射

看到这读者可能会有点感觉(希望如此),每个矩阵实际上都代表着一个线性变换,是从一个向量空间到另一个向量空间的映射。

定理介绍

这一小节会介绍一些线性变换的常用定理,基本上都和空间维度扯点关系。

首先还是引入一些概念,我们把线性映射称作同构(isomorphism),如果它是个双射(bijiective),或者等价地:im(τ)=Vim(\tau)=V and ker(τ)=0ker(\tau)=0
而如果 τ:UV\tau: U\to V 是个同构,那么 U,VU,V 就是同构的(isomorphic)

定理一、两个向量空间是同构的,当且仅当他们的维度相同
证明

定理二、 如果τ:UV\tau: U\to V 是一个线性变换,那么
dim U=dim im(τ)+dim ker(τ) dim\ U = dim\ im(\tau) + dim\ ker(\tau)
Proof.Proof.
HHker(τ)ker(\tau) 在空间U的补,U=ker(τ)HU=ker(\tau) \oplus H,那么 dim(U)=dimker(τ)+dimHdim(U)=dim ker(\tau)+dim H,所以我们要证明dimH=dim im(τ)dimH=dim\ im(\tau)。 根据定理一,我们需要证明两个空间是同构的,也就是要找出他们之间的一个同构映射(isomorphism)ϕ:Him(τ)\phi: H\to im(\tau).

ϕ=τH\phi=\tau|_{H},也就是把 τ\tau 的定义域限制在了 H,此时 ϕ\phi 必然是一个线性变换,来证明他是个双射就OK啦。

首先证明满射,对 vim(τ),u s.t. v=τ(u)\forall v\in im(\tau), \exists u\ s.t.\ v=\tau(u),存在唯一的 hH,ξker(τ):u=h+ξv=τ(u)=τ(h+ξ)=τ(h)=τH(h)=ϕ(h)h\in H, \xi\in ker(\tau): u=h+\xi \Rightarrow v=\tau(u)=\tau(h+\xi)=\tau(h) = \tau|_H(h) = \phi(h). 所以 τ\tau 是满射。

对于单射,我们需要证明 ker(ϕ)=0ker(\phi)=0. 假设存在 h 使得 ϕ(h)=00=ϕ(h)=τ(h)hker(τ)\phi(h)=0 \Rightarrow 0=\phi(h) = \tau(h)\Rightarrow h\in ker(\tau), 所以 hHker(τ)=0h=0h\in H\cap ker(\tau)=0\Rightarrow h=0. So ker(ϕ)=0ker(\phi)=0. 所以是单射。

线性变换与换基

原谅我现在懒得写了。。。有空补上!
先放张图大家自己体会吧 ????

矩阵与线性变换

相似矩阵

矩阵乘法