1.8 线性变换介绍(第1章 线性代数中的线性方程组)

内容概述

本节先从矩阵方程引入了向量变换的一系列概念,接着以矩阵变换为例,探讨了引入向量变换概念后,一些思考问题的新角度以及和之前章节一些概念的结合。最后,由矩阵变换的性质引入了一类比较重要的变换:线性变换,并探讨了线性变换的性质和几个线性变换的例子。

变换的概念

矩阵方程Ax=bA\boldsymbol x = \boldsymbol b
在线性代数中的应用不仅仅是直接与向量的线性组合问题有关,通常的情况是把矩阵AA当作一种对象,它通过乘法“作用”于向量x\boldsymbol x,产生的新向量称为AxA\boldsymbol x
例:
参考下面的方程Ax=bA\boldsymbol x = \boldsymbol b
[43132051][1111]=[58] \begin{bmatrix}4 & -3 & 1 & 3 \\ 2 & 0 & 5 & 1\end{bmatrix}\begin{bmatrix}1 \\ 1 \\ 1 \\ 1\end{bmatrix} = \begin{bmatrix}5 \\ 8\end{bmatrix}
和下面的方程Au=0A\boldsymbol u = \boldsymbol 0
[43132051][1413]=[00] \begin{bmatrix}4 & -3 & 1 & 3 \\ 2 & 0 & 5 & 1\end{bmatrix}\begin{bmatrix}1 \\ 4 \\ -1 \\ 3\end{bmatrix} = \begin{bmatrix}0 \\ 0\end{bmatrix}
乘以矩阵AA后,将x\boldsymbol x变成b\boldsymbol b,将u\boldsymbol u变成0\boldsymbol 0
1.8 线性变换介绍(第1章 线性代数中的线性方程组)
由这个新观点,解方程Ax=bA\boldsymbol x = \boldsymbol b就是要求出R4\mathbb R^4中所有经过乘以AA的“作用”后,变为R2\mathbb R^2b\boldsymbol b的向量的x\boldsymbol x

x\boldsymbol xAxA\boldsymbol x对应由一个向量集到另一个向量集的函数。这个概念推广了通常的函数概念。

Rn\mathbb R^nRm\mathbb R^m的一个变换T\boldsymbol T是一个规则,它把Rn\mathbb R^n中每个向量x\boldsymbol x对应以Rm\mathbb R^m中的一个向量T(x)\boldsymbol T(\boldsymbol x)。集Rn\mathbb R^n称为T\boldsymbol T定义域,而Rm\mathbb R^m称为T\boldsymbol T余定义域。符号T:RnRm\boldsymbol T: \mathbb R^n \rightarrow \mathbb R^m说明T\boldsymbol T的定义域是Rn\mathbb R^n而余定义域是Rm\mathbb R^m。对于Rn\mathbb R^n中的向量x\boldsymbol xRm\mathbb R^m中向量T(x)\boldsymbol T(\boldsymbol x)称为x\boldsymbol x(在T\boldsymbol T作用下)的像。所有像T(x)\boldsymbol T(\boldsymbol x)的集合称为T\boldsymbol T值域
1.8 线性变换介绍(第1章 线性代数中的线性方程组)
这里要注意余定义域值域的区别:

余定义域仅仅说明了定义域中x\boldsymbol x的像存在于哪个空间,而值域则说明了x\boldsymbol x的像的具体的取值范围。从这个意义上来说,值域一定是余定义域的子集。

这里引入了向量变换的重要概念,至于变换的类型和性质,则由下文继续深入。

矩阵变换

对于一个m×nm \times n的矩阵AA,将矩阵变换AxA\boldsymbol x记为xAx\boldsymbol x \rightarrow A\boldsymbol x。需要注意的是,根据矩阵运算的法则,上述变换T\boldsymbol T的定义域为Rn\mathbb R^nAAnn列意味着有nn个未知数,说明x\boldsymbol x属于Rn\mathbb R^n),余定义域为Rm\mathbb R^mAxA\boldsymbol x的计算结果可以看成是矩阵AA各列的线性组合,因此计算出来的结果向量肯定和组成AA的各列的向量元素个数相等,属于Rm\mathbb R^m),T\boldsymbol T的值域为AA的列的所有线性组合(从等价的向量方程的角度去看待矩阵方程可以得出这个观点)。
例:
A=[133517]A=\begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix}u=[21]\boldsymbol u=\begin{bmatrix}2 \\ -1\end{bmatrix}b=[325]\boldsymbol b=\begin{bmatrix}3 \\ 2 \\-5\end{bmatrix}c=[325]\boldsymbol c=\begin{bmatrix}3 \\ 2 \\5\end{bmatrix},定义变换T:R2R3\boldsymbol T: \mathbb R^2 \rightarrow \mathbb R^3T(x)=Ax\boldsymbol T(\boldsymbol x) = A\boldsymbol x,于是:
T(x)=Ax=[133517][x1x2]=[x13x23x1+5x2x1+7x2] \boldsymbol T(\boldsymbol x) = A\boldsymbol x = \begin{bmatrix}1 & -3 \\ 3 & 5 \\ -1 & 7\end{bmatrix}\begin{bmatrix}x_1 \\ x_2\end{bmatrix} = \begin{bmatrix}x_1 - 3x_2 \\ 3x_1 + 5x_2 \\ -x_1 + 7x_2\end{bmatrix}
a. 求u\boldsymbol u在变换T\boldsymbol T下的像T(x)\boldsymbol T(\boldsymbol x)
b. 求R2\mathbb R^2中的向量x\boldsymbol x,使它在T\boldsymbol T下的像是b\boldsymbol b
c. 是否有其他向量在T\boldsymbol T下的像也是b\boldsymbol b
d. 确定c\boldsymbol c是否属于变换T\boldsymbol T的值域。
解:
a. 通过计算,可得T(u)=[519]\boldsymbol T(\boldsymbol u) = \begin{bmatrix}5 \\ 1 \\ 9\end{bmatrix},也就是说,变换T\boldsymbol TR2\mathbb R^2中的向量u\boldsymbol u变换为了R3\mathbb R^3中的另一个向量。如图所示:
1.8 线性变换介绍(第1章 线性代数中的线性方程组)
b. 本质就是要求解矩阵方程Ax=bA\boldsymbol x = \boldsymbol b,增广行化简得到:
[101.5010.5000] \begin{bmatrix}1 & 0 & 1.5 \\ 0 & 1 & -0.5 \\ 0 & 0 & 0 \end{bmatrix}
易知,向量x=[1.50.5]\boldsymbol x = \begin{bmatrix}1.5 \\ -0.5\end{bmatrix}T\boldsymbol T下的像是给定的向量b\boldsymbol b
c. 由上述增广矩阵的形式可以看出,方程的解是唯一的,所以仅有一个x\boldsymbol x使它的像是b\boldsymbol b
d. 问题表达的是:对某个x\boldsymbol xc=T(x)\boldsymbol c = \boldsymbol T(\boldsymbol x),也就是说,方程组Ax=cA\boldsymbol x = \boldsymbol c是否相容。将对应的增广矩阵进行行化简后得:
[1330120035] \begin{bmatrix}1 & -3 & 3 \\ 0 & 1 & 2 \\ 0 & 0 & -35 \end{bmatrix}
明显的,该方程组不相容,因此c\boldsymbol c不属于T\boldsymbol T的值域(但根据定义,c\boldsymbol c仍属于T\boldsymbol T的余定义域,T\boldsymbol T的余定义域为R3\mathbb R^3)。

下面是矩阵变换的几个例子,可以从图形学的角度感受下矩阵变换的作用:
1.8 线性变换介绍(第1章 线性代数中的线性方程组)
1.8 线性变换介绍(第1章 线性代数中的线性方程组)

线性变换

1.4节引入了如下定理:

AAm×nm \times n矩阵,则变换xAx\boldsymbol x \rightarrow A\boldsymbol x有以下性质:
A(u+v)=Au+AvA(\boldsymbol u + \boldsymbol v) = A\boldsymbol u + A\boldsymbol v
A(cu)=cAuA(c\boldsymbol u) = cA\boldsymbol u

参考矩阵的上述性质,引入线性代数中最重要的一类变换:
定义:

变换(或映射)T\boldsymbol T称为线性的,若:
a. 对T\boldsymbol T的定义域中一切u\boldsymbol uv\boldsymbol vT(u+v)=T(u)+T(v)\boldsymbol T(\boldsymbol u + \boldsymbol v) = \boldsymbol T(\boldsymbol u) + \boldsymbol T(\boldsymbol v)
b. 对T\boldsymbol T的定义域中一切u\boldsymbol u和数ccT(cu)=cT(u)\boldsymbol T(c\boldsymbol u) = c\boldsymbol T(\boldsymbol u)

显然,每个矩阵变换都是线性变换。另一方面,虽然线性变换的概念由矩阵变换引入,但线性变换并不仅仅局限于矩阵变换,只要满足上述定义中的条件的变换都可以称为线性变换。
上述性质(a)说明,先将Rn\mathbb R^n中的u\boldsymbol uv\boldsymbol v相加然后再作用以T\boldsymbol T的结果T(u+v)\boldsymbol T(\boldsymbol u + \boldsymbol v)等于先把T\boldsymbol T作用于u\boldsymbol uv\boldsymbol v然后将Rm\mathbb R^m中的T(u)\boldsymbol T(\boldsymbol u)T(v)\boldsymbol T(\boldsymbol v)相加。
由上述性质又可以推出如下的性质:

T\boldsymbol T是线性变换,则:
T(0)=0\boldsymbol T(\boldsymbol 0) = \boldsymbol 0
且对T\boldsymbol T的定义域中一切向量u\boldsymbol uv\boldsymbol v以及数ccdd有:
T(cu+dv)=cT(u)+dT(v)\boldsymbol T(c\boldsymbol u + d\boldsymbol v) = c\boldsymbol T(\boldsymbol u) + d\boldsymbol T(\boldsymbol v)

证明如下:

T(0)=T(00)=0T(0)=0\boldsymbol T(\boldsymbol 0) = \boldsymbol T(0 \cdot \boldsymbol0) = 0\boldsymbol T(\boldsymbol 0) = \boldsymbol 0
T(cu+dv)=T(cu)+T(dv)=cT(u)+dT(v)\boldsymbol T(c\boldsymbol u + d\boldsymbol v) = \boldsymbol T(c\boldsymbol u) + \boldsymbol T(d\boldsymbol v) = c\boldsymbol T(u) + d\boldsymbol T(v)

并且,对于所有u\boldsymbol uv\boldsymbol vccdd,若一个变换满足T(cu+dv)=cT(u)+dT(v)\boldsymbol T(c\boldsymbol u + d\boldsymbol v) = c\boldsymbol T(\boldsymbol u) + d\boldsymbol T(\boldsymbol v),它必是线性的(取c=d=1c = d =1可得T(u+v)=T(u)+T(v)\boldsymbol T(\boldsymbol u + \boldsymbol v) = \boldsymbol T(\boldsymbol u) + \boldsymbol T(\boldsymbol v)),取d=0d = 0可得T(cu)=cT(u)\boldsymbol T(c\boldsymbol u) = c\boldsymbol T(\boldsymbol u)
可以推广到大于两个向量的向量集的情况:
T(c1v1++cpvp)=c1T(v1)++cpT(vp) \boldsymbol T(c_1\boldsymbol v_1 + \cdots + c_p\boldsymbol v_p) = c_1\boldsymbol T(\boldsymbol v_1) + \cdots + c_p\boldsymbol T(\boldsymbol v_p)
上式称为叠加原理。设想v1,v2,,vp\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_p为进入某个系统的信号,T(v1),T(v2),,T(vp)\boldsymbol T(\boldsymbol v_1),\boldsymbol T(\boldsymbol v_2),\cdots,\boldsymbol T(\boldsymbol v_p)为系统对这些信号的响应。系统满足叠加原理,若某一输入可表示为这些信号的线性组合,则系统的响应是对各个信号的响应的同样的线性组合。
例:

给定实数rr,定义T:R2R2\boldsymbol T: \mathbb R^2 \rightarrow \mathbb R^2T(x)=rx\boldsymbol T(\boldsymbol x) = r\boldsymbol x。设r=3r=3,证明T\boldsymbol T是线性变换。

解:

u\boldsymbol uv\boldsymbol v属于R2\mathbb R^2cc,dd为数,则有:
T(cu+dv)=3(cu+dv)=3cu+3dv=c(3u)+d(3v)=cT(u)+dT(v) \boldsymbol T(c\boldsymbol u + d\boldsymbol v)=3(c\boldsymbol u + d\boldsymbol v) = 3c\boldsymbol u + 3d \boldsymbol v=c(3\boldsymbol u) + d(3 \boldsymbol v)=c\boldsymbol T(\boldsymbol u) + d\boldsymbol T(\boldsymbol v)
因此,T\boldsymbol T是线性变换。

事实上,当0r10 \leq r \leq 1时,T\boldsymbol T称为压缩变换,当r>1r > 1时,$
\boldsymbol T$称为拉伸变换。
1.8 线性变换介绍(第1章 线性代数中的线性方程组)
例:

下图是u=[41]\boldsymbol u = \begin{bmatrix}4 \\ 1\end{bmatrix}u=[23]\boldsymbol u = \begin{bmatrix}2 \\ 3\end{bmatrix},和u+v=[64]\boldsymbol u + \boldsymbol v = \begin{bmatrix}6 \\ 4\end{bmatrix}T=A=[0110]\boldsymbol T = A = \begin{bmatrix}0 & -1 \\ 1 & 0\end{bmatrix}下的像:
1.8 线性变换介绍(第1章 线性代数中的线性方程组)
这里可以从几何意义上分别看到该变换的意义(逆时针旋转90°)以及变换的性质(T(u+v)=T(u)+T(v)\boldsymbol T(\boldsymbol u + \boldsymbol v) = \boldsymbol T(\boldsymbol u) + \boldsymbol T(\boldsymbol v)