内容概述
本节先从矩阵方程引入了向量变换的一系列概念,接着以矩阵变换为例,探讨了引入向量变换概念后,一些思考问题的新角度以及和之前章节一些概念的结合。最后,由矩阵变换的性质引入了一类比较重要的变换:线性变换,并探讨了线性变换的性质和几个线性变换的例子。
变换的概念
矩阵方程Ax=b:
在线性代数中的应用不仅仅是直接与向量的线性组合问题有关,通常的情况是把矩阵A当作一种对象,它通过乘法“作用”于向量x,产生的新向量称为Ax。
例:
参考下面的方程Ax=b:
[42−301531]⎣⎢⎢⎡1111⎦⎥⎥⎤=[58]
和下面的方程Au=0:
[42−301531]⎣⎢⎢⎡14−13⎦⎥⎥⎤=[00]
乘以矩阵A后,将x变成b,将u变成0
由这个新观点,解方程Ax=b就是要求出R4中所有经过乘以A的“作用”后,变为R2中b的向量的x。
由x到Ax对应由一个向量集到另一个向量集的函数。这个概念推广了通常的函数概念。
由Rn到Rm的一个变换T是一个规则,它把Rn中每个向量x对应以Rm中的一个向量T(x)。集Rn称为T的定义域,而Rm称为T的余定义域。符号T:Rn→Rm说明T的定义域是Rn而余定义域是Rm。对于Rn中的向量x,Rm中向量T(x)称为x(在T作用下)的像。所有像T(x)的集合称为T的值域。
这里要注意余定义域和值域的区别:
余定义域仅仅说明了定义域中x的像存在于哪个空间,而值域则说明了x的像的具体的取值范围。从这个意义上来说,值域一定是余定义域的子集。
这里引入了向量变换的重要概念,至于变换的类型和性质,则由下文继续深入。
矩阵变换
对于一个m×n的矩阵A,将矩阵变换Ax记为x→Ax。需要注意的是,根据矩阵运算的法则,上述变换T的定义域为Rn(A有n列意味着有n个未知数,说明x属于Rn),余定义域为Rm(Ax的计算结果可以看成是矩阵A各列的线性组合,因此计算出来的结果向量肯定和组成A的各列的向量元素个数相等,属于Rm),T的值域为A的列的所有线性组合(从等价的向量方程的角度去看待矩阵方程可以得出这个观点)。
例:
设A=⎣⎡13−1−357⎦⎤,u=[2−1],b=⎣⎡32−5⎦⎤,c=⎣⎡325⎦⎤,定义变换T:R2→R3为T(x)=Ax,于是:
T(x)=Ax=⎣⎡13−1−357⎦⎤[x1x2]=⎣⎡x1−3x23x1+5x2−x1+7x2⎦⎤
a. 求u在变换T下的像T(x)
b. 求R2中的向量x,使它在T下的像是b
c. 是否有其他向量在T下的像也是b?
d. 确定c是否属于变换T的值域。
解:
a. 通过计算,可得T(u)=⎣⎡519⎦⎤,也就是说,变换T将R2中的向量u变换为了R3中的另一个向量。如图所示:
b. 本质就是要求解矩阵方程Ax=b,增广行化简得到:
⎣⎡1000101.5−0.50⎦⎤
易知,向量x=[1.5−0.5]在T下的像是给定的向量b。
c. 由上述增广矩阵的形式可以看出,方程的解是唯一的,所以仅有一个x使它的像是b。
d. 问题表达的是:对某个x,c=T(x),也就是说,方程组Ax=c是否相容。将对应的增广矩阵进行行化简后得:
⎣⎡100−31032−35⎦⎤
明显的,该方程组不相容,因此c不属于T的值域(但根据定义,c仍属于T的余定义域,T的余定义域为R3)。
下面是矩阵变换的几个例子,可以从图形学的角度感受下矩阵变换的作用:
线性变换
1.4节引入了如下定理:
若A是m×n矩阵,则变换x→Ax有以下性质:
A(u+v)=Au+Av
A(cu)=cAu
参考矩阵的上述性质,引入线性代数中最重要的一类变换:
定义:
变换(或映射)T称为线性的,若:
a. 对T的定义域中一切u,v,T(u+v)=T(u)+T(v)
b. 对T的定义域中一切u和数c,T(cu)=cT(u)
显然,每个矩阵变换都是线性变换。另一方面,虽然线性变换的概念由矩阵变换引入,但线性变换并不仅仅局限于矩阵变换,只要满足上述定义中的条件的变换都可以称为线性变换。
上述性质(a)说明,先将Rn中的u和v相加然后再作用以T的结果T(u+v)等于先把T作用于u和v然后将Rm中的T(u)和T(v)相加。
由上述性质又可以推出如下的性质:
若T是线性变换,则:
T(0)=0
且对T的定义域中一切向量u和v以及数c和d有:
T(cu+dv)=cT(u)+dT(v)
证明如下:
T(0)=T(0⋅0)=0T(0)=0
T(cu+dv)=T(cu)+T(dv)=cT(u)+dT(v)
并且,对于所有u,v和c,d,若一个变换满足T(cu+dv)=cT(u)+dT(v),它必是线性的(取c=d=1可得T(u+v)=T(u)+T(v)),取d=0可得T(cu)=cT(u)
可以推广到大于两个向量的向量集的情况:
T(c1v1+⋯+cpvp)=c1T(v1)+⋯+cpT(vp)
上式称为叠加原理。设想v1,v2,⋯,vp为进入某个系统的信号,T(v1),T(v2),⋯,T(vp)为系统对这些信号的响应。系统满足叠加原理,若某一输入可表示为这些信号的线性组合,则系统的响应是对各个信号的响应的同样的线性组合。
例:
给定实数r,定义T:R2→R2为T(x)=rx。设r=3,证明T是线性变换。
解:
设u,v属于R2,c,d为数,则有:
T(cu+dv)=3(cu+dv)=3cu+3dv=c(3u)+d(3v)=cT(u)+dT(v)
因此,T是线性变换。
事实上,当0≤r≤1时,T称为压缩变换,当r>1时,$
\boldsymbol T$称为拉伸变换。
例:
下图是u=[41],u=[23],和u+v=[64]在T=A=[01−10]下的像:
这里可以从几何意义上分别看到该变换的意义(逆时针旋转90°)以及变换的性质(T(u+v)=T(u)+T(v))