向量范数与矩阵范数

范数(norm),是具有“长度”概念的函数。在线性代数、泛函分析及相关的数学领域,范函是一个函数,其为矢量空间内的所有矢量赋予非零的正长度或大小。半范数反而可以为非零的矢量赋予零长度。

举一个简单的例子,在二维的欧氏几何空间 R就可定义欧氏范数。在这个矢量空间中的元素常常在笛卡儿坐标系统中被画成一个从原点出发的带有箭头的有向线段。每一个矢量的欧氏范数就是有向线段的长度。

其中定义范数的矢量空间就是赋范矢量空间。同样,其中定义半范数的矢量空间就是赋半范矢量空间。

向量范数

概念

设函数f:RnRf:Rn→R,若ff满足

  1. 正定性:f(x)0xRnf(x)≥0,∀x∈Rn,等号当且仅当x=0x=0时候成了。
  2. 正齐次性:f(αx)=|α|×f(x)xRnαRf(αx)=|α|×f(x),∀x∈Rn,∀α∈R
  3. 次可加性(三角不等式):f(x+y)f(x)+f(y)f(x+y)≤f(x)+f(y)

例如:

xp=(i=1n|xi|p)1p,p[1,)Rn‖x‖p=(∑i=1n|xi|p)1p,p∈[1,∞)是Rn上的向量范数。

常见的范数

这里以CnCn空间为例,RnRn空间类似。 
最常用的范数就是p-范数。若x=[x1,x2,,xn]Tx=[x1,x2,…,xn]T,那么

xp=(|x1|p+|x2|p++|xn|p)1p‖x‖p=(|x1|p+|x2|p+⋯+|xn|p)1p

可以验证p-范数确实满足范数的定义。其中三角不等式的证明不是平凡的,这个结论通常称为闵可夫斯基(Minkowski)不等式。

当p取1,2,∞的时候分别是以下几种最简单的情形: 
1-范数:x1=x1+x2++xn║x║1=│x1│+│x2│+…+│xn│ 
2-范数:x2=(x12+x22++xn2)1/2║x║2=(│x1│2+│x2│2+…+│xn│2)1/2 
∞-范数(最大范数):x=max(x1x2xn║x║∞=max(│x1│,│x2│,…,│xn│)

其中2-范数就是通常意义下的距离。

范数的性质

(1)连续性 
ffRnRn上的任意一个范数,则ff关于xx的每个分量是连续的。

(2)等价性 
s‖⋅‖st‖⋅‖tRnRn上的任意两个范数,则存在常数c1c1c2c2,使得对任意的xRnx∈Rn有 

c1xsxtc2xsc1‖x‖s≤‖x‖t≤c2‖x‖s

(3)不等式

对于这些常用的范数有以下不等式:xx2x1n12x2nx║x║∞≤║x║2≤║x║1≤n12║x║2≤n║x║∞ 
另外,若p和q是赫德尔(Hölder)共轭指标,即1/p+1/q=1,那么有赫德尔不等式: 

|<x,y>|=||xHy|xpyq|<x,y>|=||xH∗y|≤║x║p║y║q

当p=q=2时就是柯西-许瓦兹(Cauchy-Schwarz)不等式。

(4)向量序列的收敛性 

limkx(k)=xlimkx(k)x=0limk→∞x(k)=x∗⇐⇒limk→∞‖x(k)−x∗‖=0

矩阵范数

概念

一般来讲矩阵范数除了正定性,齐次性和三角不等式之外,还规定其必须满足相容性:XYXY║XY║≤║X║║Y║

所以矩阵范数通常也称为相容范数。

如果α║·║α是相容范数,且任何满足βα║·║β≤║·║α的范数β║·║β都不是相容范数,那么α║·║α称为极小范数。对于nn阶实方阵(或复方阵)全体上的任何一个范数║·║,总存在唯一的实数k>0k>0,使得k×k×║·║是极小范数。 
注:如果不考虑相容性,那么矩阵范数和向量范数就没有区别,因为m×nm×n矩阵全体和mnmn维向量空间同构。引入相容性主要是为了保持矩阵作为线性算子的特征,这一点和算子范数的相容性一致,并且可以得到Mincowski定理以外的信息。

常见的矩阵范数

满足以上设定的矩阵范数可以有多种。由于它们都是定义在Mm,n(K)Mm,n(K)这个有限维向量空间上的范数,所以实质上是等价的。常见的矩阵范数通常是在矩阵的应用中自然定义或诱导的范数。

向量范数诱导的矩阵范数

考虑从向量空间V=KmV=Km映射到W=KnW=Kn的所有线性映射的构成的空间:Lm,n(K)Lm,n(K)。设VVWW中分别装备了两个向量范数V‖⋅‖VW‖⋅‖W,则可以定义Lm,n(K)Lm,n(K)上的算子范数L‖⋅‖L:

ALm,n(K)∀A∈Lm,n(K)

AL=max{A(x)W;xV,xV1}‖A‖L=max{‖A(x)‖W;x∈V,‖x‖V⩽1}

而给定了基底后,每个从V映射到W的线性映射都可以用一个m \times n的矩阵来表示,所以同样地可以定义Mm,n(K)Mm,n(K)上的非负映射M‖⋅‖M:

AMm,n(K)∀A∈Mm,n(K)

AL=max{A(x)W;xV,xV1}‖A‖L=max{‖A(x)‖W;x∈V,‖x‖V⩽1}

可以验证,M‖⋅‖M满足矩阵范数的定义,因此是一个矩阵范数。这个矩阵范数被称为是由向量空间范数诱导的矩阵范数,可以看作是算子范数在由有限维向量空间之间线性映射组成的空间上的特例。如果m=nm=n,所对应的矩阵空间就是n阶方块矩阵空间Mn(K)Mn(K)。这时可以验证,诱导范数M‖⋅‖M满足一致性条件。

p-范数诱导的矩阵范数

VVWW中装备的向量范数都是p-范数的时候,诱导的矩阵范数也称为矩阵的诱导p-范数。具体来说就是: 

Ap=maxx0Axpxp=maxx0(ni=1|mj=1Aijxj|p)1/p(mi=1|xi|p)1/p‖A‖p=maxx≠0‖Ax‖p‖x‖p=maxx≠0(∑i=1n|∑j=1mAijxj|p)1/p(∑i=1m|xi|p)1/p

在p=1和p=p=∞的情况下,其范数可以以下方式计算:

A1=max1jni=1m|aij|A=max1imj=1n|aij|.‖A‖1=max1≤j≤n∑i=1m|aij|‖A‖∞=max1≤i≤m∑j=1n|aij|.

这些与矩阵的Schatten p-范数不同,也可以用 Ap‖A‖p来表示。 
当p = 2(欧几里德范数)且m = n(方阵)时,诱导的矩阵范数就是谱范数。矩阵A的谱范数是A最大的奇异值或半正定矩阵A*A的最大特征值的平方根: 
A2=λmax(AA)‖A‖2=λmax(A∗A)

其中AA∗代表A的共轭转置。

矩阵元范数

这些向量范数将矩阵视为m×nm×n向量,并使用类似的向量范数。 
举例说明,使用向量的p-范数,我们得到: 

Ap=(i=1mj=1n|aij|p)1/p‖A‖p=(∑i=1m∑j=1n|aij|p)1/p

注:不要把矩阵元p-范数与诱导p-范数混淆。

弗罗贝尼乌斯范数

p=2p=2,这称为弗罗贝尼乌斯范数(Frobenius norm)或希尔伯特-施密特范数(Hilbert–Schmidt norm),不过后面这个术语通常只用于希尔伯特空间。这个范数可用不同的方式定义: 

AF=i=1mj=1n|aij|2=trace(AA)=i=1min{m,n}σ2i‖A‖F=∑i=1m∑j=1n|aij|2=trace⁡(A∗A)=∑i=1min{m,n}σi2

这里AA∗表示AA的共轭转置,σiσiAA奇异值,并使用了迹函数。弗罗贝尼乌斯范数与KnKn上欧几里得范数非常类似,来自所有矩阵的空间上一个内积。 
弗罗贝尼乌斯范范数是服从乘法的且在数值线性代数中非常有用。这个范数通常比诱导范数容易计算。

矩阵范数性质

矩阵范数的性质

(1)连续性:设ffRn×nRn×n上的任一矩阵范数,则ff关于AA的每个分量是连续的。

(2)等价性:设s‖⋅‖st‖⋅‖tRn×nRn×n上的任意两个矩阵范数,则存在常数c1c1c2c2,使得对任意的ARn×nA∈Rn×n有 

c1AsAtc2Asc1‖A‖s≤‖A‖t≤c2‖A‖s

(3) 
任何诱导的矩阵范数都满足此不等式 
Aρ(A)‖A‖≥ρ(A)

其中ρ(A)ρ(A)AA的谱半径。事实上,可以证明ρ(A)ρ(A)AA的所有诱导范数的下界。 
此外,我们有 
limrAr1/r=ρ(A)limr→∞‖Ar‖1/r=ρ(A)。 
若A是对称矩阵,则ρ(A)=A2ρ(A)=‖A‖2

算子范数的性质

定理: 
‖⋅‖RnRn上的任一向量范数,其对应的算子范数也记为‖⋅‖,则有

AxA×x‖Ax‖≤‖A‖×‖x‖

定理: 
‖⋅‖是任一算子范数,则ρ(A)Aρ(A)≤‖A‖

定理: 
对任意ε>0ε>0,总存在一个算子范数ε‖⋅‖ε,使得 

ερ(A)+ε‖⋅‖ε≤ρ(A)+ε

这个图的计算可能有一些问题 
向量范数与矩阵范数