计算机视觉---欧拉-拉格朗日方程
变分法
一、
欧拉-拉格朗日方程(The Euler-Lagrange equation)
最近经常看到这个,正好趁这次图像处理DDL总结一下。
文章结构
- 泛函
- 引例
- 欧拉拉格朗日方程
一、泛函
简单的说,泛函的定义域是函数集,值域是数集,也就是说,泛函是从函数空间到数域的一个映射。
实际上,推广开来,函数实际上是一种特殊的二元关系,二元关系是二阶笛卡尔积,所以函数集实际上是一个向量空间,所以泛函也可以说是从向量空间到标量的一个映射。
简而言之,泛函就是函数的函数。
泛函和函数的区别是:函数是变量和变量的关系,而泛函是变量和函数的关系。
二、引例
1.最短路径
众所周知,两点之间,线段最短。这是欧式几何的公理之一。从几何的角度很容易证明(反证)。但是,有没有解析的办法来证明呢?
答案是有的。
设平面上存在两点X1,X2,y=f(x)是平面上经过这两点的任意曲线。我们的目的,是求一个距离最短的f(x),这是函数和数之间的二元关系。显然,这里的定义域是f(x),也就是函数,而值域是距离,是一个数。所以这种关系是一个泛函,记为A[f]。
由弧微分公式易知。
2.最速降线
最速降线问题是伽利略提出的著名问题:一个质点在重力作用下,从一个给定点到不在它垂直下方的另一点,如果不计摩擦力,问沿着什么曲线滑下所需时间最短。换句话说,就是一个质点不是垂直的下落,只有重力做功,沿什么曲线下落所需时间最短。
这里的问题关键,是找到一条最优的曲线。下落时间是一个数值,所以这也是一个泛函问题。
由于只有重力做功,所以下落y之后的下落速度为。
选取这条曲线上很小的一段,这一段中,速度可以看成不变。易知通过这一段的时间是,分子是这一小段的弧长,分母是速度,所以这个值是通过这一段的时间。做一次积分,可以得到:
这就是总的时间,要求一个最优的f,使得该泛函的值最小。
三、欧拉-拉格朗日方程
这个方程是泛函中非常重要的方程,也是非常经典的能量泛函极小化的方法,不论在物理还是计算机领域,应用非常广泛。所谓能量泛函,是指微分的范数平方再积分。
它的最初的思想来源于微积分中“可导的极值点一定是稳定点(临界点)”。它的精髓思想在于:假定当前泛函的解已知,那么这个解必然使得泛函取得最小值(假定是最小值)。换言之,只要在泛函中加入任何扰动,都会使泛函的值变大,所以扰动为0的时候,就是泛函关于扰动的一个极小值。所以当扰动的能量趋近于0,泛函关于扰动的导数也是0。关键是扰动如何表示。答案是扰动用一个很小的数e乘上一个连续函数。当e趋近于0,意味着扰动也趋近于0。所以当a为0的时候,泛函对a的导数也为0。这就非常巧妙的把对函数求导的问题转化成了一个单因子变量求导的问题。这就是这个思想的伟大之处。
先不急于给出方程的具体形式,不妨根据上述思路,先用引例对方程做一个简单的推导(不是证明)。
函数f至少需为一阶可微的函数。若f0是一个局部最小值,而f1是一个在端点x1、x2取值为零并且至少有一阶导数的函数,则可得到以下的式子
其中ε为任意接近0的数字。
因此A[f0+εf1]对ε的导数(A的一阶导数)在ε=0时必为0。将A[f0+εf1]对ε求导,得到下式:
该式对于任意的满足条件的f1都成立。此条件可视为在可微分函数的空间中,A[f0]在各方向的导数均为0。若假设f0二阶可微,则利用分部积分法可得
其中f1为在两端点皆为0的任意二阶可微函数。记
其中f1为在两端点皆为0的任意可微函数。
若存在:使 H(x) > 0,即在周围有一区间内, H 为正值。
可以选择f1在此区间外为0,在此区间内为非负值,因此 I > 0,和前提不合。 若存在使H(x) < 0,也可证得类似的结果。因此可得到以下的结论:
由结论可推得下式:
这表明:两点间最短曲线为一直线。
一般地,考虑这样的泛函
形如这种形式的泛函,称为简单泛函。其中f二阶导连续。在这种情形下,满足欧拉-拉格朗日方程(简称E-L方程):
比如上述的最短路径问题,直接带入E-L方程,可以得到同样的结论,此处不再赘述。
这里用E-L方程推导一下最速降线。
假定y二阶导连续,则它满足E-L方程:
因为
所以
带入F的表达式,得
化简得,
不妨设
带入上式,得
再对θ求导
即
两边对θ求积分
所以,得到的曲线是
这就是摆线方程。所以最速降线就是摆线。
(p.s. 最速降线也可以用微分方程的办法解)
参考资料:
1.泛函和变分法
https://wenku.baidu.com/view/de17ef3a5727a5e9856a6164.html
2.变分法与最速降线的证明
http://www.docin.com/p-23966935.html
3.欧拉-拉格朗日方程的三种推导
https://wenku.baidu.com/view/0db3984cc281e53a5902ff31.html
二、
1.前言
若偏微分方程复杂或边界条件不规则时,则方程难以求得解析解,不得不求满足近似程度要求的近似解。变分法是常用的近似方法之一,而且,变分法的原理和应用遍及物理学的各个领域。所谓变分法即为泛函的极值问题。
2.泛函与泛函的极值
2.1 泛函的概念
最速落径问题,如图所示。A、B两点不在同一铅垂线,也不在同一高度。一质点在重力作用下无磨擦沿某曲线从A滑到B,求下滑的最短时间。或沿哪条曲线用时最短。
我们知道,质点下落速率与下落高度间的关系为:
所以
即T称为y(x)的泛函。
y(x)可取的函数种类,称泛函的定义域,泛函是函数的函数(不指复合函数)。
一般地, C是函数的集合, B是实数(或复数)的集合,若对于C中的任一称元素y(x) ,在B中均有一元素J与之对应,则称J为y(x) 的泛函是函数。
记为:
与通常函数的定义不同,泛函的值决定于函数的取形。如上例中,T的变化决定于y(x)的变化,而非某一个自变量x的值进而某一个函数y的值。而是决定于函数集合C中的函数关系,即决定于函数的取形。
通常,泛函多以积分形式出现,如:
其中,F(x,y,y`)称为泛函的核。
2.2泛函的极值与变分
在泛函的概念下,最速落径问题归结为泛函T[y(x)]的极值问题,所谓变分法,就是求泛函的极值问题。研究泛函极值问题的方法归为两类:直接法与间接法。要讨论间接法,先讨论泛函的变分问题。
设有连续函数y(x),将其微小变形为y(x)+tn(x)。
其中t是一个小参数,tn(x)称为y(x)的变分,记为δy。
此时,函数y`(x)相应变形为:
导数的变分等于变分的导数,变分微分运算可交换次序。
设中F(x,y,y`)二阶可导,y``连续!如果函数y(x)存在变分δy时,泛函J的变化为:
相对于y、y’作Tayler展开,抵消t的0次项,保留t的1次项,略去t的高阶项。
可得:
上式称泛函 J [y(x)]第一次变分!!!简称变分,记为:
3.泛函极值的必要条件——欧拉方程
设泛函 J [y(x)]的极值问题有解,记为y = y(x);现在来推导此解y(x)满足的常微分方程。
设y=y(x)有变分δy=tn(x), 则
可视为t的函数。
表示为:
这样,就把原来的泛函的极值问题转变成这种普通函数的极值问题。
令:
即:
将代入上式,得:
即:
同乘t 得:
泛函取极值的必要条件是其变分为0,或者说,泛函J的极值函数y(x)必须是满足泛函的变分dJ=0的函数类。所以泛函的极值问题称为变分问题。
又因为:
根据分部积分公式可以知道:
在简单变分问题中,端点是固定的:
所以可以得到:
这就是变分学中大名鼎鼎的“欧拉-朗格朗日条件”!!!
欧拉(Euler)方程是泛函有极值的必要条件。
4.经典最速落径问题求解
根据引言一节,最速路径问题用泛函描述为:
解:由于欧拉方程变形为 :
提取公共部分,可得:
简化为:
代入原方程,得:
求出偏导数得:
通分,并取平方可得
取.y(1+y`*y`)=c1,得:
令代入上式可得:
因此,我们就可以得到摆线得参数方程:
常数c1 、c2由A、B位置决定。
5.参考资料
1.钱伟长. 变分法及有限元[M]. 科学出版社, 1980.
2.郭大钧. 非线性泛函分析-第2版[M]. 山东科学技术出版社, 2001.