漫步最优化四十二——Partan法

漆黑的冷空中有你，
惺忪的眼睛中有你，
心底的记忆中有你，
你留在我的脑海中，
一直这么挥之不去。
无论哪时哪刻，
心中都想着你的笑，
想着你到我侧相拥，
I can dream about you.
——畅宝宝的傻逼哥哥

在早期的最优化中，对于两变量函数来说，用最速下降法得出的解轨迹表征出zig-zag模式。对于某些性质较好的函数，相邻的解差不多组成两条线，他们在最小值的邻域内相交，如图1所示，因此比较明显的策略是连接初始点与第二个解，沿着这个方向执行最速下降法。对于凸二次函数，在n次迭代内就能收敛，这个方法也被称为parallel tangent法或着partan法，这是因为在二次函数的情况下，所得轮廓的正切属性。

漫步最优化四十二——Partan法

图1

Partan算法如图2所示，假设初始点为x0，并利用两次最速下降法得到点x1,y1，然后沿着y1−x1方向进行线搜索得到点x2，这就完成了第一次迭代。对于第二次迭代，对点x2执行最速下降得到点y2，沿着y2−x1方向得到点x3，一直重复此过程。从效果上看，图2中的点y1,y2,…是通过最速下降法得到的而x2,x3,…是沿着方向y2−x1,y3−x2,…方向用线搜索得到的。

漫步最优化四十二——Partan法

图2

对于凸二次问题，连接x1,x2,…,xk的线组成一个共轭梯度方向集，可以通过以下方法来证明：先假设d0,d1,…,dk−1是共轭梯度方向集，然后说明dk是d0,d1,…,dk−1的共轭梯度方向。

考虑图3所示的步骤，注意到

g T k d i = 0 for 0 \leq i < k (1)

根据之前共轭梯度的结论可知点xk−1处的梯度可以写成

g k - 1 = \sum i = 0 k - 1 a i d i

其中ai,i=0,1,…,k−1为常数，所以

g T k g k - 1 = g T k (b + H x k - 1) = \sum i = 0 k - 1 a i g T k d i = 0 (2)

或者

g T k b = - g T k H x k - 1 (3)

因为yk是点xk用最速下降法得到的，所以我们有

y k - x k = - g k

另外

- g (y k) T g k = g T k (b + H y k) = 0

或者

g T k b = - g T k H y k (4)

因此，根据等式3与4可得

g T k H (y k - x k - 1) = 0 (5)

图3

因为

y k - x k - 1 = β (x k - 1 - x k - 1)

其中β是常数，等式5可以写成

g T k H (x k + 1 - x k - 1) = 0

或者

g T k H x k + 1 = g T k H x k - 1 (6)

接下来我们能够写成

g T k H x k + 1 = g T k H x k - 1 (7)

那么根据

g T k g k + 1 = g T k (b + H x k + 1) (8)

以及等式2，等式6与等式9可得

g T k g k + 1 = g T k (b + H x k - 1) = g T k g k - 1 = 0 (9)

点xk+1是在xk+1−yk方向上使用线搜索得到的，因此

g T k + 1 (x k + 1 - y k) = 0 (10)

从图3可以看出

x k + 1 = x k + d k (11)

且

y k = x k - α g k (12)

其中α是最小化f(xk−αgk)的α值，因此等式9，10与11得到

g T k + 1 (d k + α k g k) = 0

或者

g T k + 1 d k + α k g T k g k + 1 = 0 (13)

接下来根据等式8与12可得

g T k + 1 d k = 0

再结合等式1与13可得

g T k + 1 d i = 0 for 0 \leq i < k + 1

漫步最优化四十二——Partan法

相关推荐