1. p.128
图中,从上式到下式的推导不是很明了,困惑在于上式中右边含有α1,α2这样岂不是和左边的α2相消?若能相消,上述求偏导的过程中岂不是忽略了v1,v2是α1,α2的函数?答案并非如此,左边的α与右边的α2相当不同。
2. 定理7.6的证明
即求最优化问题:
minα1,α2W(α1,α2)=12K11α21+12K22α22+y1y2K21α1α2−(α1+α2)+y1α1∑i=3NyiαiKi1+y2α2∑i=3NyiαiKi2s.t.α1y1+α2y2=−∑i=3Nyiαi=ς(1)0≤αi≤C,i=1,2(2)
沿着约束方向未经剪辑的解为:
αnew,unc2=αold2+y2(E1−E2)η
其中,
η=K11+K22−2K21=‖Φ(x1)−Φ(x2)‖2Ei=g(xi)−yi,i=1,2g(x)=∑i=1NαiyiK(xi,x)+b
Ei为函数g(xi)对输入xi的预测值与真实输出yi之间的差.
证明:
引入记号变量 vi=∑j=3NαjyjK(xi,xj)=g(xi)−∑j=12αjyjK(xi,xj)−b,i=1,2
再由α1y1+α2y2=ς和 y2i=1可将目标函数W(α1,α2)表示成只含α2的函数:
W(α2)=12K11(ς−α2y2)2+12K22α22+y2K21(ς−α2y2)α2−(ς−α2y2)y1−α2+v1(ς−α2y2)+y2v2α2
对α2求偏导可得:
∂W∂α2=K11α2+K22α2−2K21α2−K11ςy2+K21ςy2+y1y2−1−v1y2+v2y2
令其等于0,即可求出上述问题的最优解,得到:
(K11+K22−2K21)α2=y2(y2−y1+ςK11−ςK21+v1−v2)(2−1)
这里,不同与书上,我先求v1−v2, 由vi的定义可知v1−v2为:
v1−v2=⟮g(x1)−∑j=12yjαjK1j−b⟯−⟮g(x2)−∑j=12yjαjK2j−b⟯=g(x1)−g(x2)+y1α1K21−y1α1K11+y2α2K22−y2α2K21∵α1y1+α2y2=ς,y21=1∴α1=(ς−y2α2)y1,代入得,=g(x1)−g(x2)+(ς−y2α2)K21−(ς−y2α2)K11−y2α2K21+y2α2K22=g(x1)−g(x2)+ςK21−ςK11+y2α2(K11+K22−2K21)
值得注意的是,v1−v2中的α1,α2是没有更新前的α,即αold
∴v1−v2=g(x1)−g(x2)+ςK21−ςK11+y2αold2(K11+K22−2K21)
将上式代入到式(2-1)
中即可求得
αnew,unc2=αold2+y2(E1−E2)η