非线性优化中的KTT条件(知乎文章的理解)

知乎原文
对于优化问题:
max(f(x))min(f(x))hj(x)=0,j=1,2,3...gi(x)<=0,i=1,2,3... max(f(x)) 或者 min(f(x))\\ h_j(x)=0, j=1,2,3...\\ g_i(x)<=0, i=1,2,3...
其中xxnn维向量。若存在极值点xx^*,且满足约束,则有:
f(x)=jλjhj(x)+iμigi(x)μi0(gi(x)>=0,μi<=0),μigi(x)=0 \bigtriangledown f(x^*)=\sum_j\lambda_j\bigtriangledown h_j(x^*)+\sum_i\mu_i\bigtriangledown g_i(x^*)\\ \mu_i\geq0(若g_i(x)>=0,则\mu_i<=0),\mu_ig_i(x^*)=0
若点xx^*是极大值点,则在可行域中的任意方向上移动dxdxdf<=0df<=0

jλjhj(x)\sum_j\lambda_j\bigtriangledown h_j(x^*)组成的分量与所有hj(x)=0h_j(x)=0形成的可行域正交,所以df=0df=0。对于每个gi(x)<=0g_i(x)<=0形成的可行域,gi(x)\bigtriangledown g_i(x)在该可行域里所有方向上的分量系数非正,即夹角大于等于90°。

所以最终的可行域为,hj(x)=0h_j(x)=0形成的可行域的方向中,与每个gi(x)\bigtriangledown g_i(x)的夹角都大于等于90°的方向形成的可行域。

非线性优化中的KTT条件(知乎文章的理解)
图中h为jλjhj(x)\sum_j\lambda_j\bigtriangledown h_j(x^*)组成的分量,假设不等式约束只有一个,其梯度为g,左边扇形代表最终可行域,其与h正交,且与g的夹角大于等于90°。若g的系数μ\mu小于0,则f(x)\bigtriangledown f(x^*)将在可行域中的方向上有正的分量,不满足极大值的性质。所以μ\mu大于等于0。至于多个不等式约束的情况,不知道为什么每个μ\mu都要大于等于0,按照上图的简陋分析,,是不是只要每个gi(x)\bigtriangledown g_i(x^*)的加权和如上图g一样即可,不必每个μ\mu都大于等于0?这个问题暂时放着。