【最优化笔记1】引论知识(凸集与凸函数)

这个系列的最优化笔记以唐焕文老师的《实用最优化方法》为基础,主要分享我学习中认为重要的知识点,但不会全盘分享,我也没那个精力。

凸集与凸函数

1. 凸集

定义 :设Ω\Omega\subsetRnR^n,如果对于任意的点x,yΩx,y\in\Omega,连接点x,yx,y的线段上的一切点都在Ω\Omega中,则称Ω\Omega是一个凸集。其具体数学判别式为:
对于 \forallx,yΩx,y\in\Omega, \forallμ[0,1]\mu\in[0,1],恒有μ\mux+(1μ)yΩx+(1-\mu)y\in\Omega,则Ω\Omega为一个凸集。
e.g.e.g. : 单点集,RnR^n.

定理1(常考):集合Ω\Omega\subsetRnR^n为凸集的充要条件是:点x(i)Ω(i=1,2,...,p)x^{(i)}\in\Omega(i=1,2,...,p)的任意凸组合[1]^{[1]}仍包含在Ω\Omega中。
[1][1]凸组合:设实数ai0a_i\geq0 (i=1,2,...,p),i=1pai=1(i=1,2,...,p),\sum_{i=1}^{p}a_i=1,x(i)Rn(i=1,2,...,p)x^{(i)}\in R^n(i=1,2,...,p),则称x=i=1paix(i)x=\sum_{i=1}^{p}a_ix^{(i)}为点x(1),x(2),...,x(p)x^{(1)},x^{(2)},...,x^{(p)}的一个凸组合。
充分性性显然。
必要性如下
【最优化笔记1】引论知识(凸集与凸函数)
定理2:任意一组凸集的交集仍为凸集。

2. 凸函数

定义:设f(x)f(x)是定义在非空凸集Ω\Omega\subsetRnR^n上的函数,若对于\forallx,yΩ,λ[0,1]x,y\in\Omega, \forall\lambda\in[0,1],不等式f(λx+(1λ)y)λf(x)+(1λ)f(y)f(\lambda x+(1-\lambda)y) \leq \lambda f(x)+(1-\lambda)f(y)恒成立,则称f(x)f(x)Ω\Omega的凸函数。
从函数图像上看,则函数图象总是在切线(或切平面)的上方。
注:凸函数的非负线性组合仍未凸函数。(使用定义易证明)。

定理1(凸函数的充要条件1):定义在非空凸集Ω\Omega\subsetRnR^n上的f(x)f(x)为凸函数的充要条件是:
对于\forallx,yΩx,y\in\Omega,都有:f(y)f(x)(f(x))T(yx)f(y)-f(x)\geq(\nabla f(x))^T(y-x)

定理2(凸函数的充要条件2):定义在非空凸集Ω\Omega\subsetRnR^n上的f(x)C2f(x)\in C^2(即f(x)f(x)是二阶连续可微的),f(x)f(x)为凸函数的充要条件是:
f(x)f(x)的海赛矩阵F=2f(x)F=\nabla^2f(x)在整个Ω\Omega上是半正定的。
(正定则为严格凸函数,逆定理一般不成立)。

3. 凸规划

定义:目标&约束函数在可行解R上为凸函数,则这样的优化问题称为凸规划问题(与线性规划问题没有关系)。

定理1:凸规划问题的可行集R为凸集。
定理2:对于凸规划问题,目标函数f(x)f(x)的任一局部极小点都是f(x)f(x)在非空可行集R上的全局极小点。
(证明常考,用反证法证明)。
(若凸规划的问题的目标函数f(x)f(x)在非空可行集R上是严格凸函数,则该优化问题的全局极小点是唯一的)。
【最优化笔记1】引论知识(凸集与凸函数)
第一节,完。