个人博客地址 Glooow,欢迎光临~~~
1. 拟凸函数定义
拟凸函数(quasiconvex function) 的定义为:若 domf 为凸集,且对任意的 α,其下水平集
Sα={x∈domf∣f(x)≤α}
都是凸集,则 f 为拟凸函数。
类似的有拟凹函数(quasiconcave) 的定义。如果一个函数既是拟凸的,又是拟凹的,那么它是拟线性(quasilinear) 的。
Reamrks:对于拟线性函数,要求其上水平集和下水平集同时是凸集,因此简单理解,其在某种意义上具有“单调性”。比如 ex,logx 等。
拟凸函数 |
各种函数的关系 |
![凸优化学习笔记 7:拟凸函数 Quasiconvex Function 凸优化学习笔记 7:拟凸函数 Quasiconvex Function](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzMxMi9kY2Q5Yjk1YjY5YjczYjYzOGM5ZjgxYjQ3M2VjYWZlMC5wbmc=) |
![凸优化学习笔记 7:拟凸函数 Quasiconvex Function 凸优化学习笔记 7:拟凸函数 Quasiconvex Function](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzkvNzBhNTJlYzNhZGU2NmQyNmYyODRhZTk1ZDQ3NWE4ZDkucG5n) |
一些常见的拟凸/拟凹/拟线性函数比如
拟凸函数
- f(x)=∣x∣
- f(x)=∥x−b∥2∥x−a∥2,domf={x∣∥x−a∥2≤∥x−b∥2}
拟凹函数
-
f(x)=x1x2 on R2
拟线性函数
- ceil(x)=inf{z∈Z∣z≥x}
-
logx on R++
-
f(x)=cTx+daTx+b,domf={cTx+d>0} (注意 f 本身不是凸函数,但是是一个保凸变换)
2. 拟凸函数的判定/等价定义
对于普通凸函数,有一些等价定义,比如
- Jensen 不等式 / 凸函数原生定义:f(θx+(1−θ)y)≤θf(x)+(1−θ)f(y)
- “降维打击”:g(t)=f(x+tv) convex ⟺f(x) convex
- 一阶条件:f(x) convex ⟺f(y)≥∇fT(x)(y−x)
- 二阶条件:f(x) convex ⟺∇f2(x)⪰0
- epigraph:f(x) convex ⟺epif convex
2.1 Jensen 不等式
等价定义 1:函数 f 为拟凸的等价于:定义域为凸集,且
0≤θ≤1⟹f(θx+(1−θ)y)≤max{f(x),f(y)}
证明可以直接用定义。
2.1 “降维打击”
等价定义 2:g(t)=f(x+tv) quasiconvex ⟺f(x) quasiconvex
证明可以直接用定义。
Reamrks:这种“降维打击”的定义方式实际上就是要求 f 沿着任意一个方向都是(拟)凸的,对于一些高维空间中难以判定凸性,而其一维形式又比较简单的函数来说较适用,比如下面的二阶条件的证明。
2.2 一阶条件
等价定义 3:f(x) quasiconvex 等价于:定义域为凸集,且
f(y)≤f(x)⟹∇fT(x)(y−x)≤0
Remarks:该定义实际上是指 ∇f(x) 定义了一个 Rn 空间中的超平面(作为法向量),该超平面就是某一个下水平集的支撑超平面
Sα={y∣f(y)≤f(x)=α}⊆Rn
需要注意的是,前面讲的对于凸函数来说 [∇fT(x) −1]T 定义了一个 Rn+1 空间中的支撑超平面。注意二者的不同!!!前者是下水平集的支撑超平面,后者是凸函数 surface 的支撑超平面,二者相差一个维度。
![凸优化学习笔记 7:拟凸函数 Quasiconvex Function 凸优化学习笔记 7:拟凸函数 Quasiconvex Function](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzM2L2FhOWU1MGE1NjMxM2ExNjg0NzkyMGQyYjYxZjkzZDhjLnBuZw==)
上图中三条封闭曲线代表三个水平集,而 ∇f(x) 就是其中一个水平集的支撑超平面。这可以联想梯度下降法(牛顿下山法),想象这是一个山谷,每一条线都是一个等高线,[∇fT(x) −1]T是山坡地面的法向量,指向空中,而∇f(x)则在这个等高线所在的平面内,且指向山体内部,与等高线相切。。
2.3 二阶条件
对于拟凸函数来说,没有二阶的充分必要条件,有充分条件和必要条件。
必要条件:f(x) quasiconvex ⟹ 对任意 x∈domf,y∈Rn
if yT∇f(x)=0⟹yT∇2f(x)y≥0
对于一维函数,只需要 f′(x)=0⟹f′′(x)≥0
充分条件:f(x) quasiconvex ⟸ 对任意 x∈domf,y∈Rn,y=0
if yT∇f(x)=0⟹yT∇2f(x)y>0
证明:注意这里对于一维函数 f:R→R 较简单,因此可以应用“降维打击”的等价定义进行证明。
3. 拟凸函数的保凸变换
先来复习一下凸函数的保凸变换
- 正权重求和
- 与仿射变换复合
- 最大值/上确界
- 单调凸函数与凸函数的复合
- 下确界
- 透射变换
拟凸函数的也是类似的,主要少了第一个和最后一个,也即拟凸函数的正权重求和不一定是拟凸的,也没有透射变换的定义。
3.1 与仿射变换复合
若 f 拟凸,则 g(x)=f(Ax+b) 也是拟凸的
3.2 最大值/上确界
离散情况:f=max{ω1f1,...,ωmfm},ωi≥0
连续情况:g(x)=sup{w(y)f(x,y),ω(y)≥0} 是拟凸的,如果 f(⋅,y) 是拟凸的
3.3 复合函数
如果 g 为拟凸函数,且 h 单调递增,则 f=h∘g 是拟凸的
例:若 f 是拟凸的,则 g(x)=f(Ax+b) 是拟凸的,且 g~(x)=f((Ax+b)/(cTx+d)) 也是拟凸的,其中
{x∣cTx+d>0,(Ax+b)/(cTx+d)∈domf}
3.4 下确界
f(x,y) 对于 (x,y) 是拟凸的,则 g(x)=infy∈Cf(x,y) 是拟凸的