-
凸函数 Convex Function:定义在凸集 C 上的函数 f:C→R,如果对于任意 x1,x2∈C 和 ∀λ∈[0,1],都有
f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)
则称 f 是凸函数。
- 凸函数的定义域必须是凸集
- 凸函数的图像位于连接任意两点 (x1,f(x1)) 和 (x2,f(x2)) 的线段的下方
-
凹函数 Concave Function:−f 是凸函数
-
Jenson 不等式:对于凸函数 f,pi≥0,i=1,…,k 且 ∑i=1kpi=1,都有
f(i=1∑kpixi)≤i=1∑kpif(xi)
对于凹函数 f,不等式方向相反
-
常见的凸函数
- 指数函数 eax、负对数函数 −log(ax)
- 仿射函数 aTx+b(同时是凹函数)
- 正定或半正定二次函数 xTPx+qTx+r,其中 P⪰0
- 范数函数 ∥x∥p,其中 p≥1(可能不是处处可微的)
- 幂函数 xa、绝对值幂函数 ∣x∣a(a≥1 为凸函数,0<a≤1 为凹函数)
- log-sum-exp 函数 f(x)=log(∑i=1nexi)
- 几何平均函数 f(x)=(x1x2…xn)1/n,定义域为 R++n 是凹函数
-
凸函数与连续性:定义在开的凸集上的凸函数在其定义域的内部处处连续(证明)
-
凸函数的一阶条件:定义在凸集 C 上的可微函数 f:C→Rn 是凸函数的充分必要条件是对于任意 x1,x2∈C,都有
f(x2)≥f(x1)+∇f(x1)T(x2−x1)
- 该不等式表明,凸函数在任意点处的切平面位于函数图像的下方
- 等价描述:[∇f(x2)−∇f(x1)]T(x2−x1)≥0
-
凸函数的二阶条件:定义在开凸集 C 上的二次可微函数 f:C→Rn 是凸函数的充分必要条件是对于任意 x∈C,都有 ∇2f(x)⪰0
-
多元凸函数的一维刻画:多元函数 f:Rn→R 是凸函数的充分必要条件是对于任意 x∈Rn 和任意方向 v∈Rn,一元函数 g(t)=f(x+tv),t∈R 是凸函数
-
非负加权求和:∑i=1kwifi(x),其中 wi≥0,i=1,…,k
-
与仿射变换的复合:g(x)=f(Ax+b),其中 A∈Rm×n,b∈Rm
-
逐点最大值 Pointwise maximum:f(x)=max{f1(x),f2(x),…,fk(x)}
-
逐点最大化 Pointwise supremum:f(x)=supy∈Af(x,y),其中 A 是任意集合(若 ∀y∈A,f(x,y) 关于 x 是凸函数)
-
复合函数:f(x)=h(g(x))
- 若 h 为凸函数且非减函数,g 为凸函数,则 f 为凸函数
- 若 h 为凸函数且非增函数,g 为凹函数,则 f 为凸函数
- 若 h 为凹函数且非减函数,g 为凹函数,则 f 为凹函数
- 若 h 为凹函数且非增函数,g 为凸函数,则 f 为凹函数
-
向量形式的复合函数:f(x)=h(g(x))=h(g(x1,x2,…,xn))
- 若 gi 是凸函数,h 是凸函数且对每个变量非减,则 f 是凸函数
- 若 gi 是凹函数,h 是凸函数且对每个变量非增,则 f 是凸函数
-
最小化 Minimization:若 f(x,y) 关于 x 是凸函数,C 是凸集,则 g(x)=infy∈Cf(x,y) 关于 x 是凸函数
-
透射函数 perspective:g(x,t)=tf(x/t),其中 t>0,f:Rn→R 是凸函数,则 g:Rn×R++→R 是凸函数
-
凸共轭 Convex Conjugate:f∗(y)=supx∈domf(yTx−f(x)),即使 f 不是凸函数,f∗ 也是凸函数
-
下水平集 Sublevel Set:对于函数 f:Rn→R 和标量 α∈R,其下水平集定义为 Cα={x∈domf∣f(x)≤α}。
-
上境图 Epigraph:对于函数 f:Rn→R,其上境图定义为 epif={(x,t)∣x∈domf,t∈R,t≥f(x)}。
-
拟凸函数 Quasi-Convex Function:定义在凸集 C 上的函数 f:C→R,如果对于任意 α∈R,其下水平集 Cα={x∈C∣f(x)≤α} 是凸集,则称 f 是拟凸函数。
- 等价定义:对于任意 x1,x2∈C 和 ∀λ∈[0,1],都有
f(λx1+(1−λ)x2)≤max{f(x1),f(x2)}
- 凸函数必是拟凸函数,反之不成立
- 若一个函数既是拟凸函数又是拟凹函数,则该函数是拟线性(quasi-linear)函数,某种意义上具备单调性
-
例子
- ∣x∣ 是拟凸函数
- ceil(x)=inf{z∈Z∣z≥x} 是拟线性函数
- log(x) 是拟线性函数
- f(x1,x2)=x1x2 在 x1,x2>0 时是拟凹函数
- 线性分数函数 f(x)=cTx+daTx+b,其中 cTx+d>0 是拟线性函数
- 距离比例函数 f(x)=∥x−b∥2∥x−a∥2,其中 ∥x−a∥2≤∥x−b∥2 是拟凸函数
- 拟凸函数求和不一定是拟凸函数
-
拟凸函数的一阶条件:定义在凸集 C 上的可微函数 f:C→R 是拟凸函数的充分必要条件是对于任意 x1,x2∈C,都有
f(x2)<f(x1)⟹∇f(x1)T(x2−x1)<0
-
拟凸函数的二阶条件:没有充要条件,但有
- 必要条件:∀x∈C,y∈Rn,yT∇f(x)=0⟹yT∇2f(x)y≥0
- 对于一维函数,退化为 f′(x)=0⟹f′′(x)≥0
- 充分条件:∀x∈C,y∈Rn,y=0,yT∇f(x)=0⟹yT∇2f(x)y>0
-
拟凸函数的保凸运算
- 与仿射变换复合
- 最大值/上确界
- 单调凸函数与凸函数的复合
- 下确界
- (正权重求和与透射变换不满足保凸性)