凸函数定义与判定条件

凸集与凸函数

首先是凸集的定义。一个集合SRnS\in \mathbb{R}^nS∈Rn称为凸集(Rn\mathbb{R}^nRn表示nnn维实向量空间),如果对于任意两个点a,bSa,b\in Sa,b∈S,连接它们的线段也在集合SSS内,如下图:
凸函数定义与判定条件
任意多个凸集的交集仍为凸集。

函数f:RnRf:\mathbb{R}^n→\mathbb{R}f:Rn→R(由nnn维实向量到实数的映射函数)为凸函数,当且仅当其定义域SSS是凸集,且对于所有x,ySx,y\in Sx,y∈S和每一个标量a(0,1)a\in(0,1)a∈(0,1),满足Jensen不等式:
f(ax+(1a)y)af(x)+(1a)f(x) f(ax+(1-a)y)\le af(x)+(1-a)f(x) f(ax+(1−a)y)≤af(x)+(1−a)f(x)
f(x)f(x)f(x)为严格凸函数,当且仅当x,y,ax,y,ax,y,a满足:
f(ax+(1a)y)<af(x)+(1a)f(x) f(ax+(1-a)y)< af(x)+(1-a)f(x) f(ax+(1−a)y)<af(x)+(1−a)f(x)

凸函数识别的充要条件

一阶充要条件

f(x)f(x)f(x)为凸函数,当x,y,f(x),f(x)x,y,f(x),f'(x)x,y,f(x),f′(x)满足:
(f(x)f(y))(xy)0, x,yS (f'(x)-f'(y))(x-y)\ge0,\ \forall x,y\in S (f′(x)−f′(y))(x−y)≥0, ∀x,y∈S
f(x)f(x)f(x)为严格凸函数,当x,y,f(x),f(x)x,y,f(x),f'(x)x,y,f(x),f′(x)满足:
(f(x)f(y))(xy)>0, x,yS,xy (f'(x)-f'(y))(x-y)>0,\ \forall x,y\in S,且x\ne y (f′(x)−f′(y))(x−y)>0, ∀x,y∈S,且x​=y
f(x)f(x)f(x)为凸函数,当x,y,f(x),f(x)x,y,f(x),f'(x)x,y,f(x),f′(x)满足:
f(y)f(x)+f(x)(yx) f(y)\ge f(x)+f'(x)(y-x) f(y)≥f(x)+f′(x)(y−x)

二阶充要条件

f(x)f(x)f(x)为严格凸函数,当且仅当其Hessian矩阵正定:
Hxf(x)=2f(x)xxT0, xS H_xf(x)=\frac{\partial^2 f(x)}{\partial x\partial x^T}\succ0,\ \forall x\in S Hx​f(x)=∂x∂xT∂2f(x)​≻0, ∀x∈S
凸函数的非负倍数求和、积分、仿射变换都是凸函数。
向量除了L0L_0L0​范数外的所有范数都是凸函数。
无约束凸函数的任意局部极小点xx*x∗都是该函数的一个全局极小点。

凸函数定义与判定条件凸函数定义与判定条件 魏之燕 发布了19 篇原创文章 · 获赞 51 · 访问量 14万+ 私信 关注
上一篇:Lecture1 Intro to RL


下一篇:推荐一些国内的Jquery CDN免费服务