中科大-凸优化 笔记(lec11)-凸函数:二阶条件

全部笔记的汇总贴(视频也有传送门):中科大-凸优化

一、凸函数的定义(复习)

  1. f : R n → R f:\R^n\rightarrow\R f:Rn→R 为凸函数 ⇔ d o m f \Leftrightarrow dom f ⇔domf为凸集
    ∀ x , y ∈ d o m f , 0 ≤ θ ≤ 1 有 f ( θ x + ( 1 − θ ) y ) ≤ θ f ( x ) + ( 1 − θ ) f ( y ) \forall x,y\in dom f,0\le\theta\le1有f(\theta x+(1-\theta)y)\le\theta f(x)+(1-\theta)f(y) ∀x,y∈domf,0≤θ≤1有f(θx+(1−θ)y)≤θf(x)+(1−θ)f(y)

  2. (高维情况) f : R n → R f:\R^n\rightarrow\R f:Rn→R为凸函数 ⇔ d o m f \Leftrightarrow dom f ⇔domf为凸集 ∀ x ∈ d o m f        ∀ 方 向 向 量 v g ( t ) = f ( x + t v ) 为 凸 函 数      d o m    g = { t ∣ x + t v ∈ d o m f } ( 降 维 ) \forall x\in dom f\;\;\;\forall 方向向量v\\g(t)=f(x+tv)为凸函数\;\;dom \;g=\{t|x+tv\in dom f\}(降维) ∀x∈domf∀方向向量vg(t)=f(x+tv)为凸函数domg={t∣x+tv∈domf}(降维)

  3. f : R n → R f:\R^n\rightarrow\R f:Rn→R为凸函数 ⇔ d o m f \Leftrightarrow dom f ⇔domf为凸集
    若 f f f可微, ∀ x , y ∈ d o m f , f ( y ) ≥ f ( x ) + ∇ f T ( x ) ( y − x ) \forall x,y\in dom f,f(y)\ge f(x)+\nabla f^T(x)(y-x) ∀x,y∈domf,f(y)≥f(x)+∇fT(x)(y−x)

(一维) f : R → R f:\R\rightarrow\R f:R→R可微, f f f为等价于 d o m f dom f domf为凸, ∀ x , y ∈ d o m f , f ( y ) ≥ f ( x ) + f ( x ) ( y − x ) \forall x,y\in dom f,f(y)\ge f(x)+f(x)(y-x) ∀x,y∈domf,f(y)≥f(x)+f(x)(y−x)

二、高维情况的证明

  • 证明( ⇒ \Rightarrow ⇒)
    设 f f f为凸,考虑 x , y ∈ d o m f x,y\in dom f x,y∈domf
    g ( t ) = f ( t y + ( 1 − t ) x ) = f ( x + t ( y − x ) ) g(t)=f(ty+(1-t)x)=f(x+t(y-x)) g(t)=f(ty+(1−t)x)=f(x+t(y−x))其中 t y + ( 1 − t ) x ty+(1-t)x ty+(1−t)x看作仿射组合
    g ′ ( t ) = ∇ f T ( x + t ( y − x ) ) ( y − x ) g'(t)=\nabla f^T(x+t(y-x))(y-x) g′(t)=∇fT(x+t(y−x))(y−x)
    g ( t 1 ) ≥ g ( t 2 ) + g ′ ( t 2 ) ( t 1 − t 2 ) g(t_1)\ge g(t_2)+g'(t_2)(t_1-t_2) g(t1​)≥g(t2​)+g′(t2​)(t1​−t2​)对 ∀ t 1 , t 2 \forall t_1,t_2 ∀t1​,t2​成立
    令 t 1 = 1 , t 2 = 0 t_1=1,t_2=0 t1​=1,t2​=0
    得到 g ( 1 ) ≥ g ( 0 ) + g ′ ( 0 ) f ( y ) ≥ f ( x ) + ∇ f T ( y − x ) g(1)\ge g(0)+g'(0)\\f(y)\ge f(x)+\nabla f^T(y-x) g(1)≥g(0)+g′(0)f(y)≥f(x)+∇fT(y−x)

  • 证明( ⇐ \Leftarrow ⇐)
    ∀ x , y ∈ d o m f , ∀ t t y + ( 1 − t ) x ∈ d o m f t ~ y + ( 1 − t ~ ) x ∈ d o m f \forall x,y\in dom f,\forall t\\ty+(1-t)x\in dom f\\\tilde{t}y+(1-\tilde{t})x\in dom f ∀x,y∈domf,∀tty+(1−t)x∈domft~y+(1−t~)x∈domf
    f ( t y + ( 1 − t ) x ) ≥ f ( t ~ y + ( 1 − t ~ ) x ) + ∇ f T ( t ~ y + ( 1 − t ~ ) x ) ( t y + ( 1 − t ) x − t ~ y − ( 1 − t ~ ) x ) ≥ f ( t ~ y + ( 1 − t ~ ) x ) + ∇ f T ( t ~ y + ( 1 − t ~ ) x ) ( y − x ) ( t − t ~ ) f(ty+(1-t)x)\ge f(\tilde{t}y+(1-\tilde{t})x)+\nabla f^T(\tilde{t}y+(1-\tilde{t})x)(ty+(1-t)x-\tilde{t}y-(1-\tilde{t})x)\\\ge f(\tilde{t}y+(1-\tilde{t})x)+\nabla f^T(\tilde{t}y+(1-\tilde{t})x)(y-x)(t-\tilde{t}) f(ty+(1−t)x)≥f(t~y+(1−t~)x)+∇fT(t~y+(1−t~)x)(ty+(1−t)x−t~y−(1−t~)x)≥f(t~y+(1−t~)x)+∇fT(t~y+(1−t~)x)(y−x)(t−t~)

又已知 g ( t ) = f ( t y + ( 1 − t ) x ) g ( t ~ ) = f ( t ~ y + ( 1 − t ~ ) x ) g ′ ( t ~ ) = ∇ f T ( t ~ y + ( 1 − t ~ ) x ) ( y − x ) g(t)=f(ty+(1-t)x)\\g(\tilde{t})=f(\tilde{t}y+(1-\tilde{t})x)\\g'(\tilde t)=\nabla f^T(\tilde{t}y+(1-\tilde{t})x)(y-x) g(t)=f(ty+(1−t)x)g(t~)=f(t~y+(1−t~)x)g′(t~)=∇fT(t~y+(1−t~)x)(y−x)

所以 g ( t ) ≥ g ( t ~ ) + g ′ ( t ) ( t − t ~ )                  f ( x ) 是 凸 函 数 g(t)\ge g(\tilde t)+g'(t)(t-\tilde t)\;\;\;\;\;\;\;\;f(x)是凸函数 g(t)≥g(t~)+g′(t)(t−t~)f(x)是凸函数

上一篇:第二章:09流程控制[3for]


下一篇:CF1188C Array Beauty(DP)