《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》

 

 

线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?

    覃含章 机器学习数学 话题的优秀回答者 余昌黔Victory.Kongrainoftime  等 

这两个概念是非常有关系的。不过,要搞清楚这层关系,这个问题会变得非常深刻,对此很多著名的凸分析书都有很深入的阐述,比如R.T. Rockafellar的Convex Analysis 30章就写的非常清楚。

http://www.convexoptimization.com/TOOLS/ConvexAnalysis.pdf

下面我给一个更intuitive的阐释。

首先解释为什么在数学程度更轻的教材里我们一般看不到这两者的关系。因为在一般的application当中(比如《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》中的连续优化问题),我们考虑的problem domain(称作《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》)都是完备的内积空间(希尔伯特空间),所以这个时候考虑拉格朗日函数里面那个《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》应该属于《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的对偶空间《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》没有什么意义,因为根据Riesz表示定理(Riesz representation theorem《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》是同构的。所以在这种情况下,“对偶空间”这个概念确实是多余的。

然而从纯粹数学的角度来说这种情况也只是所有情况中的一个特例。为此,不失一般性,我们考虑如下情况:让《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》是一个有限维的在《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》中的向量空间(不必是内积空间)。

顺便先指出,凸分析里对对偶问题的核心思路其实是把一个凸集(convex set)用它的支撑超平面(hyperplanes)来表示。注意,对闭凸集(closed convex sets)来说二者可以说是等价的,因为任何一个闭凸集《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》都是包含它的所有半平面(halfspaces)的交集(Theorem 11.5 in R.T. Rocafellar)。实际上这便是对集合《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的“对偶表示”。

接下来我们考虑一个真正的优化问题,即在域《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》上我们希望最小化一个凸函数《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》(注意,凸函数的epigraph是一个凸集)。根据上一段的讨论,对偶问题的核心思路是考虑函数《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》上的一个线性majorization《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》. 注意如果给定一个固定的《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》,我们可以选取一个“最好”的《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》:
《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》
所以显然我们可以选择
《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》.
注意对任意《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》不一定是有限的(可能趋于无穷),这种情况下对偶问题会不well-defined,会需要一些专门的regularity条件和其它讨论,这里暂且不表。只是指出实际上《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》实际上是《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的共轭函数(conjugate function),不了解这个定义intuition的同学可以看一下下图这张非常直观的解释(图来自Stephen Boyd的那本凸优化)。共轭函数有很多很有趣的性质,比如如果f是convex且closed的(closed表示它的epigraph是闭的)那么《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》(这个证明的实质和Theorem 11.5是一样的,你发现了么?),而如果没有convex和closed这个条件一般来说《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》.

《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》

《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》

 

 

注意《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》是定义在《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》上的,所以我们已经看到了对偶空间在优化理论中描述“对偶”的作用。接下来我们说明如何进一步推导出其和拉格朗日对偶的关系(我们先推导一个一般情况的)。注意在优化理论中,对偶问题是通过对原问题进行扰动(perturb)才得到的(对于这一点,不仅R.T. Rockafellar凸分析的30章写的很好,A. Shapiro有本Perturbation Analysis of Optimization Problems整本书都在阐述这一核心思想),而不同的扰动方式会得到不同形式的对偶问题,这也是我们常看到等价的原问题会有不同的对偶形式的原因。为了说明这一点,我们考虑如下优化问题(记作原问题《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》):《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》,其中《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》是凸的。

对任意《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》,原问题《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的扰动问题定义为《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》。接着定义函数《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》,则显然原问题《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》等价于估计《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的值。注意根据共轭函数的定义我们有《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》而且满足一些特定的regularity条件我们就有等号成立(比如《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》在0点处有次梯度,这对凸函数来说是trivial的)。

由此,我们定义对偶问题《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》为估计《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的值。或者利用《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》在0点的共轭得到《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的等价定义:《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》.

对比《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》关于《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的定义,我们得到了一组min-max的对偶形式,在原问题中出现的是《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》和定义域《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》,在对偶问题中出现的是变量《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的共轭和《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的对偶空间,在数学上十分优美。

在这个数学形式下,各种优化理论的经典命题可以很容易讨论。比如强对偶定理即意味着《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》(对偶问题perturb之后和原问题等价),而这个定理的成立要求《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》同构,这便是我们通常看不到此类讨论的深层原因。

最后我们给出拉格朗日对偶是这个框架的特例。此时,《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》定义为
《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》
可以被扰动成(对任意《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》
《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》
沿用之前的定义,我们知道《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》那么《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》仍然可以看做在估计《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的值。为了求《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》,我们知道我们需要求出《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的显式形式,即
《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》

注意到《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》的对偶空间和《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》同构,我们用《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》代替《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》,那么显然《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》

这便是拉格朗日对偶的标准形式。最后申明:我的回答非常受StackExchange上这段讨论的影响:Please explain the intuition behind the dual problem in optimization.

编辑于 2019-03-16 dual dual dual 还没有人赞赏,快来当第一个赞赏的人吧!  

更多回答

  《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》 GoophieQ 抽象乖戾嘴臭, except for gakki 看了  @覃含章 的答案感觉自己答得太浅薄了,所以只留下讲义推荐和definition
---------------------------------------------------------------------------------------------------------------------------------
dual space是所有linear functionals(linear map from Vector space to Field) 组成的vector space.
lagrange duality是将原来的问题转换成一个对偶问题即primal problem 和 dual problem,其中通过解决dual problem可以给primal提供解集的一定范围。
推荐伯村的这个讲义..
https://people.eecs.berkeley.edu/~elghaoui/Teaching/EE227A/lecture7.pdf               17 人关注 数学 onlygalois 创建 13 人关注   刘看山知乎指南知乎协议知乎隐私保护指引
应用工作
侵权举报网上有害信息举报专区
京 ICP 证 110745 号
京 ICP 备 13052560 号 - 1
《线性空间的对偶空间和优化里的拉格朗日对偶有什么关系?》京公网安备 11010802010035 号
互联网药品信息服务资格证书
(京)- 非经营性 - 2017 - 0067违法和不良信息举报:010-82716601
儿童色情信息举报专区
证照中心
联系我们 © 2020 知乎

 

        <style></style>
上一篇:Oracle 查询


下一篇:性能故障之dual调用风暴案例分享