证明: 当 ||x||=1时,Ax=0的最小二乘解是ATA的最小特征值对应的特征向量
证:上式等同于证明如下命题:ATA的最小特征值所对应的特征向量可使||Ax||最小。
(1) 若x为ATA的特征向量,则
ATAx=λx
可得
∣∣Ax∣∣=(Ax)T(Ax)=xTATAx=xTλx=xTxλ=λ
由上式可见,取ATA的最小特征值λ可使∣∣Ax∣∣最小。
(2)若x不为ATA的特征向量,则可对A做SVD分解,得
A=UΛVT
则
∣∣Ax∣∣=(Ax)T(Ax)=xTATAx=xTVΛTUTUΛVTx=xTVΛTΛVTx
又因为
ΛTΛ=⎣⎢⎢⎡λ12λ22⋯λn2⎦⎥⎥⎤
且在svd分解中V为一组n维的正交基,即
V=[v1v2⋯vn]
因此,n维向量x可用该组基来表示:
x=α1v1+α2v2+⋯+αnvn=[v1v2⋯vn]⎣⎢⎢⎡α1α2⋯αn⎦⎥⎥⎤
将上述两个式子代入,可得
∣∣Ax∣∣=xTVΛTΛVTx=[α1α2⋯αn]⎣⎢⎢⎡v1v2⋯vn⎦⎥⎥⎤[v1v2⋯vn]⎣⎢⎢⎡λ12λ22⋯λn2⎦⎥⎥⎤⎣⎢⎢⎡v1v2⋯vn⎦⎥⎥⎤[v1v2⋯vn]⎣⎢⎢⎡α1α2⋯αn⎦⎥⎥⎤=[α1α2⋯αn]⎣⎢⎢⎡λ12λ22⋯λn2⎦⎥⎥⎤⎣⎢⎢⎡α1α2⋯αn⎦⎥⎥⎤=α12λ12+α22λ22+⋯+αn2λn2
不是一般性,可令λ1⋯λN的降序排列,则
α12λ12+α22λ22+⋯+αn2λn2≥λN2(α12+α22+⋯+αn2)
因为∣∣x∣∣=1,因此
(α12+α22+⋯+αn2)=1
所以
∣∣Ax∣∣≥λN2(α12+α22+⋯+αn2)
因此,取ATA的最小特征值λ可使∣∣Ax∣∣最小
综上,取ATA的最小特征值对应的特征向量可使Ax=0得到最优解,命题得证。
参考自:
博主:emilycs09
博文地址:https://blog.csdn.net/emilycs09/article/details/84929192
来源:CSDN