【直观详解】什么是PCA、SVD

What & Why PCA (主成分分析)

PCA,Principal components analyses,主成分分析。广泛应用于降维,有损数据压缩,特征提取和数据可视化。也被称为Karhunen-Loeve变换

从降维的方法角度来看,有两种PCA的定义方式,这里需要有一个直观的理解:什么是变换(线性代数基础),想整理一下自己线性代数的可以移步我的另一篇文章:【直观详解】线性代数的本质

但是总的来说,PCA的核心目的是寻找一个方向(找到这个方向意味着二维中的点可以被压缩到一条直线上,即降维),这个方向可以:

  • 最大化正交投影后数据的方差(让数据在经过变换后更加分散)

【直观详解】什么是PCA、SVD

【直观详解】什么是PCA、SVD

  • 最小化投影造成的损失(下图中所有红线(投影造成的损失)加起来最小)


PCA 主成分分析主要目的是为了减少数据维数,其中Auto-encoder也是一种精巧的降维手段

2What & Why (奇异值分解)


SVD,Singular Value Decomposition,奇异值分解。最直观的解释如下图所示

【直观详解】什么是PCA、SVD

【直观详解】什么是PCA、SVD

【直观详解】什么是PCA、SVD


【直观详解】什么是PCA、SVD

总结,SVD就是把一个非方阵(压缩变换)分解为一个旋转➜伸缩压缩➜旋转三个变换(矩阵),如上图所示


上一篇:维度规约(降维)算法在WEKA中应用


下一篇:Clojure 用后感