主成分分析

一、用自己的话描述出其本身的含义:

1、特征选择

  在得到的数据中选出特征后,从选出的数据特征中找到更好的数据特征,逐步优化。

2、PCA

  是一种分析 、简化数据集的技术,用特征降维的方法来减少特征数,减少噪音和冗余,减少过度拟合的可能性。并不是简单地去除某些特征。

二、并用自己的话阐述出两者的主要区别

  特征选择主要是对数据变化较小,不影响整体数据的拟合和预测的这些特征数据进行处理,而在现实大量的数据特征面前,特征太多,有些特征和另一个特征之间是有关系的,所以PCA主成分分析主要是通过算法,找出之间的关系,减少降维后的数据损失,达到降维的目的。

上一篇:spark机器学习从0到1主成分分析-PCA (八)


下一篇:机器学习之LDA(线性判别分析)