PCA在Python中缺少值

我正在尝试对蒙面数组进行PCA分析.据我所知,如果原始2D矩阵缺少值,matplotlib.mlab.PCA不起作用.有没有人建议在Python中使用缺少值的PCA?

谢谢.

解决方法:

我想你可能需要在做PCA之前对数据进行一些预处理.
您可以使用:

sklearn.preprocessing.Imputer

http://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.Imputer.html#sklearn.preprocessing.Imputer

使用此功能,您可以自动替换平均值,中值或最常值的缺失值.哪个选项最好是很难说的,这取决于许多因素,例如数据的外观.

顺便说一句,您也可以使用相同的库使用PCA:

sklearn.decomposition.PCA

http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html

还有许多其他统计功能和机器学习技术.

上一篇:PCA原理补充


下一篇:《机器学习实战》第十三章 利用PCA来简化数据