sklearn PCA无法正常工作

我一直在玩sklearn PCA,它的运行方式很奇怪.

from sklearn.decomposition import PCA
import numpy as np
identity = np.identity(10)
pca = PCA(n_components=10)
augmented_identity = pca.fit_transform(identity)
np.linalg.norm(identity - augmented_identity)

4.5997749080745738

请注意,我将维数设置为10.范数不应该为0吗?

对于为什么不这样做的任何见解将不胜感激.

解决方法:

尽管PCA基于协方差矩阵计算正交分量,但sklearn中PCA的输入是数据矩阵而不是协方差/相关矩阵.

import numpy as np
from sklearn.decomposition import PCA

# gaussian random variable, 10-dimension, identity cov mat
X = np.random.randn(100000, 10)



pca = PCA(n_components=10)
X_transformed = pca.fit_transform(X)

np.linalg.norm(np.cov(X.T) - np.cov(X_transformed.T))

Out[219]: 0.044691263454134933
上一篇:PCA人脸识别GUI(ORL+Yale人脸库)


下一篇:数据压缩·课前任务二(PCA)