PCA手写版

计算过程参考:《机器学习——主成分分析(PCA)》

代码:

X = np.array([[-1, -2], [-1, 0], [0, 0], [2, 1], [0, 1]])
print(X)

def PCA(X,n):
    #转置
    X = np.transpose(X)
    #求特征的均值
    X_mean = np.mean(X,axis =1) # 计算每一行的均值
    X = X - X_mean.reshape(-1,1)
    #求协方差
    cov_mat = 1.0/(X.shape[1])*np.dot(X,X.T)
    # 将协方差进行特征值分解 第一个返回值是特征值矩阵,第二个返回值是特征向量矩阵
    values,vectors = np.linalg.eig(cov_mat)
    print(values)
    print(vectors)
    
    # 按特征值将特征向量进行排序
    # 拼接一个特征值和特征向量一起的矩阵
    eig_mat = [(np.abs(values[i]),vectors[:,i]) for i in range(len(X))]
    print(eig_mat)
    # 排序
    eig_mat.sort(reverse=True)
    # 拼接WT矩阵 降维后的权重矩阵,只保留要保留的列
    WT = np.array([_[1] for _ in eig_mat[:n]])
    print(WT)

    # 对X进行转换,降维
    return np.dot(WT,X)


n=1
PCA(X,n)

 

上一篇:端口被占用查询


下一篇:天池零基础入门NLP竞赛实战:Task4 基于深度学习的文本分类2-Word2Vec