数据挖掘——主成分分析

主成分分析

1,它提供的是一个或者几个综合指标

  • 指标要求:线性组合,信息不重合(协方差和相关系数为0),按重要性排序(重要性由方差来刻画)

2,这些综合指标是由原来的变量通过线性组合/加权平均构成的

3,它的目的是最大成分的区分你这个群体当中的最大的个体

一,怎么找出指标

       Y1     Y2      Y3       Y4        Y5

Z1=(a1Y1+a2Y2+a3Y3+........)

Z2

Z2

目标

(1)最大化方差,按照有大到小排序

(2)z1 z2互不相关

保证  Z 的方差最大,协方差为0

数据挖掘——主成分分析

取到的主成分对应的信息含量就是他的特征值

数据挖掘——主成分分析

数据挖掘——主成分分析

上一篇:linux上的socket通信


下一篇:技能&buff