数学建模(NO.5总体皮尔逊Pearson相关系数)

总体皮尔逊Pearson相关系数

一. 应用

两种最为常用的相关系数:皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小,

二.样本与总体

总体——所要考察对象的全部个体叫做总体.

我们总是希望得到总体数据的一些特征(例如均值方差等)

样本——从总体中所抽取的一部分个体叫做总体的一个样本.

计算这些抽取的样本的统计量来估计总体的统计量:
例如:
使用样本均值、样本标准差来估计总体的均值(平均水平)和总体的标准差(偏离程度)

三.总体皮尔逊Pearson相关系数

数学建模(NO.5总体皮尔逊Pearson相关系数)

四.样本皮尔逊Pearson相关系数

数学建模(NO.5总体皮尔逊Pearson相关系数)

五.总结

  1. 只用来衡量线性的相关系数,所以要先画出散点图确定线性相关

  2. 离群点对相关系数影响很大

  3. 两个变量的相关系数很大也不能说明两者相关

  4. 相关系数为0 ,只能说明不存在线性相关,还可以有其他相关

  5. 解释:
    数学建模(NO.5总体皮尔逊Pearson相关系数)
    上表所定的标准从某种意义上说是武断的和不严格的。
    对相关系数的解释是依赖于具体的应用背景和目的的。
    事实上,比起相关系数的大小,我们往往更关注的是显著性。(假设检验)

  6. 如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱;

  7. 在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说他们相关,我们一定要画出散点图来看才行

六.一个例子

【1】题目

现有某中学八年级所有女学生的体测样本数据,请见下表,试计算各变量之间的皮尔逊相关系数。
数学建模(NO.5总体皮尔逊Pearson相关系数)

【2】先算出描述性统计量

方法一:使用Matlab内置函数

数学建模(NO.5总体皮尔逊Pearson相关系数)

MIN = min(Test); % 每一列的最小值
MAX = max(Test); % 每一列的最大值
MEAN = mean(Test); % 每一列的均值
MEDIAN = median(Test); %每一列的中位数
SKEWNESS = skewness(Test); %每一列的偏度
KURTOSIS = kurtosis(Test); %每一列的峰度
STD = std(Test); % 每一列的标准差
RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD] 
%将这些统计量放到一个矩阵中表示

得到的结果:
数学建模(NO.5总体皮尔逊Pearson相关系数)

方法二:EXCEL的数据分析工具

数学建模(NO.5总体皮尔逊Pearson相关系数)
EXCEL描述性统计结果:
数学建模(NO.5总体皮尔逊Pearson相关系数)

方法三:SPSS描述性统计结果

数学建模(NO.5总体皮尔逊Pearson相关系数)

【2】矩阵散点图

在计算皮尔逊相关系数之前,一定要做出散点图来看两组变量之间是否有线性关系
这里使用Spss比较方便: 图形 ‐ 旧对话框 ‐ 散点图/点图 ‐ 矩阵散点图
数学建模(NO.5总体皮尔逊Pearson相关系数)

【4】皮尔逊相关系数的计算

corrcoef函数: correlation coefficient相关系数
R = corrcoef(A)  
返回 A 的相关系数的矩阵,其中 A 的列表示随机变量(指标),行表示观测值(样本)。
R = corrcoef(A,B)
返回两个随机变量 A 和 B (两个向量)之间的系数。
我们要计算体测的六个指标之间的相关系数,只需要使用下面这个语句:
R = corrcoef(Test);  

数学建模(NO.5总体皮尔逊Pearson相关系数)
##【5】美化相关系数表
数学建模(NO.5总体皮尔逊Pearson相关系数)
数学建模(NO.5总体皮尔逊Pearson相关系数)

上一篇:关于Android Studio 3.4.1以及gradle 3.4.1版本下kotlin工程报错New Gradle Sync is not supported due to containing


下一篇:pandas相关性分析