文章目录
1 定义 & 基本原理
1.1 假设检验
假设检验:用来判断样本与样本 ,样本与总体 的差异是由抽样误差引起还是本质差别造成的统计推断方法。
常用的假设检验方法有 Z Z Z检验、 T T T检验、卡方检验、 F F F检验等。
1.2 基本原理
基本原理:先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
- 先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
- 不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。
怎样才算是“小概率”呢?
通常可将概率不超过0.05的事件称为小概率事件,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。
1.3 显著性水平
显著性水平:一个概率值,原假设为真时,拒绝原假设的概率,表示为 α α α常用取值为0.01, 0.05, 0.10
一个公司要来招聘了,本来实际有200个人准备混一混,但是公司希望只有5%的人是浑水摸鱼进来的,所以可能会有200*0.05=4个人混进来,所谓显著性水平α,就是你允许最多有多大比例浑水摸鱼的通过你的测试。
1.4 假设的2种形式
H0:原假设,无效假设、零假设,它是要否定的假设,一般都是说没有差异,没有改变
H1:备择假设,与H0相反的假设,原假设被拒绝时而应接受的假设
1.5 检验形式
H0 | H1 | |
双侧检验 | μ = μ0 | μ ≠ μ0 |
单侧检验 | μ ≥ μ0 | μ < μ0 |
μ ≤ μ0 | μ > μ0 |
- 当关键词有不得少于/低于的时候用左侧,比如灯泡的使用寿命不得少于/低于700小时时(拒绝域在左边)
- 当关键词有不得多于/高于的时候用右侧,比如次品率不得多于/高于5%时(拒绝域在右边)
1.6 检验步骤
- 提出假设
- 确定显著性水平(通常α=0.05)
- 选定检验方法,计算检验统计量的值
- 确定P值和做出推断结论
1.7 检验结果
- 单侧检验
若p值 > α,不拒绝 H0
若p值 < α, 拒绝 H0
- 双侧检验
若p值 > α/2, 不拒绝 H0
若p值 < α/2, 拒绝 H0
2 不同の假设检验
- 参数检验:T检验、Z检验
- 非参数检验:卡方检验
卡方检验是非参数检验的一种,其稳健性不及参数检验,因此,从使用的角度来看,应首选参数检验,如果在无法满足参数检验基础条件的前提下,再考虑非参数检验。
2.1 T检验
基本概念
-
定义 & 目的:也称
student t
检验(Student’s t test)。常用T检验分为三种,分别为单样本T检验,独立样本T检验和成对样本T检验。区别主要体现在:样本数量、比较对象以及检验目的:
T检验类型 | 样本数量 | 比较对象 | 检验目的 |
单样本T检验 | 1 | 预先设定的常数 | 样本均值是否与设定常数相等 |
独立样本T检验 | 2 | 两样本的均值 | 两样本均值是否相等 |
成对样本T检验 | 2 | 两个相关样本 | 这两个样本的平均值是否有显著差异 |
-
统计量:
t
统计量 -
*度: d f = n − 1 df=n-1 df=n−1 或 n 1 + n 2 − 2 n1+n2-2 n1+n2−2 或 其他见 检验步骤
-
适用条件:
(1)T检验属于参数检验,用于检验定量数据(数字有比较意义的),若数据均为定类数据则使用非参数检验。
(2)样本数据服从正态或近似正态分布,若不满足,则可考虑使用非参数检验。 -
应用领域:
(1)样本均数与总体均数的比较;
(2)两样本均数的比较;
(3)配对数据比较
检验步骤
-
建立原假设
H0:μ1 = μ2
,即假定两个总体平均数之间没有显著差异;
(1)单一样本T检验(One-Sample T Test)
(2)独立样本T检验(Independent-Samples T Test)
(3)配对样本T检验(Paired-Samples T Test) -
计算统计量T值,对于不同类型的问题选用不同的计算方法;
(1)单一样本T检验(One-Sample T Test),用于比较一个正态总体在方差未知时总体均值与某一已知数是否有显著性差异。或者说,用看比较未知样本总体的均值和已知样本总体的均值(这个是已知的)是否有显著性差异。这里的单一样本是指只有一个样本总体。
其中,s为样本标准差。在原假设满足的情况下,t统计量服从*度为n-1的t分布。
(2)独立样本T检验(Independent-Samples T Test),用于检验两个独立样本是否来自具有相同均值的总体,本质是对两个样本均值之差进行T检验。
当两组样本的方差相等时:
其中,n1为样本组1的样本量,n2为样本组2的样本量,640?wx_fmt=png由两组样本的方差构成,它的计算公式为:
在原假设满足的情况下,t统计量服从*度为n1+n2-2的t分布。
当两组样本的方差相等时:
其中,df为方差不相等时,t统计量的*度,其计算公式如下:
(3)配对样本T检验(Paired-Samples T Test),用于检验两个配对总体的均值是否存在显著性差异。这里的配对是指,这两个样本值之间是一一对应的,样本容量相同。 -
根据*度 d f df df,查T值表,与理论T值进行比较。理论值差异的显著水平为0.01级或0.05。不同*度的显著水平理论值记为 T ( d f ) 0.01 T(df)0.01 T(df)0.01和 T ( d f ) 0.05 T(df)0.05 T(df)0.05.
-
比较计算得到的 t t t值和理论 T T T值,推断发生的概率,依据下表给出的T值与差异显著性关系表作出判断。
T值与差异显著性关系表
比较计算得到的 t t t值和理论 T T T值 | P值 | 差异显著度 |
---|---|---|
t ≥ T ( d f ) 0.01 t\ge T(df)0.01 t≥T(df)0.01 | P ≤ 0.01 P\le 0.01 P≤0.01 | 非常显著 |
t ≥ T ( d f ) 0.05 t\ge T(df)0.05 t≥T(df)0.05 | P ≤ 0.05 P\le 0.05 P≤0.05 | 显著 |
t < T ( d f ) 0.05 t < T(df)0.05 t<T(df)0.05 | P > 0.05 P > 0.05 P>0.05 | 不显著 |
如果样本量足够大,那么Z检验和T检验将得出相同的结果。对于大样本,样本方差是对总体方差的较好估计,因此即使总体方差未知,我们也可以使用样本方差的Z检验。我们有很高的*度。由于T分布接近正态分布,Z和T之间的差异可以忽略不计。
应用例子1:单一样本T检验(One-Sample T Test)
大量检测已知正常人血浆载脂蛋白E( apo E)总体平均水平为4.15mmol/L。
某医师经抽样测得41例陈旧性心机梗死患者的血浆载脂蛋白E平均浓度为5.22mmol/L,标准差为1.61mmol/L。
据此能否认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的平均浓度不一致?
-
建立检验假设和确定检验水准。
H0: μ=μ0,H1: μ≠μ0,α=0.05,双侧检验; -
选定检验方法和计算统计量。用单样本的t检验,如成组设计的两样本均值的比较用
t
检验,多个样本均值的比较用F
检验。
-
确定P值和作出推断结论。查
t
分布表, t 0.05 / 2 , 40 = 2.021 t0.05/2,40=2.021 t0.05/2,40=2.021, t = 4.26 > t 0.05 / 2 , 40 t=4.26>t0.05/2,40 t=4.26>t0.05/2,40, P < 0.05 P<0.05 P<0.05。按 α = 0.05 α=0.05 α=0.05,拒绝H0,接受H1,可认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的差别有统计学意义,结合专业可以认为前者平均浓度较高。
应用例子2:独立样本T检验(Independent-Samples T Test)
25例糖尿病患者随机分成两组,甲单纯药物治疗,乙采用药物合并饮食治疗,二月后测空腹血糖如下,问两种疗法血糖值是否相同?
数据:n1=12,s1=182.5, n2=13,s2=141
-
建立检验假设和确定检验水准。
H 0 : μ 1 = μ 2 H 1 : μ 1 ≠ μ 2 , α = 0.05 H0:μ1=μ2 H1:μ1≠μ2 ,α=0.05 H0:μ1=μ2H1:μ1=μ2,α=0.05, 选用两独立样本t检验方法 -
选定检验方法和计算统计量。根据前文检验步骤中,先计算两个样本的方差是否相等,再选择计算出
t统计量
的公式。
将数据带入公式,计算得 t = 2.639 t=2.639 t=2.639
自 由 度 = n 1 + n 2 − 2 = 23 α = 0.05 *度=n1+n2-2=23 α=0.05 *度=n1+n2−2=23α=0.05,双侧故 α / 2 = 0.025 , 1 − α = 0.975 α/2=0.025,1-α=0.975 α/2=0.025,1−α=0.975 -
确定P值和作出推断结论。查
t
分布表得临界值为 t = 2.069 t=2.069 t=2.069
因为 2.639 ( t 值 ) > 2.069 ( 临 界 值 ) , 故 p < 0.05 2.639(t值)>2.069(临界值) ,故 p<0.05 2.639(t值)>2.069(临界值),故p<0.05 , 在0.05水准下,拒绝H0,接受H1,存在显著性差异,故认为两种疗法效果不同。
应用例子3:配对样本T检验(Paired-Samples T Test)
配对设计的t检验研究的是差值均数(样本均数)与理论上的差值总体均数的比较。
• 首先计算出各对差值d的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值d的总体均数μd=0。
• 可将配对设计资料的假设检验视为样本均数与总体均数μd=0的比较。据定理:
将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素E饲料,测得两组大白鼠肝中维生素A的含量,试比较两组大白鼠中维生素A的含量有无差别。
大白鼠配对号 | 正常饲料组 | 维生素E缺乏组 | 差数d |
1 | 3550 | 2450 | 1100 |
2 | 2000 | 2400 | -400 |
3 | 3000 | 1800 | 1200 |
4 | 3950 | 3200 | 750 |
5 | 3800 | 3250 | 550 |
6 | 3750 | 2700 | 1050 |
7 | 3450 | 2500 | 950 |
8 | 3050 | 1750 | 1300 |
Mean | 3318.75 | 2506.25 | 812.5 |
-
建立检验假设和确定检验水准。
H0: μd=0,H1: μd≠0,α=0.05,双侧检验; -
选定检验方法和计算统计量。
-
确定P值和作出推断结论。查t分布表(双侧), t=4.2>t 0.05/2, 7 =2.365,P<0.05。
按 α=0.05,拒绝H0,接受H1,可以认为两种饲料喂养的两组大白鼠中维生素A的含量有差别。正常饲料组比缺乏维生素E饲料组的含量要高。
Python代码
2.2 Z检验
基本概念
-
定义:也称U检验,一般用于大样本(即 n > 30 n>30 n>30),是均值差异性检验方法。它是用标准正态分布的理论来推断差异发生的概率。
-
目的:而比较两个均值的差异是否显著
-
统计量:
z
统计量 -
*度: d f = n df=n df=n
-
适用条件:
(1)已知两个总体均值;
(2)样本来自正态 或 近似正态 总体。 -
应用领域:
(1)样本均数与总体均数的比较;
(2)两样本均数的比较。
检验步骤
-
建立原假设
H0:μ1 = μ2
,即假定两个均值之间没有显著差异; -
计算统计量Z值,对于不同类型的问题选用不同的计算方法;
(1)若要检验一个 样本均值 ( X ˉ ) (\bar{X}) (Xˉ)与一个已知的 总体均值 ( μ 0 ) (μ0) (μ0)的差异是否显著。Z值计算公式为:
Z = X ˉ − μ 0 S n Z=\frac{\bar{X}-\mu_0}{\frac{S}{\sqrt{n}}} Z=n SXˉ−μ0
X ˉ \bar{X} Xˉ——检验样本的平均数;
μ 0 μ0 μ0——已知总体的平均数;
S S S——样本的标准差;
n n n——样本容量。
(2)若要检验来自两组样本均值的差异性,从而判断它们各自代表的总体的差异是否显著。Z值计算公式为:
Z = X 1 ˉ − X 2 ˉ S 1 n 1 + S 2 n 2 Z=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{S_1}{n_1}+\frac{S_2}{n_2}}} Z=n1S1+n2S2 X1ˉ−X2ˉ
X 1 ˉ , X 2 ˉ \bar{X_1},\bar{X_2} X1ˉ,X2ˉ——样本1,样本2的平均数;
S 1 , S 2 S1,S2 S1,S2——样本1,样本2的标准差;
n 1 , n 2 n1,n2 n1,n2——样本1,样本2的容量。 - 比较计算所得 Z Z Z值与理论 Z Z Z值,推断发生的概率,依据下表 Z Z Z值与差异显著性关系表作出判断。
Z值与差异显著性关系表
比较计算得到Z绝对值 | P值 | 差异显著度 |
---|---|---|
∥ Z ∥ ≥ 2.58 \left\| Z \right\|\ge2.58 ∥Z∥≥2.58 | P ≤ 0.01 P \le0.01 P≤0.01 | 非常显著 |
∥ Z ∥ ≥ 1.96 \left\| Z \right\|\ge1.96 ∥Z∥≥1.96 | P ≤ 0.05 P\le0.05 P≤0.05 | 显著 |
∥ Z ∥ < 1.96 \left\| Z \right\|<1.96 ∥Z∥<1.96 | P > 0.05 P>0.05 P>0.05 | 不显著 |
应用例子1:一个样本平均数与一个已知的总体平均数的差异
应用例子2:两个的两组样本平均数的差异性
研究正常人与高血压患者胆固醇含量,比较两组血清胆固醇含量有无显著差异。
正常人组数据:n1=506(样本量) μ1=180.6(样本均值)s1=34.2(标准差)
高血压组数据:n2=142 μ2=223.6 s2=45.8
-
提出假设,规定适当检验统计量,确定检验水平:
H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 , α = 0.05 H0:μ1=μ2 ,H1:μ1≠μ2,α=0.05 H0:μ1=μ2,H1:μ1=μ2,α=0.05
样本量较大,且检验来自两组样本平均数的差异性,故选择z检验统计量 -
计算统计量z值,将已知数据带入z检验公式:
计算假设检验统计量 z = 10.4 z=10.4 z=10.4
α=0.05,双侧故 α/2=0.025,1-α=0.975 查表,确认临界值为1.96 -
确定p值,做出推断结论
10.4 ( z 值 ) > 1.96 ( 临 界 值 ) 10.4(z值)>1.96(临界值) 10.4(z值)>1.96(临界值),故p<0.05,按α=0.05水准拒绝H0,接受H1
可以认为正常人和高血压患者的血清胆固醇含量有差异。
Python代码
对于大样本数据(样本量 ≥ 30 ≥30 ≥30),或者即使是小样本,但是知道其服从正态分布,并且知道总体分布的方差时,需要用 z 检验。
在 Python 中,由于 scipy
包没有 z 检验,我们只能用 statsmodels
包中的 ztest
函数。ztest
函数的一般用法如下:
`ztest(x1, x2=None, value=0, alternative=`two-sided’)` | |
输入参数 | |
x1 | 数组,第一个样本的数据值 |
x2 | 数组,第二个样本的数据值,默认没有值 |
value | 浮点型数值,若是单样本,则 value 是样本假设的均值;若是双样本,则 value是两个样本均值的差值 |
alternative | 若为 `larger',备选假设 H1 大于 value 值;若为 `smaller’,备选假设 H1 小于 value 值 |
输出参数 | |
tstats | 统计量值 |
pvalue | p 值 |
23 | 36 | 42 | 34 | 39 | 34 | 35 | 42 | 53 | 28 | 49 | 39 |
46 | 45 | 39 | 38 | 45 | 27 | 43 | 54 | 36 | 34 | 48 | 36 |
47 | 44 | 48 | 45 | 44 | 33 | 24 | 40 | 50 | 32 | 39 | 31 |
检测其均值是否为 39, 该问题显然是一个双侧检验,由于样本个数大于 30,则使用 z 检验,python 代码如下:
# 导入子模块
import statsmodels.stats.weightstats as sw
# 导入数据
arr=[23,36,42,34,39,34,35,42,53,28,49,39,
46,45,39,38,45,27,43,54,36,34,48,36,
47,44,48,45,44,33,24,40,50,32,39,31]
# z检验
sw.ztest(arr, value=39)
(0.3859224924939799, 0.6995540720244979)
从 ztest 的运行结果可以看出,统计量值为 0.385,而 p 值是 0.699,在置信度 α = 0.05 α = 0.05 α=0.05 时,由于 p 值大于 α α α,接受原假设,认为该样本的均值是 39。
若要检测该样本均值是否> 39,即
H
0
:
μ
>
39
,
H
1
:
μ
≤
39
H0: μ > 39,H1: μ ≤ 39
H0:μ>39,H1:μ≤39,则我们需要在代码中增加一个参数 alternative=``smaller”
:
# 导入子模块
import statsmodels.stats.weightstats as sw
# 导入数据
arr=[23,36,42,34,39,34,35,42,53,28,49,39,
46,45,39,38,45,27,43,54,36,34,48,36,
47,44,48,45,44,33,24,40,50,32,39,31]
# z检验
sw.ztest(arr, value=39, alternative="smaller")
(0.3859224924939799, 0.650222963987751)
检测结果的 p 值为 0.650,大于置信度 0.05,则接受原假设,认为样本均值大于39。
假设另外一个样本 2 的数据:
41 | 34 | 36 | 32 | 32 | 35 | 33 | 31 | 35 | 34 |
37 | 34 | 31 | 36 | 37 | 34 | 33 | 37 | 33 | 38 |
38 | 37 | 34 | 36 | 36 | 31 | 33 | 36 | 37 | 35 |
33 | 34 | 33 | 35 | 34 | 34 | 34 | 35 | 35 | 34 |
# 导入子模块
import statsmodels.stats.weightstats as sw
# 导入数据
arr1=[23,36,42,34,39,34,35,42,53,28,49,39,
46,45,39,38,45,27,43,54,36,34,48,36,
47,44,48,45,44,33,24,40,50,32,39,31]
arr2 = [41, 34, 36, 32, 32, 35, 33, 31, 35, 34,
37, 34, 31, 36, 37, 34, 33, 37, 33, 38,
38, 37, 34, 36, 36, 31, 33, 36, 37, 35,
33, 34, 33, 35, 34, 34, 34, 35, 35, 34]
# z检验
sw.ztest(arr1,arr2,value=0)
(3.775645601380307, 0.0001595937672736755)
从 ztest 的检验结果可以看出,p 值小于 0.05, 则拒绝原假设,认为两个样本的均值不相等。
2.3 卡方检验
卡方检验是非参数检验的一种,其稳健性不及参数检验,因此,从使用的角度来看,应首选参数检验,如果在无法满足参数检验基础条件的前提下,再考虑非参数检验。
- 参数检验对观测值的普遍要求是总体呈现正态分布,但实际研究中,不是所有观测值都呈现正态分布,或者无法确定其是否正态分布。由于缺乏足够的信息,总体分布未知,这些情况下,参数检验技术就未必适用了。
- 最常用的非参数检验技术就是卡方检验,它最适合于次数分布检验。
基本概念
- 定义:也就是 χ 2 χ2 χ2检验,是英文Chi-Square Test 的谐音。非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。卡方值越大,说明实际观察值与期望值偏离越大,也说明两个事件的相互独立性越弱。
我常听到运营和分析师这样的对话,
分析师:“这个变量我做了卡方检验了,不显著,所以我没有放进模型。”
-
目的:
(1)拟合优度检验:是依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到从分类变量进行分析的目的。
(2)两变量独立性检验:根据次数资料判断两类因子彼此相关或相互独立的假设检验 -
统计量: χ 2 χ2 χ2统计量
-
*度:
(1) χ 2 χ2 χ2拟合优度检验: d f = n − k = 组 数 − 限 制 数 df=n-k=组数-限制数 df=n−k=组数−限制数
(2)变量独立性检验: d f = ( a − 1 ) ( b − 1 ) df=(a-1)(b-1) df=(a−1)(b−1)
假设a是联表的行数,b为列数 -
适用条件:
-
应用领域:
(1)在大数据运营场景中,通常用在某个变量(或特征)值是不是和因变量y有显著关系。
检验步骤
-
列出相关性表:相关性表的每列是每一种目标值,如患病和不患病、有效和无效、骰子取值123456等。每行是每种条件,如吸烟和不吸烟、喝牛奶和不喝牛奶、观察值和期望值等。
-
定义假设问题,计算CHI值:H0:两变量之间无关,假设纵列因素不影响横行的因素的变化。假设H0成立,基于此前提计算出 χ 2 χ2 χ2值,它表示观察值与理论值之间的偏离程度。 χ 2 χ2 χ2统计量的公式:
-
计算相关性表的理论值;
-
计算*度,设定置信度/显著性值,一般选择0.9、0.95、0.99、0.995、0.999等。假如选择显著性水平 α = 0.05 α=0.05 α=0.05,则H0成立的可能性(置信度)小于0.5%,即H1的概率大于99.5%。;
-
根据 χ 2 χ2 χ2分布及*度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率 P P P,通过卡方分布的临界值表判断假设是否成立。
(1)如果当前统计量> P P P值,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;
(2)如果当前统计量<= P P P值,就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。
应用例子1:投硬币
一个最简单的例子:根据投硬币观察到的正面,反面次数,判断这个硬币是均衡的还是不均衡。
现在有一个正常的硬币,我给你投50次,你觉得会出现几个正面,几个反面?按照你的经验你会这么思考,最好的情况肯定是25个正面,25个反面,但是肯定不可能这么正正好好的,差不多28个正面,22个反面吧;23个正面,27个反面也可能的,但是10个正面,40个反面肯定不可能的,除非我运气真的那么碰巧。
你上面的这个思维方式,就是拿已经知道的结果(硬币是均衡的,没有人做过手脚),推测出会出现的不同现象的次数。
而卡方检验是拿观察到的现象(投正面或反面的次数或者频数),来判断这个结果(硬币是不是均衡的)。
如果我不知道这个硬币是不是均衡的,我想用正面,反面的频次来判断。
我投了50次,其中28个正面,22个反面。怎么用卡方检验来证明这个硬币是均衡的还是不均衡的呢?
这里要引出
χ
2
χ2
χ2检验的公式:
这个公式可以帮我们求出
χ
2
χ2
χ2统计量的值,我们用
- 这个公式求得的 χ 2 χ2 χ2统计量的值
- *度 d f = ( a − 1 ) ( b − 1 ) = 1 df=(a-1)(b-1)=1 df=(a−1)(b−1)=1
- 置信度,一般我们会挑90%或者95%
这三个数值计算方法如下:
我们拿到这3个信息,去查表,因为
0.72
0.72
0.72 < 查表得到的
3.841
3.841
3.841,所以我们得出这个硬币是均衡的结论。
或者换个思维 卡方值如果大于 3.841 那我就有95%的把握说这个硬币不均衡,如果卡放置大于5.204 那我就有97.5%的把握说 这个硬币不均衡
应用例子2:投筛子
一个稍微难一点的例子,投骰子。 有一个筛子,
不知道它是不是均衡的,于是我打算投36次看一下。
按照投硬币的方式,我先要画出一个表格,然后计算出3个数值:
带着这3个值,去查表,于是我们得出这个现象不能判定他是个均衡的筛子。
应用例子3:电商中消费者的性别和购买生鲜
我们要观察性别和在线上买不买生鲜食品有没有关系。
现实生活中,女性通常去菜市场买菜的比较多,那么在线上是不是也这样。
形成表格后,我们需要计算理论的数据,在上面的例子我们发现,我们发现有66%的人不在线上买生鲜(599除以907),34%的人会在线上买。
那如果,男的有733个人,女的有174个人,根据这些比例,我们可以得出的理论值是什么呢?
根据理论和实际值,我们可以算出卡方值,*度,并且结合我们定义的置信度,查表得到性别和线上买生鲜是显著相关的。
所以我们如果下次看到一个女性来访问我们的网站,多投放一些广告,说不定会转化哦。
应用例子4:卡方拟合优度检验(非参)
需要检验总体的分布函数F(x)是否等于某个给定的函数 F0(x) ,可以根据经验来进行确定。含有未知参数时,应利用样本资料,采用点估计求得,再进行检验。
某金融系统贷款的偿还类型有四种,各种的预期还率为80%、12%、7%和1%。在一段时间的观察记录中,A型按时偿还的有380笔、B型偿还有69笔、C型有 43笔、D笔有8笔。问在5%显著性水平上,这些结果与预期的是否一致。α=0.05。
- Η0:结果与预期一致
- Η1:结果与预期不一致
或者
- Η0: P1=80%,P2=12%, P3=7%, P4=1%
- Η1: Pi≠Pi0
其中,
n
p
1
=
80
np1=80%x500=400
np1=80,
n
p
2
=
12
np2=12%x500=60
np2=12,
n
p
3
=
7
np3=7%x500=35
np3=7,
n
p
4
=
1
np4=1%x500=5
np4=1,
Q
=
5.98
Q=5.98
Q=5.98
根据显著水平,有:
χ
2
(
3
)
=
7.815
>
Q
=
5.98
χ2(3)=7.815>Q=5.98
χ2(3)=7.815>Q=5.98
表明5%的显著水平下,不拒绝原假设,意味着结果与预测一致,(观测的比率与期望的比 率一致)。
Python代码
# 导入子模块
import scipy.stats as ss
# 导入数据
obs=[107,198,192,125,132,248]
exp=[167]*6
#拒绝域 1%的显著水平,*度5
jjy=ss.chi2.isf(0.01,5)
print(jjy)
#卡方
# ss.chisquare(obs,f_exp=exp).statistic # 只出卡方 88.23952095808383
ss.chisquare(obs,f_exp=exp)
Power_divergenceResult(statistic=88.23952095808383, pvalue=1.5740730408691192e-17)
p值の意义
- P>0.05 碰巧出现的可能性>5% ,不能否定无效假设,两组差别无显著意义
- P<0.05 碰巧出现的可能性<5% ,可以否定无效假设,两组差别有显著意义
- P<0.01 碰巧出现的可能性<1% ,可以否定无效假设,两者差别有非常显著意义
2.4 方差分析
【统计学笔记】第十章 方差分析
python 实现单因素方差分析(1)
十六、 方差分析–使用Python进行双因素方差分析
3 卡方检验和方差分析的区别
方差分析:Analysis of Variance,简称ANOVA,又称“变异数分析”
从方差分析的目的来看,是要检验各个水平(因素中的内容)的均值μ1、μ2、…、μm是否相等(m为水平个数),而实现这个目的的手段是通过方差的比较(即考察各观察数据的差异)。通俗说,就是有没有变异。
- 二者的基本思想不同
方差分析基本思想:变异分解,总变异=随机变异+处理因素导致的变异,又可以分解为总变异=组内变异+组间变异,F=组间变异/组内变异,F的值越大,处理因素的影响越大。
卡方检验基本思想:以卡方分布为基础,计算观察值和期望值之间的偏离程度。 - 适用的前提条件不同
方差分析:数据具有独立性、正态性、方差齐性。
卡方检验:最小期望频数均大于1;至少4/5的单元格期望频数大于5;计算时如果单元格期望频数小于5要和其他种类合并;样本观察值量超过50。 - 适用的场景不同
方差分析:均数间的多重比较(全部两两比较)、各组均数的精细比较(可以指定要比较的两个组,通过设定系数)、组间均数的趋势检验(为了利用分组变量中体现出的次序信息,目的不是为了拟合线性或非线性的模型,而是希望知道因素的水平改变时均数的变化趋势)。
卡方检验:单样本卡方检验、两样本卡方检验、两分类变量间关联程度的度量、Kappa一致性检验、Mcnemar 配对卡方检验、分层卡方检验。