假设与检验

假设检验

公众号:ChallengeHub(机器学习,NLP,推荐系统,数据分析)
(欢迎大家关注)

​ 假设检验是统计推断的一种重要形式,其任务是通过样本对未知的总体分布特征作出合理的推断。先对总体分布中的某些参数或者对总体分布类型做某种假设,然后根据样本值做出接受还是拒绝所做假设的结论。

相关概念

原问题假设

问题假设是做假设检验的第一步,一般讲要检验的假设称为原假设,记为: H 0 H_0 H0​,则另外一个为备选假设,指拒绝原假设时的假设,记为: H 1 H_1 H1​。

假设一般分为双边假设和单边假设。

双边假设: H 0 : μ = μ 0 H_0 : \mu=\mu_0 H0​:μ=μ0​, H 1 : μ ≠ μ 0 H_1 : \mu \ne\mu_0 H1​:μ​=μ0​

单边假设: H 0 : μ ≤ μ 0 H_0 : \mu\le\mu_0 H0​:μ≤μ0​, H 0 : μ > μ 0 H_0 : \mu\gt\mu_0 H0​:μ>μ0​

拒绝域与接受域

两类错误

H 0 H_0 H0​为真 H 0 H_0 H0​不真
拒绝 H 0 H_0 H0​ 第一类错误 正确
接受 H 0 H_0 H0​ 正确 第二类错误

第一类错误(弃真错误),原假设 H 0 H_0 H0​为真,但是检验出的拒绝原假设,其概率为 α \alpha α,
P { 拒 绝 H 0 ∣ H 0 为 真 } = α P\{拒绝H_0|H_0为真\}=\alpha P{拒绝H0​∣H0​为真}=α
第二类错误(存伪错误),原假设 H 0 H_0 H0​为假,但是检验出的接受了原假设,其概率为 β \beta β,
P { 接 受 H 0 ∣ H 0 为 假 } = β P\{接受H_0|H_0为假\}=\beta P{接受H0​∣H0​为假}=β
一般来说两种错误是相互矛盾的,不能同时降低两种错误,因此一般在限制 α \alpha α的情况下,尽可能地降低 β \beta β的值。

基本思想

小概率事件在一次的实验中是不可能发生的。

如果原假设成立,那么某个分布已知的统计量在**某个区域(拒绝域)内取值的概率 α \alpha α(检验水平)**应该较小,如果样本的观测数值落在这个小概率区域内,则原假设不正确,所以,拒绝原假设,否则,接受原假设。

基本步骤

第一步:问题假设

根据实际问题提出原假设 H 0 H_0 H0​和备选假设 H 1 H_1 H1​,其中 H 0 H_0 H0​和 H 1 H_1 H1​是相互对立的。

例如:如 H 0 : μ = μ 0 H_0:\mu=\mu_0 H0​:μ=μ0​, H 0 : μ ≠ μ 0 H_0:\mu\ne\mu_0 H0​:μ​=μ0​

这种为双边检验

第二步:选取检验统计量

选取一个合适的检验统计量,并根据原假设 H 0 H_0 H0​和备选假设 H 1 H_1 H1​确定 H 0 H_0 H0​的拒绝域

在根据上一步的假设,有:
P { ∣ μ ∣ < μ α 2 } = 1 − α P\{|\mu|<\mu_{\frac {\alpha}{2}}\}=1-\alpha P{∣μ∣<μ2α​​}=1−α
或者
P { ∣ μ ∣ > μ α 2 } = α P\{|\mu|>\mu_{\frac {\alpha}{2}}\}=\alpha P{∣μ∣>μ2α​​}=α
则可以确定 ( − inf ⁡ , − μ α 2 ) ∪ ( μ α 2 , inf ⁡ ) (-\inf,-\mu_{\frac {\alpha}{2}})\cup(\mu_{\frac {\alpha}{2}},\inf) (−inf,−μ2α​​)∪(μ2α​​,inf) 为 H 0 H_0 H0​的拒绝域,而 ( − μ α 2 , μ α 2 ) (-\mu_{\frac {\alpha}{2}},\mu_{\frac {\alpha}{2}}) (−μ2α​​,μ2α​​) 为 H 0 H_0 H0​的接受域, μ α 2 \mu_{\frac {\alpha}{2}} μ2α​​称为临界值。

第三步:给定显著性水平

一般 α \alpha α的取值为0.05,0.01,0.10等。

第四步:计算检验统计量的具体值

第五步:做出判断

相关练习

单个正态总体的假设检验

设总体 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2), X 1 , X 2 . . . , X n X_1,X_2...,X_n X1​,X2​...,Xn​是取自总体的样本, X ‾ , S 2 \overline X,S^2 X,S2为样本均值和方差, α \alpha α为显著性水平。

方差已知,均值检验( μ \mu μ检验法)

1:双边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0​:μ=μ0​, H 0 : μ ≠ μ 0 H_0:\mu\ne\mu_0 H0​:μ​=μ0​

取检验统计量 U = X ‾ − μ 0 σ n U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} U=n ​σ​X−μ0​​, 当 H 0 H_0 H0​成立时, U = X ‾ − μ 0 σ n ∼ N ( 0 , 1 ) U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} \sim N(0,1) U=n ​σ​X−μ0​​∼N(0,1)。

对于给定的 α \alpha α,查正态分布表,使得
P { ∣ μ ∣ > μ α 2 } = α P\{|\mu|>\mu_{\frac{\alpha}{2}}\}=\alpha P{∣μ∣>μ2α​​}=α
于是得到 H 0 H_0 H0​的拒绝域为 ( − inf ⁡ , − μ α 2 ) ∪ ( μ α 2 , inf ⁡ ) (-\inf,-\mu_{\frac {\alpha}{2}})\cup(\mu_{\frac {\alpha}{2}},\inf) (−inf,−μ2α​​)∪(μ2α​​,inf)。

2:单边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0​:μ=μ0​, H 0 : μ > μ 0 H_0:\mu\gt\mu_0 H0​:μ>μ0​

当 H 0 H_0 H0​成立时, U = X ‾ − μ 0 σ n ∼ N ( 0 , 1 ) U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} \sim N(0,1) U=n ​σ​X−μ0​​∼N(0,1)。

当 H 0 H_0 H0​成立时, μ \mu μ的值不应该很大,而当 H 1 H_1 H1​成立时, μ \mu μ的值往往偏大。

因此,公式
P { ∣ μ ∣ > μ α } = α P\{|\mu|>\mu_{\alpha}\}=\alpha P{∣μ∣>μα​}=α
于是得到拒绝域为 ( μ α , inf ⁡ ) (\mu_{\alpha},\inf) (μα​,inf)。

类似的,若 H 1 : μ < μ 0 H_1:\mu<\mu_0 H1​:μ<μ0​

可以得到 H 0 H_0 H0​的拒绝域为 ( − inf ⁡ , − μ α ) (-\inf,-\mu_\alpha) (−inf,−μα​)

3:例题

例1 由经验知某个零件的重量 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2), μ = 15 \mu=15 μ=15, σ = 0.05 \sigma=0.05 σ=0.05; 技术革新后,抽出6个零件,测得的重量为14.7, 15.1, 14.8, 15.0, 15.2, 14.6。已知方差不变,试统计推断,平均重量是否还是15克。( α = 0.05 \alpha=0.05 α=0.05)

解:

假设: H 0 : μ = 15 H_0:\mu=15 H0​:μ=15, H 0 : μ ≠ 15 H_0:\mu\ne15 H0​:μ​=15

构造 U U U统计量,得到 U U U的0.05双侧分位数为 μ 0.025 = 1.96 \mu_{0.025}=1.96 μ0.025​=1.96。

样本的均值为 x ‾ = 14.9 \overline x=14.9 x=14.9

因此 U U U统计量的观测值为 ∣ U ∣ = ∣ x ‾ − 15 0.05 / 6 ∣ = 4.9 |U|=|\frac {\overline x-15}{0.05/\sqrt6}|=4.9 ∣U∣=∣0.05/6 ​x−15​∣=4.9

由于4.9大于1.96,即观测值落在拒绝域内,所以拒绝原假设。

方差未知,均值检验( t t t检验)

1:双边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0​:μ=μ0​, H 0 : μ ≠ μ 0 H_0:\mu\ne\mu_0 H0​:μ​=μ0​

此时,整体 σ 2 \sigma^2 σ2未知,不能采用 U = X ‾ − μ 0 σ n U=\frac {\overline X-\mu_0}{\frac{\sigma}{\sqrt n}} U=n ​σ​X−μ0​​, 因此需要用样本的方差来代替总体方差,

T = X ‾ − μ 0 S n T=\frac {\overline X-\mu_0}{\frac{S}{\sqrt n}} T=n ​S​X−μ0​​, 当 H 0 H_0 H0​成立时, U = X ‾ − μ 0 S n ∼ t ( 0 , 1 ) U=\frac {\overline X-\mu_0}{\frac{S}{\sqrt n}} \sim t(0,1) U=n ​S​X−μ0​​∼t(0,1)。

对于给定的 α \alpha α,查 t t t分布表,使得
P { ∣ t ∣ > t α 2 ( n − 1 ) } = α P\{|t|>t_{\frac{\alpha}{2}}(n-1)\}=\alpha P{∣t∣>t2α​​(n−1)}=α
于是得到 H 0 H_0 H0​的拒绝域为 ( − inf ⁡ , − t α 2 ( n − 1 ) ∪ ( t α 2 ( n − 1 ) , inf ⁡ ) (-\inf,-t_{\frac{\alpha}{2}}(n-1)\cup(t_{\frac{\alpha}{2}}(n-1),\inf) (−inf,−t2α​​(n−1)∪(t2α​​(n−1),inf)。

2:单边检验

假设: H 0 : μ = μ 0 H_0:\mu=\mu_0 H0​:μ=μ0​, H 0 : μ < μ 0 H_0:\mu<\mu_0 H0​:μ<μ0​

可得到的 H 0 H_0 H0​的拒绝域为 ( − inf ⁡ , − t α 2 ( n − 1 ) (-\inf,-t_{\frac{\alpha}{2}}(n-1) (−inf,−t2α​​(n−1)

3:例题

例2 化工厂用自动包装机包装化肥,每包重量服从正态分布,额定的重量为100千克。随机抽取了9袋化肥,发现均值为99.978,均方差为1.212,能否认为这天的化肥装机正常? ( α = 0.1 ) (\alpha=0.1) (α=0.1)

解:由于方差未知,采用 T T T检验法

假设: H 0 : μ = 100 H_0:\mu=100 H0​:μ=100, H 0 : μ ≠ 100 H_0:\mu\ne100 H0​:μ​=100

构建 T T T统计量,得到 T T T的0.1双侧分位数为
t 0.05 ( 8 ) = 1.86 t_{0.05}(8)=1.86 t0.05​(8)=1.86
T T T统计量的观测值为
∣ T ∣ = ∣ x ‾ − μ ∣ S / n = ∣ 99.978 − 100 1.212 / 9 ∣ = 0.0545 |T|=\frac {|\overline x-\mu|}{S/\sqrt n}=|\frac{99.978-100}{1.212/\sqrt 9}|=0.0545 ∣T∣=S/n ​∣x−μ∣​=∣1.212/9 ​99.978−100​∣=0.0545
因此0.0545小于1.86,因此接受原假设,今天的包装机工作正常。

方差 σ 2 \sigma^2 σ2检验( χ 2 \chi^2 χ2检验)

假设: H 0 : σ 2 = σ 0 2 H_0:\sigma^2=\sigma_0^2 H0​:σ2=σ02​, H 0 : σ 2 ≠ σ 0 2 H_0:\sigma^2\ne\sigma_0^2 H0​:σ2​=σ02​

检验统计量
χ 2 = ( n − 1 ) S 2 σ 0 2 \chi^2=\frac{(n-1)S^2}{\sigma_0^2} χ2=σ02​(n−1)S2​
当 H 0 H_0 H0​成立时
χ 2 = ( n − 1 ) S 2 σ 0 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{(n-1)S^2}{\sigma_0^2}\sim\chi^2(n-1) χ2=σ02​(n−1)S2​∼χ2(n−1)
例1 服从正态分布,抽取数为4.421,4.052,4.357,4.287,4.683,判断方差是否仍为0.108^2 ( α = 0.05 ) (\alpha=0.05) (α=0.05)

解:均值未知,的方差检验,用 χ 2 \chi^2 χ2检验法

假设: H 0 : σ 2 = 0.10 8 2 H_0:\sigma^2=0.108^2 H0​:σ2=0.1082, H 0 : σ 2 ≠ 0.10 8 2 H_0:\sigma^2\ne0.108^2 H0​:σ2​=0.1082

由 α = 0.05 \alpha=0.05 α=0.05,得到临界值
χ 0.975 2 ( 4 ) = 0.048 , χ 0.025 2 ( 4 ) = 11.14 \chi_{0.975}^2(4)=0.048,\chi_{0.025}^2(4)=11.14 χ0.9752​(4)=0.048,χ0.0252​(4)=11.14
χ 2 \chi^2 χ2统计量的观测值为17.8543

因为 17.8543>11.14

所以拒绝原假设

两个正态总体的比较

假设总体 X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2) X∼N(μ1​,σ12​),Y∼N(μ2​,σ22​), X 1 , X 2 . . . , X n , Y 1 , Y 2 . . . , Y n X_1,X_2...,X_n,Y_1,Y_2...,Y_n X1​,X2​...,Xn​,Y1​,Y2​...,Yn​是取自总体的样本。

有:

X ‾ = 1 n ∑ i = 1 n X i \overline X=\frac{1}{n}\sum_{i=1}^nX_i X=n1​∑i=1n​Xi​, S 1 2 = 1 n − 1 ∑ ( X i − X ‾ ) 2 S_1^2=\frac{1}{n-1}\sum(X_i-\overline X)^2 S12​=n−11​∑(Xi​−X)2

Y ‾ = 1 m ∑ ( Y i ) \overline Y=\frac 1m\sum(Y_i) Y=m1​∑(Yi​), S 2 2 = 1 m − 1 ∑ ( Y i − Y ‾ ) S_2^2=\frac{1}{m-1}\sum(Y_i-\overline Y) S22​=m−11​∑(Yi​−Y)

两个样本相同独立

方差已知,均值检验( μ \mu μ检验法)

假设: H 0 : μ 1 = μ 2 H_0:\mu_1=\mu_2 H0​:μ1​=μ2​, H 0 : μ 1 ≠ μ 2 H_0:\mu_1\ne\mu_2 H0​:μ1​​=μ2​

估计两个样本的均值是否相等,即 μ 1 − μ 2 = 0 \mu_1-\mu_2=0 μ1​−μ2​=0。

E ( X ‾ − Y ‾ ) = μ 1 − μ 2 E(\overline X-\overline Y)=\mu_1-\mu_2 E(X−Y)=μ1​−μ2​

D ( X ‾ − Y ‾ ) = σ 1 2 n + σ 2 2 m D(\overline X-\overline Y)=\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m} D(X−Y)=nσ12​​+mσ22​​

因此 X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n + σ 2 2 m ) \overline X-\overline Y \sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}) X−Y∼N(μ1​−μ2​,nσ12​​+mσ22​​)

当原假设成立的时候,用检验假设统计量
U = ( X ‾ − Y ‾ ) σ 1 2 n + σ 2 2 m ∼ N ( 0 , 1 ) U=\frac{(\overline X-\overline Y)}{\sqrt{\frac{\sigma_1^2}{n}+\frac{\sigma_2^2}{m}}}\sim N(0,1) U=nσ12​​+mσ22​​ ​(X−Y)​∼N(0,1)
给定的 α \alpha α,查正态表使得 P { ∣ μ ∣ > μ α 2 } = α P\{|\mu|>\mu_{\frac {\alpha}{2}}\}=\alpha P{∣μ∣>μ2α​​}=α

从而可以得到拒绝域为 ( − inf ⁡ , − μ α 2 ) ∪ ( μ α 2 , inf ⁡ ) (-\inf,-\mu_{\frac {\alpha}{2}})\cup(\mu_{\frac {\alpha}{2}},\inf) (−inf,−μ2α​​)∪(μ2α​​,inf)。

方差未知,均值检验( μ \mu μ检验法)

使用样本的方差代替总体的方差(为什么会有强调两种方差相等?)

T = ( X ‾ − Y ‾ ) ( n − 1 ) S 1 2 + ( m − 1 ) S 2 2 n + m − 2 1 n + 1 m ∼ t ( n + m − 2 ) T=\frac {(\overline X-\overline Y)}{\sqrt{ \frac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}\sqrt {\frac 1n +\frac 1m}}}\sim t(n+m-2) T=n+m−2(n−1)S12​+(m−1)S22​​n1​+m1​ ​(X−Y)​∼t(n+m−2)

例题

甲:25 28 23 26 29 22

乙:28 23 30 25 21 27

服从正态分布,方差相等且未知 ( α = 0.05 ) (\alpha=0.05) (α=0.05)

方差的检验

假设: H 0 : σ 2 = σ 0 2 H_0:\sigma^2=\sigma_0^2 H0​:σ2=σ02​, H 0 : σ 2 ≠ σ 0 2 H_0:\sigma^2\ne\sigma_0^2 H0​:σ2​=σ02​

检验统计量 F = S 1 2 S 2 2 F=\frac {S_1^2}{S_2^2} F=S22​S12​​

当 H 0 H_0 H0​成立时, F ∼ F ( n − 1 , m − 1 ) F\sim F(n-1,m-1) F∼F(n−1,m−1)

S 1 2 , S 2 2 是 σ 1 2 , σ 2 2 S_1^2,S_2^2 是\sigma_1^2,\sigma_2^2 S12​,S22​是σ12​,σ22​的无偏估计,因此当 H 0 H_0 H0​成立, F F F的值应该接近于1。

上一篇:BUAA_概率统计_Chap11_平稳过程


下一篇:专项测试-数学