现在,我们对正态分布的参数假设检验进行讨论,这也是本系列的最后一部分内容。由于本系列为我独自完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!
目录Part 1:基本步骤
正态总体\(N(\mu,\sigma^2)\)参数的假设检验不外乎遵循以下的步骤:
- 找到合适的统计量,用统计量的取值范围设计拒绝域。
- 假定原假设为真,考虑这个条件下统计量的分布。
- 根据统计量的分布,根据检验的水平要求设置拒绝域的边界值。
设计检验的核心在于假定原假设为真,这是因为检验的水平是基于弃真概率定义的,也就是说,要在第三步中写出检验的水平,就必须在\(H_0\)成立的情况下找出小概率事件的发生条件。
比如,对于均值的检验一共有三种:
\[1.\quad H_0:\mu=\mu_0\leftrightarrow H_1:\mu\ne \mu_0; \\ 2.\quad H_0:\mu\ge \mu_0\leftrightarrow H_1:\mu<\mu_0; \\ 3.\quad H_0:\mu\le \mu_0\leftrightarrow H_1:\mu>\mu_0. \]每一种又可以细分为方差\(\sigma^2\)已知和方差\(\sigma^2\)未知两种情况,但显然不论方差是否已知,最核心的统计量都应该是\(\bar X\),如果方差未知可能还要用到方差的替代:\(S^2\)。以下,对于这三种问题,拒绝域分别应该是这样的:
-
如果\(H_0\)被接受,则\(\bar X\)既不应该太大,也不应该太小,拒绝域的基础形式应该是
\[\{\bar X>c_1 \}\cup\{\bar X<c_2 \}. \] -
如果\(H_0\)被接受,则\(\bar X\)不应该太小,无论多大都可以,拒绝域的基础形式应该是
\[\{\bar X<c \}. \] -
如果\(H_0\)被接受,则\(\bar X\)不应该太大,无论多小都可以,拒绝域的基础形式应该是
\[\{\bar X>c \}. \]
当然,这只是拒绝域的基础形式,实际情况下可能不止使用\(\bar X\),但基本思想应该是这样的。对于方差的检验,则将检验统计量换成了\(S^2\),或者均值已知情况下的离差平方和\(Q^2\),步骤也和上面的差不多。
现在我们正式提出检验的p值的概念。根据拒绝域,我们只能得出接受假设、拒绝假设的二元结论,但没法给出一个接受假设的力度,是很有自信地接受假设还是勉强能够接受假设。检验的p值就可以解决这个问题,它表示在原假设成立的条件下,统计量还能比当前观测更极端的概率,是介于\([0,1]\)的数。
如果某个检验的p值很小,说明如果原假设成立,则当前观测值出现的概率已经很小(很难出现比这更离谱的观测值了),因而就更应该拒绝原假设。一个重要结论:如果检验的p值小于设定的水平,则拒绝原假设。
光靠着这个概念理解p值可能有难度,在下面我们将结合例子解释p值到底是什么。
接下来,我们先对单参数正态总体进行假设检验,并且在实践中给出一个实用的概念——检验的p值。在之前的文章中,我们说过给定置信水平的置信区间与给定水平的假设检验是共通的,因此在接下来的程序编写中,我们将既给出假设检验,也给出区间估计。
Part 2:正态分布假设检验
先考虑均值的假设检验问题。对于双边检验\(H_0:\mu=\mu_0\),核心统计量\(\bar X\)有
\[\bar X\sim N(\mu,\sigma^2/n)\Rightarrow \bar X\stackrel{H_0}\sim N(\mu_0,\sigma^2/n). \]这里要区分\(\sigma^2\)已知和未知两种情况,因为这直接关系到\(\bar X\)的分布已知或未知。\(\sigma^2\)已知时显然是更简单的,由于我们已知了\(\bar X\)在\(H_0\)下的分布,自然也可以将\(\bar X\)标准化为
\[U=\frac{\sqrt{n}(\bar X-\mu_0)}{\sigma}\stackrel{H_0}\sim N(0,1), \]在\(H_0\)成立的情况下\(|U|\)不应该过大,所以拒绝域的形式可改为\(\{|U|>c\}\),结合其弃真概率与检验水平,有
\[\mathbb{P}\left(-c<U<c\bigg|H_0 \right)=1-\alpha, \]所以\(c=u_{\alpha/2}\),即拒绝域是
\[D=\left\{-u_{\alpha/2}<\frac{\sqrt{n}(\bar X-\mu_0)}{\sigma}<u_{\alpha/2} \right\}. \]在这个问题中,如果我们实际观测得到的\(U\)值是\(u_0\),则该检验的p值就是\(\mathbb{P}(|U|>|u_0|| H_0)\),因为原假设成立的情况下\(U\)应该是越小越好的,所以\(U>u_0\)指的就是比当前观测更极端这一事件。并且因为\(H_0\)成立的情况下,\(U\)服从标准正态分布,所以结合标准正态分布表这个p值是容易计算的。
接下来是\(\sigma^2\)未知的情况,虽然\(\bar X\)的分布未知,但我们一样可以对其进行标准化,即构造
\[T=\frac{\sqrt{n}(\bar X-\mu)}{S}\stackrel{H_0}\sim t(n-1). \]同样在\(H_0\)成立的情况下\(|T|\)不应该过大,所以检验的拒绝域形式是\(\{|T|>t_{\alpha/2}(n-1)\}\),如果\(T\)的观测值是\(t_0\),则检验的p值是\(\mathbb{P}(|T|>|t_0||H_0)\)。
对于单边检验,无非是更改拒绝域和边界值,将\(\alpha/2\)分位数改成\(\alpha\)分位数,p值的计算方式也相应变化,标准化的过程是一致的,这里就不详细展开了。
现在考虑方差的假设检验问题,同样只考虑双边检验(因为单边检验的过程类似),并考虑均值已知或未知。当均值已知时,有
\[\chi^2=\frac{1}{\sigma_0^2}\sum_{j=1}^n(X_j-\mu)^2\stackrel{H_0}\sim \chi^2(n), \]在\(H_0\)成立的情况下\(\chi^2\)不应该太大也不应该太小,但是由于\(\chi^2\)分布不对称,所以其拒绝域是\(\{\chi^2<\chi^2_{1-\alpha/2}(n)\}\cup \{\chi^2>\chi^2_{\alpha/2}(n)\}\),这些都没有问题。不过这种情况检验的p值稍微复杂一些,可以这么思考:不论\(\chi^2\)的观测值\(\chi^2_0\)是多少,在\(\chi^2(n)\)分布的密度函数上都有另外一个与之对称的点,所以p值实际是这两个点以外的概率总和。
如果均值未知,则直接使用\(S^2\),就有
\[\chi^2\xlongequal{def}\frac{(n-1)S^2}{\sigma_0^2}\stackrel{H_0}\sim \chi^2(n-1), \]类似地可以计算拒绝域和p值。
事实上,由于区间估计与假设检验的一致性,在我们讨论过正态总体参数区间估计之后,这些假设检验都可以直接由区间估计推导出来。对于双正态总体的相关假设检验,也不外乎均值差和方差比,具体参见此链接即可。