【数据科学基础复习 - 4】区间估计

本文旨在熟练运用区间估计而不去探究其背后的原理

0. 区间估计思想

置信系数的理解: 区间\(U\)​置信系数为\(95\%\)​并不是说一个由给定样本确定的\(U\)​包含待估计参数\(\theta\)​的概率为\(95\%\)​, 因为样本确定后\(U\)​是否包含\(\theta\)​二者必居其一,是一个确定性的事件. 确切地说是反复抽样得到不同的\(U\)​, 其中有\(95\%\)​的\(U\)​包含\(\theta\)​

这牵扯到对概率的理解, 日后进一步探究. 此处先暂且略过

1. 枢轴变量法

步骤:

  • 找出一个与要估计参数\(g(\theta)\)有关的统计量\(T\),一般是良好的点估计(如正态中的\(\overline{X}\))
  • 找出含\(T\)和\(g(\theta)\)的某一统计量\(S\),\(S\)的分布\(F\)应当与\(\theta\)无关
  • 对于任何常数\(a<b,a\leq S\leq b\)要能改写为等价的形式\(A\leq g(\theta)\leq B\). 且\(A,B\)只与\(a,b\)有关而与\(\theta\)无关
  • 取\(F\)的\(\alpha/2\)上分位点和\(1-\alpha/2\)​上分位点即可

有关指数分布的一个有趣性质

若\(X\sim E(\lambda)\)​, 则\(2\lambda X\sim E(2)\)​. 因为\(E(2\lambda X)=2\lambda*\frac{1}{\lambda}=2\)​​. 亦可通过随机变量的函数关系推得.​

利用这一点则可采用枢轴变量法给出\(\lambda\)的参数估计区间

2. 大样本法

对于离散变量或分布未知的随机变量,无法直接求出一个枢轴变量. 如果样本量很大(\(n\geq 50\))此时就利用中心极限定理求解:

设\(X=\sum X_i\)

\[\frac{X-n\mu}{\sqrt{n\sigma^2}}\sim N(0,1) \]

必要时还可用样本方差\(S^2\)代替\(\sigma^2\)

对于二项分布和泊松分布需要解一个一元二次方程

3. 贝叶斯法

待考试完后补充...

上一篇:NOIP提高组模拟赛14


下一篇:蓝桥杯真题:数列求值(2019 年省赛)