抽样调查之分层抽样

1、在某工业系统所属企业中,中型100个,小型400个。采用简单随机抽样,以企业为单元,分别从两类企业中抽取3个企业和5个企业,记录1990年的工业总产值(单位:千元)。3个中型企业分别为12300、11500、9800;5个小型企业分别为3200、5600、2300、4200、3600.试估计工业系统1990年的工业总产值。

【解题过程】写清楚解题过程,公式用公式编辑器输入。
解:由题意得,把工业系统所属企业总体划分成两层,分别是中型企业和小型企业,L=2。
总体单元数N=500,各层单元总数分别为N1=100,N2=400,
每层权数分别为:W1=N1/N=0.2,W2=N2/N=0.8,
各层样本量分别为:n1=3,n2=5。
第一层样本均值的样本方差为:
抽样调查之分层抽样

第二层样本均值和样本方差为:
抽样调查之分层抽样

工业系统1990年的工业总产值的估计为:
抽样调查之分层抽样

工业系统1990年的工业总产值估计量的方差估计为:
抽样调查之分层抽样

估计量的标准差估计为:
抽样调查之分层抽样

【R语言代码】

N=500;
Nh=c(100,400);
W=Nh/N;
nh=c(3,5); 
f=nh/Nh; #各层抽样比
yh1=c(12300,11500,9800);#各层的样本
yh2=c(3200,5600,2300,4200,3600);
yhmean=c(mean(yh1),mean(yh2));yhmean; #各层的样本均值
s2h=c(var(yh1),var(yh2));s2h;#各层的样本方差
Y=N*sum(W*yhmean);Y;#总体总值的估计
vY=N^2*sum(W^2*s2h/nh*(1-f));vY;#总值估计量的方差的估计
sdvY=sqrt(vY);sdvY;#总值估计量的标准差估计

【输出结果】
抽样调查之分层抽样

故该工业系统1990年工业总值估计为2632000千元,估计量的方差估计为53049533333,估计量的标准差估计为230324.8千元。

2、某厂有三个生产车间,现分别从每个车间中抽取10%的工人,分别为60、50、40,征询工人对该厂某项议案的意见,反对人数所占比例分别为10%、20%、30%。3估计全厂工人反对该项议案的人数所占的比例。

【解题过程】写清楚解题过程,公式用公式编辑器输入。
解:由题意得,把工厂总体划分为三层L=3,每个车间一层。
每层的样本量分别为:n1=60,n2=50,n3=40,总样本量为:n=150。
采用样本量按比例分配,第h层权数Wh=Nh/N=nh/n,各层权数分别为:
W1=n1/n=0.4,W2=n2/n=0.33,W3=n3/n=0.27。
各层反对人数所占比例分别为:p1=0.1,p2=0.2,p3=0.3。
全厂工人反对该议案的人数所占比例估计为:
抽样调查之分层抽样

全厂工人反对该议案的人数所占比例估计量的方差估计为:
抽样调查之分层抽样

估计量的标准差估计为:
抽样调查之分层抽样
【R语言代码】

nh=c(60,50,40); ##各层的样本量
n=sum(nh); #总样本量
f=rep(0.1,3); #各层抽样比
W=round(nh/n,2);W;#各层层权
p=c(0.1,0.2,0.3);#样本中各层工人反对议案的人数所占比例
Pst=sum(W*p);Pst;#总体比例的估计
vPst=sum(W^2/nh*(1-f)*(nh*p*(1-p)/(nh-1)));vPst;#估计量方差的估计
sdvPst=sqrt(vPst);sdvPst; #估计量的标准差估计

【输出结果】
抽样调查之分层抽样

故全厂工人反对该议案的人数所占比例估计为18.7%,估计量的方差估计为0.0008929783,标准差估计为0.02988274。

3、已知总体数据如表,拟估计总体均值,精度要求估计量的方差不超过0.1。若进行分层随机抽样,分别采用尼曼分配和比例分配,分别计算总样本量和各层样本量。

层号h 各层总体单元数 Nh 各层标准差Sh
1 250 10
2 750 8
合计 1000

【解题过程】写清楚解题过程,公式用公式编辑器输入。
解:由题意得,把总体划分为两层,L=2。
总体单元数N=1000,各层单元总数分别为:N1=250,N2=750,
每层权数分别为:W1=N1/N=0.25,W2=N2/N=0.75,
已知计量的方差不超过0.1,V=0.1;每层标准差分别为:S1=10,S2=8。
当按尼曼分配时:
总样本量为:
抽样调查之分层抽样

各层样本量为:

抽样调查之分层抽样

当按比例分配时:
总样本量为:
抽样调查之分层抽样

各层样本量为:

抽样调查之分层抽样

【R语言代码】

Nh=c(250,750); #各层单元数
N=sum(Nh); #总体单元数
Wh=Nh/N;Wh;#各层层权
Sh=c(10,8); #各层标准差
vY=0.1; #估计量方差限度
n0=ceiling((sum(Wh*Sh))^2/vY); n0;#尼曼分配时总样本量
n=ceiling(n0/(1+(sum(Wh*Sh^2))/(sum(N*vY))));n;#调整的总样本量
nh=n*Wh*Sh/sum(Wh*Sh); #尼曼分配各层样本量
nh
n0p=ceiling(sum(Wh*Sh^2)/vY); n0p;#比例分配时总样本量
np=ceiling(n0p/(1+(sum(Wh*Sh^2))/(N*vY))); np;#调整的总样本量
nh=np*Wh; #比例分配各层样本量
nh

【输出结果】
抽样调查之分层抽样

故当按尼曼分配时,总样本量418,各层样本量分别为122.9412和295.0588,即大约为123和295;
当按比例分配时,总样本量422,各层样本量分别为105.5和316.5,即大约为105和316。

上一篇:Windows上实现iOS APP自动化测试:tidevice + WDA + airtest


下一篇:1016 Phone Bills