只考虑一个因素 A 对所关心的指标的影响, A 取几个水平,在每个水平上作若干个试验,试验过程中除 A 外其它影响指标的因素都保持不变(只有随机因素存在),我们的任务是从试验结果推断,因素 A 对指标有无显著影响,即当 A 取不同水平时指标有无显著差别。 A 取某个水平下的指标视为随机变量,判断 A 取不同水平时指标有无显著差别, 相当于检验若干总体的均值是否相等。
1.1数学模型
1.2 统计分析
由卡方分布的可加性得:
1.3 方差分析表
方差分析一般用的显著性水平是:取α = 0.01,拒绝 H0 ,称因素 A 的影响(或 A 各水平的差异)非常显著;取α = 0.01,不拒绝 H0 ,但取α = 0.05 ,拒绝 H0 ,称因 素 A 的影响显著;取α = 0.05 ,不拒绝 H0 ,称因素 A 无显著影响。
1.4 Matlab 实现
Matlab 统计工具箱中单因素方差分析的命令是 anoval。 若各组数据个数相等,称为均衡数据。若各组数据个数不等,称非均衡数据。
(1)均衡数据
处理均衡数据的用法为: p=anoval(x)
返回值 p 是一个概率,当 p > α 时接受 H0 ,x 为m× r 的数据矩阵,x 的每一列是一个 水平的数据(这里各个水平上的样本容量 ni = m )。另外,还输出一个方差表和一个 Box 图。
示例:
x=[256 254 250 248 236
242 330 277 280 252
280 290 230 305 220
298 295 302 289 252];
p=anova1(x)
得 p = 0.1109 >α = 0.05,故不能拒绝原假设,接受H0,即 5 名工人的生产率没有显著差异。
方差表对应于上面的单因素方差分析表的1 ~ 4 列,F = 2.262 是 F(4,15) 分布的1− p 分 位数,可以验证 fcdf(2.262,4,15)=0.8891=1-p。
Box 图反映了5个工人生产率数据的特征。
(2)非均衡数据
处理非均衡数据的用法为: p=anova1(x,group)
x 为向量,从第 1 组到第 r 组数据依次排列;group 为与 x 同长度的向量,标志 x 中数 据的组别。
示例:
clc,clear;
x=[1620 1580 1460 1500
1670 1600 1540 1550
1700 1640 1620 1610
1750 1720 1680 1800];
x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
p=anova1(x,g)
求得:p=0.0331<0.05,所以几种工艺制成的灯泡寿命有显著差异。
1.5 多重比较
在灯泡寿命问题中,为了确定哪几种工艺制成的灯泡寿命有显著差异,我们先算出各组数据的均值:
虽然 A1 的均值最大,但要判断它与其它几种有显著差异,还需做多重比较。一般多重比较要对所有 r 个总体作两两对比,分析相互间的差异。根据问题的具体情况可以减少对比次数。
clc,clear;
x=[1620 1580 1460 1500
1670 1600 1540 1550
1700 1640 1620 1610
1750 1720 1680 1800];
x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];
[p,t,st]=anova1(x,g)
[c,m,h,nms] = multcompare(st);
[nms num2cell(m)]