方差分析就是多组均值比较,方差分析和T检验区别:group > 2组
使用条件:
每个group中的观测独立
正态分布
group间方差齐性
For a balanced layout as shown in this example, the SAS Types I, II, III, and IV sums of squares (see Appendix D) are identical
对于平衡试验设计,I II III IV型平方和是一样的。详见sums of squares。
1. 原理
如果F大,组间均方大,组内均方小,证明至少有一个组的分布相对其他组分布较远,且每个组方差较小,分布都非常集中,因此可以拒绝H0
这是计算每组的方差
MSE = SSE / N - K.
这是组内误差,或组内标准差,或残差
ni是第i组的观测数量。
MSG是组间标准差,衡量的是组间变异。
2. 单因素
*one-factor; data one; input patno dosegrp $ hama @@; datalines; 101 LO 21 104 LO 18 106 LO 19 110 LO . 112 LO 28 116 LO 22 120 LO 30 121 LO 27 124 LO 28 125 LO 19 130 LO 23 136 LO 22 137 LO 20 141 LO 19 143 LO 26 148 LO 35 152 LO . 103 HI 16 105 HI 21 109 HI 31 111 HI 25 113 HI 23 119 HI 25 123 HI 18 127 HI 20 128 HI 18 131 HI 16 135 HI 24 138 HI 22 140 HI 21 142 HI 16 146 HI 33 150 HI 21 151 HI 17 102 PB 22 107 PB 26 108 PB 29 114 PB 19 115 PB . 117 PB 33 118 PB 37 122 PB 25 126 PB 28 129 PB 26 132 PB . 133 PB 31 134 PB 27 139 PB 30 144 PB 25 145 PB 22 147 PB 36 149 PB 32 ; ods html; proc glm data = one; class dosegrp; model hama = dosegrp; means dosegrp/hovtest = bartlett; run;
单因素方差分析,Model总变异和group变异相同。
在group显著的情况下,比较均值;means dosegrp/hovtest = bartlett;
estimate "Compare HI - PB" dosegrp 1 0 -1 / ;
根据高亮部分算出HI - PB置信区间,estimate 和 means两种方式得出结果相同。
lsmeans dosegrp/tdiff diff cl adjust=bon;
第一部分是最小二乘均值,第三部分是最小二乘均值和置信区间
第二部分是均值差和 对应的T检验的P值。
第四部分是均值差的置信区间。
第二部分和第四部分其实都是两两比较,由tdiff 和 diff控制。
3. 两两比较
means dosegrp/snk bon dunnett('PB'); lsmeans dosegrp/tdiff diff cl stderr adjust=bon;
两两比较:
LSD: 最小显著差异法,没控制总的 水平。随着比较次数增多,犯第一类错误概率增大
SNK:q检验
Bonferroni:每次比较都设定 alpha 水平,alpha/k, K是比较次数
Dunnett:和设定组比较
多项式比较:指定比较类别。Contrast ‘label’ class_group values; contrast ‘a’ drug 1 -1 0;
4. 多因素方差比较
TRT就是用TRT组的每组均值 - 总体均值
TYPE就是用TYPE组的每组均值 - 总体均值
TRT - by - TYPE就是交叉相乘的每个小单元格,也就是交互作用
就是每个人的数据 - 总体均值
*tw-factor; data two; input trt $ type $ patno hgbch @@; datalines; ACT C 1 1.7 ACT C 3 -0.2 ACT C 6 1.7 ACT C 7 2.3 ACT C 10 2.7 ACT C 12 0.4 ACT C 13 1.3 ACT C 15 0.6 ACT P 22 2.7 ACT P 24 1.6 ACT P 26 2.5 ACT P 28 0.5 ACT P 29 2.6 ACT P 31 3.7 ACT P 34 2.7 ACT P 36 1.3 ACT R 42 -0.3 ACT R 45 1.9 ACT R 46 1.7 ACT R 47 0.5 ACT R 49 2.1 ACT R 51 -0.4 ACT R 52 0.1 ACT R 54 1.0 PBO C 2 2.3 PBO C 4 1.2 PBO C 5 -0.6 PBO C 8 1.3 PBO C 9 -1.1 PBO C 11 1.6 PBO C 14 -0.2 PBO C 16 1.9 PBO P 21 0.6 PBO P 23 1.7 PBO P 25 0.8 PBO P 27 1.7 PBO P 30 1.4 PBO P 32 0.7 PBO P 33 0.8 PBO P 35 1.5 PBO R 41 1.6 PBO R 43 -2.2 PBO R 44 1.9 PBO R 48 -1.6 PBO R 50 0.8 PBO R 53 -0.9 PBO R 55 1.5 PBO R 56 2.1 ; proc glm data = two; class trt type; model hgbch = trt type trt*type/; *means trt*type/hovtest = levene; lsmeans trt*type/tdiff lines adjust=bon; *lsmeans trt*type/slice=type; run;
slice = type 对TYPE的每个level进行计算。
/ lines adjust=bon
进行两两比较,Bon方法,如上图所示,高亮部分没有相同字母,所以只有 1 和 6之间由显著差异。