方差分析 - GLM

方差分析就是多组均值比较,方差分析和T检验区别:group > 2组

使用条件:

每个group中的观测独立

正态分布

group间方差齐性

 

For a balanced layout as shown in this example, the SAS Types I, II, III, and IV sums of squares (see Appendix D) are identical

对于平衡试验设计,I II III IV型平方和是一样的。详见sums of squares。

1. 原理

如果F大,组间均方大,组内均方小,证明至少有一个组的分布相对其他组分布较远,且每个组方差较小,分布都非常集中,因此可以拒绝H0

方差分析 - GLM

 

 

 这是计算每组的方差

 

方差分析 - GLM

 

MSE = SSE / N - K.

这是组内误差,或组内标准差,或残差

 

方差分析 - GLM

 

 

 方差分析 - GLM

 

 

 ni是第i组的观测数量。

MSG是组间标准差,衡量的是组间变异。

 

方差分析 - GLM

 

 

 

2. 单因素

*one-factor;
data one;
 input patno dosegrp $ hama @@;
 datalines;
101 LO 21 104 LO 18
106 LO 19 110 LO .
112 LO 28 116 LO 22
120 LO 30 121 LO 27
124 LO 28 125 LO 19
130 LO 23 136 LO 22
137 LO 20 141 LO 19
143 LO 26 148 LO 35
152 LO . 103 HI 16
105 HI 21 109 HI 31
111 HI 25 113 HI 23
119 HI 25 123 HI 18
127 HI 20 128 HI 18
131 HI 16 135 HI 24
138 HI 22 140 HI 21
142 HI 16 146 HI 33
150 HI 21 151 HI 17
102 PB 22 107 PB 26
108 PB 29 114 PB 19
115 PB . 117 PB 33
118 PB 37 122 PB 25
126 PB 28 129 PB 26
132 PB . 133 PB 31
134 PB 27 139 PB 30
144 PB 25 145 PB 22
147 PB 36 149 PB 32
; 

ods html;
proc glm data = one;
class dosegrp;
model hama = dosegrp;
means dosegrp/hovtest = bartlett;
run;

 

方差分析 - GLM

 

 

 单因素方差分析,Model总变异和group变异相同。

在group显著的情况下,比较均值;means dosegrp/hovtest = bartlett;

 

estimate "Compare HI - PB" dosegrp 1 0 -1 / ;

 

方差分析 - GLM

 

 

 根据高亮部分算出HI - PB置信区间,estimate 和 means两种方式得出结果相同。

 

lsmeans dosegrp/tdiff diff cl adjust=bon;

方差分析 - GLM

 

 

 第一部分是最小二乘均值,第三部分是最小二乘均值和置信区间

第二部分是均值差和 对应的T检验的P值。

第四部分是均值差的置信区间。

第二部分和第四部分其实都是两两比较,由tdiff 和 diff控制。

 

 3. 两两比较

means dosegrp/snk bon dunnett('PB');
lsmeans dosegrp/tdiff diff cl stderr adjust=bon;

两两比较:

LSD: 最小显著差异法,没控制总的 水平。随着比较次数增多,犯第一类错误概率增大

SNK:q检验

Bonferroni:每次比较都设定 alpha 水平,alpha/k, K是比较次数

Dunnett:和设定组比较

多项式比较:指定比较类别。Contrast ‘label’ class_group values; contrast ‘a’ drug 1 -1 0;

 

4. 多因素方差比较

方差分析 - GLM

 

 

 

方差分析 - GLM

 

 

 方差分析 - GLM

 

 

TRT就是用TRT组的每组均值 - 总体均值

TYPE就是用TYPE组的每组均值  - 总体均值

 方差分析 - GLM

 

 

 TRT - by - TYPE就是交叉相乘的每个小单元格,也就是交互作用

 

方差分析 - GLM

 

 

 就是每个人的数据 - 总体均值

方差分析 - GLM

 

 

 

*tw-factor;
data two;
 input trt $ type $ patno hgbch @@;
 datalines;
ACT C 1 1.7 ACT C 3 -0.2 ACT C 6 1.7
ACT C 7 2.3 ACT C 10 2.7 ACT C 12 0.4
ACT C 13 1.3 ACT C 15 0.6 ACT P 22 2.7
ACT P 24 1.6 ACT P 26 2.5 ACT P 28 0.5
ACT P 29 2.6 ACT P 31 3.7 ACT P 34 2.7
ACT P 36 1.3 ACT R 42 -0.3 ACT R 45 1.9
ACT R 46 1.7 ACT R 47 0.5 ACT R 49 2.1
ACT R 51 -0.4 ACT R 52 0.1 ACT R 54 1.0
PBO C 2 2.3 PBO C 4 1.2 PBO C 5 -0.6
PBO C 8 1.3 PBO C 9 -1.1 PBO C 11 1.6
PBO C 14 -0.2 PBO C 16 1.9 PBO P 21 0.6
PBO P 23 1.7 PBO P 25 0.8 PBO P 27 1.7
PBO P 30 1.4 PBO P 32 0.7 PBO P 33 0.8
PBO P 35 1.5 PBO R 41 1.6 PBO R 43 -2.2
PBO R 44 1.9 PBO R 48 -1.6 PBO R 50 0.8
PBO R 53 -0.9 PBO R 55 1.5 PBO R 56 2.1
; 

proc glm data = two;
class trt type;
model hgbch = trt type trt*type/;
*means trt*type/hovtest = levene;
lsmeans trt*type/tdiff lines adjust=bon;
*lsmeans trt*type/slice=type;
run;

slice = type 对TYPE的每个level进行计算。

 

方差分析 - GLM

 

 / lines adjust=bon

 进行两两比较,Bon方法,如上图所示,高亮部分没有相同字母,所以只有 1 和 6之间由显著差异。

 

上一篇:广义线性模型GLM


下一篇:《Deep Residual Learning for Image Recognition》翻译