杂合度计算分为两种:位点杂合度和样本杂合度
1、计算位点杂合度,测试数据如下:
[root@centos79 test]# ls outcome.map outcome.ped [root@centos79 test]# cat outcome.map ## 8个snp位点 1 snp1 0 55910 1 snp2 0 85204 1 snp3 0 122948 1 snp4 0 203750 1 snp5 0 312707 1 snp6 0 356863 1 snp7 0 400518 1 snp8 0 487423 [root@centos79 test]# cat outcome.ped ## 8个样本 DOR 1 0 0 0 -9 G G C C G G G G G A A A G G G C DOR 2 0 0 0 -9 G G G C G G G G G G A A A G C C DOR 3 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 4 0 0 0 -9 G G C C G G G G G G A A G G G G DOR 5 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 6 0 0 0 -9 G G C C G G G G G G A A A A C C DOR 7 0 0 0 -9 G G C C G G A G A A A A G G C C DOR 9 0 0 0 -9 G G C C G G A G A A A A G G C C
2、--hardy计算位点杂合度
[root@centos79 test]# plink --file outcome --hardy --out sitehet &> /dev/zero [root@centos79 test]# ls outcome.map outcome.ped sitehet.hwe sitehet.log sitehet.nosex ## 结果文件 [root@centos79 test]# cat sitehet.hwe CHR SNP TEST A1 A2 GENO O(HET) E(HET) P ## o(HET)为观测杂合度百分率,利于第一个位点0,全部是G 1 snp1 ALL(NP) 0 G 0/0/8 0 0 1 1 snp2 ALL(NP) G C 0/1/7 0.125 0.1172 1 1 snp3 ALL(NP) 0 G 0/0/8 0 0 1 1 snp4 ALL(NP) A G 0/2/6 0.25 0.2188 1 1 snp5 ALL(NP) A G 2/1/5 0.125 0.4297 0.07692 1 snp6 ALL(NP) 0 A 0/0/8 0 0 1 1 snp7 ALL(NP) A G 1/3/4 0.375 0.4297 1 1 snp8 ALL(NP) G C 1/3/4 0.375 0.4297 1 [root@centos79 test]# cat outcome.ped DOR 1 0 0 0 -9 G G C C G G G G G A A A G G G C DOR 2 0 0 0 -9 G G G C G G G G G G A A A G C C DOR 3 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 4 0 0 0 -9 G G C C G G G G G G A A G G G G DOR 5 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 6 0 0 0 -9 G G C C G G G G G G A A A A C C DOR 7 0 0 0 -9 G G C C G G A G A A A A G G C C DOR 9 0 0 0 -9 G G C C G G A G A A A A G G C C
2、--het 计算样本杂合度
首先要剔除没有多态的位点:
[root@centos79 test]# ls outcome.map outcome.ped [root@centos79 test]# plink --file outcome --maf 0.0000001 --recode tab --out test &> /dev/null ## 利用plink的--maf参数剔除没有多态的位点 [root@centos79 test]# ls outcome.map outcome.ped test.log test.map test.nosex test.ped [root@centos79 test]# cat test.ped ## 剩余5个位点 DOR 1 0 0 0 -9 C C G G A G G G G C DOR 2 0 0 0 -9 G C G G G G A G C C DOR 3 0 0 0 -9 C C G G G G A G G C DOR 4 0 0 0 -9 C C G G G G G G G G DOR 5 0 0 0 -9 C C G G G G A G G C DOR 6 0 0 0 -9 C C G G G G A A C C DOR 7 0 0 0 -9 C C A G A A G G C C DOR 9 0 0 0 -9 C C A G A A G G C C [root@centos79 test]# plink --file test --het --out indhet &> /dev/null ## 计算样本杂合度 [root@centos79 test]# ls indhet.het indhet.log indhet.nosex outcome.map outcome.ped test.log test.map test.nosex test.ped [root@centos79 test]# cat indhet.het FID IID O(HOM) E(HOM) N(NM) F ## 0(HOM)为观测的纯合子数目,N是总的位点数杂合度为 (O-N)/N DOR 1 3 3.375 5 -0.2308 ## 比如第一个样本三个纯合子,那么杂合子5-3=2;杂合度 (5-3)/ 5 = 0.4 DOR 2 3 3.375 5 -0.2308 DOR 3 3 3.375 5 -0.2308 DOR 4 5 3.375 5 1 DOR 5 3 3.375 5 -0.2308 DOR 6 5 3.375 5 1 DOR 7 4 3.375 5 0.3846 DOR 9 4 3.375 5 0.3846