介绍 Haploview旨在简化和加快单体型分析过程,为与此类分析有关的若干任务提供一个通用界面。 Haploview目前支持以下功能:
LD和单元型块分析
单倍型群体频率估计
单个SNP和单体型关联测试
关联显着性的排列检验
实现Paul de Bakker的Tagger标签SNP选择算法。
从HapMap自动下载分阶段的基因型数据
PLINK全基因组关联结果的可视化和绘图,包括高级过滤选项
安装地址:https://www.broadinstitute.org/haploview/downloads
在安装软件之前,必须安装java,虽然手册注明支持java1.4及更高版本,但是我在安装过程中发现,haploview暂不支持比1.8更高的版本。
在Windows平台中,科直接下载HapInstall.exe,双击运行。
在Mac / Linux平台中:获取JAR文件后,程序就可以通过命令从终端运行: java -jar Haploview.jar
利用haploview用Haploview分析数据的第一步是加载数据。程序启动时会出现一个对话框,提供数据格式的选择。
其中linkage format格式的输入文件为.ped文件和.info文件。
.ped文件中,第一列:个体来自的家系号,如果分析的是无关个体,则可以直接用1,2,3,4。
第二列:表示个体的ID,并且在同一个家系内不可以重复,不同的家系间可以重复
第三列,第四列:分别是父亲ID和母亲ID,如果是无关个体,可全设为0.
第五列:性别信息。1代表男性,2代表女性
第六列:表示个体的疾病状态。0表未知,1表示未患病,2表示患病。
第七列以后,每两列代表一个SNP位点。可以用A C G T,也可以用1 2 3 4。0与N表示缺失值。
输入文件成功后,出现数据质量检查页面
这时点击LD plot,可以看到block:
LD显示器允许多种方式检查数据。 详细的LD统计信息可以通过右键单击任何框进行比较。 右击一个标记号码显示它的名字和次要等位基因频率。菜单Display中的LDzoom和LD color scheme可改变图形颜色和大小。
点击Haplotypes,显示单倍型位点文本信息。种群频率显示在每个单倍型旁边(灰色字体),线条显示了从一个块到下一个块最常见的交叉点,线条越粗,相邻单倍体型结合可能性越大。在交叉线下面显示的是多区域D素数,它是两个区块之间的LD的度量。值越接近零,两个块之间重组可能性越大。
Association显示关联分析,Haploview目前支持多种类型的关联测试,具有多种功能:单SNP TDT和案例/控制测试;基于块的单元型关联测试;用户指定的单元型测试;排列显着性测试。使用重复置换检验(permutation tests)时,可以使用排列测试选项卡通过置换生成实验范围的p值。软件可显示了对于这个数据集的所有单个SNP和单元型等位基因在块中的500个排列的结果。
Tagger:Haploview还可以使用Tagger算法的变体来选择一组优化的标签SNP:
Configuration :可以在这个数据集中指定想要标记的基因,选择后“Run Tagger”,页面将会直跳转到接跳转到Results:
注意:1,Haploview只能分析单位点突变。
2,当输入的snp太多时,java虚拟机的内存不足,暂时只能减少SNP个数。