ATAC-seq技术及相关技术的发展
Reveling in the Revealed这篇文章中,对DNase-seq和ATAC-seq还有MNase-seq相关技术原理以及优缺点进行了总结。具体如下:
首先,向我们了解到的,CHIP-seq即染色质免疫共沉淀质谱技术,它主要通过对已知的蛋白,通常是目的转录因子TF免疫沉淀,抓取与该TF结合的DNA片段,然后再进一步的扩增,找到TF的潜在靶基因。通常这种方法是由很大局限的:
- 这种方法智能找到潜在的有限的转录因子的靶基因。而不能找到基因组范围内所有被蛋白质保护的区域。
而文章中提到的DNase-seq 主要是利用DNase酶1对基因组上具有DNase敏感型的位置进行切割,即通过酶进行消化,然后对消化后的片段进行扩增,最后对测序出来的数据分析峰值,找到,有蛋白质保护的区域通常是转录因子以及核小体结合的位置。
这种方法的优缺点是
优点
- 方法较为简单,易于建立实验体系,已应用于多种细胞,并且对其切割误差有较好的了解;
- 通过测序的结果,间接的推测核小体以及转录因子的结合位点。
缺点:
- 此种方法很难控制最佳的消化条件,与此同时,对需要处理的细胞的数目要求较多,比较费时费力,通常需要的细胞数目达到几百万个;
- 由于其对测序所需要的细胞的数目要求较多,因此对一些样本量较少的细胞来说,这种方法不适用;
- DNase酶1对于DNA的切割具有序列依赖性,因此,这种方法将会给测序带来较大的误差。不能保证切割后的结果,就完全是蛋白质覆盖的区域。
在这张图里,作者提到,由于在测序的时候,染色质的状态是一个动态的过程,因此上述的三种方法,MNase-seq以及ATAC-seq和DNase-seq并不能很好的放映染色质的开放状态ATAC-seq和DNase-seq的结果,并不能很好的与MNase-seq的结果互补。
ATAC-seq 这是一种利用超活跃的转座酶来分析染色质的开放性的技术。主要的原理,利用Tn5转座酶复合体,将带有标记的标签,与DNA进行孵育,裸露的DNA片段,将在转座酶的作用下,被置换出来,然后通过特异的标签引物进行PCR扩增,进行后续的测序工作。
这种技术的优缺点:
优点
- 技术相对来说较为简单;
- 所需要的细胞量大大减少,目前差不多只需要5个细胞左右。
缺点
- Tn5转座酶的价格较为昂贵;
- 对于ATAC-seq测序所得结果;记录还不是特别完全,无法充分的去解释这种酶切割的序列偏好问题;
- 每个细胞都是不同的,所以你需要根据你的特殊情况调整细胞数量和裂解条件;
- 理想情况下,需要温和地裂解细胞,使转座酶进入,并且不破坏染色质状态;
- 使用太多的细胞会导致插入的测序适配器减少,从而导致较大的DNA片段;使用太少的细胞会导致较短的DNA片段;
- 细胞的最佳数量可能会有所不同,这取决于细胞起源的组织或机体器官。
单细胞测序中的ATAC-seq存在的问题,单细胞测序的结果较为稀疏,在基因组的任何位置都存在零星的1-2个可接近位点,但是这些数据不准确,难以置信。
MNase-seq数据的原理
研究人员使用金黄色葡萄球菌的微球菌核酸酶(mnase)消化和研究染色质至少已有40年。2010年,他们开始将其与高通量测序配对。
工作原理
mnase通过切割消化暴露在外的基因组片段来工作;与核小体相关的dna被恢复并测序。这使得mnase-seq至少在概念上是atac-seq和dnase-seq是互补的,但是这一条件的实现,需要将几种测序在同一种细胞内,进行同时测序处理。
优点
- 应用广泛;
缺点
- 需要的细胞数量较多,约10-20百万个;
- 染色质可接近性分析中使用的大多数酶具有序列特异性偏好;
- mnase酶偏好切割基因组中AT富集区域;
- 基因组的某些区域比其他区域对该核酸酶消化更敏感,但具体的机制目前仍不清楚。
针对以下问题,DNase-seq测序的数据和MNase-seq测序的数据并不是互补的分析,Lieb他认为,在细胞进行测序的过程中,存在某些位点同时是DNase超敏感的,也可能是被核小体保护的,针对于这一问题,我们将如何进一步的确切的描述染色体最真实的状态呢?
对于MNase-seq进行补充的方法被称为NOMe-seq,该方法在2012年被提出拉进行使用。这种方法在全基因组的范围内产生关于核小体定位和dna甲基化状态信息,由此将核小体的占位信息和甲基化的状态联合起来。而对于这种NOMe-seq的技术,我将在下一篇文章进行分析。