常见基因组功能数据介绍 | 表观注释 | DNase-seq | H3K27ac | H3K4me1 | eQTL | ENCODE | ROADMAP

functional genomics | epigenomic annotations

刚入行的总是一头雾水,对这些表观的标记一点兴趣都没有,种类繁多,总是记不住,这里我就做一个常识性的总结,不搞太多术语。

需要了解的也不多,常见的就那么几个,搞懂ENCODE和ROADMAP上有的就行。细节颇多,需要一点耐心。

各种类型的数据可以直接在这个genome browser里浏览:http://genomebrowser.wustl.edu/

 

Enhancer

TFBSs

DHSs

H3K4me3

H3K9ac

H3K27ac

H3K4me1

 

主要是ChIP-seq占了很大一类,把它搞懂就行。

 

待续~

 


 

快速使用epigenomic annotations data:

有个叫做baseline_v1.1的文件,里面包含了各种整理好的表观注释数据。

https://data.broadinstitute.org/alkesgroup/LDSCORE/baseline_v1.1_bedfiles.tgz
~/project2/CPloci/Evo/ENCODE/

  

包含的数据类型:

  • Coding
  • Intron
  • Transcribe
  • Conserved
  • DGF
  • DHS
  • H3K9ac
  • H3K27ac
  • H3K4me1
  • H3K4me3
  • CTCF
  • TFBS
  • TSS
  • Promoter
  • Enhancer
  • SuperEnhancer
  • WeakEnhancer
  • Repressed
  • UTR_5
  • UTR_3

算是种类非常多了,如果对精度没有要求,就可以直接用了,全部是bed格式的。

 

 

 

  

 

上一篇:数据库删除重复数据


下一篇:Vue基础1(简单易上手,适合前后端)