functional genomics | epigenomic annotations
刚入行的总是一头雾水,对这些表观的标记一点兴趣都没有,种类繁多,总是记不住,这里我就做一个常识性的总结,不搞太多术语。
需要了解的也不多,常见的就那么几个,搞懂ENCODE和ROADMAP上有的就行。细节颇多,需要一点耐心。
各种类型的数据可以直接在这个genome browser里浏览:http://genomebrowser.wustl.edu/
Enhancer
TFBSs
DHSs
H3K4me3
H3K9ac
H3K27ac
H3K4me1
主要是ChIP-seq占了很大一类,把它搞懂就行。
待续~
快速使用epigenomic annotations data:
有个叫做baseline_v1.1的文件,里面包含了各种整理好的表观注释数据。
https://data.broadinstitute.org/alkesgroup/LDSCORE/baseline_v1.1_bedfiles.tgz
~/project2/CPloci/Evo/ENCODE/
包含的数据类型:
- Coding
- Intron
- Transcribe
- Conserved
- DGF
- DHS
- H3K9ac
- H3K27ac
- H3K4me1
- H3K4me3
- CTCF
- TFBS
- TSS
- Promoter
- Enhancer
- SuperEnhancer
- WeakEnhancer
- Repressed
- UTR_5
- UTR_3
算是种类非常多了,如果对精度没有要求,就可以直接用了,全部是bed格式的。