本周最新文献速递20210718

本周最新文献速递20210718

一、精细解读文献 一

文献题目: Tissue-specific 5-hydroxymethylcytosine landscape of the human genome

不想看英文题目: 人类基因组的组织特异性 5-羟甲基胞嘧啶景观

杂志和影响因子: Nat Commun (IF: 12.121; Q1)

研究意义: 5-羟甲基胞嘧啶 (5hmC) 是一种重要的表观遗传修饰,在各种生物学过程中起着重要作用,包括转座子沉默、基因表达调控、基因组印记和X-染色体失活等。绘制人体组织中 5hmC 图谱有助于了解其调控机制。

本周最新文献速递20210718

结论:

1)通过 hmC-CATCH 测序方法生成了 19 种人体组织类型的 5hmC 全基因组数据,数据包括 6 个中国捐赠者(3 名男性 、3 名女性)的 60 个组织样本;

2)产生了 721,404 个可重复的 5hmC 峰,9,416,937 个可重复的 5hmC 位点,峰和位点大部分位于内含子和基因间隔区;

3)分析 5hmC 在不同调控区域的 motif,发现 5hmC motif 呈现规律性的 “CAhmCGT” 模式,与 ARNT 的 motif 接近,揭示 5hmC 可能影响 ARNT 在基因组的结合率,有文献报道食管癌患者的 ARNT 结合motif后 会使得 5hmC 信号丢失;

4)对人体组织中的 5hmC 水平和基因表达进行皮尔森相关性分析,发现基因的表达水平和 5hmC 水平显著正相关,且大多数基因为组织特异性表达,但 5mC 与组织特异性基因的表达水平则无显著相关,说明 5hmC 不仅与基因表达密切相关,并且可能维持组织特异性的功能;

5)为了进一步阐明 5hmC 维持组织特异性可能的调控机制,作者鉴定了一系列具有组织特异性的 5hmC 峰,表现为在不同组织中呈现差异高羟甲基化,并将该区域命名为组织特异性差异羟甲基化区域(tsDhMRs), 大部分 tsDhMRs 位于内含子和远端区域,且在进化上更为保守,说明 tsDhMRs 属于一种重要的调控元件;

6)探究 tsDhMRs 潜在的转录因子结合位点 (TFBS),发现超过一半的 tsDhMR 与至少一个 TFBS 重叠,且重叠的 TFBSs 多为组织特异性;

7)结合GWAS结果,发现 tsDhMRs 区域富含 GWAS 发现的显著信号位点,且与 eQTL SNP 高度重合,说明 tsDhMR 有助于理解 GWAS 发现的 SNP 功能;

亮点: 鉴定了数十万个 5hmC 峰和数百万个 5hmC 位点,远远超越之前报道的数量;

局限: 大方向上观察到 tsDhMRs 区域与 eQTL 位点(或GWAS 信号位点)高度重合,但文章没有进一步解释 eQTL(或GWAS信号位点) 与 5hmC 是如何一起影响基因表达(或表型)?

文章链接:

https://pubmed.ncbi.nlm.nih.gov/34253716/

doi: 10.1038/s41467-021-24425-w

公开的资料:

Sequencing data:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE134078
BS-seq:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE119981
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE112356
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE59395
ChIP-seq data:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE59395
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE16256
DNase-seq:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE18927
Code:
https://github.com/herb-BO/hmC_CATCH

二、精细解读文献 二

文献题目: Discovery and prioritization of variants and genes for kidney function in >1.2 million individuals

不想看英文题目: 在超过 120 万人的队列中发现和优化肾功能相关的变异位点和基因

杂志和影响因子: Nat Commun (IF: 12.121; Q1)

研究意义: 慢性肾病 (CKD) 在发达国家成年人口中患病率超过 10%,为全球发病率和死亡率主因。CKD 的临床表现为肾小球滤过率(GFR )降低,其可用血清肌酐水平进行估计。据报道,基于血清肌酐的肾小球滤过率 (eGFRcrea) 遗传度高达54%,但缺乏大规模队列对其调控下的慢性肾病进行研究。

本周最新文献速递20210718

结论:

1)总共纳入了 1,201,909 个人,对 eGFRcrea 表型进行荟萃分析,鉴定了424 个相关的基因座,其中 201 个为新基因座,223 个是已知的;

2) 82% 的 eGFRcrea 基因座与多种肾功能标志物显著相关,比如血清胱抑素 C (eGFRcys)、血尿素氮 (BUN),说明 eGFRcrea 鉴定的基因座可很好表征肾功能;

3)使用 GCTA 进行条件分析,发现了 634 个独立信号;

4)为了缩小关联信号的范围,对每个信号的后验概率 (PPA)进行计算,并构建 99% 可信集。 在 634 个独立信号中, 138 个位于 99% 可信集中,其中 30 个被映射到新基因座上;

5)对99%可信集的变异位点进行 cis -eQLT/sQTL 共定位并映射到基因上,总共产生 5906 个基因,结合CADD 得分、肾功能注释数据库(MGI小鼠数据库、OMIM数据库)等对 5906 个基因进行优先排序(GPS)后,产生了32个与肾功能高度相关的基因;

6)使用 LDSC-SEG 对 5906 个基因的细胞类型和组织特异性进行鉴定,发现主要富集在肾脏和肌肉中,与之前文献报道的一致;

亮点:

使用 eGFRcys/BUN 关联结果侧面验证 eGFRcrea 结果的可靠性;

文章链接:

https://pubmed.ncbi.nlm.nih.gov/34272381/

doi: 10.1038/s41467-021-24491-0

公开的资料:

log(eGFRcrea), log(eGFRcys), log(BUN) gwas summary 数据:
http://www.genepi-regensburg.de/ckd
https://ckdgen.imbi.uni-freiburg.de/
https://ckdgen.imbi.uni-freiburg.de/

GPS基因:
http://www.genepi-regensburg.de/ckd


三、其他文献推荐

下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);


文献题目: Senolytics reduce coronavirus-related mortality in old mice

不想看英文题目: Senolytics 降低老年小鼠与冠状病毒相关的死亡率

杂志和影响因子: Science (IF: 41.845; Q1)

文章链接:

https://science.sciencemag.org/content/373/6552/eabe4832


文献题目: Highly accurate protein structure prediction with AlphaFold

不想看英文题目: 使用 AlphaFold 进行高精度蛋白质结构预测

杂志和影响因子: Nature (IF: 42.778; Q1)

文章链接:

https://www.nature.com/articles/s41586-021-03819-2


文献题目: The chromatin, topological and regulatory properties of pluripotency-associated poised enhancers are conserved in vivo

不想看英文题目: 多能静态增强子的染色质、拓扑和调控特性在体内是保守的

杂志和影响因子: Nat Commun (IF: 12.121; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-24641-4


文献题目: Profiling variable-number tandem repeat variation across populations using repeat-pangenome graphs

不想看英文题目: 使用重复泛基因组分析不同群体的可变数目串联重复变异

杂志和影响因子: Nat Commun (IF: 12.121; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-24378-0


四、工具或资源类介绍


文献题目: Si-C is a method for inferring super-resolution intact genome structure from single-cell Hi-C data

不想看英文题目: Si-C:从单细胞 Hi-C 数据推断超分辨率完整基因组结构

杂志和影响因子: Nat Commun (IF: 12.121; Q1)

文章链接:

https://www.nature.com/articles/s41467-021-24662-z


文献题目: RoboCOP: jointly computing chromatin occupancy profiles for numerous factors from chromatin accessibility data

不想看英文题目: RoboCOP:从染色质可及性数据中联合计算多因素下的染色质占用率

杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)

文章链接:

https://pubmed.ncbi.nlm.nih.gov/34255854/


文献题目: quincunx: an R package to query, download and wrangle PGS Catalog data

不想看英文题目: quincunx:查询、下载和处理多基因评分 (PGS)目录数据的 R 包

杂志和影响因子: Bioinformatics (IF: 5.61; Q1)

网站: https://github.com/maialab/quincunx

文章链接:

https://pubmed.ncbi.nlm.nih.gov/34270693/


文献题目: LINADMIX: Evaluating the effect of ancient admixture events on modern populations

不想看英文题目: LINADMIX:评估古代混合事件对现代人群的影响

网站: https://github.com/swidler/linadmix

杂志和影响因子: Bioinformatics (IF: 5.61; Q1)

文章链接:

https://pubmed.ncbi.nlm.nih.gov/34270685/


致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX

感谢小可爱们多年来的陪伴, 我与你们一起成长~

本周最新文献速递20210718

上一篇:计组第一章(1.2是重点)


下一篇:读scala的reduce、Flod函数源码笔记