本周最新文献速递20220123
一、精细解读文献 一
文献题目: Multi-ancestry eQTL meta-analysis of human brain identifies candidate causal variants for brain-related traits
不想看英文题目: 人脑的多血统 eQTL 荟萃分析确定了大脑相关性状的候选因果变异位点
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
研究意义: 全基因组关联研究 (GWAS) 发现了数百个与大脑性状相关的基因座,但识别这些性状背后的分子机制仍具有挑战性。GWAS 与表达数量性状基因座 (eQTL) 的整合已被广泛用于候选因果变异位点的检测。然而,这种方法受限于样本量、统计能力和连锁不平衡。因此,作者开发了多变量多 QTL 方法,并进行大规模、多祖先 eQTL 荟萃分析,以提高功效和精细定位结果;
结论:
- 对 GTEx 、PsychENCODE 和 ROSMAP 的脑组织进行了多祖先 eQTL 随机效应荟萃分析,并将其整合成统计框架(mmQTL);
- 对 eQTL 进行荟萃分析有助于精细定位结果,比如将 GTEx 从 1 个组织的 eQTL 增加到 7 个组织再增加到 13 个可以显著提高效能并减小 95% 可信集的大小,而与 PsychENCODE 和 ROSMAP 荟萃分析后因果变异位点直接缩减至一个;
- 采用模拟和真实的数据评估 mmQTL 的性能,性能评估包括(1)控制假阳性率,(2)共享的 eQTL 的组织数量;(3) 95% 可信集的缩减数量。结果显示 mmQTL 采用线性混合模型进行随机效应荟萃分析可有效控制假阳性率,此外,多血统比单一欧洲血统荟萃分析可信集数量少,说明 eQTL 的多血统线性混合模型荟萃分析更有利于精细定位;
- 使用分层 LD 回归分析整合脑部复杂性状 GWAS 和 eQTL 荟萃分析结果,发现 22 个脑部复杂性状显着富集在 eQTL 上;
- 使用联合精细映射方法将 eQTL 与大规模 GWAS 性状进行整合,鉴定了 7,564 个变异-性状对(CLPP > 0.01),包括 24 个大脑性状的 329 个变异-性状对;
- CLPP > 0.5 的基因中显示 ZNF823、THOC7 和 FURIN 均与精神分裂症和双向相关。值得注意的是,驱动 CACNA1C 与精神分裂症和双向共定位的候选因果变异位点是次要 eQTL,而非主要 eQTL,说明对 eQTL 进行条件分析有助于发现疾病更多因果变异位点;
- 在阿尔兹海默病的分析中确定了五个基因的候选因果变异位点,这些基因之前已被报道与阿尔兹海默病相关,但通过 mmQTL 方法可找到驱动疾病的因果变异位点。以 APH1B 上的因果变异位点 rs117618017 为例, mmQTL 方法表明 rs117618017 主要通过增加 APH1B 基因表达促进 AD 风险;
亮点: 对多个 eQTL 进行荟萃分析,并用 95% 可信集数量等角度证明对 eQTL 进行荟萃分析的有效性;
局限: 两个问题。第一、这篇文章强调了 mmQTL 对多血统解析疾病的贡献,但是在方法描述中,对于多血统的 eQTL calling 并不是分开 calling, 而且也没有过多的论述是否多血统同时 calling 会造成过多的假阳性;第二、作者采用 number of tissues sharing QTL 评估 mmQTL 的性能(sharing 越多,性能越好),用这种方法评估是否是正确的?毕竟 brain tissue 之间的异质性也是很大的;
文章链接:
https://www.nature.com/articles/s41588-021-00987-9
公开的资料:
Brain eQTL meta-analysis: http://icahn.mssm.edu/brema
Code: https://github.com/jxzb1988/mmQTL
二、精细解读文献 二
文献题目: Tissue-specific multi-omics analysis of atrial fibrillation
不想看英文题目: 房颤的组织特异性多组学分析
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
研究意义: 房颤 (AF) 的全基因组关联研究 (GWAS) 发现了许多与之相关的变异位点,但其潜在分子机制,尤其是 mRNA 和蛋白质表达对疾病的影响仍未知。因此,作者通过整合人类心房组织的基因组学、转录组学和蛋白质组学,以确定遗传变异对转录本 ( cis -eQTL) 和蛋白质 ( cis -pQTL ) 丰度的影响;
结论:
- 对 75 例 mRNA 和蛋白质表达谱进行 cis -eQTL 和 cis -pQTL 鉴定,总共发现了
57,403 对 cis -eQTL (FDR < 0.05) 和 4081 对 cis -pQTL (FDR < 0.05) ;
- cis -eQTL ( P < 1 × 10-5 ) 的效应大小在 GTEx 中显示出 0.81 ( P = 2.3 × 10-71 ) 的相关性;
- 比较 cis -eQTL 和 cis -pQTL 的重合情况,发现二者的重合率很低。只有 8.2% 的 SNP-基因对在 mRNA 和蛋白质重合;
- 作者通过计算蛋白质丰度/mRNA 比率(ratioQTLs) 将 QTL 分为三种潜在的遗传模式:
- 1)共享的 eQTLs/pQTLs:QTL 同时影响转录本和蛋白质水平,共享的 eQTLs/pQTLs 富含顺式调节元件区域,例如活性转录起始位点;
- 2)Independent eQTLs:只对转录本起作用,不对蛋白质水平产生影响,主要富集在转录因子结合位点(TFBS)、增强子,以及剪切区域;
- 3)Independent pQTLs:只对蛋白质水平产生影响,主要富集在 RNA 结合蛋白(RBP)的结合位点区域;
- 为了研究与心血管疾病相关的基因表达水平和蛋白质水平,作者将心血管疾病相关的 GWAS 与 eQTLs、pQTLs 进行整合。在 GWAS 信号位点和 cis -QTL 的所有重叠位点中,AF 基因座与 cis -QTL 重合最多(17 个基因座与 eQTL 重合,其中 4 个 基因座同时与 pQTL 重合);
- 此外,作者还发现一个独立的 pQTL (非 eQTL)与肌酸激酶水平 GWAS 位点重合;
- 作者通过研究反式调节进一步扩展 QTL 分析。反式调节的思想是假设存在核心基因,该核心基因通过反式作用调节疾病相关基因座;
- 基于该思想,作者将其应用于 AF 疾病上。在 eQTL 层面,鉴定了两个 trans-eQTL:编码心脏结构蛋白(rs11658168- TNNT2 )和转录因子(rs9481842 -NKX2-5);
- 在 pQTL 层面,鉴定了五种与代谢有关的 trans-pQTLs(rs11588763-CYB5R3/NDUFB3/NDUFA9/DLAT、rs11658168-HIBADH);
- 为了评估 rs9481842 -NKX2-5 在 AF 中的作用机制,作者通过估计 NKX2-5 的 TF 活性 (TFA) 揭示 NKX2-5 转录水平对靶基因的影响。基于 iPSC ChIP-seq 和 HiC 数据,观察到 rs9481842 和 NKX2-5 转录本之间的高度相关性(cor = -0.43,P = 1.4 ×-4)以及 NKX2-5 转录物和 TF 活性之间的相关性(cor = 0.36,P = 1.3×10-4);
- 为了阐明 NKX2-5 对 AF 的作用,作者进一步分析了 NKX2-5 对 AF 靶基因的影响。总共发现了 13 个与 rs9481842/NKX2-5 显著相关(转录水平和蛋白质水平)的靶基因,且 13 个靶基因中在 AF cases 中均显示出较低的蛋白质水平;
亮点:
- 作者将 AF 的多基因分险评分( PRS )应用在回归模型中筛选具有 trans effect 的候选基因/蛋白质,随后再将其进行 trans QTL分析。这么做有两个目的,一个是减少多重检验校正,一个是将 trans 特定于 AF 疾病,筛选到的基因/蛋白质更具有特异性 ;
- 在比较 eQTL 和 pQTL 时,作者使用了
蛋白质丰度/mRNA 比率(ratioQTLs)
这个概念,值得借鉴;
局限: eQTL 和 pQTL的 overlap 只有 8%,之前看过的大多数报道 overlap 在 ~40%,但作者也没有多做解释;
文章链接:
https://www.nature.com/articles/s41467-022-27953-1
公开的资料:
- data: https://zenodo.org/record/5080229#.Yez4v-pByUk
- code: https://github.com/heiniglab/symatrial
三、其他文献推荐
下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);
文献题目: Limb development genes underlie variation in human fingerprint patterns
不想看英文题目: 人类指纹遗传变异与肢体发育相关
杂志和影响因子: Cell (IF: 38.637; Q1)
文章链接:
https://www.cell.com/cell/fulltext/S0092-8674(21)01446-X
文献题目: The Chinese pine genome and methylome unveil key features of conifer evolution
不想看英文题目: 中国松基因组和甲基化组揭示针叶树进化的关键特征
杂志和影响因子: Cell (IF: 38.637; Q1)
文章链接:
https://www.cell.com/cell/fulltext/S0092-8674(21)01428-8
文献题目: The UGT2A1/UGT2A2 locus is associated with COVID-19-related loss of smell or taste
不想看英文题目: UGT2A1 /UGT2A2 基因座与 COVID-19 相关的嗅觉或味觉丧失有关
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
文章链接:
https://www.nature.com/articles/s41588-021-00986-w
文献题目: Multi-ancestry fine mapping implicates OAS1 splicing in risk of severe COVID-19
不想看英文题目: 多血统精细图谱表明 OAS1 剪接与严重 COVID-19 风险有关
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
文章链接:
https://www.nature.com/articles/s41588-021-00996-8
文献题目: Single-cell multi-omics reveals dyssynchrony of the innate and adaptive immune system in progressive COVID-19
不想看英文题目: 单细胞多组学揭示了 COVID-19 先天免疫系统和适应性免疫系统相互作用之间的不同步
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-021-27716-4
文献题目: Blood-based epigenome-wide analyses of cognitive abilities
不想看英文题目: 认知能力的表观基因组分析
杂志和影响因子: Genome Biol (IF: 10.81; Q1)
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-021-02596-5
文献题目: Functional genomics analysis identifies T and NK cell activation as a driver of epigenetic clock progression
不想看英文题目: 功能基因组学分析确定 T 和 NK 细胞激活是表观遗传时钟进展的驱动因素
杂志和影响因子: Genome Biol (IF: 10.81; Q1)
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-021-02585-8
文献题目: Polygenic transcriptome risk scores (PTRS) can improve portability of polygenic risk scores across ancestries
不想看英文题目: 多基因转录组风险评分(PTRS)可以提高多基因风险评分跨血统的可移植性
杂志和影响因子: Genome Biol (IF: 10.81; Q1)
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-021-02591-w
四、工具或资源类介绍
文献题目: Polympact: exploring functional relations among common human genetic variants
不想看英文题目: Polympact:探索常见人类遗传变异之间的功能关系
杂志和影响因子: Nucleic Acids Res (IF: 16.97; Q1)
网站: https://bcglab.cibio.unitn.it/polympact/
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac024/6513575
文献题目: Inverse Potts model improves accuracy of phylogenetic profiling
不想看英文题目: 逆 Potts 模型提高了系统发育分析的准确性
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac034/6513380
文献题目: Capturing large genomic contexts for accurately predicting enhancer-promoter interactions
不想看英文题目: 捕获大型基因组背景以准确预测增强子-启动子相互作用
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
https://academic.oup.com/bib/advance-article-abstract/doi/10.1093/bib/bbab577/6513727?redirectedFrom=fulltext
致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感谢小可爱们多年来的陪伴, 我与你们一起成长~