文献名:利用靶向质谱策略进行上皮性卵巢癌病例的蛋白质组生物标志物研究
期刊名:Molecular & Cellular Proteomics
发表时间:(2019年7月)
IF:5.41
单位:
- 苏黎世联邦理工学院
- 美国东北大学
- 隆德大学
- 苏黎世大学附属医院
- 普渡大学
- 巴塞尔大学附属医院
- 巴赛尔大学生物医学系
- 法兰克福大学附属医院
- 哈佛医学院
- 斯科讷大学附属医院
- 苏黎世大学
物种:小鼠卵巢组织,小鼠卵巢肿瘤组织,人类血浆,人类卵巢组织,人类良性卵巢肿瘤组织,人类上皮卵巢癌组织
技术:非靶糖蛋白质组学,靶向糖蛋白质组学,组织微阵列
一、 概述:(用精炼的语言描述文章的整体思路及结果)
本研究首先利用卵巢癌小鼠模型进行卵巢肿瘤组织的N-糖蛋白质组分析,筛选出275个存在显著差异的候选蛋白并作为候选标记物。将该275个候选标记物转换为人类同源蛋白同时增加其他研究中可能作为卵巢癌标记物最终共得到376个糖蛋白作为候选标记物,利用SRM采集模式可在人类血浆中检测到65种。通过对110例健康人群和134例癌症病人的靶向糖蛋白质组学数据的测定以及逻辑回归模型的应用,可通过其中5个糖蛋白的逻辑回归模型准确诊断出病人是否患有卵巢癌,且该模型与临床上使用的CA125联合的诊断效果优于单独使用CA125的诊断效果。
二、 研究背景:(简要介绍研究进展动态、研究目的和意义)
上皮性卵巢癌(EOC)是女性癌症致死的第五大杀手,由于大部分EOC病人在确诊时已经到了晚期,因此存活率很低。目前EOC病人的早期肿瘤诊断率只有20%,FDA通过的EOC标记物有CA125和HE4两种,然而这些标记物的单独使用依旧在诊断的灵敏度和特异性上有所欠缺,因此急切需要能够在早期诊断EOC的有效手段。
三、实验设计:
四、研究成果:
1、在小鼠模型*鉴定了906个糖蛋白,其中有275个存在显著变化(校正pvalue<0.01,fold change>4),在肿瘤组织中124个糖蛋白显著上调,151个糖蛋白显著下调。将该275个候选标记物转换为人类同源蛋白同时增加其他研究中可能作为卵巢癌标记物最终共得到376个糖蛋白作为候选标记物,利用SRM采集模式可在人类血浆中检测到65种糖蛋白,结果图1。
图1,A红色代表利用SRM采集方式可在人类血浆中检测到的蛋白质及相应浓度,灰色代表无法检测到的糖蛋白;B绿色代表可检测到的65中糖蛋白的功能分布,灰色代表未检测到的糖蛋白的功能分布。
2、65种人类血浆糖蛋白质组的共分两个批次,研究人员通过在两板重复测定38例样本,加入标准蛋白,加入同位素肽段的实验方法以及3种归一化的数据处理方式,进而来降低批次效应提高数据的准确度;同时将数据分为训练集和验证集并保证其在年龄以及疾病阶段的分布平衡性;同时利用纵向聚类考察65种糖蛋白质在区分健康人群和上皮性卵巢癌病人的效果。
图2,A为降低批次效应研究人员所进行的重复测定,加入标准蛋白,加入同位素标记肽段以及相应的归一化方法;B将234例样本分为训练集和验证集后年龄以及疾病阶段的分布图;C训练集中利用65中糖蛋白的纵向聚类图。
3.利用8折逻辑回归在训练集中进行特征量的选择,并最终选择了IGHG2,LGALS3BP,DSG2,THB1以及L1CAM五个糖蛋白;将其与CA125共同以用于逻辑回归模型中后,其在训练集中的ROC的AUC值为0.973;在验证集中的ROC曲线汇总,CA125和5个糖蛋白的回归模型AUC为0.987,单独使用CA125的AUC为0.959,仅使用5种糖蛋白的回归模型AUC为0.869。
图3,A为在训练集中利用逻辑回归进行特征量选择,并使用8折的交叉验证;其中红色代表在EOC病人中显著上调的糖蛋白(校正pvalue<0.05,fold change>1.1),蓝色代表在EOC病人中显著下调的糖蛋白,灰色代表在EOC和健康病人中无显著变化的糖蛋白;黑色代表在各折中所建立回归模型使用的糖蛋白以及相应AUC;加红点的蓝色柱状图代表在8折中超过6次被选入逻辑回归模型中的糖蛋白。
B为在训练集中,利用所选的5个糖蛋白以及CA125共同拟合的逻辑回归模型的ROC曲线。C为在验证集中,利用5个糖蛋白和CA125共同拟合的逻辑回归模型的ROC曲线,单独使用CA125的ROC曲线以及5个糖蛋白拟合的逻辑回归模型的ROC曲线以及前两者的混合矩阵等统计量。
4.在145例EOC病人,30例良性卵巢肿瘤病人以及13例健康人群的卵巢组织中进行LGALS3BP的组织微阵列实验,并按照染色强度进行分级。其在EOC病人中含量显著增高,这与血浆中的结果相同;利用Fisher检验也表明EOC病人组织的LGALS3BP的含量与健康人群和良性卵巢肿瘤人群的卵巢组织具有明显差异(pvalue<0.01)。
图4,A表示进行组织微阵列实验后的染色分级;B表示EOC病人,良性卵巢肿瘤病人以及健康人群中LGALS3BP的染色分级分布。
五、文章亮点(结论讨论):
1.作者在批次效应的矫正上采取了多种方法以保证不同批次实验数据的准确性和可比较性,作者也认为该方法在其他研究中可以进行拓展。
2.研究包括非靶向糖蛋白质组学进行候选标记物的选择,靶向糖蛋白质组学进行准确定量,机器学习来选择合适特征量进行模型建立,并在后期进行部分验证实验,结构完整。
3.仅仅结合临床上的方法,并与之比较,具有较强的实践性和临床可能。
阅读人:王聚