今天给大家介绍华中农业大学信息学院章文教授课题组发表在Bioinformatics的一篇文章“ A multimodal deep learning framework for predicting drug-drug interaction events ”,作者提出一个多模态深度学习框架,通过结合不同的药物特征来预测药物相互作用事件类型。
1
研究背景
药物-药物相互作用 (DDI, Drug-Drug Interaction) 是指病人同时或在一定时间内先后服用两种或两种以上药物后会产生复合效应,既可能使药效加强或副作用减轻,也可能使药效减弱或出现毒副作用。大多数预测药物-药物相互作用的方法只是预测两个药物之间是否有相互作用,但是研究表明,同时服用药物可能会导致意想不到的药品不良事件(ADE),探查药品不良事件背后的隐藏机制更有研究意义。所以,章文教授课题组提出将多种药物特征与深度学习相结合的计算方法DDIMDL来预测药物-药物相互作用事件类型。论文主要贡献在于 (1)标准化DDI事件划分流程,开发了DDI事件划分/抽取工具;(2)提出多模态深度学习框架,整合来自于DrugBank的多种药物特征,预测药物-药物相互作用事件。
图 1 DDIMDL模型图
2
研究方法
(1)提取不同类型药物特征向量
作者收集与药物相关的四个特征:化学亚结构、靶标、酶和途径。每个特征都对应于一组描述符,用二元特征向量表示,1或0分别表示相应描述符存在或不存在。如:化学亚结构是根据PubChem定义的881种类型的子结构定义的,此时药物表征向量定义为881维向量,值1或者0分别定义为该药物存在或者不存在某种子结构类型。与药物相关的靶标共有1162种,基于靶标定义的药物表征向量定义为1162维向量,1或0分别定义为是否为当前药物靶标,酶和途径药物表征向量与之类似。
使用Jaccard相似性度量572种药物中成对药物的相似性,根据四种不同的药物表征向量生成4个与之对应的572*572的相似矩阵。
(2)多模态深度神经网络预测DDI事件类型
根据4个相似性矩阵,查找DDI对涉及的4对药物表征,拼接药物对表征向量,使用深度神经网络(DNN)基于每种特征构建子模型,将DDI对表征向量送入DNN网络进行训练,针对最终四个子模型训练输出结果采用平均算子组合,得到最后的DDI事件类型预测结果。
3
数据
DDI数据来源于DrugBank数据库5.1.3版本,收集了DDI对以及药物的四种特征:化学亚结构(chemical substructures)、靶标(targets)、途径(pathways)以及酶(enzymes),实验数据包含74528对DDI数据,其中涉及572种药物和65种DDI相关事件类型。
图 2 前10个高频率DDI事件
DDI相关事件定义为四元组形式(药物A,药物B,机制,作用),其中“药物A”指疗效受到影响的药物,另一个药物作为“药物B”,“机制”指药物在代谢、血清浓度、治疗效果等方面的作用,“作用”是指增加或降低。
图 3 DDI事件示例图
DDI相关事件提取使用StanfordNLP工具(Qi et al., 2018)进行依存分析,构建依存分析树。根据依存分析结果构建DDI相关事件四元组作为实验数据。
表 1 根据依存关系提取DDI事件四元组算法
4
实验
作者主要针对三种不同DDI任务进行评估:第一个任务是预测已知药物对之间未知的相互作用;第二个任务是预测已知药物与新药物之间的相互作用;第三个任务是预测新药物与新药物之间的相互作用。实验是通过把未参与模型训练的药物作为新药物进行模型测试。
作者通过消融实验针对不同特征组合对最终DDI事件预测的影响情况进行评估。作者将化学亚结构、靶标、途径和酶分别进行单个特征、两个特征、三个特征、四个特征组合。根据实验结果显示,在所有单个药物特征中,化学亚结构最为有用,能够达到0.8623的准确度;两个特征的情况下,化学亚结构和靶标拼接的组合也达到了最佳性能(0.8806);三个特征组合中化学亚结构、靶标和途径的组合性能最佳,准确率达到0.8852,甚至超过了四种药物特征组合情况(0.8725)。
表 2 特征集性能评估对比
作者将DDIMDL方法与最先进的DDI事件预测方法DeepDDI(Ryu等人,2018),几种流行的分类方法随即森林(RF)、K最近邻算法(KNN)、逻辑回归(LR),以及直接拼接四种特征向量送入DNN的方法,在三种不同任务上进行实验对比。实验结果表明,针对第一个任务,作者的方法DDIMDL在所有指标上都比其他方法有更好的性能。任务二和任务三主要和DeepDDI和DNN方法进行比较,可以发现在没有新药物的先验知识的情况下,这两个任务性能明显降低,特别是任务三,但是DDIMDL在所有评价指标中性能都优于DeepDDI,也再次证实深度学习和多样化的药物特征对DDI事件预测至关重要。
表 3 Baseline性能评估对比
作者还研究了不同DDI事件类型在不同模型下的预测性能,实验结果表示频率较高的事件可能会获得更好的性能,除了事件39之外,DDMDL对于1-46编号的事件有大于0.5的AUPR分数,一般来说,DDIMDL在大多数类型的事件中能比其他方法产生更高的AUPR和AUC分数。
图 4 不同方法针对每个事件类型的AUPR和AUC评估
此外,作者还进行了案例研究来验证DDIMDL在实践中的有用性。作者主要关注频率最高的前5个事件类型,提取每个事件预测的前20个DDI对,使用由drugs.com提供的Interactions Checker tool验证预测结果的准确性。如药物Dextroamphetamine和药物Fenfluramine相结合会引起事件2,即当药物A与药物B联合使用时,不良反应的风险或严重程度可能会增加。根据drugs.com的证据显示,Fenfluramine可能会增加Dextroamphetamine的作用,目前已经报道了诸如神经过敏、紧张、焦虑、烦躁不安和思绪奔涌等副作用。
表 4 确认的DDI对以及相关的事件类型
5总结
本文从DrugBank数据集中获取DDI数据,并使用NLP技术将DDI相关的事件分为65类,收集了572种药物以及74528个DDI对。作者提出DDIMDL多模态深度学习框架,将多种药物特征:化学亚结构、靶标、酶和途径与深度学习相结合对DDI事件类型进行预测,实验证明DDIMDL优于现有的DDI事件预测方法,多样化药物特征与多模态深度学习框架相结合能够明显提高DDI事件预测的性能。