清华团队提出药物相互作用预测方法,预测准确率提升近三成

清华团队提出药物相互作用预测方法,预测准确率提升近三成
2025年09月21日 21:09 DeepTech深科技

来源:DeepTech深科技

近日,清华大学姚权铭副教授团队提出了一套全新的药物相互作用预测方法——CBR-DDI 框架。这项研究首次把临床医生常用的参考过往病例CBRCase-Based Reasoning)方法引入到大语言模型(LLMLarge Language Model)中,显著提升了药物相互作用预测的准确性和可解释性。实验表明,CBR-DDI 框架能够让模型在两个主流数据集上的准确率平均提升 28.7%超过了大语言模型和 CBR 基线。

图丨姚权铭(来源:资料图)

日前,相关论文以《案例推理可提升大语言模型在药物相互作用预测中的能力》(Case-Based Resoning Enhances the Predictive Power of LLMs in Drug-Drug Interaction) 为题发表在预印本网站arXiv[1]

图|相关论文(来源:

arXiv)

药物相互作用(DDIDrugDrug Interaction)是指两种或多种药物共同使用时,可能产生的疗效增强、副作用增加甚至危险反应。准确预测 DDI 对医疗安全至关重要:它能帮助医生避免处方冲突,也能在新药研发时提前识别潜在风险,从而节省巨额的临床试验成本。

但 DDI 的预测极具挑战性。药物之间可能通过代谢酶竞争等复杂机制产生相互作用,尤其对于新药物而言,由于缺乏历史数据,预测更为困难。虽然近年来大语言模型在生物医药领域展现了潜力,但直接用于 DDI 预测时仍面临难题:首先是缺乏可解释性,模型可以给出预测,却无法给出潜在药理机制,使得其可靠性大打折扣;其次是泛化能力不足,对新药物缺乏先验知识,难以迁移到未知场景。

图|

Naive-CBR 和 CBR-DDI 方法对比(来源:arXiv)

该研究的灵感来自临床实践。在现实中,医生在面对复杂病情时,通常会查阅相似的历史病例,并结合其中的治疗经验来推断新的决策。CBR-DDI 正是把这种人类经验迁移的思路引入大语言模型当中。

其核心设计是建立一个案例知识库将历史药物对的交互机制系统化存储,然后在预测新药物时,通过检索和比对,让模型能够参考过去的案例。病例库中的每个药物对都包含药物描述、药物关联、相互作用机制以及相互作用类型。其中,药物描述以及其潜在可能的相互作用机制由 LLM 生成,药物关联信息由图神经网络由图神经网络(GNNGraph Neural Network)模块从知识图谱中(KGsbiomedical knowledge graph)提取的结构化知识。

CBR-DDI 的框架也运用了相同的方法,首先通过大语言模型生成药物功能描述,并同时用 GNN 捕捉药物在知识图谱中的结构关系。混合检索策略将语义相似度与结构相似度相结合,从病例库中找到最接近的历史案例。这些病例与药物的结构关系共同构造成双层知识提示,引导大模型输出预测结果。为避免病例库无限扩大,团队还引入了代表性抽样策略,去除冗余样本,仅保留最具代表性的机制案例,从而兼顾效率与覆盖度。

团队在两个主流数据集——DrugBank 和 TWOSIDES上对 CBR-DDI 进行了系统验证。结果显示在涉及新药物预测的任务中,CBR-DDI 的表现全面领先,与现有的 Naive-CBR 方法相比,准确率提升了 28.7%值得注意的是,即便配合较小模型(如 Llama-3.1-8B),也能超越许多先进神经网络方法。而在大型模型(如 Llama-3.1-70BDeepSeek-V3)的加持下,CBR-DDI 达到了目前该领域的最佳成绩。

图|不同模型在 

DrugBank 数据集上实验准确度(来源:arXiv)

研究团队在消融实验中分析了 CBR-DDI 框架中各个模块的作用。在双层知识增强提示中去掉病例机制信息和药物关联信息两者其之一会导致性能下降,缺少病例机制的影响更为明显,说明病例推理起了重要作用。团队还通过调整语义相似度与结构相似度的权重评估混合检索策略,发现当两者保持平衡时,检索到的病例最为相关,模型预测也最准确。而对代表性抽样策略的实验表明,该方法可将病例库规模压缩超过 90%,但同时保持预测性能。

在研究团队提供的一个示例中,模型可以检索到与 Rifabutin 与 Zopiclone 相似的药物交互机制,并由此推断出 Rifabutin 可能通过诱导CYP2C9 和 CYP3A4 酶,加速 Zopiclone 的代谢。这说明 CBR-DDI 可以通过整合历史医药案例,给出以药物作用机制为基础的逻辑推理,并得到了准确可靠的结果。

目前,该预测模型还有一定局限性,即病例库以及预测只依靠文字信息,而没有分子结构等数据。未来,团队计划进一步扩展病例库的信息,引入分子结构数据,帮助提供更准确的预测,同时为案例库中 LLM 生成的内容设计自动化的校验方法,为每个案例提供更加准确、深入的药理学解释。

参考资料:

1.https://arxiv.org/pdf/2505.23034

2.Y. Wang, Z. Yang, Q. Yao. Accurate and Interpretable Drug-drug Interaction Prediction Enabled by Knowledge Subgraph Learning. Communications Medicine. 2024

3.H. Du, Q. Yao, J. Zhang, Y. Liu, Z. Wang. Customized Subgraph Selection and Encoding for Drug-drug Interaction Prediction. Annual Conference on Neural Information Processing Systems (NeurIPS). 2024

4.Z Shen, M Zhou, Y Zhang, Q Yao. Benchmarking graph learning for drug-drug interaction prediction. Arxiv. 2024.

5.Y. Zhang, Q. Yao, L. Yue, X. Wu, Z. Zhang, Z. Lin, Y. Zheng. Emerging Drug Interaction Prediction Enabled by Flow-based Graph Neural Network with Biomedical Network. Nature Computational Science. 2023.

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片