30倍于传统方法,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点

30倍于传统方法,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点
2024年06月30日 18:20 机器之心Pro
编辑 | 萝卜皮编辑 | 萝卜皮

糖类是自然界中最丰富的有机物质,对生命至关重要。了解糖类如何在生理和病理过程中调节蛋白质,可以为解决关键的生物学问题和开发新的治疗方法提供机遇。

然而,糖类分子的多样性和复杂性,对实验识别糖-蛋白质结合以及相互作用的位点提出了挑战。

在这里,中国科学院团队开发了一种深度学习模型 DeepGlycanSite,它能够准确预测给定蛋白质结构上的糖结合位点。

DeepGlycanSite 将蛋白质的几何和进化特征融入具有 Transformer 架构的深度等变图神经网络中,其性能显著超越了之前的先进方法,并能有效预测各种糖类分子的结合位点。

结合诱变研究,DeepGlycanSite 揭示了重要 G 蛋白偶联受体的鸟苷-5'-二磷酸糖识别位点。

这些发现表明 DeepGlycanSite 对于糖结合位点预测具有重要价值,并可以深入了解具有治疗重要性蛋白质的糖类调节背后的分子机制。

该研究以「Highly accurate carbohydrate-binding site prediction with DeepGlycanSite」为题,于 2024 年 6 月 17 日发布在《Nature Communications》。

糖在所有生物体的细胞表面普遍存在,它们与多种蛋白质家族如凝集素、抗体、酶和转运蛋白相互作用,调节免疫反应、细胞分化和神经发育等关键生物学过程。理解糖类与蛋白质的相互作用机制是开发糖类药物的基础。

然而,糖类结构的多样性和复杂性,尤其是它们与蛋白质结合位点的多变性,给实验数据的获取和药物设计带来了挑战。

图示:糖类分子的复杂性和糖结合位点的多样性。(来源:论文)图示:糖类分子的复杂性和糖结合位点的多样性。(来源:论文)

过去,传统的结合位点预测方法不适用于结构复杂、大小变化大的糖类分子。加之高分辨率糖-蛋白质复合物结构数据的稀缺,导致预测模型的性能受限。

近年来,随着蛋白质数据库(PDB)和开放糖组学资源的快速发展,学界已经积累了超过 19000 个此类复合物的结构数据。这些高质量数据的增加,为采用 AI 技术开发精确的糖结合位点预测模型提供了可能,从而有望加速糖类药物的发现和优化过程。

在最新的研究中,中国科学院团队引入了 DeepGlycanSite,这是一种深度等变图神经网络 (EGNN) 模型,能够准确预测具有目标蛋白质结构的糖结合位点。

图示:DeepGlycanSite 概述。(来源:论文)图示:DeepGlycanSite 概述。(来源:论文)

该团队利用几何特征(例如残基内和残基间的方向和距离)以及进化信息,在 DeepGlycanSite 中以残基级别的图形表示形式呈现蛋白质。结合具有自注意力机制的 Transformer 块来增强特征提取和复杂关系发现。

在涉及一百多种独特糖结合蛋白的独立测试集上,研究人员将 DeepGlycanSite 与当前最先进的计算方法进行了比较。

结果显示,DeepGlycanSite (0.625) 的平均马修斯相关系数(MCC) 是 StackCBPred (0.018) 的 30 倍以上,同时远超其他序列基础的预测方法。

传统配体结合位点方法可能因疏水性或小尺寸而排除简单糖类分子的结合位点,而 DeepGlycanSite 则能有效识别这些位点。

图示:比较模型在预测不同糖结合位点方面的表现。(来源:论文)图示:比较模型在预测不同糖结合位点方面的表现。(来源:论文)

并且,DeepGlycanSite 在预测蛋白质上的多个糖结合位点方面也表现出色,这对于理解多价糖缀合物如何影响糖-蛋白相互作用以及生物过程的调控具有重要价值。例如,多价糖缀合物被设计成化学工具和药物候选物,以影响糖类分子与凝集素之间的相互作用。

与传统的仅使用蛋白质序列或结构信息的方法不同,DeepGlycanSite 充分考虑了蛋白质的几何信息及进化特性,这可能是其表现优异的关键因素。

此外,给定查询糖类分子的化学结构,DeepGlycanSite 还可以预测其特定结合位点。

图示:查询糖的特定结合位点预测。(来源:论文)图示:查询糖的特定结合位点预测。(来源:论文)

研究人员探索了 DeepGlycanSite 对功能重要的 G 蛋白偶联受体 (GPCR) 的应用。利用 AlphaFold2 预测的蛋白质结构和糖类化学结构,DeepGlycanSite 成功检测到了人类 P2Y14 上 GDP-Fuc 的具体结合位点。

图示:DeepGlycanSite 的实验验证。(来源:论文)图示:DeepGlycanSite 的实验验证。(来源:论文)

虽然 AlphaFold2 预测的侧链质量有待提高,但 DeepGlycanSite 对蛋白质结构准确性的依赖较低,能够使用预测的蛋白质结构提供糖-蛋白相互作用的见解。

综上所述,DeepGlycanSite 在独立测试集和体外案例研究中的验证表明,它是一个有效的糖结合位点预测工具。研究人员可以利用 DeepGlycanSite 预测目标蛋白质上的糖结合口袋,从而促进对糖-蛋白质相互作用的理解。

糖类在生物学功能中扮演着关键角色,DeepGlycanSite 不仅有助于解析糖类分子和糖结合蛋白的生物学功能,也为糖类药物的开发提供了有力工具。

论文链接:https://www.nature.com/articles/s41467-024-49516-2

© THE END 
论文中国科学院
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片