DeepMind开源的AlphaFold怎么用?打开Colab就能在线用

DeepMind开源的AlphaFold怎么用?打开Colab就能在线用
2021年07月30日 00:48 机器之心Pro

来源:机器之心

借助 Colab,你可以在线使用 AlphaFold 的一个简化版本。

前段时间,《自然》杂志刊登了 DeepMind 的两篇论文,介绍了该公司在蛋白质结构预测方向的最新进展。研究表明,DeepMind 的 AlphaFold 所预测的蛋白质结构已经能达到原子水平的准确率。与此同时,他们还在 GitHub 上公开了 AlphaFold 的源代码。

开源链接:https://github.com/deepmind/alphafold

然而,有些研究者抱怨说数据文件太大了(2.2TB)。于是,在几个小时之内,一些敬业的研究者就创造出了一个 Google Colab notebook。借助这一工具,任何一个拥有免费谷歌账号的人都可以在自己感兴趣的蛋白质上运行略微简化的 AlphaFold 2,甚至不需要下载数据,也不需要任何特殊硬件。所有的计算都是在云上进行的,而且是在一个免费的 colab 空间内进行的,这让用户能够对运行进行微调。这是加速技术大众化最好的方法之一。

不过,Colab 版本的 AlphaFold 2 经过了一些简化,没有模板(同源结构),而且只用了 BFD 序列数据库的一部分。开发者表示,他们已经在数千个最近的 PDB 结构上验证了简化版和完整版的差异,虽然在许多目标上,Colab 版本的准确度与完整的 AlphaFold 系统几乎相同,但由于 MSA(多序列比对)较小和模板的缺失,一小部分目标的准确度出现了显著下降。如果你想得到更加可靠的结果,建议使用完整的开源 AlphaFold 或 AlphaFold 蛋白质结构数据库。

数据库链接:https://alphafold.ebi.ac.uk/

在洛桑联邦理工学院研究结构生物学、分子建模等方向的博士后 Luciano Abriata 表示,他已经用这些 notebook 做了一些测试,而且已经得出了一些结论。最重要的是序列对齐等功能对于获得更好的模型大有帮助。Abriata 还发现,很多人在使用这个工具时都忽略了 LDDT 估计图,但其实这些图非常关键。

AlphaFold 的开放使用给全世界的研究者都带来了便利。对于那些难以用实验测定结构的蛋白质来说,通过这种方式建立蛋白质模型至关重要。即使你有一些无法适当使用的数据,拥有一个优秀的蛋白质模型也是有帮助的。

随着 DeepMind 所涉足的生物学领域愈加广泛(目前还没有计划公布,但可以猜测他们可能进军蛋白质间的相互作用以及下一步的小分子设计),更多的学者将从 AF2 的应用和所有公开的知识中获利。

长期以来,生物学领域的研究一直依赖计算机和传统软件。而如今,生物学已经进入了 AI 时代。

参考链接:https://towardsdatascience.com/google-colab-notebooks-are-already-running-deepminds-alphafold-v-2-92b4531ec127#630a

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片