欢迎关注“新浪科技”的微信订阅号:techsina
文/李开复
来源:李开复(ID:kaifu)
在我的新书中,我和科幻作家陈楸帆创造性合作,畅想了 20 年后在人工智能等科技影响下的人类世界。
书中的 10 个短篇故事,展示了一系列的未来场景 —— 身临其境的沉浸式娱乐方式、自如使用人类语言的虚拟伴侣、 没有“司机”的完全自动驾驶汽车、能够以假乱真的照片和视频,以及基于量子计算、计算机视觉和其他 AI 技术的展开应用……
在故事《无接触之恋》发生的时代,人类社会已经被疫情彻底改变——直到最后,新冠病毒(COVID-19)也没有被彻底消灭,相反,它进化成了一种长期存在的、不断变异的季节性病毒。
这当然只是一种虚构的情境。然而,在经历了一次新冠肺炎疫情之后,不论这种病毒今后会如何变异,可以确定的是,AI 将重塑整个医疗行业,例如加快疫苗和相关药物的研发,加速 AI 诊断与现有医疗手段进行技术集成的进程,等等。
那么,新冠病毒如何推动这些技术的发展?
我们现在对人工智能医疗的关注尤其及时,因为医疗行业正在数字化,而这将产生人工智能颠覆医疗所需的大量数据。2042 年当我们回顾,我们可能会看到过去20年医疗领域是AI颠覆最大的行业。
传统药物及疫苗研发
长期以来,药物及疫苗的研发都是一件极其耗时、成本高昂的工作。想象一下,人类用了 100 多年时间,才完成了脑膜炎疫苗的研制和改进。而在这次新冠肺炎疫情中,正是因为各国政府把史无前例的巨额资金投入多条研发赛道,支撑了大量的临床试验和量产尝试,医药企业的疫苗研发才推进得如此迅速。
在等待了一年之后,我们终于用上了安全有效的新冠疫苗。好在新冠病毒的致死率没有那么高,这样的等待才显得可以接受。然而,如果新冠病毒进化成一种像埃博拉一样致命的传染病,情况就会变得完全不同。因此,考虑到未来可能出现新的传染病,疫苗和药物的研发速度仍然需要继续提高。
研发药物时,第一步先要理解病毒蛋白质(氨基酸序列)是如何折叠成独特的 3D 结构的。理解这种 3D 结构,对解读病毒的工作原理并找到对抗它的方法至关重要。例如,就像钥匙插入锁孔中一样,新冠病毒表面的刺突蛋白可以附着在人体细胞表面的受体上。当新冠病毒侵入人体细胞后,新冠病毒基因组(新冠病毒的 RNA)将被传递、整合到宿主细胞上,然后在许多器官中不断复制,从而导致感染者表现出一系列的症状。
针对某种病原体的小分子药物发明,是通过将治疗分子附着在病原体上来抑制其功能而起作用。这种治疗分子的发现过程可以分为以下四个步骤:
第一步,利用 mRNA 序列推导病原体的蛋白质序列(现在这一步不难实现);
第二步,探索该蛋白质序列的三维结构(蛋白质折叠方式);
第三步,确定三维结构上的靶点;
第四步,生成可能有效的靶向分子,然后从中选择最佳临床前候选药物。
如果回到之前用过的类比,那么第一、二、三步相当于摸清锁的结构,第四步相当于打造一把适配的钥匙。这四个步骤需要依次完成,后三个步骤的工作不仅非常耗时,而且成本高昂。
例如第二步,为了确定病毒蛋白质序列的三维结构,科学家会使用冷冻电子显微镜成像等技术,直接观察病毒蛋白,然后一步一步艰苦地摸索、推敲出 3D 蛋白质结构。
第三、第四步是找到靶点并设计出对应的靶向药物,这是一个漫长的试错之旅,而且需要科学家具备强烈的直觉、丰富的经验和好运气。不过,就算科学家耗费数年时间锁定了一种临床前候选药物,它也有 90% 的概率无法通过二期、三期临床试验。这个探索过程会耗费相当长的时间。当然,也可以并行探索几种不同的方法,不过这样虽然可以缩短时间,但需要大量的资金投入。
AI 在蛋白质折叠、药物筛选及研发方面的潜力
目前,要研发一种有效的药物或疫苗,需要投入 10 亿 ― 20 亿美元的资金和数年的研发时间。我相信,AI 将大幅提升药物的研发速度,降低研发成本,为患者提供更多价格在可承受范围内的特效药,帮助患者活得更健康、更长寿。
2020 年,DeepMind 公司针对蛋白质折叠研究(药物研发的第二步),推出了蛋白质折叠预测软件 AlphaFold,可以说,这是迄今为止 AI 在科学领域最伟大的成就。
蛋白质是生命的基石,但对于人类来说,蛋白质的氨基酸序列如何折叠成 3D 结构,从而成为生命活动功能执行者的整个过程,仍是一个谜。解开这个谜,不仅具有重大的科学意义,对医学领域也有极高的价值。恰巧,深度学习技术似乎非常适合在这个问题上“大展拳脚”。
AlphaFold 背后的训练数据集非常庞大,包含了过去发现的所有蛋白质三维结构信息。目前,AlphaFold 已经证明了它模拟未知蛋白质三维结构的能力,其准确性与传统方法(如上面提到的冷冻电子显微镜成像技术)不相上下。区别在于,传统方法成本高、耗时长,而且只能解析所有蛋白质结构中不到 0.1% 的部分;AlphaFold 的出现,提供了一种快速扩大人类已知蛋白质数量的方法,被视为“解决了困扰生物学界 50 年之久的巨大挑战”,是一项划时代的突破。
一旦掌握了蛋白质的三维结构,“药物再利用”就成了一种能够帮科学家快速找到有效治疗手段的方法,即尝试每一种已经证明对一些小病安全、有效的现有药物,看看其中哪些药物可能成功嵌入当前病毒的蛋白质三维结构。
“药物再利用”方法有可能成为一条捷径,从而使人类能够在一场严重的流行病发生之初就阻止病毒的传播。因为这些能被“再利用”的药物均已通过不良反应测试,可以直接使用,无须再经过大范围临床试验。《无接触之恋》中的男主角加西亚在被检测出携带 COVID-Ar-41 的变体病毒后,临床中心就立即启动了 AI 程序,以“再利用”一种能够减轻他的症状的药物。
科学家还可以充分利用AI的优势,发明新的化合物。AI 可以锁定一些靶向分子可能附着的靶点(药物研发的第三步)。如果给定一个靶点,AI模型就可以通过识别数据的内部模式,来缩小对药物的搜索及筛选范围,锁定候选药物(药物研发的第四步)。2021 年,AI 药物研发公司英矽智能宣布其利用 AI 完成了治疗特发性肺纤维化的新药研发,先在三维结构上找到靶点(第三步),然后提取相关信息并找到最佳的靶点分子(第四步)。英矽智能的AI技术不仅为药物研发的后两个步骤节省了 90% 的成本,还创造了一项不可思议的奇迹:用 18 个月的时间完成了新药研发。要知道,传统新药研发往往要耗时 10 年以上,耗资超过 20 亿美元。
此外,AI 还可以整合多方面知识来优化第三、四步研发过程。例如,自然语言处理(NLP)技术可对海量学术论文、专利成果和公开数据进行深入挖掘,从中提取出能够帮助锁定靶点或有效分子排序的信息。AI 还可以根据过去的临床试验结果,预测所有潜在候选新药的有效性,为进一步排序提供参考。这些,都可以在计算机系统上模拟完成。科学家可以站在 AI 的肩膀上,参考系统给出的推断,排除“错误选项”,然后再进行下一步研究。
当然,除利用计算机模拟进行研究的“干实验”外,还有一种“湿实验”,即在实验室培养皿中对人体细胞展开药物测试。对于这一类实验,AI 同样有很大的施展空间。在今天,由机器人来主导这类实验,会比由实验室技术员来操作更加高效,而且可以采集到更多的数据。镁伽机器人就是这样的先进公司,镁伽的实验室机器人,无须人工干预,就能进行 24 小时全天候的重复实验,这将大大加快药物的研发速度。