来源:DeepTech深科技
12 月 5 日,AI 生成型合成生物学智造公司智峪生科宣布,百吨级生物合成天然香料生产中心新工厂正式在江苏常州落地,其产品生产管线涵盖了天然香料、化妆品原料、功能食品添加剂等多个领域。
这标志着智峪生科不仅将 AI 计算(IT)和设计完全整合到合成生物学的研发(BT)和量产(VT),还将其独特的 T³业务模式在生产线成功验证,实现从反应路线设计到相关生物元件的挖掘、设计及改造,再到自动化高通量智能化的研发和生产。
值得关注的是,智峪生科突破性地仅用 1 年半时间便实现了从 AI 蛋白设计到天然阿魏酸香兰素(以下简称“香兰素”)产品,并且具有低成本和百吨级稳定量产潜力。
“我们考虑的不仅是技术,更重要的是市场和落地层面,例如,市场价值、市场空间、用户购买意向以及能否降低成本等。因此,公司在探索一系列市场因素后,反向推导出需要达到的技术目标,比如每升产量、转化率和选择性等,进而逐步将常州百吨级生物合成天然香料生产中心落地。”智峪生科创始人兼 CEO 王晟博士表示。
王晟拥有 10 多年国际知名企业蛋白质结构预测、研发和筛选的工作经验,博士毕业于中国科学院理论物理专业,先后在美国芝加哥大学丰田技术中心、沙特阿拉伯阿卜杜拉国王科技大学以及腾讯 AI Lab 等科研机构与跨国公司任职,曾入选美国斯坦福大学 2021、2022 年度“全球前 2% 顶尖科学家”和 DeepTech 2022 年度中国智能计算科技创新人物。
作为最早使用深度学习研究蛋白质结构的学者之一,王晟不仅是蛋白结构预测方法 RaptorX 的核心开发者,还领导了蛋白结构预测方法 tFold 项目。他在蛋白质结构预测和研发方面的成果,为 2024 年诺贝尔化学奖得主约翰·江珀(John Jumper)的工作提供了重要的基础和灵感。
蛋白质结构设计和预测的技术累积:从学术创新到产业落地
技术的突破并非一蹴而就,这离不开智峪生科独到的技术方案和产业洞察力。
故事要从 2014 年说起,王晟在芝加哥大学托宾·罗伊·索斯尼克(Tobin Roy Sosnick)教授的课题组进行访问交流期间,彼时的江珀正在该课题组攻读博士学位。江珀发现,传统的精确原子层面模拟方法成本过高,因此他转而采用粗粒化方法来研究蛋白质折叠。那段时间里,王晟与江珀进行了深入的学术交流,不仅共同探讨蛋白质结构预测的问题,还在学术思想上频繁交流碰撞。
2014 年,王晟利用当时最先进的卷积神经网络,将保持 15 年之久的二级结构预测精度记录从不到 80% 提高到了 85%。2015 年,他提出深度学习不仅能预测一维结构特征,还能预测距离图和接触图等二维特征。
他与许锦波老师一起使用卷积神经网络构建了超深度学习模型 RaptorX-Contact,显著提高了蛋白质结构预测精度,这一突破彻底改变了整个领域。后来,王晟展示了如何将一维二级结构和二维接触图作为距离约束,并将其用于蛋白质三维结构建模。2017 年,这项工作发表在计算生物学顶级期刊 PLOS Computational Biology 上。
这一系列工作促进江珀将研究方向调整至深度学习,在完成博士后研究之后加入了谷歌 DeepMind 公司,并在 2018 年开发出 AlphaFold 一代。2019 年,华盛顿教授大卫·贝克(David Baker)、华人学者杨建益在 RaptorX-Contact 技术思路的启发下,开发了蛋白结构预测工具 trRosetta,实现了学术界对 AlphaFold 一代的“绝对反杀”。
2020 年,王晟团队获第 14 届 CASP 的邻接图预测第一名,以及 3D 结构预测工业界排名全球第二;2020 年 6 月起,在 CAMEO 竞赛上连续半年获得冠军;2022 年,在第 15 届 CASP 获得 RNA 结构预测的第一名和蛋白质-小分子复合体预测第二名。
同年,AlphaFold 2 使用基于 Transformer 的大模型技术,将一维序列和三维结构统一,实现了端对端的训练和推理。“江珀的工作与 RaptorX-Contact 有一定关系,但 AlphaFold 2 的底层架构是全新的,这也是它能够获得诺贝尔奖的原因。”王晟表示。
智峪生科成立于 2021 年,王晟在创业后并没有选择在 AI 学术领域与国际巨头“硬碰硬”,而是将 AI 技术应用于合成生物学实际的落地场景,并在高速海量结构建模和生物制造领域取得进展。
“凭借多年来对蛋白质结构以及蛋白与其他生物分子之间相互作用的深入建模理解和对商业、产业及市场的敏锐洞察,我们拥有将这些科学洞见成功转化为实际的产业应用和市场优势的能力。”王晟表示。
到了 2022 年,王晟团队实现了比 AlphaFold 2 的速度提高百倍,使他们具备了在短时间内预测大量未知结构蛋白质的能力,相关论文发表于 Nature Biotech[2]。更重要的是,他们的工作还帮助发现了新的酶或改造已知酶,不仅提高了效率,还使得生物产品能更有效地生产。
智峪生科利用高速海量的蛋白质结构建模能力进行反向虚筛,找出可能与特定底物或产物发生相互作用的酶,然后通过实验验证这些酶是否真正能催化特定的反应。2023 年,他们通过挖掘酶的手段,找到了能够催化三步合成路线的酶组,并通过了实验验证,达到理想的效果。
与其他公司不同之处在于,智峪生科的计算和技术团队与产业落地团队深度融合,而不是分开管理。
例如,在中试阶段,智峪生科发现之前开发的酶存在热稳定性不足的问题,限制了其在高温生产工艺条件下的应用。该公司计算团队与实验团队紧密合作,迅速准确地识别出酶热稳定性不足的问题,并在短短几天内通过计算提供了几十个可能的解决方案,大大缩小了筛选范围,相关论文发表在 Protein Science 上[3]。
实验团队迅速从这些选项中选出了一个效率相当甚至更高、热稳定性提高到了 70 摄氏度的酶。“最终,我们仅用了几周时间,就显著加快了与生产相关的问题解决速度。”王晟表示。
打通“算研产销”链条,实现产品从设计到落地周期 18 个月
随着 AI 技术的发展和合成生物学领域需求的演变,目前,已有合成生物学企业通过 AI 进行创新研发,来加速研发和技术落地进程,而智峪生科的不同之处在于,AI 在产品落地中起到主导性作用。“我们不仅实现了技术变革,同时也实现了产业升级和产品落地。”王晟说。
相较于原有基于反复多次实验的研发范式,智峪生科通过 AI+合成生物学研发平台,由 AI 先在计算端进行研发生成,再进行实验验证,从而显著缩短研发时间降低实验成本。
在酶设计、路径设计和细菌设计等方面,该公司基于设计方案进行构建,再通过实验测试来验证设计是否达到预期目标。由实验产生的数据结果被用来学习和优化,并指导后续的设计工作,在信息和计算技术与生物技术的深度融合的基础上,进而实现“设计-构建-验证-学习”(DBTL,Design-Build-Test-Learn)的循环。
智峪生科通过打通“算研产销”全链条,为合成生物学和生物制造行业的“卷、污、慢”问题提供新的解决方案。具体来说,“卷”是指传统化工或生物路线由于过于单一,容易形成内卷问题;“污”是生物制造的高污染、高能耗问题;“慢”则指新路线或新分子的研发周期长。
以香兰素为例,它是一种广谱香料,具有调味和定香的效果,主要应用领域包括:食品工业、医药中间体、饲料、调味剂和化妆品等。该公司香兰素项目基于少量实验,以极高的效率和以周为单位的迭代速度,快速开发出酶或其他所需产品,从而克服了内卷问题。
另一方面,以阿魏酸作为底物酶转化生产的香兰素产品工艺简便,在污染和能耗方面具有显著优势。与传统发酵法相比,该工艺所需的设备规模更小,几乎不产生废水排放,实现了高效率和环保的目标。此外,该工艺在设备投入和能耗上大幅度降低,污染排放量远低于化工法,甚至优于传统生物制造法。
在新工艺路线的开发方面,智峪生科通过运用 AI 技术显著加速了这一过程,将原本需要数年时间的研发周期大幅缩短至数天。“我们创纪录地实现了香兰素从项目启动到产品大规模生产的整体周期仅用了一年半时间,这也标志着 AI 生物制造的产业化能力得到了实际验证。”王晟说。
在元件挖掘方面,智峪生科基于 AI 根据功能计算序列,耗时不到 1 周即预测出具有活性的酶,并通过实验验证;在元件优化方面,通过 AI 全理性设计酶改造技术,耗时 3 个月即获得更好的酶并进行实验验证。
与市场中主流的化学合成法制备的香兰素相比,智峪生科的阿魏酸香兰素在多个方面实现了显著的改进。
具体而言,其采用生物合成技术,在风味上更接近于天然提取的香兰素,有效解决了化学合成法香兰素长期存在的杂质气味问题。同时,该产品纯度高、无化学物质残留、安全性更高,且价格远低于天然提取物。此外,在产能方面不受种植产量和气候的限制,不仅可满足高端及食品产业风味升级需求,也保证了供应的稳定性。
今年 6 月,智峪生科的香兰素产品已经获得了 FDA 体系下美国食品香料和萃取物制造者协会公认为安全(FEMA GRAS,Flavor and Extract Manufacturers Association Generally Recognized as Safe)认证。据介绍,目前该香兰素产品的产量达百吨级别,产品可销往全球大部分地区,满足高端及食品产业风味升级的需求。
将在保健品和化妆品原料等多个方向拓展业务
目前,智峪生科基于 AI 和合成生物学的深度融合,正在通过产品矩阵的方法,为拓展业务做准备,其产品管线涵盖了天然香料、化妆品原料、功能食品添加剂等多个领域。
据介绍,在化妆品原料方面,该公司正在与国内美妆行业的头部公司合作,推广一款维生素 E 的重要衍生物。在天然香料方向,智峪生科正在推广一款年用量与香兰素相当的花香味产品,目前这款产品已进入中试阶段。
此外,他们还开发了一款能够降低餐后血糖的食品添加剂,可以添加到糕点、软糖或餐后饮用的产品中,有效降低血糖水平。这些产品不仅展示了智峪生科在技术融合方面的成果,也体现了在产品开发上的深度和广度。
AI 与生物技术的结合,在生物制造领域展现出巨大的潜力。尽管 AI 在生物制药领域,如虚拟筛选等方面已有相关成果,但在临床实验等后期阶段的作用尚未达到预期。相比之下,AI 在生物制造领域从酶的设计、挖掘到改造的不同层面都能够提供赋能。
未来,如果 AI 能够进一步渗透到生物制造的各个层面,包括酶催化、后处理工艺和质量检测,实现全流程的数字化和信息化,则有望打造无人化的“黑灯工厂”。这样的工厂将能够按需定制产品,减少人力资源需求,提高生产效率和环保性。
“这不仅会引领生物制造产业的革命,还有望推动人类进入一个全面绿色生活的新时代,实现化工品、材料、能源的智能、环保生产。我认为,通过 AI 的深度融合和赋能,这一愿景可能在未来 5 到 10 年内实现。”王晟表示。
参考资料:
1.公司官网:https://www.zelixir.com/
2.Hong,Liang;Hu Zhihang;Sun Siqi;Tang Xiangru;Wang Jiuming;TanQingxiong;Zheng Liangzhen;WangSheng;Xu Sheng;King Irwin;GersteinMark;Li Yu."Fast,sensitive detection of protein homologs using deep dense retrieval".Nature Biotechnology 42,(2024). https://www.nature.com/articles/s41587-024-02353-6#citeas
3.Xu,Ran;Pan,Qican;Zhu,Guoliang;Ye,Yilin;Xin,Minghui;Wang,Zechen;Wang,Sheng;Li,Weifeng;Wei,Yanjie;Guo,Jingjing.“ThermoLink:Bridging disulfide bonds and enzyme thermostability through database construction and machine learning prediction”.Protein Science 33,(2024). https://pubmed.ncbi.nlm.nih.gov/39145402/
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)