摘要
AI 和脑科学是一个桥的两边,他们在相向而行,迟早也会在中间合拢。
整理 | 汤一涛编辑 | 靖宇
脑机接口一度承载了人们对赛博格的绝大部分想象,但是这两年脑机接口的进步似乎并不是预想中的快,尤其是在 AI 日新月异的进步衬托下。
这其中当然有很多复杂的原因。脑机接口本身就是一个典型的交叉学科,涉及到了电极材料、芯片封装、医疗器械、算法,是一个非常复杂的全系统。更为关键的是,伦理问题使得脑机接口的每一次试验都必须十分慎重。彭雷提到,他们往往需要一年时间来准备一场试验。
实际上,AI 的很多关键技术突破,往往都有脑科学理论的身影,例如神经网络,例如图像识别。
2021 年,上海脑虎科技有限公司成立(下称「脑虎科技」)。对比另一家脑机接口的明星公司——马斯克的 Neuralink,在成立的 3 年中,脑虎科技已经把两者的差距从 7、8 缩小到了 3 年内。
在彭雷看来,脑机接口和 AI 分别象征着桥的两端,一端代表碳基生命拥抱硅基生命,一端代表硅基生命模拟碳基生命。他相信,soon or later,这两个技术都会在桥的中间合拢。
以下是脑虎科技 CEO 彭雷在 IF 2025 的演讲全文,经极客公园整理。在演讲中,彭雷分享了脑机接口和 AI 的关联,以及脑机接口的未来。
01 神经科学启发了很多 AI 的关键突破
大家下午好,我是脑虎科技的 CEO 彭雷,今天我分享的话题是「一个硬币的两面——AI 和 BCI」。BCI 就是脑机接口的简称,叫 brain-computer interface。
听上去大家可能觉得 BCI 跟 AI 没有什么联系,但我相信听完我的分享之后,大家会发现其实这两件事情在底层逻辑层面上有很高的一致性。它们有一个互洽的过去,也有着一个共同的未来。
我们回顾一下 AI 过去 20 年,尤其是最近 3、5 年的重大事情,你会发现神经科学在 AI 几次关键技术突破上都扮演了非常重要的角色。例如,我们最早对神经网络的设计来自于我们对大脑神经元的放电的原理的研究,然后产生了神经网络;图像识别是来自于视觉神经元怎么处理视觉信号的一些研究;包括 Transformer 架构以及现在的大语言模型,背后本质上是一个叫 attention 的机制,这也来自于神经科学里对人的注意力的研究。
今年获得诺贝尔奖的 Jeff Hinton 就曾经也说过,人工智能的整个研究都是借鉴神经科学的基础。但上个月在跟多伦多大学的采访中,Hinton 也说,他作为一个做了 20 年 AI 研究的科学家,觉得现在对神经科学的研究太慢了。
也就是说,刚开始神经科学给 AI 起了个头,但是后面 AI 的发展速度更快,显得神经科学的发展速度慢了。这个背后有很多原因,我稍后会展开。
首先问一个问题,大家有没有想过大脑跟 GPU 的关系是什么?大家可能觉得好像没有什么可比性,但实际上从物理上来讲、从数学上来讲,他们是有很多方面可以参照对比的。
就拿现在大家已经买不到的英伟达的 H200 来举例子。它的晶体管有 10 的 11 次方;大脑差不多是 860 亿个神经元,大概也是 10 的 11 次方。所以GPU 从浓度上来说已经可以做到和大脑比较一致了。
但是从结构组件上来讲,GPU 晶体管之间的连接,还是跟大脑有重大的区别。大脑神经元跟神经元之间的连接可以有 10 的 4 次方次,而晶体管跟晶体管之间的连接可能是个位数。所以从这个角度来讲,虽然说晶体管跟神经元数量相当,但是它们在连接通路上有 10 的 4 次方的差异。
这是第一个差异点。
第二个差异点,大脑是存算一体的,没有计算单元和储存单元分离这么一说;而我们现在的计算机在冯·诺依曼架构下,还是存算分离的。
第三个差异点是软硬分离和软硬一体的差别。我们不管开发什么软件,可以跑在这台电脑上,也能跑在那台电脑上,软件跟硬件是可分离的。但是大脑的软件跟硬件是不可分离的。
所以之前有人问我,AI 是不是可以很快地模拟整个大脑?
我自己认为大概还有 10 的 9 次方的差异。其中自于 10 的 4 次方,是由于神经元之间的连接通路比晶体管的连接通路复杂很多。
还有 10 的 4 次方到 5 次方的差异是来自一个重要的特性,叫神经可塑性,就是说这个神经元跟神经元之间的连接是可以动态变化的。像今天我在跟各位分享,本质上就是我的 800 亿个神经元在噼里啪啦地放电,传递我想说的话。在座的各位的神经元也在噼里啪啦地放电,我的声音。而听完这段声音之后,你们今天回去,你的大脑会永久地被我所改变——因为我创造了你的新的连接,产生了新的 pattern,你有了新的认知、新的记忆。那这个过程就意味着神经元之间的连接是可以被改变的,而晶体管之间的连接是不能改变的。这里面至少又差了 10 的 4 到 10 的 5 次方的复杂度。
所以说我说这两个路径是在相向而行的,但是两边的速度不一样。
02 脑机接口行业在做什么?
接下来我展开说说 BCI,跟大家讲一下 BCI 到底在做什么。
首先跟大家做一个简单的科普,脑科学中对大脑的认知。我们知道它是我们最重要、最脆弱的器官,也是我们有别于动物最重要的区别。但在脑科学的定义中,我们所有的感知、认知、记忆、情感、情绪全是由电信号决定的。只要我能读你的电信号,我就有机会能改你的电信号。
所以说我们面对的自身,本质上其实是一堆电信号产生的各种感知跟认知。
那我们现在对大脑的了解是什么水平呢?
我觉得人类目前对大脑的了解可能不到 10%。大脑有不同的区域,今天我们已经知道哪些地方管理运动,哪些地方管理语言,哪些地方管理听觉。但是更高级的功能,像知识、记忆、情感、意识、自我认知,这些在哪其实我们都不知道。
也就是说,我们大概知道基础的运动是怎么控制的,但其他的东西都还处于探索阶段,它是由非常复杂的网络来支配的。
而脑机接口的本质就是在大脑的不同区域里面插入电极。电极就像导线一样,对那个区域神经元放电的信号进行读取,同时也可以对那个神经元进行刺激。
脑机接口的特征是个典型的交叉学科,涉及到了电极材料、芯片封装、医疗器械、算法,是一个非常复杂的全系统,难度是非常之高的。而我们做很多研究的目的,都要解决如何让大脑在植入脑机接口的时候受益更多、受创伤更少。这是一个不断要 trade off 的事情。
这是脑机接口的植入位置,是一个纵剖面。植入的过程就是切开头皮、颅骨、硬脑膜到脑组织,让电极插在不同的位置,能记到不同的信号。简单地讲,离脑子越近,记到的信号越好。
现在行业里面主要有三个技术路线。一种是左边的这种硬质电极,就这么一个铁盘。这其实是个硅片,有指甲盖那么大,上面有 100 根针。它直接打开大脑插到你的大脑皮层里面去。这 100 根针,就意味着 100 个通道,可以记录 100 到 200 个神经元放电的信号。
第二个是血管支架,通过静脉血管放在大脑里面,血管里面隔着血管去记录神经元。
第三个就是马斯克的 Neuralink,包括我们脑虎科技使用的柔性电极系统。
诞生 20 年以来,第一种技术路线全球植入了 60 个人,第二个路线植入了 10 人,第三个路线是 3 人。
这是第一个技术路线插到人脑上的效果。可以看到患者头上有一个非常大的设备,我们叫 head stage。这个设备是将电信号转移出来,然后基于这个信号来控制机械臂进行一些简单的操作。这个患者是高位截瘫,意味着他脖子以下都是不能动的。但植入脑机接口后,他可以控制两个机械臂切蛋糕吃。我们看上去是平平无奇的动作,但对于一个高位截瘫的患者来讲,切开蛋糕,用叉子叉起来,很缓慢地拿到自己嘴里,是很困难的一件事情。但是通过脑机接口,配合机械臂,这一步已经可以实现了,可以非常大地提升患者的生活质量。
但你也可以看到,这套效果永远还能在实验室实现。他头上接了 3 根线,还有龙门架和其他一堆设备,你没有办法在医院或者家里用。
第二种路线,血管支架,就是把电极放到血管里。它的天花板比较低,我就跳过了。
第三种技术路线,柔性电极系统,代表公司就是马斯克的 Neuralink。马斯克真正当 CEO 的只有 3 家公司,一个特斯拉,一个 SpaceX,最后一个就是 Neuralink。
这是 Neuralink 今年最新的临床进展,可以看到它将前面头上那 3 个很大的设备变成了一个极小的单设备的脑机接口,植入皮下之后完全实现了无线。这是我觉得工程师跟科学家的区别,科学家可以跑 20 年,证明原理可行,但干得非常复杂。马斯克就用它的第一性原理把设备干得极小、极方便,工程能力拉满。
今年 1 月份 Neuralink 植入了第一个患者。这个患者也是高位截瘫,它通过脑机接口能够完整地控制电脑。他正在玩的游戏叫 Webgrid,原理就是移动鼠标点击。
这个游戏在在 Neuralink 官网上就有。我玩这个游戏大概是 11 分,已经是非常快的速度,我们公司平均下来得分在 9 分左右。但是这个患者纯粹用脑控制想象,就可以做到 9.5 分,已经比很多健全的人都快了。
我们讲脑机接口发展需要 3 个核心的要素,高通量、低创伤和长期在体。
高通量很好理解,我们有 800 亿个神经元,那我们希望能记录下来的神经元数量是多少?马斯克能记录 1024 个,我们能记录 256 个,还有几倍的差距。但我也抛出过一个概念是脑机接口的摩尔定律,就是我们认为能读写神经元的数量,每 18 个月应该会翻一番,至少我们是这样做的,马斯克也是这样做的。
所以说未来 8 年、 10 年,我觉得能记录上百万通道神经元的脑机接口一定会出现。这样你控制手、控制机械臂,甚至控制特斯拉车、控制 Optimus 机器人,从原理上来讲都是可行的。
03 为什么神经科技发展速度比 AI 慢?
AI 和脑科学真的是一个桥的两边,在相向而行。我们整个产品包括了硬件、软件和动物资源,AI 领域里面也有同样的硬件,软件跟实验资源,完全可以对应。我们做的脑机接口的这套东西,放在 AI 领域就是英伟达做的事情——从整个基础的芯片、到硬件框架、网络连接、交换等等。然后数据跟算法其实就是 CUDA,就是 hugging face。但是现在在 AI 里面有非常成熟的数据集跟算法的分享集,脑科学里面还没有形成,所以我们要建立自己对脑信号脑算法解码的 Hugging Face 跟 CUDA。
但是为什么神经科学的发展速度比 AI 的慢?原因只有一个,就是伦理。我们没有办法大规模地去做动物的实验和人的试验。每做一次试验,我们都要准备一年,要非常严格地评估患者的受益,一步步按照相关的要求走。但是 Sam Altman 去融 15 亿美元,把 GPU 的规模放大 20 倍,就可以迭代了。
所以说我们也希望在脑科学领域成为英伟达这样的基础公司,加上像 Hugging Face、CUDA 这样的生态,来让全球的神经科学家共同加速,这样我们硅基跟碳基的融合可能会比想象的更快来到。
我们脑虎在去年做到了两个实验,一个是训练狗在跑步机上走路,来解码它怎么控制四只腿的;另一个是训练猴通过解码来打乒乓球的游戏。这两个是马斯克在 21 年做到的事情,我们在 23 年做到了。所以说从实验进度的角度来讲,我们大概落后它两年半到三年的时间。但我们作为一家新创的中国公司,跟它的这个差距是从最初的七八年慢慢的缩小 3 年,我们觉得还是进步很快的。
04 脑机接口的未来
那马斯克现在在做什么呢?
第一个是运动恢复。现在的患者都是用脑控设备,但是未来可以做到脑控外骨骼、脑控机械臂,那患者就可以用他自己的躯体站起来,或者控制机器人来帮他做一些事情。
第二个是语言接口。我现在已经在非常快地表达了,但其实也就每分钟 140 个字。实际上大脑的想象速度肯定超过 140,只是人讲不了那么快,你也听不了那么快。有朝一日通过脑机接口,可以将我的表达用 1 分钟 800 个字传递给你,就不用这么来回讲了。去年实验室里已经能够做到正常人说话速度的 60%,未来这个速度一定还会提高。
第三个是视觉。对于盲人或者没有眼球的人,可以通过在视觉皮层刺激,让他看到黑暗中有闪烁的白色的斑点。这些白色的斑点就可以用来描绘物体的边界。那对于一个盲人来讲,60 个通道能看到这样的东西。到 600 个通道、 2000 个通道,其实可以说绕过眼球传递视觉是完全可行的。马斯克已经开始招募做视觉刺激的患者了,我相信在明年年底这个产品方案应该就会看到第一个植入的人。
第四是记忆假体。大家可能发现自己随着年纪大了,记忆越来越差。本质上对记忆储存的位置还在研究中,但是有一些机会能够对记忆进行强化,或者选择性遗忘,甚至修改。当然现在修改还远远谈不上,但是加强跟选择性遗忘是有科学根据支撑的了,也有些公司在做这样的事情。
然后还有具身智能。Optimus 前两天刚发了视频,可以看到它下个坡已经很流畅了,也能适用于各种环境。相信未来植入脑机接口的人也不一定完全要靠自己的身体,可以直接通过脑控 Optimus 帮他完成事情。那这可能就真是一个机械飞升的过程。
我们相信硅基生命和碳基生命的融合会在 2035 到 2045 年之间发生。我们代表了碳基生命这边拥抱硅基生命的趋势,其他 AI 伙伴们代表了硅基生命在模拟我们的方式。反正 soon or later,我们会在中间合拢。
我相信大家在有生之年一定可以看到这件事,我们也希望能够共同推动把这件事做成。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)