对话英诺王建明:机器人目前面临的核心问题是数据 | GAIR 2025

对话英诺王建明:机器人目前面临的核心问题是数据 | GAIR 2025
2025年12月12日 14:16 雷锋网

每晚 10 点,城市渐入静谧,英诺天使基金 ED 王建明的 “专属写作时间” 才刚刚开启;周末的时光,也早已被她固定分配给了采访与写作。

这份坚持,源于一直在坚持做的 “石麻笔记”,最初她只是想随手记录工作中接触的技术信息,未曾想,石麻笔记受到了越来越多业内人士的关注,也在潜移默化中改变着她对机器人行业的认知。

早在具身智能成为资本热词之前,英诺王建明就已经踏入机器人赛道。据科技产业投资平台华芯资本统计,在一级市场,2025 年前七个月,具身智能行业总融资金额超过 300 亿元,在 2024 年上半年,这个数字还只是 75 亿元。资本狂欢的背后,却难掩数据困境。

从 2017 年到现在的 2025 年,她几乎见证了这个行业从默默无闻到名扬世界,也比任何人都清楚,若数据难题不解决,再高的融资额也难以支撑行业走得长远。

英诺王建明坦言:“机器人的数据问题如果不被解决的话,具身行业用现在的范式不一定做得通。”

以下是 AI 科技评论与王建明的对话,AI 科技评论对其进行了不改原意的编辑:

01 只是想要记录而已

AI科技评论:最开始做石麻笔记有遇到困难吗?怎么解决的?

王建明:没遇到什么困难,因为非常随性,叫“笔记”其实就是因为这只是工作或学习过程的记录,没有什么期待,所以没有什么困难。

AI科技评论:有给自己规定访谈or写作计划吗?

王建明:没有,完全是随性随机的,我自己有空并且是感兴趣的话题就会想一下,写一下。

AI科技评论:石麻笔记的文章既有专业深度又能让技术小白看懂,您是怎么把握这个平衡的?

王建明:我会从我看论文所产生的问题去发问,因为我自己也不是学术背景,也不会问非常专业的问题,而是从比较容易理解这个工作的点来问的,所以问题比较通俗,受访者的回答也会比较照顾我,会简单的解释一些专业问题,因此写出来的内容对于非技术背景也比较容易消化。

AI科技评论:为什么从投资人来做石麻日记呢?这其中的心路历程是怎么样的?

王建明:其实我在关注具身智能之前就已经在写石麻笔记了,我一直会对自己看的方向进行梳理,比如看SAAS的时候就会有一些技术向的东西也会记录下来,所以机器人的核心点也会梳理,比如具身智能的脉络、机器人创业者的聚集地、还比如很多打过机器人比赛的创业者,谁先把工作做出来,这个也需要梳理。

具身是一个比较前沿的技术,技术的拥有者大部分都在学术圈。而且技术一般都有多个技术路径,每个技术路径上都有一些阶段性的突破,在梳理的过程中也会比较关注当下的技术突破,对一些有影响力的论文去做一些科普采访。

我不是学术背景,同时对具身又很感兴趣,很好奇落地边界在哪里?离落地的距离有多远?技术所创造的价值是什么?从这个角度去跟有影响力的老师做一些访谈,将论文以通俗的方式解释出来、科普出来。而且也能跟作者建立一些联系,很多技术创新的创业者都是来自学术圈,建立了这些联系,也方便后续去跟进他们的创业项目。

AI科技评论:做石麻笔记的过程中,有没有哪些具身的行业观点或认知,是通过访谈和写作后发生颠覆式改变的?

王建明:石麻笔记我一直是业余时间做的,一般是晚上 10 点之后和周末的时间点来整理或者采访。

之所以一直持续去做的原因就在于,它在持续地改变我对于这个行业的一些认知,这个改变是潜移默化的,不是说我采访了某一篇工作直接就对整个行业的认知就改变了,而是每一次的采访、每一篇文章的梳理都会慢慢改变我对这个行业的一些认知,尤其是对前沿方向的判断。

AI科技评论:有没有什么投的项目体现出来了慢慢改变的认知呢?

王建明:现阶段的一些交流不一定能够通过投资体现出来这个认知的价值,但通过时间的慢慢积累我相信是可以体现出来的,因为投资本身就是一个长周期的闭环验证,而且现在具身智能处于一个泡沫之中,不管是什么样的项目都可以有一个比较好的融资,这意味着我通过自己的访谈过程中积累出来的对技术路径或商业模式的认知判断,可以筛选出我自己愿意推进的项目和不愿意推进的项目。

虽然可能不愿意推进的项目也会有一个好的表现,但这个事情可以拉长到终局来看,现在付出的努力和时间是不会白费的。其实我跟很多行业人士交流的时候,大家都有有一些小范围的共识,这些共识不见得每一个投资人都有,这就是在交流过程中的认知差异,所以这些访谈对我的帮助是非常大的。

AI科技评论:您觉得作为投资人和作为采访者这两个身份面对交谈的对象的侧重点有什么不同吗?

王建明:作为采访者,主要的侧重点其实是针对于论文本身,我会想为什么会往这个方向去做,这个方向肯定有自己的一些局限性或者过往工作没有解决好的问题,相当于这个工作的起因。还会侧重于工作中会用到的一些方法,在方法上有一些比较大的创新,或者另一些工作会沿用核心的思想和方法,比如石麻笔记的 Human Data 系列,很多都是在 DeepMimic 这一套思想的基础上进行微创新。

另外是这个方法能解决什么现实问题,比如去年采访的 UMI 的工作,它从硬件的结构去做相对应的方法,虽然没那么难,但提出了一个很好的解决数据采集的方法,可以真的解决行业内的某个问题,虽然可能早一点、晚一点都会被人提出来,但他们就是第一个提出来的,利用手持夹爪的末端轨迹来训练机器人,既可以很方便的解决真机末端执行器的数据稀缺问题,又在最终应用角度对行业有巨大贡献。

而投资人访谈,我所在的投资机构英诺天使基金主要是投早期,所以我们的访谈核心是围绕着人的背景,创始人对创业这件事的理解,他为什么想现在这个时间点创业以及他看到的机会是什么等等这些方面去了解。

AI科技评论:您是属于比较早期就深耕在具身智能赛道的投资人了,对吧?

王建明:我看机器人时间比较久了,2017 年就在看机器人这个方向了。

AI科技评论:那您这么多年看下来感觉有什么变化吗?或者是您自己心态有什么变化吗?

王建明:我自己对于机器人的理解是有基于前一波的机器人的投资和观察的,这个经验对于现在去看机器人也会有一些指导。

现在的具身智能,也需要借助机器人的外壳去实现它的 AI 能力,再从最终交付的产品上来说,也无外乎是一个机器人的产品。

AI科技评论:软硬解耦可行吗?

王建明:我其实不那么相信只需要做机器人的系统和软件,我觉得能够真正的把机器人做好的,一定是同时具备硬件的能力、系统的能力、软件的能力以及算法的能力的公司。

如果是从最终应用的角度来说,现阶段需要去考虑的是解决行业痛点,其中硬件就是一个很大的卡点。硬件涉及到本体和上游的零部件,那上游的零部件从终局的角度来说,它真正的核心的价值点又在哪里?其实也不仅仅限于在关节模组本身,那可能是更上游的一些零部件的真正突破。

另外在系统层面,更多的是嫁接软件和硬件,现在有很多单纯做算法的一些团队,但我个人不会觉得单纯做算法能够把整个机器人系统做好,因为它离硬件和最终的产品距离有点远。机器人系统其实就是链接软件和硬件的,必须要有很好的对硬件的理解、硬件的适配,以及很好的算法能力,互相需要密集的互动,最终才能够把整个机器人系统做到完美。所以我对于软硬解耦这件事情没那么相信,尤其是一些单纯做算法的公司。

AI科技评论:您目前有在看什么具身项目吗?

王建明:今年其实是投了不少项目,我一般会阶段性的去找侧重的方向看,比如 23 年就会重点看一些拥有好的学术背景的人,以及用 Robot learning 的方式来做机器人控制,尤其是能够做机器人基座模型的那类公司,23年我当时聊了很多第一轮的公司现在涨得都非常好。

到了 24 年就会侧重去看有应用能力的公司;到了今年关注点则回到了双足人形的一些工作,可以看到我今年一整年的工作都是跟双足人形相关的。

虽然存在着一些随机性,但我认为最核心的点是因为具身行业的数据问题越来越严重,怎么去解决数据问题变得异常的迫切。所以我现在比较关注怎么利用现成的数据也就是人的数据 Human Data 去解决这个问题,过程中遇到的鸿沟能否用什么数据或方法去弥合。

AI科技评论:您主要关注具身创始团队的哪些方面?

王建明:像我们做早期,维度首先主要是看这个人本身,他作为创业者的一些素质和他自己内心深处的关于创业这件事情的一些想法。第二点是他现在选的这个方向,通过跟他沟通为什么要做这个方向,来去了解他自己思考问题的过程。第三点是创始人他过往的背景,现在想做的这个事情有没有足够的支撑。最后是他想做的这个事情他怎么去做,是不是和我的认知有共鸣,或者我能不能被他说服。

AI科技评论:在具身智能领域,您是怎么判断哪些是好的项目?

王建明:具身智能现在还太早期了,太技术向了,对于很多标的筛选是需要有一些技术方向的预判,不太像单纯做一个很成熟的技术路径下的产品创新的项目,这个就更多看执行力。而具身智能需要有一些你对于技术路径的预判,然后去筛选你认为可能对这个行业的发展有核心推动力的一些项目,大家把这些问题都逐步解决的过程中,才有落地的可能性。

其实现在具身智能的创业者都是有很好的背景,我们常常会筛选的眼花缭乱,至少我自己在内部推进项目的一个核心点就是,他在这个阶段或者未来两三年之内会不会成为这个行业的突破圈,或者是进一步往前去推动的一个核心价值贡献者。

如果是的话,我会比较愿意去推动,如果不是的话,可能相对来说就没有那么愿意推动。每一个人去筛选哪些项目要去推动都有自己的标准,可能其他的人会有另外的一些思考,尤其现在有很多很好背景的人去做具身的创业,如果没有自己的一个标准的话,很容易筛选的眼花缭乱。

AI科技评论:现在具身智能很多家企业都宣布自己有落地场景,就您个人观察而言,现在具身智能的落地的实际情况究竟是怎么样的呢?

王建明:落地的实际情况是应该还没有什么落地。如果落地是说机器人可以做一些演出之类的,它是有落地的。但如果是从我们生活中问题的解决来看,其实现在的机器人并没有解决,至少我们在生活中没有看到任何的具身智能机器人。

像公司楼下半身倒咖啡的机器人,它也不是具身智能机器人,只是用传统的控制方式来去做的机器人。那个很早就有了,我们之前投过的镁伽机器人,他们就有这个产品。

02 资本寒冬或许还没那么快

AI科技评论:今年具身智能领域它的投融额远远超于去年,这背后的原因是什么呢?

王建明:首先是因为 23 年成立的第一波公司,已经到了相当高的一个估值,所以资金量的需求就会大很多。其次是因为市面上又出现了很多新公司。

很多人没有想到,这个赛道的火热从 2023 年上半年开始一直延续到了今年下半年,持续了三年的时间。每到年末,大家就开始觉得这个赛道会变,比如今年很多人就说,明年年初或者明年上半年这个赛道可能会变。

这个赛道有很多刺激因素,比如我们阶段性地看到了很多海外公司很厉害的突破或进展,或者一些政策性的刺激,也能看到听到 Elon Musk 之类的大佬他们对这个赛道的一些预判,这些都会形成刺激,而且这些刺激是一波一波的来,每一次刺激都比上一次来来得更强烈一些。刺激因素一直在的话,大家就一直会敢投,而且今年也确实看到了一些进展。

AI科技评论:今年具身方面的投资特别火热,经常出现抢项目高估值的情况,这种情况会不会给你们判断投资带来困难?

王建明:肯定是会的,核心的点就在于,在投资的时候会面临一些泡沫,本来这个项目不用那么贵,但因为有人争抢,所以估值就会高一点。

今年我有一个普遍的感觉,本来 2023 年当时的很多项目的第一轮是在两个亿人民币左右,今年好一点的具身智能公司,第一轮基本上都是 5 个亿人民币了。其实这些项目回到 23 年,估计可能也是两个亿人民币,能感觉到估值的溢价。

AI科技评论:好多人都说明年具身智能就会遭遇资本寒冬了。

王建明:好像去年就有听到,到了 25 年,可能具身智能赛道就会转冷,但实际上今年又上了一个高度。投资行业是一波一波的热潮,如果按照一个正常的行业来看,会有一个周期,大概到了一个时间点的头部形成,整个赛道就相对来说降温了。

但是具身智能这个方向,它的技术创新性持续的出现,而且本身技术难度很大,很多个环节是需要有突破的,终极的想象空间又是巨大的,所以整个赛道的厚度和大家对它的期望值是极限的高,泡沫的生命周期也是意料之外的长。

AI科技评论:也就是说您认为明年或者未来两三年,应该还不至于说陷入寒冬?

王建明:我不太会做这种预测,但是从今年的观察来说,依然有大量的非常优秀的人,持续跳到这个行业里面来创业,我们是看早期的第一轮,所以能够发现持续有很多项目出来,而且感觉今年好像比往年都多。

AI科技评论:目前进入具身赛道还有机会吗?

王建明:任何时间都不晚,但确实从融资的角度或者从生态位的角度来说,要面临一个问题:如果要卡一个比较好的生态位,这个时间点出来感觉是会有点晚。但是依然可以做一些事情,比如能不能推动整个行业的核心价值贡献?例如数据问题。另外,这个时间点其实有很多做细分应用的公司出来的。

AI科技评论:现在有好多投资人都说现在具身里面有很太多泡沫了都不敢投,那您觉得现在还适合投吗?

王建明:这个见仁见智,还是得回到筛选项目的标准是什么?如果现阶段是能够解决这个行业价值卡点的一个事情,那就有意义做。

AI科技评论:现在投资具身智能面临的最大的风险是什么呢?

王建明:风险和收益是并存的,对个人来说最大的风险是你投中的公司最终都没有跑出来,而跑出来的公司你都没有投中。

整个行业的风险是,现在很多成立两三年的公司也在资本化,从投资人的角度来说,只要他在二级市场上市了,至少阶段性的流动性就能够被满足。只要行业没有一下子垮掉,从收益的角度还是可以保证的。所以这也是为什么 23 年出手早、出手猛的投资人其实是可以赚到第一波收益的。

当下确实太多的公司在这个行业里面了,未来不管是从业务落地,还是从融资,还是从生态位各方面来说,都会有很多挑战的,这个时间不会是短期的,可能得等这个赛道的融资遇冷之后,才会暴露出来问题。

如果拉长周期来看,现在的创业公司可能最终的成功率是百分之个位数的,意味着大多数公司后面会挂掉。这就是任何一个行业的规律。百分之个位数的数字,主要是因为基数比较大,现在跟具身智能这个标签相关的公司,应该有几千家了,而且还会持续有新的公司出来。

我们现在相对还处于比较早期,属于风险点还没有被暴露出来的时间。

AI科技评论:机器人未来的行业格局可能是怎么样子的呢?

王建明:行业格局这个挺难判断的,可能会有很多个应用场景,每一个应用场景可能会有一些做的比较好的公司。

值得推敲的是为什么在过往的自动驾驶行业和大语言模型行业,中国没有培养出来相应的数据公司,可能是因为中国大厂太强了。但是机器人它暂时还没有一个很明确的终极应用场景,谁可以做成比较强的大厂,我们现在还不知道。

另外,不管是 AI 1.0,还是自动驾驶,还是大模型,其实中国都是跟随者,但是具身智能这个赛道有可能成为引领者,比如数据范式被引领者尝试出来之后,后来者有一个成功的路径可以去参考。所以在具身智能这个行业作为引领者是需要在数据上做一些引领的。在中游会有像数据公司存在的,也可能会有一些基础设施的公司存在,上游的话可能有很多的硬件的零部件公司。

03 数据是目前机器人领域的核心问题

AI科技评论:现在有一批自动驾驶的团队过来做具身智能,您觉得最后能做成的人会是他们吗?

王建明:他们是最接近具身智能的一个形态,也是一个物理 AI,也有一个现实的载体,所以他们过往的一些经验确实是很值得参考,但是我倒觉得最终能做成功机器人的还是机器人行业内的人。

AI科技评论:为什么?

王建明:自动驾驶其实是车厂的生意,终端的形态是极其之固定的,就是一辆汽车。在终端场景上的电动汽车,其实是产品上的创新,这个东西跟算法没关系,是主机厂的生意。

回到机器人的形态,能想象到终极的机器人形态是什么吗?其实想象不到的。所以这个过程中需要一个非常有产品、硬件、结构设计天赋的团队去突破它最终能够进入生活中的形态的问题。

这有点像当年苹果手机研发,如果当时没有苹果手机无按键的形式,那可能我们现在还在用按键手机。其实机器人现在也是差在这个环节,机器人的产品形态其实跟自动驾驶没什么关系,还是需要一个有着极致产品和结构天赋的人去推动。

自动驾驶行业他们有过往的一些经验,可以告诉具身行业里面的人要避开的坑是什么?自动驾驶对可靠性和安全性的要求是比较高的。但是实际上机器人进到家庭里面,不管是产品的复杂度,还是动作的维度,还是指令的复杂度,它对于安全的需求都是远远高于自动驾驶的。

AI科技评论:目前机器人这个领域还没有出现像您刚刚说的那种人吗?

王建明:我觉得可能有,但是至少从产品层面还没看到。

AI科技评论:您认为现在机器人的进程类比到自动驾驶,处于自动驾驶的哪个阶段?

王建明:我其实没怎么系统地看过自动驾驶,如果要类比的话,其实很多都是固定程序编程,把道路上的很多情况都模拟出来,然后手工的编一些规则,让它去遵循这些规则。

这就跟传统机器人差不多。像现在的割草机、泳池、清洗机器人,甚至扫地机,它的智能化程度也是够的,那我觉得这些机器人是不是可以说成是自动驾驶的 L1 和 L2?

现在通用机器人的技术,其实在处理刚才说的场景上,可能还赶不上过往的技术。大家都喜欢去对标现在是 Chatgpt.几的时间或者自动驾驶 L 几的时间,我觉得不太能够去类比,核心还是回到机器人本身的技术栈上面,它现在的问题是什么?问题被解决的可能性是什么?

AI科技评论:那机器人现在最核心的问题是什么?

王建明:核心问题还是数据,数据问题被解决之后,可能又暴露出来其他的问题,比如说模型结构、算法路径。只是可能匹配到相应的数据之后,算法路径也会更清晰一点,在相应能成的算法路径上,判断模型的框架要不要被修改,有了更合适的模型框架,最终回到解决到这个行业的问题,通用任务的完成度、可靠性。

去做落地的时候,可能有更多问题。所以整个环节问题有太多了,很难去对标到曾经的 Chatgpt 级和 L 级,因为整个机器人系统的复杂度是远远高于大语言模型和自动驾驶的。

AI科技评论:您在机器人领域深耕了这么久,您能观察目前相对比较确定的一个趋势是什么吗?

王建明:确定的趋势是机器人的数据问题如果不被解决的话,具身行业用现在的范式不一定做得通。

AI科技评论:今年有很多创业者进入了机器人数据这个赛道,您是怎么看待这个现象的?这背后有什么原因呢?

王建明:大家是到了一个节点,认为这个行业进一步推动的卡点就在于数据,所以大家都是要先解决数据的这个问题,解决数据问题会有不同的角度和逻辑。

AI科技评论:如果是创业公司的话,它聚焦于这个机器人数据这个细分的赛道可行吗?

王建明:要看他做的数据是什么类型的数据,以及他能够给客户提供的数据维度是什么。如果它本身提供的数据的采集难度很大,而且提供的价值链条不仅仅是采下来的数据,还涉及到一些算法,甚至涉及到模型层的一些东西,那这个东西的价值贡献还蛮大的。

AI科技评论:中国好像没怎么听到数据公司。

王建明:从商业模式的角度来说,大家都会质疑在中国会不会有数据的生意的模式存在,因为过往并没有很成功的数据公司。但是如果不从这个维度思考,而是从具身智能本身行业的卡点来思考的话,那数据这个问题它值不值得被解决?并且解决这个问题的公司是不是有一个商业生态位?从这个角度去思考,答案是肯定的。

AI科技评论:数据的采集路径有哪些?壁垒高吗?

王建明:可以想象一下未来的机器人行业,它跟自动驾驶和现在的大模型都不一样。自动驾驶它的数据生产的过程是可以强烈的依靠在本体上面的,这个也是为什么像去年 VLA 很火的时候,大家是用模仿学习,所以大家会觉得我反正有大量的本体,把本体布出去,通过本体来采数据。这个路径就是典型的自动驾驶的思路,就是通过遥操设备去采集数据。

但现在大家发现这个方式采集数据的量、效率,包括质量都是有问题的。像今年世界模型也比较火,那它核心点就是做了数据生成式的东西,想通过生成式的东西来解决数据问题。最后是人的数据,维度还挺多的,包括人的形态的数据、人的视角的数据等等。

数据这个生意得要想得透,如果数据本身采集的壁垒很低的话,那很多做场景的公司依托自己的数据采集设备来搞就好了。如果数据采集的壁垒比较高的话,比如一套设备都几百上千万,还要很大的量,那这个肯定就是壁垒。做一个数据公司是不是就可以给行业带来很多的贡献?顺着这个角度去分析,就会发现一定会有数据公司的生态位在的。

AI科技评论:具身领域中所提的世界模型究竟是什么?

王建明:世界模型的定义很广,如果抽象出来它的一个定义,就是基于当下的观察,引入一个个影响因素,它去预测下一步的东西,下一步东西可能是下一帧的视频生成,可以是下一帧机器人动作的预测。定义是很广的,不同的人脑子里的世界模型也不一样。

从事机器人的人脑子里的世界模型一定是有物理的,有三维的。现在很多创业公司的世界模型只是一个视频生成的事情。

AI科技评论:感觉目前的世界模型还比较粗糙,它生成的数据真的能运用到机器人上吗?

王建明:今年世界模型是比较火,我没有做过很全面的关于世界模型的采访。我首先强调一下,我也不是那么懂世界模型。但是我之前有采访一些机器人领域学者,他们确实是世界模型的拥护者。

世界模型是一个比较终极的问题,这个问题短期内它还有很多的问题没有被解决,从落地的角度来说,它可能是一个更遥远的技术路径,需要在学术上面有很多的探索和突破,是一个需要尝试的路线。

AI科技评论:您对于想要入局的一些创业者或者从业者有什么建议吗?

王建明:对于年轻的创业者来说,我个人的建议是不着急。

可以先在大的创业公司里面,去把需要积累的资源给积累下来,比如人的资源、创业的小伙伴资源、投资人资源,包括整个行业里面合作伙伴的资源,同时积累对于创业这件事情的认知。

AI科技评论:为什么是创业公司?

王建明:因为在一个创业公司里面,是可以跟 1 号位比较接近的,可以侧面观察到创业的一些事情,把这个认知积累下来,同时再去加深一些对于这个行业的思考和观察,然后等待你能够把自己想要解决的问题给解决了的那个时间点的到来。

因为现在具身行业对于很多年轻的创业者来说需要去竞争,很多项目的创始人背景很好,可能要花大量的时间和力气去跟他们去 PK,拿投资人的钱。与其花这个时间,还不如先积累资源,等待这个行业的下一个拐点。(雷峰网(公众号:雷峰网)

04 GAIR 2025

2025年 12 月 12-13 日,由 GAIR 研究院与雷峰网联合主办的「第八届 GAIR 全球人工智能与机器人大会」,将在深圳南山·博林天瑞喜来登酒店举办。

今年大会,将开设三个主题论坛,聚焦大模型、算力变革、世界模型等多个议题,描绘 AI 最前沿的探索群像,折射学界与产业界共建的智能未来。

王建明机器人AI
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片