对话小马智行彭军:不要迷信大模型,自动驾驶格局已变

对话小马智行彭军:不要迷信大模型,自动驾驶格局已变
2024年07月03日 17:13 极客公园

摘要

一家志在攀登「珠峰」的科技公司,学习如何商业闭环的故事。

小马智行的故事,是一类中国科技公司的缩影:在面对巨大变革的浪潮时,他们不断挑战技术和工程的极限。这样的旅程充满了不确定性和巨大的投入,不是辉煌的成功,就是惨痛的失败。

然而,要实现如此激动人心的目标,过程是异常艰辛的。随着外部环境的冷热交替,资本市场的不断开合,自动驾驶也经历了从风口浪尖到低谷的剧烈变化。

但很多人可能未曾留意,小马智行们已经从小规模商业走到大规模量产的前夕。

小马智行开启北京大兴机场至北京亦庄之间自动驾驶载人示范 | 图片来源:小马智行小马智行开启北京大兴机场至北京亦庄之间自动驾驶载人示范 | 图片来源:小马智行

小马智行是彭军和楼天城的第一次创业,之所以选择在自动驾驶赛道开启这次创业,并不是源于某种商业推理的逻辑,而是源于一种大趋势到来时的时不我待。彭军回忆创业瞬间时说,他不知道实现L4要多久,但就是觉得这件事情值得做。

在创业的初期和随后的几年里,L4一直是他们的「原力」和「定海神针」。在美国,自动驾驶市场主要还是谷歌、通用Cruise以及车厂等巨头的游戏;但在国内,自动驾驶是从「黄埔军校」——百度开始,随后不断出走、裂变、再裂变,形成了一张充满活力的中国自动驾驶创业版图。当然,这其中也少不了复杂的结盟与背叛,闹剧、谎言和绯闻。

然而,小马智行似乎并未受到太大影响,保持了自己的节奏和定力。深入了解小马智行,我们听到最多不是融资、新概念,而是对「以终为始」和「规模化」的持续关注。多年来,小马智行都给人一种武林「扫地僧」的感觉。

当然,创业的路上也充满了意外和挑战。彭军在创业前,觉得创业就是一直朝着目标冲。但他后来意识到,短期和长期目标之间并不是一条直线,就像攀登珠峰需要建设6个营地一样。这是他创业最大的感触。

疫情的突然来临打乱了原本的计划,他们做了很多调整,包括开始尝试乘用车L2业务,开始销售一些硬件产品。同时,也开辟了Robotruck的业务条线。

小马智行一直是一家典型的技术驱动型的公司,推崇工程师文化,信仰用技术改变世界。这种信念不仅体现在公司的愿景中,也融入了每个员工的工作和思考方式。今天中国有不少有科技公司,但真的相信技术能带来核心价值的人并不多。

在北京亦庄的小马智行办公室里,极客公园见到了彭军。他给人的感觉是一个内敛的人,交流中没有那么多激情四溢的语言,很容易被看作典型的工程师。然而,他所做的事情却充满了「梦想家」的气质,这种气质也深深植入了小马智行的企业文化。

如今,小马智行已经走过了创业的「少年期」,正进入「青春期」。回顾这八年的创业历程,小马智行有着自己的坚持和变化:不变的是出发时的愿景、目标,和以始为终的思考方式;不断变化的,则是他们灵活调整的短期目标。最新的挑战是到2025年实现规模化,然后等待技术与市场的交汇点。

勤工俭学的大二学生

极客公园:小马智行从2016年成立到现在过去8年了,经历了许多关键时刻。在你看来,如今在中国的自动驾驶行业,已经走过了婴儿期吗?

彭军:对,婴儿期已经过去了,现在正处于青春期。目前,小马基本上可以说已经在大学上了一两年级,目前在勤工俭学。虽然还没毕业,但个人世界观和价值观已经形成,知道自己喜欢什么,努力的方向在哪。不过,未来能否找到最理想的工作,还是未知数。

极客公园:回到创业的那一刻,很多人都会有一些梦想或使命的驱动。当时你决定离开大厂创立小马智行,是因为大厂不追求L4这个目标吗?

彭军:不是不追求目标,而是大厂动作太慢了。大公司病、政治斗争,各种问题导致进展缓慢,不如自己做得快。

极客公园:小马智行一开始是坚定地要做Robotaxi,还是先追求L4技术,然后选择了Robotaxi这种商业模式?

彭军:应该说是后者。从终局来看,L4技术在前期能够实现规模化应用定制的,一定是Robotaxi。因此,我们坚定地选择了Robotaxi,当然后面的驱动力是L4技术。

极客公园:你当时觉得多快能实现目标?有没有大致的时间框架?因为融资、团队搭建和业务成长线都需要有一个预期?

彭军:说实在,要做多久我不知道,就是觉得这件事情值得做。从终局来看,Robotaxi行业是机器代替人,那么它的规模会很大。无论是五年还是十年,做到行业头部一定有价值。因此,我们最早融资时,并没有跟投资人说明确的时间预期,而是说我们能做到行业头部,可以引领行业发展。

极客公园:我们管这种叫顶尖创业者的「逻辑轮融资」,算不出具体数据,主要看逻辑和候选人。从天使轮到A轮,小马大概拿了1亿美元融资。那个时候,你是如何规划业务预期的?

彭军:自动驾驶的不确定性很大。早期还是希望技术先成熟,因此A轮甚至到B轮前期,基本都是在拼技术。这就像制药行业,研发一个药需要十年时间,但早期至少能在动物实验中看到效果。所以当时我们希望尽快把技术进展展示出来,因为商业的路径还是很长。

极客公园:那当时技术进展体现在哪里?比如说从几台车到100台车?

彭军:关键不在于数量,而是安全性、接管率和复杂场景处理能力。说到底,从100、500到1000台,在技术不成熟之前并没有本质区别。从A轮末期和B轮初期,大家关注的是乘车的体验、能力,不只是看简单的功能,更重要的是处理复杂场景的能力。

极客公园:在那个时代,如何保持技术足够的领先?跟大厂有什么不同?

彭军:最大的不同其实是团队合作。自动驾驶是一个复杂的系统,不可能靠「一招鲜」实现。就像医生看病,不是头疼医头,而是需要系统性调养。有时表面上看是规划的问题,实际上可能是感知或预测的问题。我觉得整个团队的协同能力,不甩锅的能力是最关键的。

很多人宣传端到端技术多厉害,实际上背后有一整套体系支持。同样用端到端,只有特斯拉做的好,其他人效果一般。所以特斯拉用不用端到端其实不重要,就是他做得好,所以端到端就牛逼了。

L2 的问题在没做出用户可感知的差异化

极客公园:你最开始决定做Robotaxi时,肯定也考虑过L2相关的技术和产品,但没有选择它。是因为当时大模型还没有出现吗?

彭军:其实,端到端自动驾驶在2016、2017年就已经被提及,只是当时技术不够成熟。我们也做过很多探索,大概在两三年前,很多端到端的技术我们已经在使用。

现在回想起来,我们的创业出发点与很多人有些不同:对我们来说,创业是为了实现自己的追求,而不是为了创业而创业。当时我们认为自动驾驶很有价值,创业是为了实现用机器代替人类驾驶,所以最开始没有选择L2。

极客公园:L2不值得你投入如此大的精力?

彭军:对。很多人觉得L2的市场有吸引力,但我觉得天花板太低。即使中国一年有2000万辆车,每辆车装配L2技术的价格在几千元。即使装配率达到100%,整个市场规模不是特别大。而且很多主流车企都选择自研,十几家供应商平均份额可能只有几百万辆车。加上要承担的风险,我觉得不值得投入太大精力去做。

极客公园:那回到疫情这几年,全球的融资环境并不好。在那段时间内,如何调整团队的目标?

彭军:在这个时候,我们进行了许多调整,尝试了很多新的策略和调整。最初我们认为Robotaxi三五年就能大规模商用,但疫情期间,我们意识到可能还需要五六年的时间。但作为一家公司,那时候已经成立了四五年,我们需要学会如何商业化,即使这并非Robotaxi的商业化。那个时候,我们开始涉足L2业务,开始销售一些硬件产品。

极客公园:如果说天使轮、A轮关注逻辑,然后B轮关注技术。那2020年左右小马进入到C轮融资,就需要看看这个技术能不能带来一些收入。在Robotaxi还没有商业化的时候,你们选择了L2++业务。它对技术的发展会有帮助吗?

彭军:最大的帮助,是使得大家能够更清晰地知道应该做些什么,以及整个商业化过程中可能需要经历的事情。特别是对于公司里一些纯技术高管来说,他们可能没有闯荡过真实的商业世界。

我不指望L2++业务能立刻养活我,但很多体系建设、跟车厂的合作能力和合作方式,这对将来L4也是必需的。

极客公园:在L2领域,你们对客户选择有特定的策略吗?

彭军:我们主要是做L2++,一些复杂的功能,更偏向城市高级驾驶辅助系统(NOA)。因为高速NOA的功能谁都能做,跟友商卷价格,我们无法赢过他们。我们更擅长处理城市中最复杂路况的处理能力,这是我们能做得比任何人都好的地方。

极客公园:目前L2市场本身就有限,但部分客户还在自研,如何看待这种现象?

彭军:说到底,今天的L2产品很难做出用户感知的差异化。你可以说他每小时接管一次,你每3小时接管一次,或者他开5个城市,你开20个城市,但用户感受不到这些区别。

极客公园:我觉得自动驾驶的问题是,车厂们都觉得有希望,而自动驾驶公司都感到绝望,本质上是技术没做到位。那么,如何实现差异化呢?

彭军:目前有一些迹象,部分车厂正在逐步放弃,认为自己做不了。

因为自动驾驶公司和传统车厂对文化和组织架构的要求不同:对车企来说,供应链管理是核心竞争力,但在技术发展方面可能就不行了。如果为了自动驾驶,要建立一个新的技术团队和内部文化是很难的。事实上,在大公司工作过的人都知道,找外部供应商要比内部合作容易得多。

极客公园:那有什么因素会加速车厂放弃全栈自研,而转向分工体系?

彭军:一般来说,基础能力车企会找供应商,差异化部分要自己建。完全放弃自研不太可能,那车企就没有可以宣传的亮点了。他们仍然需要进行差异化的开发,所以会自己找团队来建设这些能力。这就类似于安卓这样的汽车操作系统,车厂在上面做很多定制APP。

极客公园:小马智行有三个业务板块:Robotaxi、自动驾驶卡车(Robotruck)以及乘用车智能驾驶领域(POV)。这三块业务的商业化进展如何,预计哪块会走得更快一些?

彭军:我认为,乘用车L2+业务商业化速度最快,但是天花板偏低,后劲不足。相比之下,Robotaxi的天花板足够高,技术比较难但实现后价值巨大。因此,我们的主要发力点依然是在Robotaxi上。

至于Robotruck,与Robotaxi在技术上有相通之处,但在业务逻辑和应用场景上也有很大的不同,需要去找布局。不过,Robotaxi的大规模商业化速度肯定比Robotruck快得多。

所以,小马商业化的节奏应该是这样:勤工俭学是L2++,真正的主力职业是Robotaxi和Robotruck,但从长远来看,还能在干线物流领域创造更大的社会价值。

极客公园:这跟很多人的认知好像不太一样?

彭军:很多人可能不理解,实际上关键在于市场接受度和安全性能的要求不同。Robotruck要做一个Demo很容易,但要将其真正产品化,比起Robotaxi来说难度要大得多。

举个例子,人类司机在城区大约每2-3万公里发生一次事故,而卡车司机在高速公路上可能需要驾驶30万公里才发生一次事故。换言之,卡车在高速公路上的安全性是城市驾驶的10倍。因此,要做好Robotruck,至少需要达到Robotaxi的10倍安全性能,这在技术和实现上都是极大的挑战,但是我们做到了。

极客公园:如果一家公司选择的路线是,主打跟人一样的安全性,但成本下降呢?

彭军:即使安全达到跟人类司机相似的水平,也是困难重重。技术的实现不仅仅是AI的问题,还包括控制精度、天气、环境等多重因素。同时,即使AI技术可以达到10倍的安全性,AI与车辆的整合是否能达到这个水平还是个未知数。

Robotruck的技术入门低,但要做到及格很难。很多人只看到易上手的一面,但是要在高速公路上做到真正精通,处理的问题远比城市驾驶复杂。在高速公路上,并不是很多人想象的没有人,它也需要处理各种复杂情况。

极客公园:那到底Robotaxi为啥反而更容易呢?

彭军:实现Robotaxi到处通用确实很困难。但它的优势在于,只要在几个城市能够运营,就已经有了商业价值,形成商业闭环也更为容易。作为出租车公司,我可以在北上广深等大城市运营大量车辆,这本身就是一个巨大的市场。相比之下,货运公司不覆盖全国主要干线就没有商业价值。

极客公园:就是闭环的门槛不能太高,否则会成为不断烧钱的过程?

彭军:所以我不需要追求无图的方案,因为不需要在全国范围内运营。在一个城市内,出租车司机都是带图的。因此,我觉得我们讨论技术时不能脱离商业逻辑。

极客公园:很多人提到,高精度地图方案的成本很高?

彭军:大家有时混淆了一次性成本和维护成本。为什么高精地图昂贵?因为更新和维护成本高。对地图供应商来说,要做到全国实时更新,需要大量的人力、车辆,所以成本很高。

但对小马来说,如果在北京有5万辆车在路上,每天都返回数据,那我的地图就是最新的,并没有额外的成本。

大模型给AI圈来了场「全民健身」

极客公园:最近这两年,大模型技术在自动驾驶领域也开始应用。特斯拉的端到端技术加入后,接管率明显下降。那端到端对智能驾驶是有多大的助推?

彭军:我认为至少对L2有很大推动作用。说到底,端到端、数据驱动结合大模型,能够大幅降低开发成本并提升通用性,对用户体验和技术迭代都有很大帮助。例如,很多车企过去需要一个一个城市去开放,如果我买一辆车,只能在十个城市使用,其他地方不能用,这种用户体验很差。但端到端很好地解决了通用性问题。

极客公园:您提到端对端对L2有很大帮助,但对L4作用不大,L2技术无法渐进到L4,是因为L4更复杂吗?

彭军:不是更加复杂,而是要求不同:对于L2来说,核心是低成本和通用性,而端到端技术很好地解决了这两个问题。L2对安全性的要求达到一定高度即可,比如每半小时接管一次,用户已经觉得很好。

但对于L4而言,核心是足够的安全性,之后再考虑通用性。Robotaxi的核心诉求是在足够大的有限区域内(比如几个城市),能实现比人类司机高十倍的安全性。

打个比方,通过端到端,可以培养一个略逊于人类司机的驾驶系统,它通用性很高,能在各种环境中行驶,但时不时会犯错。所以,我们在L4技术中也会使用端到端技术,它对新城市的早期拓展有很大帮助。但我们还需要在此基础上进行许多其他优化,仅靠端到端是无法实现L4目标的。

小马智行在亦庄开启无人自动驾驶出行服务(Robotaxi)运营 | 图片来源:小马智行小马智行在亦庄开启无人自动驾驶出行服务(Robotaxi)运营 | 图片来源:小马智行

极客公园:我觉得现在很多大模型公司打的是乱仗,数据、算法、工程、产品从第一天就必须捏在一起,否则就不work。您认为这会对自动驾驶的组织形态产生影响吗?

彭军:短期内不会。核心原因在于驾驶和大模型不完全相同,尤其是与大语言模型不同。

大语言模型追求的不是底线足够高,而是上限足够高,可以容忍某些方面的偏差。比如大语言模型可以文生图、视频,100个视频中只要两个可用就很牛逼。

但对Robotaxi来说,开100次车有一次出问题就是大麻烦了。它需要底线足够高,可解释性和可重复性要求都很高。所以,我们在大模型之上需要做很多额外的工作,确保系统不会低于这个底线。

极客公园:如果量化一下,你觉得大模型对自动驾驶实现L4的进程会缩短多少年?

彭军:智能驾驶过去的技术栈过于复杂,没有五到十年的积累很难有所突破,但现在两年的时间就可以完成通向通用性认知的过程,这是核心的变化。就像医生培训的时间从十年缩短到六年一样,大模型技术让人们更容易进入这个行业。

这可能是最本质的变化。大模型技术相当于AI圈的全民健身运动,提升了国民的身体素质。虽然这些人还不能立即成为职业运动员,但让国家队选择的范围变大了很多。

极客公园:马斯克在8月8日宣布推行Robotaxi计划,您怎么看待这件事?

彭军:我猜测马斯克更可能是推行Robotaxi的计划,而不是立即推出Robotaxi产品。如果他要做L4,那一定是一个新的产品线,这有可能,但他不可能用L2技术直接升级到L4。

极客公园:今年5月,Waymo宣布其Robotaxi出租车服务在三个城市每周完成超过5万次付费出行。这个水平如何评价?

彭军:在我看来,这个并不重要。大厂内部有自己的指标和需求,需要向领导展示成绩。在毛利没有偏向正之前,铺的量越多亏损越大。因此,我的追求不在于开始量产后就盲目增加规模,那会是在浪费钱。

这个指标不是我要对标或追求的,我更关注的是车辆数量能否产生足够的数据,支持技术迭代和验证我们的运营效率,而不是过分迎合短期目标以取悦老板。

不能把KPI拆得过细

极客公园:在硅谷,很多创业者先谈Why,然后在谈How、What。目前来看,你们团队的技术迭代速度明显高于大厂,核心原因是啥?

彭军:表面上看,我们的车在复杂场景下的处理能力显然很好,但真正的核心在于背后的体系建设。

自动驾驶技术本质上并不高深,就是不断解决路上遇到的问题。但这项技术之所以复杂,是因为有很多权衡取舍(trade-offs)。比如开车时,如果这个弯没拐好,可以拐大一点,但这可能会引发更多问题。最大的难点在于副作用很多,就像治病一样,用药多了会有副作用。我把肝治好了,但肾不能坏掉。

极客公园:掌握这个度非常困难,这也是自动驾驶面临的挑战。那从组织上如何实现整体把控呢?

彭军:为了实现这一点,在组织架构建设就不能像某些大厂那样过早地拆分KPI。中国一些大厂在组织体系上很强,比如数据驱动和流量驱动的业务上表现非常好,是因为他们能够层层拆分KPI,每个团队都有自己的目标。

然而,自动驾驶领域也需要拆分KPI,但如果拆分得太细,反而会适得其反。一个KPI指标表现很好,可能会导致其他指标下降。

所以,最终不是一个拆分KPI的过程,而是大家整体来背KPI的过程。比如我们可能为了优化车辆变道能力,会组建一个专注于变道的虚拟团队,让感知、规控等人员都加入其中。这些团队在一段时间内的绩效指标会集中在变道方面,但他们又能在各自领域内协调资源。

用户搭载小马智行的无人化测试车辆 | 图片来源:小马智行用户搭载小马智行的无人化测试车辆 | 图片来源:小马智行

极客公园:所以就是相当于纵向组织建立起横向联系,各个团队都能理解其他团队?

彭军:对。我们的组织架构,特别是研发体系,一直倾向于这种网格状的结构,同时有垂直团队也有横向团队。所以,与很多公司不同,小马每个员工可能有不止一个老板,可能同时有两三个。所以一开始有些人确实适应不了。我常常看到这些文章,说新人跨级汇报是职场的大忌,但小马却非常鼓励。

极客公园:这其实对人本身是一种挑战?

彭军:是的。因为我们不是单一目标优化,而是要多目标优化,甚至几个业务指标之间是有冲突的,而且在不同事务上有不同的老板来负责。这对人提出了很大挑战。有些人很聪明、很有能力,最后却因为这个原因不开心而离开。

极客公园:小马已经成立八年了,你对于L4的判断有过什么样的变化或调整吗?

彭军:大方向和使命应该没有变化,但在一段时间内,我们的关注点会不断进行小调整。我们坚持用终局思考,基本上还是沿着原路坚定地走下去,当然走的路程充满曲折。

极客公园:你说的曲折,是指什么呢?

彭军:曲折,应该是说当你要把长期目标拆为可控制的短期目标时,它一定不是一条直线的。

这个话题其实很有意思,我在创业之前从未考虑过,但创业后感触很深。创业就像爬山一样,如果你的目标是攀登珠穆朗玛峰。走了很久,你告诉团队目前只爬了一半,所有人都不会喜欢那样。

真正的创业者,不仅仅要设定攀登珠峰的最终目标,更重要的是如何在中途建立六个前进营地。因为攀登珠峰就是经过六个营地,才能最终登顶。特别是自动驾驶这种没有人做过的领域,这些营地需要自己去建立,实际上是更加困难。这也是对一号位、二号位最具挑战性的部分。

当下最紧急的是规模化

极客公园:目前来看,Robotaxi 的成本比人低一半,你觉得未来这种比例还会下降吗?

彭军:今天目标并不是追求进一步降低这个比例,而是实现规模化。之前的许多努力已经证明了这种模式的可行性,但现在缺乏足够的资源和政策支持来大规模推广。

极客公园:要实现规模的增长,总需要一些动力来推动,成本继续下降是一种很好的方式吗?

彭军:基本上目前的成本效率已经接近极限了。实现规模增长并不是一推动二、二推动三,而是一个相互踩跷跷板的过程。只要经济效益、安全性都足够高,就会有更多人愿意尝试,政策支持也会增加,更多车厂愿意合作生产,这样就能推广到更多地方,最终形成滚雪球效应。

极客公园:所以,目前阶段只是算直接成本。那如果我们设想一个比较乐观的预期,未来18个月内,Robotaxi的规模会达到什么水平?

彭军:整个行业会超过一万辆。我们的目标是在未来两年内达到几千辆

极客公园:在走向Robotaxi的过程中,小马的商业模式和定位是如何设计的?

彭军:如果展望未来5到10年,小马的核心还是提供虚拟司机。从商业模式上看,我们既可以通过第三方平台获客,也可以有自己的平台,两者可以互补。至于如何分成,只要合理都是可以的,有更多的获客端其实是有利的。

同时,为了让这个虚拟司机更好地发挥作用,我们会做很多定制化工作,比如参与车辆的生产过程,以及出租车的运营。

极客公园:从长期来看,你们的商业效率如何?你们对未来的利润和毛利有过推演吗?

彭军:假设我们提供的虚拟司机,一年能够节约的成本是 10 万元,这已经是巨大的市场。

这些都基于我们有几个核心判断:因为安全性、法规,Robotaxi的门槛其实是很高的。即使在十年后,Robotaxi也不会变得烂大街。只有少数长期投入的公司才能做到这一点。因此,只要我们能比人类司机便宜20%到30%,就具有很大的竞争力。另外,从长期来看,人类司机的数量肯定是越来越少,价格一定是越来越高的。

小马智行与丰田联合开发的铂智4X Robotaxi概念车 | 图片来源:小马智行小马智行与丰田联合开发的铂智4X Robotaxi概念车 | 图片来源:小马智行

极客公园:在当前阶段,什么是小马最重要和紧急的事情?

彭军:我认为最重要和紧急的是实现规模化。这个过程其实非常复杂,如果在拆分一下的话,我的核心目标是确保毛利为正,这是最重要的指标。

极客公园:很多厂商提到局部城市能够实现毛利为正,你怎么看呢?

彭军:设定指标有很多方式,但我认为不需要欺骗自己。有些公司宣称很快就能实现毛利为正,但实际上他们可能隐藏了很多成本,并未计算在内。

我们的团队目标是要坦诚地将所有成本计算在内,实现真正的毛利为正。毛利为正,就意味着你的业务被认可为资产、生产工具,可以用来获得银行贷款等支持。

极客公园:那当你的业务上量,毛利开始转正,如何面对大厂的竞争?我觉得这是创业者都会面对的一个问题。

彭军:大厂拥有显著的资源优势,但也面临着自身的劣势。特别是在涉及到前沿技术和创新,或者短期目标不明确的时候。

同时,在早期技术不够深的时候,大公司可能通过高薪挖几个人一拼就可以了,这在中国以前也发生过很多次。但现在自动驾驶技术发展已经到了一个新的阶段。自动驾驶技术的发展已经足够复杂,不再是简单地挖人就能解决的问题,而是需要更复杂的体系和更深的技术积累。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片