21 解读|百亿大模型浪潮背后:蔚小理的智驾组织哲学

21 解读|百亿大模型浪潮背后:蔚小理的智驾组织哲学
2024年06月24日 20:07 21世纪经济报道

大家都在瞄准端到端,用自己的方式奋力奔跑。

2023年,特斯拉FSD(Full Self-Driving,全无人驾驶)迎来重磅更新。在V12版本中,特斯拉成为率先在智能驾驶引入端到端架构的车企。 

特斯拉掀起端到端风暴,小鹏、理想、蔚来等车企也在迅速跟进,端到端大模型成为新的技术风口。据中商产业研究院预测,2023年,中国大模型市场规模将达到147亿元。

人人都想抓住机会。“当进入一个新的、以特斯拉为引领的技术周期下,我们不能以传统的时间去估算新技术产生的时间。”一位从业10余年的智驾人士告诉21世纪经济报道,“别觉得,谁花了多久,我们就得花多久。”

大模型冲刺下,高效的组织是驱动业务运转的关键。

21世纪经济报道获悉,蔚来近期对智驾团队进行了调整。蔚来单独设立了一个大模型部,专门负责端到端的模型研发;还成立“架构与方案解决部”,总体负责车端的项目交付。总体来说,“核心业务变成了两块,一块是云,一块是车。”一位接近蔚来的智驾人士总结。

在上述人士看来,新的智驾组织是一种“小步快跑”的方式,“研发快步往前走的同时,也能有常规的产品交付出来。”

去年年底,理想也为端到端模型单独成立了一个团队,放在“算法研发”团队下,由贾鹏负责。近期理想也在围绕端到端做封闭研发。

现在理想智能驾驶团队主要分成两个团队——算法研发、量产研发。

算法研发除了要负责端到端模型的研发,也要负责三季度无图城市NOA的量产。量产研发团队,主要维护已有车型上搭载的智能驾驶功能,由王佳佳负责。

相较于蔚来、理想的整合思路,小鹏的智能驾驶组织设计部门最多、分工也最精细,与数据相关的部门至少有3个,包括大数据、时空数据、美国平台支撑数据等。

从目前人员设置上来看,小鹏在智能驾驶上的人员相对充足,达3000人的规模,是蔚来的2倍、理想的近4倍。

总体来说,蔚来选择了“小步快跑”,理想选择研发和量产两条线并行,而小鹏则将组织划分得更为精细。

为了赢得高阶智驾的未来,大家都在瞄准端到端,用自己的方式奋力奔跑。

蔚来:研发快跑同时,产品也要交付

21世纪经济报道从蔚来内部公告及多位信源处获悉,近期,蔚来成立大模型部、部署架构与方案部、时空信息部,撤销原来的感知部、规划与控制部、环境信息部及方案交付部。

  •  大模型部门,主要负责端到端模型的研发工作,由原感知部门和规控部门下的模型部合并而来,负责人为彭超。
  •  部署架构与方案部门,主要负责和车端相关的整体算法研发、架构设计和功能交付,负责人为秦海龙。
  • 时空信息部门,则为原地图定位部,主要负责车端和云端的地图信息相关的算法、模型开发及服务,负责人为袁弘渊。
  • 以上均直接向蔚来汽车副总裁任少卿汇报。

架构调整后,蔚来智驾的核心业务变成了两块,一块是云,一块是车,分别由“大模型部”、“部署架构与方案部”负责。

蔚来认为车是一个交付品,但未来更大的算力主要发生在云端。所以‘车’负责目前的交付,‘云’则负责创造出一个本身更好的基础模型,去支持未来车端的迭代。”一位接近蔚来的车企高管称。

他表示,以前蔚来的风格更偏向用户、产品导向,技术人员“等着输入”;调整后,研发资源相对来说更集中,“整体上更加主动一些”。

“我们得找到一个适合自己的、小步快跑的方式”,上述人士总结道,在研发上快步往前走的同时,也能有常规的产品交付出来。

将部门打散、合并,最直观的表现便是向任少卿汇报的人数变少了,各大部门内的人数变多了

一位知情人士告诉21世纪经济报道,以前汇报给任少卿的人有“20个左右”,现在“减少了一半”。而他所在的部门经历拆分、合并,成为“部署架构与方案部门”之后,部门总人数相较于原来“翻了一倍”

蔚来取消原来按照功能模块划分的方式,取而代之的是以项目进行划分,“核心是为了产品化和交付”,一位蔚来高管称。

调整前,蔚来智驾部门的设置类似于原来L4公司的组织架构,按照感知、地图、数据、规控等模块进行分部门管理,再以项目为核心去串联起各个垂直的算法部门,进行交付。

在这种组织架构下,算法模块部门是实体组织,项目则是横向的虚线组织。

调整后,则是以项目为中心将涉及的各方都组合在一起。“相当于将原来的横向组织进行纵向化”,一位熟悉蔚来的车企员工告诉21世纪经济报道。

他解释道,在变革组织架构前,分模块管理的组织方式在融合上面“进展缓慢”。

以大模型部为例。

新成立的大模型部,主要由原来的感知部门和之前做规控算法模型的部门组成。原来感知和规控都是模块化的状态,感知模型中没有规控模型的底层算法,“感知模型不知道如何将信息更好地上车”,而合并之后,能够让感知模型上车这件事提速。

将各个模块的人以项目为核心组织到一起的好处便是做事的阻力更小了

以记忆泊车功能为例。

举个例子,在原来的架构下,如果要做记忆泊车这个功能,需要横向拉通多个算法部门,包括感知、规控、标定、测试等多个部门,对各部门的协作效率要求很高。而现在记忆泊车则作为“部署架构与方案部”下属的三级部门存在。

“原来推进项目要从各个部门找人做事,阻力相对多一些,现在研发资源相对来说会更充裕一些,思想上、整体行动上会更加主动,合作效率也要更高。”一位车企智驾部门的高管称。

以产品化、交付为核心合并组织,蔚来在进行一种新的组织实验。在这种组织实验下,原有的模块概念在被模糊,取而代之的是项目概念

以前的架构下,感知、规控、地图定位等是功能部门,有感知工程师、决策工程师等。但是新的架构下,这些称呼都不存在了,取而代之的是项目称呼,如泊车工程师、行车工程师、主动安全工程师。

“架构调整之后,立马适应这种项目称呼会很难,因为思想上有惯性。但大家在慢慢习惯。”蔚来员工称。

理想:算法研发和量产研发,两条腿并行

在感知决策一体化的自动驾驶模型UniAD得到学术界的认可之后,理想、蔚来都在同期开始探索大模型上车,招聘相关的人员。

21世纪经济报道曾了解到,去年7月、8月蔚来一直在市场上寻找大模型负责人,想从公司整体层面把大模型做成一个中台,去赋能各个相关的智能化团队,如智能座舱、智能驾驶等。

和蔚来思路不同,理想的想法是分开做——在具体的智能化环节上分别匹配大模型

2023年6月家庭科技日上,理想推出了座舱大模型Mind GPT。而至于将大模型应用于智能驾驶功能上,理想的思路是在感知、决策、规控、数据闭环等各个模块应用大模型。当时并未直接成立大模型团队。

去年8月,理想给智能驾驶各个环节招聘大模型相关的人才,“要求应聘者必须要有相关的大模型项目经验。这样的候选人很难找。”一位服务理想招聘工作的猎头曾向21世纪经济报道感叹道。

2个月之后的国庆节,理想一口气在官方招聘平台放出了50个智能驾驶相关岗位,其中有5个岗位和大模型相关。在布局大模型的同时,理想也在做基于高精地图的“城高一体化”(城市NOA和高速NOA的无缝衔接)以及无图版本城市NOA的量产落地。

2023年年底,理想对智能驾驶团队进行了一次组织架构调整,在这次调整中,理想将大模型重新组成一个团队,放在前端算法研发团队之下,整体负责端到端架构的研发、上车。

调整前,理想智能驾驶的组织架构和蔚来类似,都是根据自动驾驶各个环节,如感知、决策、系统、规控、数据闭环、量产等模块去进行人员架构的排布。

  • 感知团队由当年5月加入、阿里云背景的常黎(化名)负责,数据闭环团队则由英伟达、IBM背景的贾鹏负责,量产研发则由博世背景的王佳佳负责。

而调整后,理想的智能驾驶团队主要分成两大块:

  • 一块是算法研发团队,由贾鹏管理,主要负责前端算法的研发,包括无图NOA研发、端到端模型的上车,原感知负责人常黎向贾鹏汇报;
  • 一块则是量产研发团队,依然由王佳佳负责,主要负责老款车型上基于高精地图的高速NOA的维护,尽可能优化算法在落地过程中出现的问题。

今年5月,理想将无图版本的城市NOA向千名用户推送,6月推送了万人内测版本。“进步很大,虽然有些极端场景(corner case)要进行处理,但已经很不错了。”一位最近试驾了万人内测版本的业内人士告诉21世纪经济报道。

理想汽车CEO李想在6月初表示,会在今年三季度推无图版的城市NOA,最晚会在明年年初推送端到端+VLM视觉模型+仿真模型(世界模型)的智能驾驶体系。据21世纪经济报道获悉,目前理想汽车正在做端到端架构的封闭开发。

要达成这样的成绩并不容易,毕竟理想自研智能驾驶的时间比蔚来、小鹏晚了3年。

“去年理想的智驾中台不如蔚来,今年开始慢慢赶上华为了。现在理想两三个月就能做一次更新,感觉几个月干了别人好几年的活。”一位前蔚来智能驾驶员工这样感叹道。

小鹏:团队3000人,分工精细

全球率先将“端到端智驾大模型”量产上车的是特斯拉,而在国内,小鹏是首家量产上车端到端智驾大模型的车企。

投入早、投入重、组织架构较为稳定,是小鹏领先其他新势力的“三大法宝”。2017年9月,小鹏便开始自研智能驾驶软件算法,分别领先华为和理想1年8个月、3年5个月。小鹏2024年智能研发投入将在35亿元,每年算力投入超过7亿元,新招募人员4000人。

在蔚小理中,小鹏智驾的组织设计部门最多,分工最精细。

21世纪经济报道从知情人士处获悉,小鹏自动驾驶中心由10余个部门组成,包括产品研发部、架构、元件、系统开发部、整车项目、测试、仿真、大数据、时空数据、人工智能组、项目质量管理等,覆盖云端算法、车端到工程落地,负责人是李力耘,团队约由3000人组成。

“做得越精细,产出就越精细。”上述知情人士总结。

要想AI智驾汽车自主学习、模仿人类的驾驶经验,离不开海量的数据投喂。在小鹏智驾团队中,直接与数据相关的部门至少有3个,包括大数据、时空数据、美国平台支撑数据等,分工很精细。

在产出效果上,不同于完全一体化,小鹏的端到端大模型由神经网络XNet(眼睛)、规控大模型XPlanner(小脑)和 AI大语言模型XBrain(大脑)三个部分构成,能够提升智能驾驶的各项性能指标:

  • XNet 的感知距离提升2倍,能看清1.8个足球场面积,识别目标物50余个;
  • XBrain 能认识待转区、潮汐车道,还能读路牌文字,推测交通参与者意图;
  • XPlanner在复杂场景也越来越像老司机,顿挫、卡死、安全接管都减少将近50%。

“端到端智驾大模型体系下不是只有神经网络,实际上目前也没有任何一个玩家将整个体系完全AI化。”小鹏汽车CEO何小鹏解释称。

分工精细的另一面是横向拉通成本高。小鹏智驾团队的解决方法之一是成立专项。专项,就是把难解决的问题单拎出来,召集相关的产品、测试、研发人员组成小组,一起厘清主要矛盾,集中资源解决问题。

在北京开发无图智驾系统时,小鹏的智驾团队成立了几十个专项,白天测试,晚上开技术讨论会。第二天一早,研发人员会给出新的软件版本,测试工程师继续对软件变更点进行复测,直到稳定。

端到端的优势是能加速城区 NOA 等高阶智能驾驶功能的落地。

今年1月,小鹏XNGP已落地243座城市,提前半年完成目标。5月,何小鹏进一步透露,到2024年第三季度,小鹏汽车的目标是“全国都能开,每条路都能开”,2025年实现城区智驾比肩高速的智驾体验。

(21世纪经济报道记者郑植文对本文亦有贡献。)

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片