听得懂、看得见、找得到!理想汽车下一代自动驾驶架构MindVLA亮相

听得懂、看得见、找得到!理想汽车下一代自动驾驶架构MindVLA亮相
2025年03月18日 11:42 快科技

快科技3月18日消息,理想汽车自动驾驶技术研发负责人贾鹏在NVIDIA GTC 2025上发表演讲,分享了下一代自动驾驶技术MindVLA的最新进展。

据悉,MindVLA是理想全栈自研的机器人大模型。

该模型整合了空间智能、语言智能和行为智能,旨在将汽车从单纯的运输工具转变为贴心的专职司机,它能听得懂、看得见、找得到。

该技术基于端到端和VLM双系统架构,通过3D空间编码器和逻辑推理生成合理的驾驶决策,并利用扩散模型优化驾驶轨迹,整个过程需在车端实时运行。

MindVLA采用3D高斯作为中间表征,利用海量数据进行自监督训练,显著提升下游任务性能。

其LLM基座模型采用MoE混合专家架构和稀疏注意力技术,确保模型规模增长的同时不降低推理效率。

此外,MindVLA通过Diffusion模型将动作词元解码为优化轨迹,并结合自车行为生成和他车轨迹预测,提升复杂交通环境中的博弈能力。

该技术还基于自研的重建+生成云端统一世界模型,实现大规模闭环强化学习,优化场景重建与生成效率。

MindVLA赋能的汽车可通过语音指令改变车辆路线和行为,车辆还能通过照片识别用户位置并自主寻找车位。

这一技术不仅将重塑用户体验,还将重新定义自动驾驶,为汽车行业和人工智能领域带来深远影响。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:王略

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片