世界模型才是自动驾驶唯一解？年度自动驾驶峰会同期世界模型技术研讨会议程出炉|无人驾驶_新浪财经

2025年1月14日，第四届全球自动驾驶峰会将在北京中关村国家自主创新示范区展示交易中心-会议中心举行。全球自动驾驶峰会由智一科技打造，已经成为国内自动驾驶领域最具影响力、规模最大的产业峰会之一。

本次峰会由智一科技旗下智猩猩、车东西共同发起，以“技术新周期产业新征程”为主题，计划邀请30+位嘉宾同台分享和讨论，全方位呈现自动驾驶端到端新周期里的科研成果、技术探索、产品方案创新与未来趋势。

峰会由“主会场+分会场+展区”组成，主会场将进行开幕式、端到端自动驾驶创新论坛，分会场将进行城市NOA专题论坛、自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会。其中，自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会为两场闭门会议，主要向持有峰会通票或贵宾票的用户开放。主会场与分会场外则设有展区。

作为本次峰会的两场技术研讨会之一，自动驾驶世界模型技术研讨会将在分会场二的下午进行，由主题报告和圆桌Panel两个环节组成。

目前，自动驾驶世界模型技术研讨会邀请到西湖大学工学院博导、助理教授、人工智能企业KMind联创兼首席科学家于开丞，商汤绝影智能驾驶高级总监武伟，DriveWorld一作、中国科学院计算技术研究所助理研究员闵称，Vista一作、香港科技大学在读博士、上海AI Lab OpenDriveLab实习研究员高深远，SimGen一作、上海交通大学计算机系2020级博士、上海人工智能实验室浦驾团队研究员周云松5位技术专家和青年学者带来报告。

于开丞老师将为本次研讨会带来开场报告。于开丞老师曾在阿里巴巴达摩院从事相关领域的研究工作，加入西湖大学后，负责组建自主智能实验室并致力于构建基于数据驱动世界模型为核心的的下一代自主智能系统。本次研讨会，于开丞老师将介绍自主智能实验室在构建基于世界模型的数据闭环方面的研究成果，也将探讨未来世界模型如何进一步助力实现更加自主的数据闭环系统。

2014年11月，商汤绝影「开悟」世界模型发布，是首个同时满足多视、长时、高分辨率、可控的自动驾驶世界模型。本次研讨会，武伟将深入解读商汤绝影“开悟”世界模型以及其长时、高分辨率、多视一致、可控等特性的实现方式，展示绝影「车云一体」数据闭环新范式。

中国科学院计算技术研究所助理研究员闵称博士曾提出自动驾驶世界模型DriveWorld、纯视觉自动驾驶预训练模型UniScene等。其中，DriveWorld的相关论文获得了CVPR 2024收录。闵称博士将以《从降低不确定性角度构建世界模型》为主题带来报告分享。

来自上海AI Lab OpenDriveLab的高深远博士将以《构建开放场景中通用自动驾驶世界模型》为主题带来报告。本次分享将着重介绍GenAD和Vista系列工作，为构建可在开放场景中泛化的通用自动驾驶世界模型提供了一条可行的技术路线。相关工作已先后被CVPR 2024和NeurIPS 2024接收。

周云松博士也同样在上海AI Lab OpenDriveLab从事研究工作，此次将以《基于仿真条件控制的自动驾驶世界模型》为主题带来报告。本次报告，将对收录于ECCV 2024的最新成果「SimGen」进行解读。SimGen通过混合来自模拟器和真实世界的数据来学习生成多样化的驾驶场景。

一、自动驾驶世界模型技术研讨会议程

二、技术研讨会报告人及报告主题介绍

1、西湖大学工学院博导、助理教授、人工智能企业KMind联创兼首席科学家于开丞

于开丞博士，西湖大学工学院博士生导师、助理教授，人工智能企业KMind联合创始人兼首席科学家。于开丞先后于2016年获香港大学工学学士（一等荣誉），2021年获瑞士洛桑联邦理工大学（EPFL)计算与通讯科学理学博士学位。其研究的主要方向为3D视觉、自动驾驶、自动机器学习等，并先后在因特尔智慧系统实验室（Intel Intelligent Systems Lab），Abacus.AI，阿里巴巴达摩院从事相关领域的研究工作。加入西湖大学后，其负责组建自主智能实验室（AutoLab）并致力于构建基于数据驱动世界模型为核心的的下一代自主智能系统。于开丞博士主持多个国家、省部级、校企合作项目，并作为首席科学家联合创办人工智能企业KMind。

报告主题：《通向自主数据闭环的自动驾驶世界模型构建》

内容概要：在自动驾驶领域，利用世界模型合成新数据已成为解决数据稀缺问题的事实标准。本报告将首先概述自动驾驶数据世界模型的最新行业进展。随后，我们将介绍自主智能实验室在构建基于世界模型的数据闭环方面的研究成果。最后，报告将探讨未来世界模型如何进一步助力实现更加自主的数据闭环系统。

2、商汤绝影智能驾驶高级总监武伟

武伟，商汤绝影智能驾驶高级总监，负责商汤绝影云端技术体系建设，专注于构建大算力、大模型、大数据三位一体基建工作，曾带领团队荣获Waymo Sim Agents自动驾驶算法挑战赛、VOT视觉目标跟踪挑战赛等多项世界级竞赛冠军。

2024年11月，商汤绝影「开悟」世界模型全新升级发布，是业内首个同时满足多视、长时、高分辨率、可控的自动驾驶世界模型。依托商汤绝影云端基础设施打造的自动驾驶系统，现已落地应用于广汽埃安、一汽红旗等多款量产车型，助力智能驾驶体验的升级与优化。

武伟已在TPAMI、CVPR、ICCV、ECCV、NeurIPS等平台发表超50篇顶级会议/期刊论文，谷歌学术引用次数超14000次，多个算法被收录入OpenCV标准库。

报告主题：《「开悟」世界模型打造智驾「车云一体」数据闭环新范式》

内容概要：数据闭环一直是自动驾驶研发上的重要环节，以往基于高精度传感器的数据采集和基于量产车的数据闭环都存在不少问题，需要全新的解决方案。近年来，多模态大模型的技术突破带来了自动驾驶世界模型的快速发展。在本次研讨中，将介绍商汤绝影“开悟”世界模型以及其长时、高分辨率、多视一致、可控等特性的实现方式，展示绝影「车云一体」数据闭环新范式，也会探讨世界模型的下一步发展方向和应用前景。

3、DriveWorld一作、中国科学院计算技术研究所助理研究员闵称

闵称，中国科学院计算技术研究所助理研究员，2024年毕业于北京大学计算机学院，获得博士学位。主要研究方向为自动驾驶和具身智能等。在CVPR、ICCV、ICRA、IROS、RA-L等人工智能和机器人顶级国际会议和期刊上发表论文10余篇。担任IEEE-TIP、ECCV、ICRA、RA-L等期刊或会议审稿人。入选2024年度“CCF智能汽车分会青年激励计划”。获得跨越险阻无人车挑战赛一等奖。提出自动驾驶世界模型DriveWorld、纯视觉自动驾驶预训练模型UniScene等。参与国家自然科学基金、科技委重点项目等多项国家重点研发项目。

报告主题：《从降低不确定性角度构建世界模型》

内容概要：智能体面临两种不确定性：认知不确定性和随机不确定性。认知不确定性源于信息或知识的不足，可以通过获取更多信息来减轻或解决；而随机不确定性则源于真实世界的随机性，例如对未来可能性的预测。随机不确定性无法完全消除，但可以通过评估不同结果的概率来应对。对于自动驾驶而言，理解并有效建模这两种不确定性对安全决策至关重要，因为驾驶过程中需要应对不完美的感知数据并准确预测未来场景。本报告将从降低不确定性的角度出发，构建能够同时建模认知和随机不确定性的世界模型，以提升自动驾驶系统的性能和可靠性。

4、Vista一作、香港科技大学在读博士、上海AI Lab OpenDriveLab实习研究员高深远

高深远，香港科技大学电子与计算机工程系在读三年级博士。研究兴趣主要围绕具身智能和自动驾驶场景中的世界模型。曾在CVPR、NeurIPS、ECCV以第一作者身份发表多篇论文，并担任TPAMI、ICLR、ICML、NeurIPS、CVPR等期刊会议的审稿人。

报告主题：《构建开放场景中通用自动驾驶世界模型》

内容概要：世界模型是真实世界的模拟，可以预测不同行动对应的未来状态，并反馈给智能体的训练和决策过程。在自动驾驶领域，世界模型具有解决高效错误重放、合成数据生成以及增强决策鲁棒性等核心问题的巨大潜力，受到了学界和业界越来越广泛的关注。

本次分享将着重介绍GenAD和Vista系列工作，为构建可在开放场景中泛化的通用自动驾驶世界模型提供了一条可行的技术路线。相关工作已先后被CVPR 2024和NeurIPS 2024接收。

5、SimGen一作、上海交通大学计算机系2020级博士、上海人工智能实验室浦驾团队研究员周云松

周云松，上海交通大学计算机系2020级博士，吴文俊人工智能荣誉班成员，上海人工智能实验室浦驾团队研究。CVPR、ICCV、 NeurIPS、ICLR等国际会议审稿人，CVPR 2023及2024自动驾驶workshop主办人。研究方向为生成式模型，具身智能（自动驾驶、感知）。已以第一作者身份发表7篇CCF-A类国际学术会议与期刊（包括TPAMI，CVPR，NeurIPS）。曾获得NeurIPS的Spotlight论文，国家奖学金，腾讯奖学金等荣誉。

报告主题：《基于仿真条件控制的自动驾驶世界模型》

内容概要：可控的合成数据生成可降低自动驾驶研发中训练数据的标注成本。在本工作中，我们提出了SimGen，它通过混合来自模拟器和真实世界的数据来学习生成多样化的驾驶场景。SimGen在保持基于文本和模拟器布局的可控性的同时，实现了卓越的生成质量和多样性，并作用于数据增强，危险场景生成，闭环评测等应用。

三、峰会报名进入最后阶段立即抢票参会

自动驾驶世界模型技术研讨会是第四届全球自动驾驶峰会的两场闭门制技术研讨会之一，将在分会场二的下午进行。另一场闭门制技术研讨会是自动驾驶视觉语言模型技术研讨会。研讨会主要向持有峰会通票或贵宾票的用户开放。

除了通票、贵宾票外，大会也开放免费票申请（需经主办方审核通过）。不过，持有免费票，无法参加两场闭门制技术研讨会，仅可以参加主会场以及分会场一的城市NOA专题论坛。有需要的朋友可以申请。敲重点！免费票不能参加自动驾驶世界模型技术研讨会哦～