Meta、World Labs、Niantic Labs 和谷歌DeepMind 等团队近期均发布了各自的世界模型进展。这些世界模型所展示了前所未有的理解能力和构建虚拟空间的效果,为冷却的元宇宙回了一波温。
目录
01. 冷却的元宇宙热度又被世界模型拉回来了?
最近都有发了世界模型?世界模型+AR能让元宇宙回温吗?
02. Meta 对元宇宙的布局仍然有优势吗?
All in 的 Meta 有哪些技术储备?除了世界模型,Meta 还为元宇宙屯了哪些科技?
03. World Labs 的大世界模型会更有机会吗?
单图生成3D世界的项目早有预告?做LWM更有机会解锁AR元宇宙吗?
04. 谷歌或皮卡丘?还有哪些玩家有望先解锁 AR 元宇宙?
谷歌DeepMind 新发的 Genie 2 有多强?用宝可梦Go 训练的世界模型有什么优势?
01 冷却的元宇宙热度又被世界模型拉回来了?
1、ALL in 元宇宙的 Meta 经历了裁员、股价下跌、人员变动和团队拆分等一系列动荡。但在 2024 年初,Meta 在 AI 方面的突破为公司的股价回了一口血,也让扎克伯格对元宇宙+AI 双管齐下的策略更具信心。
2、扎克伯格曾表示,元宇宙是一个「具身的互联网」,目前 AI 领域发展迅速,但下一代的 AR、MR 和 VR 计算平台将提供真实的「在场感」,这将成为未来社交体验乃至几乎所有其他领域的基础。[5]
① 「在场感」强调了用户在虚拟环境的身临其境,以及可交互性。而这种虚拟的空间可以视为现实世界的一种复制或延展,与 AI 领域所追求世界模型所需的特征相重合。
3、Yann LeCun 作为最早开始推崇世界模型的研究者之一,他带领 FAIR 团队在 2024 年提出了一系列世界模型方面的进展。
① 2024年11月,LeCun 团队提出了一种可基于离线的轨迹数据集构建与任务无关的世界模型的方法,称为DINO-WM,用于在不重建视觉世界的情况下模拟视觉动态。
② 2024年12月,LeCun 团队发提出了NWM,这是一种能够在复杂环境中导航的世界模型,能在已知和未知环境中导航,执行路径规划;还能基于单张图像生成连续一致的视频。
4、除了 Meta,2024 年宣布创业的李飞飞团队同样计划开发世界模型,通过赋予 AI 空间智能以创建更真实、更具互动性的 3D 世界,根据其创业公司 World Labs 描述的路径,他们或许也会有机会先解锁 AR 元宇宙。
5、与 Meta 同为 AI 头部公司的谷歌 DeepMind 在 2024 年同样公布了团队在世界模型的突破。其在年初推出的世界模型 Genie 能够生成多种 2D 世界,而在 12 月 5 日发布的第二代 Genie 2 则实现了质的飞跃,能够通过单图生成可交互的 3D 世界。
6、除了 AI 巨头,知名 AR 游戏宝可梦 GO 的团队 Niantic Labs 也在 11 月提出了大型地理空间模型(LGM)的概念,虽然目前仅有一项概念验证的成果,但因为 LGM 与李飞飞提出的「空间智能」概念颇为相似,因而认为是先一步解锁 AR 元宇宙的有力竞争者。
02 Meta 对元宇宙的布局仍然有优势吗?
Meta 的 Reality Labs 部门自 2019 年以来已累计亏损约 465 亿美元。尽管亏损巨大,马克·扎克伯格并未放弃对元宇宙的投入。2024 年 9 月,Meta 发布了 AR 眼镜 Orion 和 Llama 3.2 版本,并强调后者补齐了公司的主流多模态储备,Yann LeCun 团队提出的DINO-WM和NWM等世界模型则进一步为其 AR 元宇宙的基础。
1、由图灵奖得主 Yann LeCun 领衔的基础人工智能研究团队 FAIR 是 AI 领域备受关注的明星实验室之一。2024 年 6 月,FAIR 在 Meta 的 AI 部门重组后并入了 Reality Labs,而前者的一系列技术储备也将更直接地为 Meta 的元宇宙设备增加智能性......
关注👇🏻「机器之心PRO会员」,前往「收件箱」查看完整解读
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)