安装新浪财经客户端第一时间接收最全面的市场资讯→【下载地址】

Sora 证明特斯拉的思路是对的,而特斯拉证明 Sora 的价值不止是生成视频。
来源:极客公园
作者 | 曹思颀
Sora 推出,马斯克可能是心情最复杂的一个。不仅因为其本人与 OpenAI 早年的纠葛,更因为 Sora 实现的其实是特斯拉早几年间一直在探索的方向。
2 月 18 日,马斯克在科技主播 @Dr.KnowItAll 一条主题为‘OpenAI 的重磅炸弹证实了特斯拉的理论’的视频下留言,称‘特斯拉已经能够用精确物理原理制作真实世界视频大约一年了’。
随后他在 X 上转发了一条 2023 年的视频,内容是特斯拉自动驾驶总监 Ashok Elluswamy 向外界介绍特斯拉如何用 AI 模拟真实世界驾驶。视频中,AI 同时生成了七个不同角度的驾驶视频,同时只需要输入‘直行’或者‘变道’这样的指令,就能让这七路视频同步变化。

当然,这不意味着特斯拉早在一年前就掌握了 Sora 的技术,毕竟特斯拉的生成技术只用于模拟车辆行驶,而 Sora 能够处理的环境、场景、Prompt、物理规律等信息更加复杂,二者在难度上不可同日而语。
但特斯拉 AI 和 Sora 训练的思路是一致的:并不是训练 AI 如何生成视频,而是训练 AI 理解和生成一个真实的场景或者世界,视频只是从某一个视角观察这个场景的一段时空。这是两家在现有业务上完全不同的公司,以彼此不同的方法来感知真实世界,而他们共同希望通向的,都是 AGI(通用人工智能),甚至更具体一些,就是具身智能和智能体。
理解这个观点的核心,是理解 OpenAI 为 Sora 赋予的使命,并不只是替代视频生成的创作者,而是将视频生成作为帮助 AI 理解真实世界的‘模拟器’。如果说特斯拉数以百万计的车辆仍然需要用‘肉身’感受这个世界,那么 Sora 则是单纯依靠数据的输入,建立起对世界的认知。

OpenAI 官网上,关于 Sora 的这篇研究论文名为《把视频生成模型作为世界模拟器》。请注意‘世界模拟器’(world simulators)这个关键词,它是比生成视频更关键的核心所在。
其实,早在特斯拉发布 FSD V12 的时候,这家以汽车为主要消费产品的人工智能公司,就已经展示了类似的能力。
如何理解呢?首先,在 FSD V12 上,工程师删除了超过 30 万行定义驾驶规则的代码,系统将从被‘投喂’的驾驶视频中,学习如何应对真实的驾驶场景,而不是向过往那样,按照写好的规则,在某个特定场景下执行某一个具体的命令。
当然,和作为‘生成式模型’的 Sora 不同,FSD 的目标是实现自动驾驶,所以它并不需要真正生成一个具体的视频。你可以想象成一个人(或者智能体)正在进行‘防御性驾驶’,基于过往经验,可以对周围环境中交通参与者的下一步移动趋势做出判断。这个判断存在在头脑里就行了,不需要真正把它画在纸上。因此,特斯拉的 FSD 也不需要把对未来的想象,生成为一个真实视频,并呈现在车辆的某一个屏幕上。
所以,现在有 OpenAI 和特斯拉两家完全不同的公司,用截然不同的方式和路径,实现‘通过视频生成,让 AI 理解物理世界’这个相同的目标。
简单了解一下 Sora 的运行逻辑:OpenAI 表示,Sora 结合了 Transformer 和 Diffusion 两个过去几年最重要的模型。ChatGPT、Gemini、LLaMA 等语言模式都是基于 Transformer 模型,它对词语进行标记,并生成下一个单词;Diffusion 模型则是‘文生图’的代表。
如果从‘理解世界’的角度来审视 Sora,那么某一帧图像的画质、画面关系绝不是模型质量高低的评判标准,甚至官网释出的 60 秒一镜到底视频也不是最核心的部分。重要的是这个生成的视频可以被剪辑——在不同的机位下,无论是广角、中景、近景、特写,视频中人物和背景的关系都保持着高度的‘一致性’。这才是 Sora 遥遥领先并接近真实的地方。

这一点和特斯拉在 FSD 上采取‘纯视觉’方案可以结合理解。简单来说,99% 的车企或者智驾团队都会在车辆上保留激光雷达,通过激光束的发射和接收,辅助计算周围物体和车辆间的距离关系。但马斯克不仅删除了 30 万行代码,还移除了雷达,只依靠高清摄像头采集和神经网络学习来判断距离关系。
无论是对特斯拉,还是对 OpenAI,这都是巨大的挑战。毕竟输入的画面是 2D 的,但输出的结果(无论是驾驶指令还是视频)都需要基于对 3D 世界的深刻理解。
规模和质量是训练模型的核心。特斯拉的数据来源于真实道路上,搭载了传感器的车辆;而 OpenAI 的大量数据,从目前的公开信息来看,来源于网络。在质量的维度,在《马斯克传》里,作者艾萨克森写道特斯拉通过和 Uber 合作,获取‘五星司机’的素材训练 FSD;而从规模出发,奥特曼最近希望筹集万亿规模的资金,就是重注算力和规模的具体体现。

最后,回到一开始的那个问题,为什么我们会认为 Sora 和 FSD v12 是相似的?Sora 和 OpenAI 未来的想象空间又是什么呢?它们和 AGI 又有什么关系?
在马斯克看来,当人工智能可以真正解决一个问题(物理、数学、化学等等)的时候,AGI 就到来了。不过还有另外一个理解维度,那就是具身智能。毕竟现实世界里,并不是只有数学公式和文字规则,拥有一定的智商的小猫小狗也可以依靠运动真实地和物理世界进行互动。
这点对于过去只能输入二维信息的 AI 来说很难做到。这也是为什么马斯克看到 Sora 后在 X 上评价是‘GG Humans’,在他看来 Sora 今天做到的,已经打破了过去的次元壁,而能理解真实世界并继续学习,AI 也就有了更进一步影响真实世界的能力。
而就像特斯拉把这种生成能力用于训练车辆,Sora 的价值也不仅仅是生成一个难以让人区分真假的视频,用作影视创作者的生产力工具(尽管这是一个非常困难且刚需的场景)。就像周鸿祎所说,‘Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。’
*头图来源:《埃隆·马斯克传》
责任编辑:刘万里 SF014








APP专享直播
热门推荐
女子吐槽银行8个窗口6个不营业,银行:领导就给这些人,都上岗了 收起女子吐槽银行8个窗口6个不营业,银行:领导就给这些人,都上岗了
- 2025年02月20日
- 01:45
- APP专享
- 扒圈小记
15,899
网传“河北邢台一局长酒后砸店伤人”,官方通报:停职,纪委监委立案调查
- 2025年02月20日
- 01:47
- APP专享
- 扒圈小记
4,799
特朗普称期待中方领导人访问美国,外交部回应
- 2025年02月20日
- 07:51
- APP专享
- 北京时间
4,225

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 12:17:41
普元信息(sh688118)公告称,由于工作人员疏忽,现对《关于部分董事、高级管理人员减持股份计划公告》进行更正。更正后,杨玉宝拟减持数量不超过66万股,占公司总股本的比例不超过0.70%;王克强拟减持数量不超过19万股,占公司总股本的比例不超过0.20%。减持期间为2025年3月17日至2025年6月16日。小财注:此前公告公司控股股东刘亚东拟减持不超过1.54%股份事项,在更正公告中删除。 -
趋势领涨今天 11:18:53
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 10:20:55
【2连板云中马(sh603130):目前公司在中玺新材料(安徽)有限公司参股比例较小 对公司业绩不产生重大影响】财联社2月20日电,云中马(sh603130)发布股票交易异常波动公告,公司关注到近期市场对于人形机器人(sz300024)相关概念的关注度较高,部分机构将公司列为机器人(sz300024)概念标的。公司就相关事项澄清说明如下:公司在2024年半年度报告中就对外投资的中玺新材料(安徽)有限公司的情况进行了披露。目前公司在中玺新材料(安徽)有限公司认缴的注册资本为1571.4848万元,对应的持股比例为8.1491%,参股比例较小,对公司业绩不产生重大影响。 -
趋势领涨今天 10:18:52
【2连板云中马(sh603130):目前公司在中玺新材料(安徽)有限公司参股比例较小 对公司业绩不产生重大影响】云中马(sh603130)发布股票交易异常波动公告,公司关注到近期市场对于人形机器人(sz300024)相关概念的关注度较高,部分机构将公司列为机器人(sz300024)概念标的。公司就相关事项澄清说明如下:公司在2024年半年度报告中就对外投资的中玺新材料(安徽)有限公司的情况进行了披露。目前公司在中玺新材料(安徽)有限公司认缴的注册资本为1571.4848万元,对应的持股比例为8.1491%,参股比例较小,对公司业绩不产生重大影响。 -
数字江恩今天 09:34:22
这里只是宽幅震荡,涨跌都没有持续性。明日关注红线,如果跌破则回踩看机会,如果不跌破则再冲高,那么高位板块且近几天持续冲高的,就要注意短线风险。 -
数字江恩今天 09:34:17
明日关注图上的白色震荡轮回线第一个低点对应红色水平线,只要这条线不跌破,明天还会向着3366冲锋一下,也或者略微突破。可以明确的是,3366已经是结构结束点位,哪怕略微新高,也属于震荡高点,没有持续性。 -
数字江恩今天 09:34:06
今天看1分钟图即可。大盘周二下跌到3314点,周三上涨反包,而今天周四没有再继续下跌,而是维持窄幅震荡,从节奏上就隐含了再次冲高3366的可能,个股涨跌比也支持这个结论。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:33:57
盘中ai医疗,消费电子和人形机器人(sz300024)上涨领先,而之前的云概念和农林牧渔则继续调整。 -
数字江恩今天 09:33:33
A股两市今日成交6701 + 10865 = 17566 亿人民币,相比昨日轻微放量约350亿。大盘今天全天窄幅震荡,没有超过20个点震幅,收跌不到1个点。个股方面,则是近2/3的个股收红上涨,忽视了指数的波动。 -
数字江恩今天 09:33:29
涨跌皆不持续