转自:星空财研
这样的技术并没有超越现有科技水平,但它确实是一次创新。它让我们意识到,之前的 AI 绘画模型可能走错了方向。Sora 的成功告诉我们,将 AI 与游戏引擎相结合,可以实现更为高效和逼真的画面生成。
一觉醒来,AI讨论群里热血沸腾。
一头雾水的我看了数百条的聊天记录,发现原来OpenAI发布了最新的视频大模型Sora。
OpenAI的CEO奥特曼发布了一些演示视频,众所周知,当初谷歌演示的时候涉嫌造假,奥特曼干脆让网友提需求,他即时生成。
截止现在(北京时间2月16日11点),一部分海外IP用户反馈,已经可以在ChatGPT4上试用。
演示视频显示,60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
我对 Sora 生成的画面非常感兴趣,尤其是它在不崩、不闪方面的表现。
确实,Sora 的出现为 AI 视频领域带来了新的突破,其生成的画面质量令人印象深刻。
首先,我们来分析一下脸崩现象的原因。在目前的 AI 绘画工具中,许多大模型在处理大幅画面时,往往会遇到面部细节处理困难的问题。这是因为这些模型在训练过程中,可能没有接触到足够多的、具有大幅面画面的训练数据。因此,当它们面对实际问题时,就会出现细节处理不足的情况,也就是我们所说的“脸崩”。
此外,目前的 AI 大模型都是通过逐帧生成画面,然后将这些画面拼接成视频。这种方法在画面细节发生变化时,容易出现闪烁现象。这是因为每一帧的画面都是独立生成的,它们之间的差异会在视觉上形成闪烁效果。
然而,Sora 似乎成功地解决了这两个问题。有分析人士认为,Sora 使用了游戏引擎。我对此表示认同。事实上,使用游戏引擎来生成视频,可以有效地避免逐帧生成画面再拼接的弊端。通过游戏引擎,可以实现更为连续和自然画面生成,从而避免脸崩和闪烁现象。
英伟达高级科学家 Jim Fan 对 Sora 发表了一些观点。他认为 Sora 是一个数据驱动的物理引擎,它可以对真实世界和虚构世界进行模拟。这种模拟器通过去噪和梯度学习方式,学习了复杂的渲染、直观的物理、长期推理和语义理解。如果 Sora 真的使用了虚幻引擎 5 并接受了大量合成数据的训练,那么它的表现就一点也不令人惊讶了。
在 ChatGPT 3.5 推出之前,ChatGPT 发布了几个版本。尽管这些版本的表现令人惊艳,但它们的能力有限,并没有引起广泛关注。然而,ChatGPT 3.5 的推出让一切都变了。它一炮走红后,紧接着推出了付费的 4.0 版本。
与 ChatGPT 类似,Sora 的出现也让人感到措手不及。就在不久前,大家还在为 AI 视频去闪问题而努力。毕竟,我们都看过基于现有技术水平的论文,知道瓶颈在哪里,知道上限在哪里。然而,Sora 的出现就像是从天而降的天顶星科技,打破了我们的认知。
但是,如果 Sora 真的使用了游戏引擎,比如虚幻 5,那么这一切又都可以理解了。只能说之前的 AI 视频走的是 AI 绘画的老路,想当然地认为视频等于绘画逐帧叠加。Sora 巧妙地换了一条路,依然遵循 ChatGPT 的逻辑,用数据去驱动游戏引擎,再由游戏引擎生成画面。
这样的技术并没有超越现有科技水平,但它确实是一次创新。它让我们意识到,之前的 AI 绘画模型可能走错了方向。Sora 的成功告诉我们,将 AI 与游戏引擎相结合,可以实现更为高效和逼真的画面生成。

随着 Sora 的成功,我们可以预见,未来会有越来越多的 AI 大模型接入游戏引擎。这种结合将为绘画大模型带来降维打击,让它们在画面生成方面面临巨大的挑战。不过,这也是 AI 技术发展的必然趋势。只有不断尝试创新,才能推动技术的进步。
并非现实不存在了。
这,就是现实。
内容由AI生成
本文作者:天渊三,来源:星空财研,原文标题:《现实不存在了?不,这就是现实》
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

责任编辑:于健 SF069


APP专享直播
热门推荐
妻子举报上海一财政局主任科员出轨副科长,纪委回应 收起妻子举报上海一财政局主任科员出轨副科长,纪委回应
- 2025年03月28日
- 09:18
- APP专享
- 扒圈小记
14,365
女童小区内被碾压身亡,肇事司机家属:将起诉特斯拉
- 2025年03月28日
- 14:46
- APP专享
- 扒圈小记
2,217
六部门:公立医院3月31日起全面停止收取门诊预交金 6月30日起降低住院预交金额度
- 2025年03月28日
- 08:05
- APP专享
- 北京时间
2,124

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨2025-03-28 10:26:55
阿尔特(sz300825)(300825.SZ)公告称,公司与日产(中国)投资有限公司签署了《业务主协议》,双方将以汽车产品相关车型的开发为目标,在整车开发委托、汽车零部件和系统的开发等领域积极开展项目合作。该协议为合作框架性文件,具体业务合作将以另行协商签署的协议为准。协议有效期为6年。公司是行业领先的提供独立整车研发及系统解决方案的前瞻技术驱动型企业,能够为客户提供全流程、全领域、全栈式、短周期的“交钥匙”服务。日产汽车在中国市场深耕多年,开发了多款经典畅销车型。本次协议签署有利于公司业务拓展和稳健经营,提高公司在国际客户群体中影响力和全球范围内的品牌知名度。 -
数字江恩2025-03-28 09:18:43
2-c是否跌破3340不能保证,只能当下确认。下周几个需要确认的事情是:首先,如果跌破3297,则代表结构判断错误,反之,不跌破都将完成第2浪回踩,然后开始第3浪上涨。其次,下周一二内突破3406代表向上扩展,直接确认第3浪开始,这是小概率事件;正常来说,下周一二震荡,则下周二之后,站上图上的蓝色轮峰线,即确认第三浪开始。判断条件都给出了,下周大家可以结合条件,自己当下判断第2浪下跌结束、第3浪上涨开始。 -
数字江恩2025-03-28 09:18:38
5分钟图来看3297上涨的内部次级别结构。其中第1浪上涨内不是abc三段式结构,第2浪回踩也同样是abc三段式结构。其中2-c的主要跌幅已经在本周五完成。【更多独家重磅股市观点请点击】 -
数字江恩2025-03-28 09:18:25
首先看15分钟图,这是大盘去年12月3494以来的总体结构。对3140的反弹结构,提前预测了abc+X+12345的内部形态。这里我们已经看到3297开始新的1浪上涨结束,而上周高点3439开始的第2浪回踩将在下周确认结束,这是下周最重要的事情。【更多独家重磅股市观点请点击】 -
数字江恩2025-03-28 09:18:07
大盘本周成交量继续缩量,周内略微冲高试探上周周阴线实体50%位置后再次回落,受到10周线3336支撑,收了一根跌幅22个点的周小阴线。10周线继续是下周的重要支撑,这条均线只要不有效跌破,3140的上涨结构都将持续上涨。 -
数字江恩2025-03-28 09:17:59
下周行情展望2025.03.28 -
张馨元2025-03-28 08:17:46
下周还有一个利空要落地,4月2号美国对等关税即将到来,看看金毛还要玩啥幺蛾子再说吧。 -
张馨元2025-03-28 08:16:46
大盘今天单边杀跌,本周的走势去上周如出一辙,下周清明节前还有4个交易日,节前效应,预计更加清淡,大概率要缩到万亿之下,大盘10天线下管住手。 -
张馨元2025-03-28 08:13:44
[问]淡然: 老师放量下跌和缩量下跌怎么讲[答] 张馨元老师: 缩量缓跌,抛盘减弱;放量大跌,主力出货。 -
北京红竹2025-03-28 08:02:09
2、没交易一天没有任何的交易,如果市场出现第一种情况,那短线组合就会动一动,做做短线,长线组合依然不动,乖乖等待日线级别回落段出现之后在布局。现在谈不上布局的事,只能短线随便玩玩。而且前两天进场的酱油股,虽然单只仓位很低,但到现在都没出来,市场的容错率太低了。全天市场成交额1.12万亿,估计过几天就要破玩意了,这可是从2万亿缩下来的。当下成交量是个大问题,没有成交量的市场,自然就没有主线和热点了,持续性更别谈了。上涨942家,下跌4352家,涨停35家,跌停33家。这数据已经是非常差了,还能更差吗?下周应该就会有答案了,是不破3297点出现反弹,还是跌破3297点。大家觉得应该是哪种?