转自:星空财研
这样的技术并没有超越现有科技水平,但它确实是一次创新。它让我们意识到,之前的 AI 绘画模型可能走错了方向。Sora 的成功告诉我们,将 AI 与游戏引擎相结合,可以实现更为高效和逼真的画面生成。
一觉醒来,AI讨论群里热血沸腾。
一头雾水的我看了数百条的聊天记录,发现原来OpenAI发布了最新的视频大模型Sora。
OpenAI的CEO奥特曼发布了一些演示视频,众所周知,当初谷歌演示的时候涉嫌造假,奥特曼干脆让网友提需求,他即时生成。
截止现在(北京时间2月16日11点),一部分海外IP用户反馈,已经可以在ChatGPT4上试用。
演示视频显示,60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
我对 Sora 生成的画面非常感兴趣,尤其是它在不崩、不闪方面的表现。
确实,Sora 的出现为 AI 视频领域带来了新的突破,其生成的画面质量令人印象深刻。
首先,我们来分析一下脸崩现象的原因。在目前的 AI 绘画工具中,许多大模型在处理大幅画面时,往往会遇到面部细节处理困难的问题。这是因为这些模型在训练过程中,可能没有接触到足够多的、具有大幅面画面的训练数据。因此,当它们面对实际问题时,就会出现细节处理不足的情况,也就是我们所说的“脸崩”。
此外,目前的 AI 大模型都是通过逐帧生成画面,然后将这些画面拼接成视频。这种方法在画面细节发生变化时,容易出现闪烁现象。这是因为每一帧的画面都是独立生成的,它们之间的差异会在视觉上形成闪烁效果。
然而,Sora 似乎成功地解决了这两个问题。有分析人士认为,Sora 使用了游戏引擎。我对此表示认同。事实上,使用游戏引擎来生成视频,可以有效地避免逐帧生成画面再拼接的弊端。通过游戏引擎,可以实现更为连续和自然画面生成,从而避免脸崩和闪烁现象。
英伟达高级科学家 Jim Fan 对 Sora 发表了一些观点。他认为 Sora 是一个数据驱动的物理引擎,它可以对真实世界和虚构世界进行模拟。这种模拟器通过去噪和梯度学习方式,学习了复杂的渲染、直观的物理、长期推理和语义理解。如果 Sora 真的使用了虚幻引擎 5 并接受了大量合成数据的训练,那么它的表现就一点也不令人惊讶了。
在 ChatGPT 3.5 推出之前,ChatGPT 发布了几个版本。尽管这些版本的表现令人惊艳,但它们的能力有限,并没有引起广泛关注。然而,ChatGPT 3.5 的推出让一切都变了。它一炮走红后,紧接着推出了付费的 4.0 版本。
与 ChatGPT 类似,Sora 的出现也让人感到措手不及。就在不久前,大家还在为 AI 视频去闪问题而努力。毕竟,我们都看过基于现有技术水平的论文,知道瓶颈在哪里,知道上限在哪里。然而,Sora 的出现就像是从天而降的天顶星科技,打破了我们的认知。
但是,如果 Sora 真的使用了游戏引擎,比如虚幻 5,那么这一切又都可以理解了。只能说之前的 AI 视频走的是 AI 绘画的老路,想当然地认为视频等于绘画逐帧叠加。Sora 巧妙地换了一条路,依然遵循 ChatGPT 的逻辑,用数据去驱动游戏引擎,再由游戏引擎生成画面。
这样的技术并没有超越现有科技水平,但它确实是一次创新。它让我们意识到,之前的 AI 绘画模型可能走错了方向。Sora 的成功告诉我们,将 AI 与游戏引擎相结合,可以实现更为高效和逼真的画面生成。

随着 Sora 的成功,我们可以预见,未来会有越来越多的 AI 大模型接入游戏引擎。这种结合将为绘画大模型带来降维打击,让它们在画面生成方面面临巨大的挑战。不过,这也是 AI 技术发展的必然趋势。只有不断尝试创新,才能推动技术的进步。
并非现实不存在了。
这,就是现实。
内容由AI生成
本文作者:天渊三,来源:星空财研,原文标题:《现实不存在了?不,这就是现实》
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

责任编辑:于健 SF069


APP专享直播
热门推荐
特朗普批评泽连斯基:三年前就该结束这一切 收起特朗普批评泽连斯基:三年前就该结束这一切
- 2025年02月19日
- 00:27
- APP专享
- 扒圈小记
11,592
事发上海!妻子被撞,丈夫拦停酒驾肇事逃逸者,致其十级伤残,被索赔30万,法院判了
- 2025年02月18日
- 14:18
- APP专享
- 扒圈小记
3,537
明查|德国防长称对美副总统万斯的讲话“感到恶心”?假
- 2025年02月18日
- 23:16
- APP专享
- 北京时间
3,265

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 10:23:29
捷昌驱动(sh603583)公告称,公司股票连续三个交易日内日收盘价格涨幅偏离值累计超过20%,属于股票交易异常波动情形。经自查,公司目前生产经营活动正常,市场环境、行业政策未发生重大调整,生产成本和销售等情况没有出现大幅波动。公司控股股东及实际控制人不存在应披露而未披露的影响公司股价异常波动的重大信息。公司专注于线性驱动行业,生产的线性驱动系统广泛应用于智慧办公、医疗康护、智能家居等领域。公司主持的“领雁”研发攻关计划项目仍处于研发和测试阶段,目前尚未对市场进行批量供货,暂未形成收入。 -
趋势领涨今天 10:23:05
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 10:04:53
【南向资金今日净买入超103亿港元 阿里巴巴获净买入居前】南向资金净买入103.24亿港元。其中,阿里巴巴-W、快手-W、华虹半导体分别合计获净买入约28.30亿港元、8.13亿港元、7.35亿港元;美团-W、晶泰控股-P合计遭净卖出13.31亿港元、0.49亿港元。 -
数字江恩今天 09:45:35
这里昨日的急跌、今日的急涨都属于宽幅震荡结构,哪怕略为突破3366也不改变这个事实。宽幅震荡中,急跌不杀跌、急涨不追涨,今天修复之后,等待再次回踩,配合5分钟底背离和轮峰线的支持寻找机会。 -
数字江恩今天 09:45:27
这里先不看细节,直接看15分钟图。图上的3464-3418蓝色轮峰线是核心,3140的反弹abc突破蓝色轮峰线之后,只要不有效跌破轮峰线,维持之上震荡,其实都是宽幅震荡结构。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:45:17
今日最瞩目的板块当属人形机器人(sz300024)机器人(sz300024),此外,deepseek各个细分行业也在修复。无论是大盘,还是双创,还是国政2000都反V了昨日的中阴线实体部分。市场大悲后迎来大喜,大悲大喜后自然是各种观点的混乱。 -
数字江恩今天 09:45:11
A股两市今日成交6751 + 10459 = 17210 亿人民币,相比昨日缩量近800亿。大盘早盘1小时左右强力拉升,然后全天在20点内的小区间窄幅震荡,收涨27个点。个股方面,和昨日想法,超过85%的个股收红。7%以上大幅上涨个股家数也超过了昨日大幅下跌个股家数。 -
数字江恩今天 09:45:07
宽幅震荡忌追涨杀跌 -
趋势领涨今天 09:25:41
盘后再放利好,两部门:鼓励外资在华开展股权投资 引导更多优质外资长期投资我国上市公司;适时进一步扩大电信、医疗领域开放试点 研究制定有序扩大教育、文化领域自主开放实施方案。五部门印发《优化消费环境三年行动方案(2025—2027年)》 -
北京红竹今天 08:47:20
3、指数调整还没到位目前沪指五分钟级别三买还是没有出现,恒生科技指数和创业板也没有跌破防守线,昨天第一次洗盘,今天快速修复。对于指数来说,调整还没有完成,至少五个新低还没有。如果你是纯指数交易者,还要继续等。不过我在直播中也大家说过了,指数会有回落,但不谈大风险,定义为洗盘。目前指数的洗盘还没结束。