前阵子,老黄在 CES 上又狠狠秀了波肌肉。
不过呢大多数人,基本都被全新的 RTX 50 系显卡给吸住了,世超这两天研究了下发现,那些被咱 “ 冷落 ” 的新技术里,一个两个其实也都憋着大招。
就拿Cosmos 世界基础模型平台来说,这可是个让 AI 能够理解物理世界的好东西。
![](http://n.sinaimg.cn/spider20250130/232/w660h372/20250130/c119-03f2c1fdc73dd41284d69113bd5e7d3e.jpg)
根据官方的说法, Cosmos 平台是一个专门为物理人工智能开发者设计的平台。
这又是物理人工智能,又是开发者,打眼一看,好像跟咱也没啥太大关系。
但大伙儿先别着急,这次 Cosmos 一发布,技术报告一甩,有些报道的标题已经用上了 “ 开启物理 AI 大时代 ” 这样的字眼,连老黄都说“ 机器人(20.340, 0.88, 4.52%)的 ChatGPT 时刻即将到来 ”。
而世超也去翻了翻 Cosmos 的技术报告,这么说吧, Cosmos 就好比物理 AI ( 机器人、无人车等 )的“ 黄埔军校 ”,咱们以后能不能指望机器人养老,它说不定能帮上大忙。
咱们可以简单把 Cosmos 平台,当成一个工具箱,里边儿大概集成了世界基础模型 ( WFM ) 、高级分词器器、安全护栏以及加速数据处理管道这么几个 “ 工具 ” 。
![](http://n.sinaimg.cn/spider20250130/16/w660h156/20250130/29b2-dd247bf98a1627eef2a2e5122b909ddf.jpg)
后面那几个专业名词没听说过不要紧,但模型总该知道是啥吧。
这次,英伟达一口气在 Cosmos 上发布了 8 个世界基础模型,而且都是基于 2000 万小时的视频训练出来的,参数量从 40 亿到 140 亿不等,根据不同场景的应用需求,还可以分为 Nano 、 Super 和 Ultra 三种。
![](http://n.sinaimg.cn/spider20250130/324/w660h464/20250130/0249-063d79bfa9f03babd063ca56162ff429.jpg)
看着唬人,但世界基础模型,跟咱们熟悉的图像、视频生成模型差不多,是生成式 AI 模型。
只不过它生成的东西并不是视频那么简单,更准确的说,当你输入文本、图像、视频或者运动数据以后,世界基础模型生成的是有物理规律的 “ 场景 ” 、 “ 环境 ” 。
本质上,就是合成出高度仿真的数据,来实现物理 AI 跟虚拟环境的交互。
至于其他的什么高级分词器、安全护栏和加速数据处理管道,咱了解个大概就行。像高级分词器可以把复杂的数据简化,给数据划重点。安全护栏就更好理解了,就是防止有害的输出,保护隐私。
另外, Cosmos 还用到了一个 “ 先预训练再后训练 ” 的法子。
![](http://n.sinaimg.cn/spider20250130/325/w660h465/20250130/a4f1-bec04f49f941cac62ed1d158a491c660.jpg)
大概意思是,预训练阶段先给模型喂大规模的真实视频数据,起码要让模型知道物理世界到底是咋运转的。
接着,后训练阶段再具体问题具体分析,对预训练模型进行微调,满足特定任务的需求。
总之就是, Cosmos 平台通过各种技术手段,为物理 AI 构建出了一个跟现实物理世界类似的空间和交互环境。
![](http://n.sinaimg.cn/spider20250130/244/w660h384/20250130/be8b-74f08fe93067703b5f0ba5aaee64cfe4.jpg)
不过说了这么半天,可能有差友还是没太明白,这玩意儿到底能用来干啥。
其实这个问题,老黄已经在发布会上讲得很清楚了,就是机器人和自动驾驶汽车。
拿机器人行业来说,为啥这么多年了一直没啥大突破,很重要的一个原因就是缺数据。
跟大语言模型不太一样,机器人训练需要的数据不只是文字、图像那么简单,因为机器人要感知这个世界,还要跟这个世界产生交互,所以它就得学习物理规律、动态变化。
但这些数据,恰恰是最难收集的。
还是拿机器人洗碗举例,看似动作很简单,但机器人想学会你得有视觉数据,比如餐具的形状大小、油污程度,还有抓放碗的力度、用多大力气擦洗这些力学数据,当然,洗碗过程中手臂移动、抓取角度的调整,包括一些复杂的动态因素,也需要收集、标注数据。
像之前的斯坦福 Aloha 家务机器人,还是开发者通过亲身示范 “ 遥控 ” 机器人完成指定动作,来收集数据。
![](http://n.sinaimg.cn/spider20250130/190/w660h330/20250130/4696-9142e37e68f41638846a5bd025216942.jpg)
所以这个时候, Cosmos 就派上用场了。
模拟出一个洗碗环境,不就相当于,提前给机器人预习了一遍现实世界,等模型出师了,再放到现实世界去实操。
这样一来,训练效率上去了,成本也能控制住。
按照英伟达官方的介绍,现在已经有一部分机器人和自动驾驶公司用上了 Cosmos 。
OpenAI 投的那家 1X ,用 Cosmos 来给机器人做动态规划。
![](http://n.sinaimg.cn/spider20250130/261/w660h401/20250130/a547-fdbd142a337564a39b14fe3f553ec6fb.jpg)
小鹏也用 Cosmos 来合成各种天气和路况的数据,训练自动驾驶算法。
当然了,精准模拟现实世界只是理想状态下的 Cosmos ,包括技术报告里也提到,现阶段的世界基础模型还比较早期,生成的视频并不完全符合物理规律。
该说不说,世超现在也觉得走世界模型这条路,确实有搞头。
如果有一天, AI 能对现实世界进行模拟甚至是一比一复刻,并像咱们人一样理解世界、做出决策,这才更贴近咱们人类对于人工智能的期望。
去年,包括 Lecun 、李飞飞这些 AI 大拿,还有谷歌 Deepmind ,其实都在研究世界模型。世超盲猜一波,今年在世界模型和机器人领域里,可能会出现突破性的进展。
但不管成与不成,擅长 “ 卖铲子 ” 的英伟达,都是那个最大赢家。
撰文:西西
编辑:江江&面线
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](https://tva2.sinaimg.cn/crop.0.0.180.180.50/74d91cd9jw1e8qgp5bmzyj2050050aa8.jpg)
![](https://tvax2.sinaimg.cn/crop.0.69.362.362.50/008Bh2NZly8hkja4ye2foj30a20dw3yv.jpg)
![](https://tvax3.sinaimg.cn/crop.93.0.313.313.50/008BhF3Yly8hkja6g1yt9j30dw08paaf.jpg)
![](https://tvax1.sinaimg.cn/crop.0.37.225.225.50/005GzWCmly8hjeiu98bwcj306908ca9x.jpg)
![](http://n.sinaimg.cn/sinanews/eb9bf575/20190108/TouXiang120.png)
![](https://tvax1.sinaimg.cn/crop.0.0.500.500.50/008BhXWkly8hkja9iz16ij30dw0dwaad.jpg)
APP专享直播
热门推荐
法国小伙带622张日军侵华照片抵达北京,希望捐赠给中国 收起法国小伙带622张日军侵华照片抵达北京,希望捐赠给中国
- 2025年02月16日
- 13:38
- APP专享
- 扒圈小记
21,978
人民热评:重庆燃气事件,不要每次都以道歉收场
- 2025年02月16日
- 13:58
- APP专享
- 扒圈小记
6,468
重庆燃气道歉:针对燃气收费问题已派驻整改督导专班
- 2025年02月16日
- 09:51
- APP专享
- 北京时间
3,018
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 11:00:54
岭南股份(sz002717)发布股价异动公告称,公司注意到网络上存在有关“公司和腾讯在人工智能、智慧文旅等领域合作”的诸多传闻。公司与腾讯之间的合作尚未取得实质性进展,也未有具体合作项目落地实施。 -
趋势领涨今天 10:56:20
最后两天!!!最后两天!!!最后两天!!!【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 09:52:39
光线传媒(sz300251)今日高开低走大幅收跌,全天振幅近40%,天量成交超223亿元,换手率超24%。盘后数据显示,买方五个席位均为东财活跃营业部,合计买入达8.84亿元;一机构净卖出3.3亿元,深股通净卖出2.61亿元。 -
数字江恩今天 09:52:01
在c的延伸过程中,这样的个股热点还会持续不断,直至c的完成,这个时间点应该在本周。但只要未能确认c延伸结构的破坏,大盘就依然允许新高,个股也允许发挥。 -
数字江恩今天 09:51:56
看5分钟图,大盘一直处于3140反弹abc的c延伸结构之中。目前出现了图上的两个白色方框,第一个宽度30个点,第二个宽度为40个点,c目前就靠这样反复震荡向上延伸,只要第二个方框不跌破,这个延伸就还未结束。反过来说也可以,第二个方框跌破,则c确立结束。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:51:43
板块来看,ai医疗持续向上,国产算力、云、ai应用都继续表现,农林牧渔今日也表现不错。而前面持续表现的影视动漫,今天则迎来了大幅回调,周末消息发酵的金融类,今天表现也不如人意 -
数字江恩今天 09:51:39
A股两市今日成交7501 + 11914 = 19415 亿人民币,属于持续温和放量。大盘今天先震荡回踩,然后尾盘拉回,总的来说在一个不到30点的窄幅区间震荡了一个W型分时结构,收涨9个点。个股方面,约70%的个股收红。 -
数字江恩今天 09:51:34
煎熬和享受都是延伸 -
北京红竹今天 09:38:54
3、1.94万亿全天成交额将近两万亿,配合上缠论的方向,后面的吃肉行情还会继续,只是要掌握好节奏,而且还不能格局。为啥不能格局?反正我持有的品种只要大涨我就卖,因为量化都是这么干的,大涨就卖,咱手动操作干不过它,等量化卖往下砸,还不如我主动大涨就卖呢。但这么大的成交额活跃度没问题,反复的跟量化对着干就行了。目前新的方向没有出现,而且资金已经明牌,就是高低切换,那就跟随市场切滞涨的DS、人形机器人(sz300024)和铜缆就好。 -
北京红竹今天 09:38:48
2、不追高春节回来之后市场很疯狂,虽然指数没有怎么大涨,但赚钱效应很高涨。恒生科技指数更是率先反转,晚上在直播间跟红竹聊天的同学,恒生科技吃了一大口肉。而沪指本周,红竹的第六感告诉我,要有一波洗盘,就在周二三之后。当然了,第六感不能当饭吃,交易上谨慎点就行了,别追高就行。缠论结构上,恒生科技指数和创业板都有防守线了,不破反弹还会继续,跌破咱就小心点洗盘。沪指我从上周就在等五分钟级别三买,到今天都没有出现。客观上要么盯好恒生科技指数和创业板的防守线,跌破就防守下,要么就等着沪指的防守线出现。