财中社1月9日电长江证券发布软件与服务行业报告。北京时间1月7日,国际消费电子展(CES 2025)开幕前夕,英伟达创始人兼CEO黄仁勋发表主题演讲,发布世界模型Cosmos。Cosmos系列模型能够根据文本或视频帧生成可控的高质量合成数据,解决智能驾驶与机器人训练中数据不足的问题。Cosmos模型基于9000万亿个tokens和2000万小时的真实世界人机交互、环境、工业、机器人及驾驶数据训练而成,主要用来加速自动驾驶和下一代机器人训练研发。
Cosmos模型从小到大包含三类,参数范围约40亿-140亿。Nano:超低延迟的实时模型,优化用于边缘部署;Super:高性能基线模型,适用于开箱即用的微调和部署;Ultra:最高准确度和质量,适合模型定制;开发者既可以用Cosmos模型生成物理合成数据,也可以用英伟达NeMo框架+私有视频数据进行微调。
Cosmos模型有望缓解智能驾驶、机器人训练数据不足问题。在英伟达展示的案例中,Cosmos已经被应用于模拟真实环境,如工厂车间或驾驶场景。或者与Sora类似,使用多模态内容的输入生成基于物理定律的视频,主要用于机器人、自动驾驶汽车等领域的模型训练和开发。
Cosmos模型开源,有望加速智能驾驶、机器人相关产业技术落地。英伟达允许无论公司规模如何,研究人员和开发者都可以根据英伟达的开放模型许可协议自由使用Cosmos模型,并且该许可协议允许商业用途。目前已公布的第一批试用者包括机器人公司1倍、Agility Robotics,以及自动驾驶领域的Uber、小鹏、比亚迪等。
Cosmos模型也为Omniverse(英伟达工业数字化和物理AI仿真平台)赋能。开发者可在Omniverse中构建3D场景,渲染输出后用于Cosmos模型生成合成虚拟环境,最终用于物理人工智能训练。Cosmos模型加持下的Omniverse平台开源在数字孪生环境中大规模开发、测试和优化物理AI和机器人队列,然后再部署到现实设施中。
(文章来源:财中社)
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)