文|IT时报记者 贾天荣
编辑|郝俊慧 孙妍
黄仁勋发表CES“科技春晚”演讲后一夜间,英伟达市值蒸发超1.6万亿元。
这令人有些意想不到,就在一天前,英伟达总市值飙升8800亿元,差点创历史新高。大家似乎都在期待,这家2024年全球市值涨幅最大的公司将在新的一年里带来何种震撼,而在这场约90分钟的演讲中,作为首席执行官的黄仁勋确实显示出更大的野心。
北京时间2025年1月7日10:46,黄仁勋身着亮闪闪的“新皮肤”亮相CES,开场时他轻松地问道:“你们喜欢我的夹克吗?”
演讲中,黄仁勋用Grace Blackwell NVLink72的巨型芯片充当盾牌,Cos(角色扮演)美国队长,号称要超越世界最快超级计算机,紧接着又取出拳头大小的Project Digits ,定义为“全球最小的个人AI超级计算机”,起售价3000美元(约人民币21980元)。
发布会后,英伟达股价一度上涨2%,创历史新高,随后一路跳水,分析认为,这或与黄仁勋未能对短期目标有清晰阐释有关。
不过,黄仁勋或许并不在意这些。从新夹克、新显卡,到全新超级AI PC再到雄心勃勃的世界基础模型,英伟达正在构建自己的AI宇宙,而奇点何时到来?
最强显卡性能翻倍
“机器学习改变了每一个应用程序的构建方式、计算方式以及超越这些的可能性,GPU以及所有与AI相关的技术,都是AI普及的基础。如今,AI正回归GeForce。”演讲伊始,黄仁勋便直接发布了本次CES最受期待和瞩目的产品——GeForce RTX 50系列GPU。
该系列采用英伟达Blackwell架构,主要面向游戏玩家、创作者和开发者,这一系列GPU中,包括号称目前世界上速度最快的显卡GeForce RTX 5090。黄仁勋表示,其速度是上一代RTX 4090的两倍,搭载920亿个晶体管和4000 AI TOPS,并支持每秒高达1000万TOPS(万亿次操作)的AI运算能力,是上一代Ada架构的三倍,售价1999美元(约人民币16450元)。
新的GPU架构包含多项创新技术,其中包括采用Micron的G7内存技术,提供1.8TB每秒的带宽,几乎是上一代GPU内存带宽的两倍;而Blackwell系列的可编程着色器不仅能够完美执行传统的图形计算任务,还能高效并行处理复杂的神经网络,推动AI模型的迅速推理与训练。这一系列的突破,显著提升了计算效率,并大幅降低了AI应用的能耗。
此外,英伟达还推出了 GeForce RTX 5080,售价999美元;RTX 5070 Ti, 售价749美元;RTX 5070,售价549美元,预计将于本月底上市。值得一提的是,这款售价549美元的显卡,性能堪比1600美元的RTX 4090。
黄仁勋还介绍,得益于AI技术,英伟达能够将Blackwell显卡缩小并集成到笔记本电脑中,搭载上述显卡的游戏笔记本电脑,售价从1299美元至2899美元不等,将从今年3月起开始发货。
“这就是人工智能令人难以置信的能力之一,它正在彻底改变GeForce。”黄仁勋表示。
“机器人的GPT时刻即将到来”
正如黄仁勋拿出超大系统级晶圆“Grace Blackwell NVL72”Cos美国队长伸手召唤雷神之锤,又将英伟达的最新世界模型非常直白地命名为“NVIDIA Cosmos(宇宙)”,发布完50系列GPU后,他将更多时间留给了英伟达的“AI宇宙”。
黄仁勋首先介绍Llama Nemotron系列开放式大型语言模型 ( LLM ),这些模型采用LLaMA构建,可帮助开发人员在一系列应用程序中创建,可帮助开发人员在一系列应用程序中创建和部署 AI 代理,包括客户支持、欺诈检测以及产品供应链和库存管理优化。
Llama Nemotron模型使用英伟达的最新技术和高质量数据集进行修剪和训练,以增强代理能力,它们擅长指令遵循、聊天、函数调用、编码和数学,同时经过尺寸优化,可以在各种英伟达加速计算资源上运行。
重磅推出的NVIDIA Cosmos,则是一个旨在理解物理世界的世界基础模型,黄仁勋称其效果,“唯有亲眼目睹才能真正理解”。
Cosmos 系列大模型从小到大分为:Nano、Super、Ultra三大类,参数规模从 40 亿到 140 亿不等,基于9000万亿个标记(Tokens)和2000万小时真实世界的人机交互、环境、工业、机器人及驾驶数据训练而成。
据黄仁勋介绍,Cosmos的核心目标并不仅仅是生成创意内容,而是让AI理解物理世界。通过物理AI,开发者能够生成合成数据,训练并优化模型,最终实现机器人技术的突破。因此,Cosmos的设计优先考虑自动驾驶和机器人技术的独特需求,特别是对真实世界环境、照明和物体持久性的高度关注。同时,Cosmos支持视频字幕制作和高质量字幕生成,可辅助训练多模态大型语言模型,为未来的机器人和AI系统提供强大支持。
按照英伟达展示的案例,Cosmos已被应用于模拟真实环境,在工厂车间或驾驶场景中,输入多模态内容(如文本、图像、视频以及机器人传感器数据)可生成基于物理定律的视频。如今,1X、Agile Robots、Wayve、Uber 等机器人和汽车公司已在使用Cosmos。
随后,Cosmos将采用开放许可,并在GitHub上开源,支持大中小不同规模的模型,英伟达希望其像LLaMA3之于企业AI一样,推动机器人和工业AI领域的革命。
黄仁勋还公布了英伟达在数字孪生领域的新突破:Mega Omniverse Blueprint,这一框架旨在为数字孪生环境中的大规模物理AI与机器人队列的开发、测试和优化提供支持。
目前,许多先进的仓库和工厂已经开始使用机器人与人类协作。这些机器人需要在复杂的传感器和自主系统的支持下,进行高度协同性的工作。因此,如何在模拟环境中协调训练、优化操作流程、保障安全并防止中断,成为技术发展的关键所在。
Mega Omniverse Blueprint的核心目标是通过虚拟模拟和优化,在解决方案部署到现实设施之前,确保机器人的工作效率和安全性。在模拟环境中,机器人可通过感知和推理完成任务,规划下一步动作并执行,企业可以不断更新其设施中的机器人大脑,以实现智能化的路径规划和任务分配,从而提升运营效率。此外,Mega还可精确跟踪数字孪生中所有资产的状态和位置。
“机器人技术的 ChatGPT 时刻即将到来。”黄仁勋表示,“世界基础模型对于推动机器人和自动驾驶汽车开发至关重要,但并非所有开发者都具备训练自己世界模型的专业知识和资源,我们创建 Cosmos 是为了让物理 AI 普及化,让每个开发者都能用上通用机器人技术”。
大小通吃,将超级计算机摆到桌头
“更大更好”“大力出奇迹的暴力美学”的Scaling Law,即尺度定律,称得上AI行业的大模型第一性原理,意指大模型能力可以通过算力、参数和数据的堆叠得到大幅提升。
2024年末,围绕Scaling Law的讨论一度热烈,有观点认为Scaling Law正在逐渐失效,AI模型演进速度放缓。
然而,此次演讲中,黄仁勋仍坚定地表示,大量研究人员和业内人士观察并证明“Scaling Law仍在持续发挥作用”,数据越多、模型越大、计算能力越强,模型就越有效。
关于AI范式的变化,黄仁勋进一步指出,Scaling Law的应用已从预训练阶段(Pre-training scaling)逐步过渡到后训练阶段(Post-training scaling),如今进入测试阶段(Test-time scaling),即增加推理时间以改进模型表现而非仅依靠增加参数。
Scaling Law也在推动着对英伟达产品,尤其是Blackwell芯片的巨大需求。被黄仁勋用来Cos美国队长的“盾牌”,是一块Grace Blackwell NVLink72的芯片模型,他透露,英伟达计划造一个由72块Blackwell GPU组成的巨型芯片,AI 浮点性能达到1.4 ExaFLOPS,包括130万亿个晶体管,重量达1.5吨,60万个零部件,大约相当于20辆汽车,功耗120千瓦,拥有超越世界上最快超级计算机的能力。
黄仁勋说,这是有史以来最大的单一芯片,已经在全球45家工厂中生产,英伟达会将部件拆卸并送往各个数据中心重新组装。
展示完“足够大”,黄仁勋还展示了“足够小”。他拿出一款将于今年5月推出的个人 AI 超级计算机Project Digits,其核心是最新的 GB10 Grace Blackwell Superchip,具有足够的处理能力来运行复杂的 AI 模型,同时又很紧凑,可以放在桌子上并使用标准电源插座供电。这个产品尺寸类似 Mac Mini,号称可处理多达 2000 亿个参数的AI模型,起售价为 3000 美元。
每个 Project Digits 都配备了 128GB 的统一内存和高达4TB的NVMe存储。对于要求更高的AI应用,两个Project Digits可以连接在一起,处理多达 4050 亿个参数的模型(Meta 的最佳模型 Llama 3.1 具有 4050 亿个参数)。
用户可以在Project Digits上本地开发和测试AI模型,然后使用相同的 Grace Blackwell架构和Nvidia AI Enterprise软件平台将其部署到云服务或数据中心基础设施。
“人工智能将成为每个行业每个应用的主流。通过Project Digits,Grace Blackwell超级芯片将惠及数百万开发者,”黄仁勋表示,“将 AI 超级计算机放在每个数据科学家、AI 研究人员和学生的办公桌上,使他们能够参与和塑造 AI 时代”。
排版/ 季嘉颖
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)