英伟达也认可了!
据英伟达官网最新消息,为了帮助开发人员安全地试验这些功能并构建自己的专用代理,6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服务可以在单个NVIDIA HGX H200系统上每秒提供多达3872个令牌。开发人员可以使用应用程序编程接口(API)进行测试和试验,该接口预计很快将作为可下载的NIM微服务提供,是NVIDIA AI Enterprise软件平台的一部分。
此外,英伟达还在官网中表示,DeepSeek-R1是一个具有最先进推理能力的开放模型。DeepSeek-R1等推理模型不会提供直接响应,而是对查询进行多次推理,采用思路链、共识和搜索方法来生成最佳答案。

来自英伟达的认可
英伟达称,DeepSeek-R1等推理模型不会提供直接响应,而是对查询进行多次推理,采用思路链、共识和搜索方法来生成最佳答案。执行这一系列推理过程(使用推理得出最佳答案)称为测试时间扩展。DeepSeek-R1是此扩展定律的完美示例,证明了加速计算对于代理AI推理的需求至关重要。
由于模型可以反复“思考”问题,因此它们会创建更多输出标记和更长的生成周期,因此模型质量会不断提高。大量的测试时计算对于实现实时推理和来自DeepSeek-R1等推理模型的更高质量响应至关重要,这需要更大规模的推理部署。R1在需要逻辑推理、推理、数学、编码和语言理解的任务中提供了领先的准确性,同时还提供了高推理效率。
为了帮助开发人员安全地试验这些功能并构建自己的专用代理,6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服务可以在单个NVIDIA HGX H200系统上每秒提供多达3872个令牌。开发人员可以使用应用程序编程接口(API)进行测试和试验,该接口预计很快将作为可下载的NIM微服务提供,是NVIDIA AI Enterprise软件平台的一部分。
DeepSeek-R1 NIM微服务通过支持行业标准API简化了部署。企业可以通过在其首选的加速计算基础设施上运行NIM微服务来最大限度地提高安全性和数据隐私。通过使用NVIDIA AI Foundry和NVIDIA NeMo软件,企业还可以为专门的AI代理创建定制的DeepSeek-R1 NIM微服务。
DeepSeek-R1是一个大型混合专家(MoE)模型。它包含了令人印象深刻的6710亿个参数——比许多其他流行的开源LLM多10倍——支持128000个Token的大输入上下文长度。该模型还在每个层中使用了极多的专家。R1的每一层都有256位专家,每个Token并行路由到八个不同的专家进行评估。
为R1提供实时答案需要许多具有高计算性能的GPU,并通过高带宽和低延迟通信进行连接,以将提示令牌路由到所有专家进行推理。结合NVIDIA NIM微服务中提供的软件优化,一台使用NVLink和NVLink Switch连接的带有八个H200 GPU的服务器可以以每秒高达3872个令牌的速度运行完整的6710亿参数DeepSeek-R1模型。这种吞吐量是通过在每一层使用 NVIDIA Hopper 架构的FP8 Transformer Engine实现的,并且使用900GB/s的NVLink带宽进行MoE专家通信。
充分利用GPU的每秒浮点运算(FLOPS)性能对于实时推理至关重要。下一代NVIDIA Blackwell架构将通过第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的测试时间扩展,第五代Tensor Core可提供高达20 petaflops的峰值FP4计算性能,以及专门针对推理优化的72-GPU NVLink域。
从开源到复现
近日,加州大学伯克利分校的研究人员开发出了中国开发的 AI 语言模型DeepSeek R1-Zero的小规模语言模型复制品,成本约为30美元。语言模型TinyZero是由校园研究生Jiayi Pan和其他三名研究人员领导的项目,由校园教授Alane Suhr教授和伊利诺伊大学厄巴纳-香槟分校助理教授Hao Peng指导。
DeepSeek的R1模型权重和代码库采用公共MIT许可证,因此Pan和他的团队能够访问基础代码来训练一个明显小得多的模型。潘表示,TinyZero同样是开源的,这意味着代码可供公众使用。他说,TinyZero 的开源性质允许人们下载代码并尝试训练和修改模型。“小规模复制非常容易实现,而且成本非常低,即使人们将其作为实验的副项目,”潘说。“从项目一开始,我们的目标基本上就是揭开如何训练这些模型的神秘面纱,更好地理解它们背后的科学和设计决策。”
昨天,微软(402.57, 4.67, 1.17%)官网显示,DeepSeek R1现已在Azure AI Foundry和 GitHub上的模型目录中提供,加入了1800多个模型的多样化产品组合,包括前沿、开源、行业特定和基于任务的AI模型。作为Azure AI Foundry的一部分,DeepSeek R1可在值得信赖、可扩展且企业级就绪的平台上访问,使企业能够无缝集成高级AI,同时满足SLA、安全性和负责任的AI承诺——所有这些都由Microsoft的可靠性和创新支持。
黑石(160.215, 2.98, 1.90%)最新态度
本周,硅谷、华盛顿、华尔街等地的领导人因中国人工智能公司DeepSeek的意外崛起而陷入混乱。许多分析师认为DeepSeek的成功动摇了推动美国人工智能行业发展的核心信念。
但人工智能科学家反驳说,许多担忧都是夸大其词。他们表示,尽管DeepSeek确实代表了人工智能效率的真正进步,但美国人工智能行业仍然具有关键优势。兰德公司人工智能研究员伦纳特·海姆表示:“这并不是人工智能前沿能力的飞跃。我认为市场只是搞错了。”
另外,截至目前,私募股权巨头、全球主要人工智能系统数据中心投资者黑石集团仍持乐观态度。“我们仍然认为,实体基础设施、数据中心和电力的需求十分迫切,”黑石总裁乔纳森·格雷(Jonathan Gray)周四在与投资者举行的第四季度财报电话会议上表示。“这些需求的使用方式可能会发生变化。”
格雷表示,与投资界和企业界的大多数人一样,黑石集团的高管在过去一周花了大量时间来权衡DeepSeek的影响。近年来,黑石集团积极购买和建设数据中心,这是科技公司运行人工智能系统所使用的物理基础设施。2021年,黑石集团以100亿美元收购了美国数据中心公司QTS,去年,黑石集团牵头以约160亿美元收购了在亚洲运营数据中心的AirTrunk。
格雷同时预计,随着人工智能计算能力成本的大幅下降,人工智能将得到更广泛的应用。换句话说,虽然人工智能模型回答特定问题所需的能力可能会减少,但人们会提出更多问题。格雷表示,黑石集团只为签订长期租约的科技公司建造数据中心。“我们不会投机性地建造它们。”他指出,客户使用这些数据中心的方式很可能会改变。
责编:罗晓霞








APP专享直播
热门推荐
最低500万美元,特朗普推出移民“金卡”,取代EB-5签证 收起最低500万美元,特朗普推出移民“金卡”,取代EB-5签证
- 2025年02月26日
- 00:02
- APP专享
- 扒圈小记
10,712
俄会展基金会:乌克兰大部分最具价值的矿藏已归入俄罗斯
- 2025年02月25日
- 08:47
- APP专享
- 扒圈小记
3,414
美国“政府效率部”21名工作人员辞职 称不愿帮助削减政府规模
- 2025年02月26日
- 01:35
- APP专享
- 北京时间
2,930

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 10:10:44
【中证金融官微缩减两融相关数据披露范围 不再披露两融数据】财联社2月26日电,中证金融近日调整了官方微信号的数据披露范围。财联社记者注意到,公开数据由此前每日披露前三个交易日的“转融通和融资融券业务每日数据”,“瘦身”为仅披露“转融通业务每日数据”,也即不再披露融资融券数据。具体来看,此前披露数据包括“两融交易金额、融资买入额、融券卖出额、两融余额、融资余额、融券余额、两融担保资产总额以及平均维持担保比例”等8项数据,瘦身后,变为仅披露“转融资交易金额、转融资余额、转融券余额以及转融通余额”等4项数据。 -
趋势领涨今天 10:09:52
【中证金融官微缩减两融相关数据披露范围 不再披露两融数据】中证金融近日调整了官方微信号的数据披露范围。财联社记者注意到,公开数据由此前每日披露前三个交易日的“转融通和融资融券业务每日数据”,“瘦身”为仅披露“转融通业务每日数据”,也即不再披露融资融券数据。具体来看,此前披露数据包括“两融交易金额、融资买入额、融券卖出额、两融余额、融资余额、融券余额、两融担保资产总额以及平均维持担保比例”等8项数据,瘦身后,变为仅披露“转融资交易金额、转融资余额、转融券余额以及转融通余额”等4项数据。 -
数字江恩今天 09:45:36
看5分钟图,本人在vip课堂其实判断这里是70点量级的回踩,3316支撑。实际3384-3337还不到50个点,强的有点意外。无论如何,今日突破了图上的蓝色轮峰线,结构就有改变了。明天上午是分辨的关键时间,关注3356区间是否支撑,极限3350。若不再跌破3356区间,那么小震荡之后,就算3384的回踩完成;反之,若明天午盘附近跌破3356区间,那也不过是按照原来的预期,跌破3337也空间不大了。明天上午+午盘来分辨即可。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:45:26
本人早就判断3140的上涨没有结束,但没想到宽幅震荡的幅度这么小,也算是意外的强势了。今日机器人(sz300024)板块冲高回落,但新能源发挥稳定,半导体芯片也表现不错。 -
数字江恩今天 09:45:21
A股两市今日成交7479 + 11905 = 19384 亿人民币,相对昨日略微缩量。大盘今天跳空高开高走,反包了昨日的阴线,收涨34个点。个股方面,80%的个股收红上涨。 -
数字江恩今天 09:45:15
关注3350支撑 -
趋势领涨今天 09:28:19
【中金银河(sz300619)合并传闻再制造涨停板 公司无奈:无法回应】午后一则消息迅速在金融圈刷屏,消息称,“中金和银河证券拟通过换股方式合并,预计将于未来几周内宣布”。面对这一重磅消息传闻,记者第一时间向中金、银河两券商进行采访核实,都无法对此做出任何回应,原因也很简单:没有任何相关消息或通知,也没有办法给出回应。事实上,两家券商此前就多次传出合并传闻,每一次都引发市场的广泛关注,但两家公司均予以否认。只能说,这是高层的决策,员工当然不知道,所以,无法回应是正常的! -
北京红竹今天 08:22:20
3、成交额健康全天成交额1.94万亿,上涨4250家,下跌1054家,涨停107家,跌停3家。目前还是正常的买卖成交额,什么时候成交额继续放大,券商和互金大涨,那时候的成交额会有问题。暂时看没大问题。滞涨品种继续干就好。 -
北京红竹今天 08:22:16
2、买在分歧,卖在一致上午人形机器人(sz300024)大涨,上涨一致了,对于这个主线,我还是强调不宜追高,滞涨品种到冰点在低吸,大涨就卖出,不格局了。它的防守线昨天就出现了,并且是非常标准的五分钟级别2个中枢的上涨。DS大方向没结束,但第一波也是末端了,防守线也在五分钟级别三买的位置,当下还是可以交易的。规避高位的,低吸滞涨的,就这么操作就好,只是别格局,一旦跌破防守线立刻走人,别犹豫。目前防守线已经明确,那么策略上还是不变,将仓位降低至半仓,等待客观信号的跌破。 -
北京红竹今天 08:22:13
1、风险是涨出来的最近脑子迷迷糊糊的,睡眠也足够,每天都是8小时睡眠,早起锻炼一个小时,中午还能眯一会,就是经常干一些迷迷糊糊的事。昨晚直播正准备聊,直接点了结束键,中午的午报,看到是夜报的账号,直接点发布,晚上只能用午报发夜报了。生活上迷糊,交易上不能迷糊。目前几个指数都有标准了,风险是涨出来的。基本结构都完成了,至于什么时候上涨结束,看信号就好了。恒生科技指数再创新高,这一波妥妥的大肉,防守线5538点,跌破反弹结束,不跌破反弹还可以继续。波动比较大的ETF,我比较喜欢恒生科技和科创50,1月初和大家聊恒生科技ETF是当下最有性价比的一只ETF,今后它也是。因为它是先行者,只要指数大方向是向上的,它的力度和幅度都会大于沪指。这次如果错过的,那就错了,等下次日线级别回落段出现之后吧。科创50也新高了,防守线在1079点,不破反弹继续,跌破反弹结束。沪指也出现防守线了,点位在3337点,跌破反弹结束,不跌破反弹继续。