英伟达也认可了!
据英伟达官网最新消息,为了帮助开发人员安全地试验这些功能并构建自己的专用代理,6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服务可以在单个NVIDIA HGX H200系统上每秒提供多达3872个令牌。开发人员可以使用应用程序编程接口(API)进行测试和试验,该接口预计很快将作为可下载的NIM微服务提供,是NVIDIA AI Enterprise软件平台的一部分。
此外,英伟达还在官网中表示,DeepSeek-R1是一个具有最先进推理能力的开放模型。DeepSeek-R1等推理模型不会提供直接响应,而是对查询进行多次推理,采用思路链、共识和搜索方法来生成最佳答案。

来自英伟达的认可
英伟达称,DeepSeek-R1等推理模型不会提供直接响应,而是对查询进行多次推理,采用思路链、共识和搜索方法来生成最佳答案。执行这一系列推理过程(使用推理得出最佳答案)称为测试时间扩展。DeepSeek-R1是此扩展定律的完美示例,证明了加速计算对于代理AI推理的需求至关重要。
由于模型可以反复“思考”问题,因此它们会创建更多输出标记和更长的生成周期,因此模型质量会不断提高。大量的测试时计算对于实现实时推理和来自DeepSeek-R1等推理模型的更高质量响应至关重要,这需要更大规模的推理部署。R1在需要逻辑推理、推理、数学、编码和语言理解的任务中提供了领先的准确性,同时还提供了高推理效率。
为了帮助开发人员安全地试验这些功能并构建自己的专用代理,6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服务可以在单个NVIDIA HGX H200系统上每秒提供多达3872个令牌。开发人员可以使用应用程序编程接口(API)进行测试和试验,该接口预计很快将作为可下载的NIM微服务提供,是NVIDIA AI Enterprise软件平台的一部分。
DeepSeek-R1 NIM微服务通过支持行业标准API简化了部署。企业可以通过在其首选的加速计算基础设施上运行NIM微服务来最大限度地提高安全性和数据隐私。通过使用NVIDIA AI Foundry和NVIDIA NeMo软件,企业还可以为专门的AI代理创建定制的DeepSeek-R1 NIM微服务。
DeepSeek-R1是一个大型混合专家(MoE)模型。它包含了令人印象深刻的6710亿个参数——比许多其他流行的开源LLM多10倍——支持128000个Token的大输入上下文长度。该模型还在每个层中使用了极多的专家。R1的每一层都有256位专家,每个Token并行路由到八个不同的专家进行评估。
为R1提供实时答案需要许多具有高计算性能的GPU,并通过高带宽和低延迟通信进行连接,以将提示令牌路由到所有专家进行推理。结合NVIDIA NIM微服务中提供的软件优化,一台使用NVLink和NVLink Switch连接的带有八个H200 GPU的服务器可以以每秒高达3872个令牌的速度运行完整的6710亿参数DeepSeek-R1模型。这种吞吐量是通过在每一层使用 NVIDIA Hopper 架构的FP8 Transformer Engine实现的,并且使用900GB/s的NVLink带宽进行MoE专家通信。
充分利用GPU的每秒浮点运算(FLOPS)性能对于实时推理至关重要。下一代NVIDIA Blackwell架构将通过第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的测试时间扩展,第五代Tensor Core可提供高达20 petaflops的峰值FP4计算性能,以及专门针对推理优化的72-GPU NVLink域。
从开源到复现
近日,加州大学伯克利分校的研究人员开发出了中国开发的 AI 语言模型DeepSeek R1-Zero的小规模语言模型复制品,成本约为30美元。语言模型TinyZero是由校园研究生Jiayi Pan和其他三名研究人员领导的项目,由校园教授Alane Suhr教授和伊利诺伊大学厄巴纳-香槟分校助理教授Hao Peng指导。
DeepSeek的R1模型权重和代码库采用公共MIT许可证,因此Pan和他的团队能够访问基础代码来训练一个明显小得多的模型。潘表示,TinyZero同样是开源的,这意味着代码可供公众使用。他说,TinyZero 的开源性质允许人们下载代码并尝试训练和修改模型。“小规模复制非常容易实现,而且成本非常低,即使人们将其作为实验的副项目,”潘说。“从项目一开始,我们的目标基本上就是揭开如何训练这些模型的神秘面纱,更好地理解它们背后的科学和设计决策。”
昨天,微软(397.9, -6.10, -1.51%)官网显示,DeepSeek R1现已在Azure AI Foundry和 GitHub上的模型目录中提供,加入了1800多个模型的多样化产品组合,包括前沿、开源、行业特定和基于任务的AI模型。作为Azure AI Foundry的一部分,DeepSeek R1可在值得信赖、可扩展且企业级就绪的平台上访问,使企业能够无缝集成高级AI,同时满足SLA、安全性和负责任的AI承诺——所有这些都由Microsoft的可靠性和创新支持。
黑石(157.23, 0.16, 0.10%)最新态度
本周,硅谷、华盛顿、华尔街等地的领导人因中国人工智能公司DeepSeek的意外崛起而陷入混乱。许多分析师认为DeepSeek的成功动摇了推动美国人工智能行业发展的核心信念。
但人工智能科学家反驳说,许多担忧都是夸大其词。他们表示,尽管DeepSeek确实代表了人工智能效率的真正进步,但美国人工智能行业仍然具有关键优势。兰德公司人工智能研究员伦纳特·海姆表示:“这并不是人工智能前沿能力的飞跃。我认为市场只是搞错了。”
另外,截至目前,私募股权巨头、全球主要人工智能系统数据中心投资者黑石集团仍持乐观态度。“我们仍然认为,实体基础设施、数据中心和电力的需求十分迫切,”黑石总裁乔纳森·格雷(Jonathan Gray)周四在与投资者举行的第四季度财报电话会议上表示。“这些需求的使用方式可能会发生变化。”
格雷表示,与投资界和企业界的大多数人一样,黑石集团的高管在过去一周花了大量时间来权衡DeepSeek的影响。近年来,黑石集团积极购买和建设数据中心,这是科技公司运行人工智能系统所使用的物理基础设施。2021年,黑石集团以100亿美元收购了美国数据中心公司QTS,去年,黑石集团牵头以约160亿美元收购了在亚洲运营数据中心的AirTrunk。
格雷同时预计,随着人工智能计算能力成本的大幅下降,人工智能将得到更广泛的应用。换句话说,虽然人工智能模型回答特定问题所需的能力可能会减少,但人们会提出更多问题。格雷表示,黑石集团只为签订长期租约的科技公司建造数据中心。“我们不会投机性地建造它们。”他指出,客户使用这些数据中心的方式很可能会改变。
责编:罗晓霞








APP专享直播
热门推荐
最低500万美元,特朗普推出移民“金卡”,取代EB-5签证 收起最低500万美元,特朗普推出移民“金卡”,取代EB-5签证
- 2025年02月26日
- 00:02
- APP专享
- 扒圈小记
9,639
美国“政府效率部”21名工作人员辞职 称不愿帮助削减政府规模
- 2025年02月26日
- 01:35
- APP专享
- 扒圈小记
2,902
特朗普表示想购买俄矿产 获得稀土资源
- 2025年02月25日
- 22:59
- APP专享
- 北京时间
1,967

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 07:50:14
A股中国银河(sh601881)涨停报16.2元,H股涨近17%报8.74港元;中金公司(sh601995)A股涨停报36.43元,H股涨近15%报15.62港元。路透称中金公司(sh601995)将与中国银河(sh601881)拟通过换股方式合并,这笔交易将创建中国第三大券商,预计将于未来几周内宣布。 -
宋谈股经今天 07:38:51
传中金公司(sh601995)将与中国银河(sh601881)合并?官方暂未回应!临近A股尾盘时分,中央汇金旗下中金公司(sh601995)和中国银河(sh601881)双双涨停,分析人士认为,汇金系券商异动与一则传闻有关。市场传出,中金公司(sh601995)将与同业中国银河(sh601881)合并,这笔交易将缔造出一家资产规模达1930亿美元的券商巨头。此前市场曾多次曝出两大券商合并传闻,但均被公司否认。对此,记者联系了中金公司(sh601995)的投资者关系办公室和公关部,但均未对此给出回应。银河证券公关部亦未对此回应。(券商中国) -
宋谈股经今天 07:24:35
今日共99股涨停,连板股总数15只,36股封板未遂,封板率为73%(不含ST股、退市股)。焦点股方面,机器人(sz300024)板块再度爆发,近40股涨停或涨超10%,其中杭齿前进(sh601177)11天9板、中大力德(sz002896)6天4板。此外,叠加了钢铁与国资云概念的杭钢股份(sh600126)走出16天12板。 -
趋势领涨今天 07:19:20
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 07:19:04
今天走势最强的是汽车相关产业链,苏轴股份(bj430418)、明阳科技(bj837663)大涨创出新高;山子高科(sz000981)、万里扬(sz002434)、雪龙集团(sh603949)、银轮股份(sz002126)、三联锻造(sz001282)、中鼎股份(sz000887)、联诚精密(sz002921)等多股涨停。消息面上,特斯拉官方推送软件更新,称2024.45.32.12已开始分批次推送,主要升级内容为:城市道路自动辅助驾驶;驾驶室摄像头;地图包版本更新等对这个板块构成利好。重点是,昨晚特斯拉大跌,今天A股市场汽车板块大涨,这就是东升西落!机器人(sz300024)相关概念今天继续走强,减速器、人形机器人(sz300024)、一体压铸、PEEK材料等相关板块涨幅靠前,江苏博云(sz301003)、宝通科技(sz300031)、横河精密(sz300539)等多股出现20cm涨停。消息面上,宇树机器狗进化“功夫版”大模型,近期由上海人工智能实验室等机构共同发布的一项算法技术,能够使人形机器人(sz300024)从各种状态下实现快速、稳定地站立。刺激了这个板块走强,人形机器人(sz300024)进化很快, 商业化的速度也很很快,所以市场的炒作热情很高,但近期涨幅也确实太大了!大家追涨还需谨慎,看补涨的机会吧。昨天大盘回调,我们提示3340点附近是低吸的机会,详见昨天的文章或者直播,今天大盘就出现了大涨,重点两市个股都是普涨的,但今天大盘反弹没有放量,说明大盘还不具备向上突破的条件,3400点附近不是顶,3500点、3600点也都不是今年的高点,但大盘向上突破还需要时间,总的原则还是低吸为主。 -
趋势领涨今天 07:18:54
港股大涨 A股要加油了!今天大盘在港股大涨的影响下,两市大盘高开高走,盘中虽然出现了多次回落,但最终还是以上涨报收,但相比港股来说,A股只能提鞋了!盘面上,两市个股普涨,减速器、一体压铸、BC电池、人形机器人(sz300024)、汽车热管理、PEEK材料、新型工业化、工业母机等板块涨幅靠前;种业、知识付费、粮食概念、供销社、短剧游戏等板块跌幅靠前,两市近120只个股涨停,一只个股跌停,创业板走势与主板基本同步。本轮大盘反弹是从港股开始的,港股本轮反弹已经超过了35%,今年反弹超过了18%,基本是领涨全球;A股今年反弹0.5%,本轮从低点反弹超过7%,你们说,同一片蓝天,差别怎么就这么大呢?当然,港股主要是国际资金,机构资金等在做多,南向资金基本是天天流入的,近期南向资金流入超过千亿元,但A股内资上周大幅流出超过1800亿元,本周继续大幅流出,包括今天,南向资金流入超过110亿元,但内资今天流出近80亿元,一个天天流入,一个天天流出,难道大家都是在卖出A股抄底港股去了吗?看来,A股再不努力就要被大家淘汰了!重点是腾讯、阿里等科技龙头基本都在港股上市,A股上市公司很多,但垃圾也多,所以,内资天天流出,大盘天天走弱,这就非常正常了!因为内资流出里面包括大小非减持的资金,这是一笔很大的资金,而且是卖不完的资金!不过,尾盘券商启动了拉升,券商是市场人气板块,目前需要券商启动带动人气,重点是大盘面临3400点附近整数关,大盘能否突破这个整数关就看明天券商能否继续走强了!如果明天券商继续走强,A股就有望后发制人,追赶港股了!重点是我们今天上午提到了券商这个板块的机会,今天顺利启动,恭喜了! -
趋势领涨今天 07:18:29
昨天大盘回调,我们提示3340点附近是低吸的机会,详见昨天的文章或者直播,今天大盘就出现了大涨。上午直播,我们提示了券商板块的布局机会,尾盘正是启动券商带动大盘上行,说明整体分析还是准确的,现在重点就是看明天券商能否继续走强,如果能够继续走强,大盘有望开始追赶港股的脚步,否则,大盘还将在3400点下方震荡,但调整还是机会,今天到此。 -
徐小明今天 07:14:25
【盘中直播】语音课见 -
巨丰投资张翠霞今天 07:14:03
4小时运行结束,总结全天市场运行,1)尾盘证券板块放量拉升,市场补量且三大指数收盘涨幅齐超1%,港股反包新高,走势大幅强于A股,历史统计来看,当AH偏离值较大时,有望修正,A股有望向上补涨;2)量能,沪深两市今日成交额19697亿元,较上个交易日19255亿元增加442亿元;3)行业板块方面,以加权涨幅来看56家行业52家红盘,钢铁、证券、通用机械等板块涨幅居前;电信运营、船舶、石油等板块跌幅居前;4)市场延续结构型行情,题材热点快速轮动。详细解盘,可关注《翠霞首席课》的“热点直击”和“操盘指南”~~~ -
宋谈股经今天 07:07:44
2月26日收评:沪指震荡反弹涨超1%,中国银河(sh601881)、中金公司(sh601995)尾盘涨停1、市场全天震荡反弹,三大指数均涨约1%。券商股尾盘拉升,中金公司(sh601995)、中国银河(sh601881)双双涨停。机器人(sz300024)概念股持续走强,兆威机电(sz003021)、宝通科技(sz300031)、上海机电(sh600835)、五洲新春(sh603667)、达意隆(sz002209)等多股涨停。钢铁板块集体走高,三钢闽光(sz002110)、本钢板材(sz000761)、新钢股份(sh600782)、凌钢股份(sh600231)、华菱钢铁(sz000932)等涨停。个股涨多跌少,沪深京三市超4200股飘红,今日成交1.97万亿。截止收盘沪指涨1.02%,深成指涨0.93%,创业板指涨1.23%。2、板块概念方面,机器人(sz300024)、钢铁、券商、房地产等板块涨幅居前,农业、AI医疗、贵金属、民航机场等板块跌幅居前。3、两市共4043只个股上涨,105只个股涨停,998只个股下跌,3只个股跌停,36只股票炸板,炸板率26%。