【华西计算机】Deepseek连续5日发布新产品,国产AI持续放大招

【华西计算机】Deepseek连续5日发布新产品,国产AI持续放大招
2025年03月04日 07:37 市场投研资讯

(来源:华西研究)

华西计算机

(一)Deepseek5日连续更新,国产AI崛起

国产模型Deep seek 再度5日更新,软件定义硬件能力继续加强,我们认为随着国产模型能力提升加速,国产算力、云、AI商业化落地会持续兑现。

DeepSeek3月1日发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2美元/小时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。

Day 1: FlashMLA —— GPU 的“加速器”亮点:FlashMLA 是为 NVIDIA Hopper GPU 打造的解码内核,专攻变长序列,内存带宽 3000 GB/s,计算性能 580 TFLOPS,支持 BF16 和分页 KV 缓存。

Day 2: DeepEP —— 大模型的“通讯员”亮点:DeepEP 是混合专家模型(MoE)的通信库,支持 NVLink 和 RDMA,优化大规模训练和推理的通信效率。

Day 3: DeepGEMM —— 计算的“大力士”亮点:DeepGEMM 是 FP8 矩阵运算库,性能 1350+ TFLOPS,代码才 300 行,简单高效。

Day 4: DualPipe & EPLB —— 训练的“双人舞”亮点:DualPipe 是双向流水线并行算法,优化计算和通信重叠;EPLB 是专家负载均衡工具,提升 MoE 效率,还附带性能分析数据。

Day 5: 3FS —— 数据管理的“超级管家”亮点:3FS(Fire-Flyer File System)是分布式文件系统,峰值吞吐量 6.6 TiB/s,推理缓存 40 GiB/s,支持数据准备、加载、检查点和缓存。

(二)投资建议

受益标的:

云:金山云、优刻得品高股份青云科技首都在线、微盟集团、迈富时;

AI agent:金山办公润达医疗新致软件开普云彩讯股份科大讯飞

机器人祥鑫科技秦安股份信质集团三联锻造均胜电子华依科技(维权)

机器人大小脑:科远智慧能科科技麦迪科技

一体机:开普云、天玑科技恒为科技云从科技卓翼科技(维权)苏州科达等。

风险提示:市场系统性风险、科技创新政策落地不及预期、中美博弈突发事件

证券分析师:刘泽晶 S1120520020002

发布日期:2025-03-02;

Deepseek连续5日发布新产品,国产AI持续放大招

如需完整报告,请联系对口销售经理

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 03-11 新亚电缆 001382 --
  • 03-10 江南新材 603124 --
  • 03-07 恒鑫生活 301501 --
  • 03-04 弘景光电 301479 41.9
  • 02-28 永杰新材 603271 20.6
  • 新浪首页 语音播报 相关新闻 返回顶部