DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM

DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM
2025年02月26日 09:57 Bianews

鞭牛士 2月26日消息,DeepSeek公布开源周第三天的开源项目——DeepGEMM。

据介绍,DeepGEMM是一个支持密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算的 FP8 通用矩阵乘法库,它为V3/R1模型的训练和推理提供支持。

DeepGEMM在英伟达Hopper系列GPU上可实现高达1350以上的FP8每秒万亿次浮点运算(TFLOPS);完全即时编译;核心逻辑代码约300行——但在大多数矩阵规模下,其性能超过了经过专家优化调整的内核;支持密集型布局以及两种混合专家(MoE)布局。

  • DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM

  • OpenAI「深度研究」功能向ChatGPT Plus等用户开放

  • 英国报纸集体刊登封面抗议政府可能废除AI版权保护提案

  • Perplexity推出5000万美元风险基金,支持早期创业公司

  • 阿里云视频生成大模型万相2.1宣布开源

  • DeepSeek-R2计划提前发布?幻方量化相关人士回应:以官方消息为准

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片