首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
2025年10月13日 16:54 新浪科技

  新浪科技讯 10月13日下午消息,蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。

  据介绍,在基准测试中,dInfer将扩散语言模型的推理速度相比于英伟达扩散模型框架Fast-dLLM提升了10.7倍;在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011Tokens/秒的速度,首次在开源社区中实现扩散语言模型的单批次推理速度显著超越自回归模型。dInfer的工作表明,扩散语言模型具备显著的效率潜力,可以通过系统性的创新工程兑现,为通往AGI的架构路径提供极具竞争力的选项。

  在配备8块NVIDIA H800 GPU的节点上,dInfer的性能表现令人瞩目:

  在与先前的dLLM推理方案Fast-dLLM的对比中,dInfer在模型效果持平的情况下,平均推理速度(avg TPS)实现了10.7倍的巨大提升(681 vs 63.6) ;在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011 tokens/秒的速度 ;与在业界顶尖的推理服务框架vLLM上运行的、参数量和性能相当的AR模型Qwen2.5-3B相比,dInfer的平均推理速度是其2.5倍(681 vs 277) 。

  蚂蚁集团表示,dInfer连接了前沿研究与产业落地,标志着扩散语言模型从“理论可行”迈向“实践高效”的关键一步。此次开预案,也是诚邀全球的开发者与研究者共同探索扩散语言模型的巨大潜能,构建更加高效、开放的AI新生态。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:何俊熹

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 10-17 必贝特 688759 --
  • 10-16 西安奕材 688783 --
  • 10-15 超颖电子 603175 --
  • 10-14 禾元生物 688765 29.06
  • 10-13 马可波罗 001386 13.75
  • 新浪首页 语音播报 相关新闻 返回顶部