MiniMax M2.5发布:性能比肩Claude Opus 4.6,输入价格约0.3美元/百万Token

MiniMax M2.5发布:性能比肩Claude Opus 4.6,输入价格约0.3美元/百万Token
2026年02月13日 09:13 新浪科技

  新浪科技讯 2月13日上午消息,MiniMax上线新一代文本模型MiniMax M2.5。在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus 4.6,达到了行业最好的水平。更重要的是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。

  在工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项 Agent 任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20% ,达到了行业顶尖水平。

  办公场景中,在 Word、PPT、Excel 金融建模等 Workspace 高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比取得了 59.0%的平均胜率。

  性能之外,M2.5的另一核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100 Token计算,连续运行一小时成本约1美元;若按50 Token计算,成本约0.3美元。

  这意味着1万美元理论上可支持4个Agent连续工作一年。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。

  目前,M2.5已在 MiniMax Agent上线,并于13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长。(文猛)

海量资讯、精准解读,尽在新浪财经APP

责任编辑:杨赐

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 02-25 固德电材 301680 --
  • 02-24 海菲曼 920183 19.71
  • 02-11 通领科技 920187 29.62
  • 02-09 通宝光电 920168 16.17
  • 02-04 海圣医疗 920166 12.64
  • 新浪首页 语音播报 相关新闻 返回顶部