DeepSeek-V3.1发布开源,更强Agent 能力,API调用价格将调整

DeepSeek-V3.1发布开源,更强Agent 能力,API调用价格将调整
2025年08月21日 15:34 TechWeb

【TechWeb】8月21日消息,DeepSeek正式发布并开源 DeepSeek-V3.1。

本次升级包含以下主要变化:

混合推理架构,同时支持思考模式与非思考模式;

支持更长的文本生成与处理,当前上下文长度已拓展至 128k;

更高的思考效率,相比 DeepSeek-R1-0528,DeepSeek-V3.1 思考模式能在更短时间内给出答案;

更强的 agent 能力,通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。       

官方网页、APP、小程序、API 开放平台所调用模型均已同步更新。

用户可以通过点击对话框中的“深度思考”按钮,实现思考模式与非思考模式的自由切换。

API 接口调用方式保持不变,并增加了对 Anthropic API 格式的支持,开发者们可以轻松接入Claude Code 框架。

据介绍,在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。

DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。

测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。

V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

V3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了 840B tokens。目前Base 模型与后训练模型均已在 Huggingface 与魔搭开源。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片