DeepSeek-V3.1发布开源，更强Agent 能力，API调用价格将调整_新浪科技

【TechWeb】8月21日消息，DeepSeek正式发布并开源 DeepSeek-V3.1。

本次升级包含以下主要变化：

混合推理架构，同时支持思考模式与非思考模式；

支持更长的文本生成与处理，当前上下文长度已拓展至 128k；

更高的思考效率，相比 DeepSeek-R1-0528，DeepSeek-V3.1 思考模式能在更短时间内给出答案；

更强的 agent 能力，通过 Post-Training 优化，新模型在工具使用与智能体任务中的表现有较大提升。

官方网页、APP、小程序、API 开放平台所调用模型均已同步更新。

用户可以通过点击对话框中的“深度思考”按钮，实现思考模式与非思考模式的自由切换。

API 接口调用方式保持不变，并增加了对 Anthropic API 格式的支持，开发者们可以轻松接入Claude Code 框架。

据介绍，在代码修复测评 SWE 与命令行终端环境下的复杂任务（Terminal-Bench）测试中，DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。

DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试（browsecomp）与多学科专家级难题测试（HLE）上，DeepSeek-V3.1 性能已大幅领先 R1-0528。

测试结果显示，经过思维链压缩训练后，V3.1-Think 在输出 token 数减少 20%-50% 的情况下，各项任务的平均表现与 R1-0528 持平。

V3.1 在非思考模式下的输出长度也得到了有效控制，相比于 DeepSeek-V3-0324 ，能够在输出长度明显减少的情况下保持相同的模型性能。

V3.1的Base模型在V3的基础上重新做了外扩训练，一共增加训练了 840B tokens。目前Base 模型与后训练模型均已在 Huggingface 与魔搭开源。

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

DeepSeek-V3.1发布开源，更强Agent 能力，API调用价格将调整