DeepSeek宣布V3 模型更新,各项能力全面升级

DeepSeek宣布V3 模型更新,各项能力全面升级
2025年03月25日 22:50 新浪科技

  新浪科技讯 3月25日晚间消息,DeepSeek宣布V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。

  据悉,DeepSeek-V3-0324 API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。

  模型推理任务表现提高,新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

  DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。(文猛)

海量资讯、精准解读,尽在新浪财经APP

责任编辑:何俊熹

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 03-31 信凯科技 001335 --
  • 03-31 泰禾股份 301665 --
  • 03-28 泰鸿万立 603210 --
  • 03-26 中国瑞林 603257 20.52
  • 03-24 首航新能 301658 11.8
  • 新浪首页 语音播报 相关新闻 返回顶部