阿里开源通义DeepResearch,性能超OpenAI、DeepSeek旗舰模型

阿里开源通义DeepResearch,性能超OpenAI、DeepSeek旗舰模型
2025年09月17日 11:33 新浪科技

  新浪科技讯 9月17日上午消息,阿里开源旗下首个深度研究Agent模型——通义DeepResearch。该模型在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成绩(State-of-the-art),超越OpenAI Deep Research、DeepSeek-V3.1等Agent模型。目前,通义DeepResearch的模型、框架和方案均已全面开源,用户可在Github、Hugging Face和魔搭社区社区下载模型和代码。

  据悉,针对现有深度研究种模式在处理长周期任务时,Agent会面临“认知空间窒息”和“不可逆的噪声污染”的挑战,导致推理能力下降,最终难以完成真正长程、复杂的研究任务。通义团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路,显著提升了模型的迭代速度和泛化能力。

  在Humanity‘s Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集上,通义DeepResearch模型以3B激活参数,性能超越基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent。(文猛)

海量资讯、精准解读,尽在新浪财经APP

责任编辑:江钰涵

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 09-19 云汉芯城 301563 --
  • 09-19 瑞立科密 001285 --
  • 09-16 锦华新材 920015 18.15
  • 09-16 建发致新 301584 7.05
  • 09-15 联合动力 301656 12.48
  • 新浪首页 语音播报 相关新闻 返回顶部