阿里开源最强 AI 编程模型 Qwen3-Coder,性能比肩Claude4

阿里开源最强 AI 编程模型 Qwen3-Coder,性能比肩Claude4
2025年07月23日 10:02 MacTalk

来源:MacTalk

去年知名 VC 机构 Menlo Ventures 曾经在 11 月底发布过一份企业 AI 应用现状的报告 。报告中提到,目前 AI 在企业的五个高用例场景分别为:代码生成、聊天机器人、搜索、数据转换和会议纪要。其中,代码生成的占比远高于其它几个

这也是为什么我早早让墨问的研发团队把编程工具切换到了 AI IDE ,并且开始持续关注 vibe coding 的发展。2025 年这个趋势越来越明显,即便是从全世界范围内来看,代码生成都是大模型的最佳应用场景。

我们梳理一下 AI 时代的 IDE 工具,创业 3 年的 Cursor 公司,估值已经到了 99 亿美金。类似的挑战者,国外有 Devin、Bolt.new 等一众玩家。这还只是创业公司,大厂亚马逊(Kiro)、微软(Copilot)也都在这方面下了重注。国内的阿里通义灵码、字节的 Trae、腾讯的 CodeBuddy 等等,都在做类似的编程工具。

你不觉得奇怪吗?这个赛道内怎么能挤满这么多玩家。Jetbrains 发展了 25 年,目前做到了行业 Top 3 ,但年营收也才三四亿美金,这么看,市场规模并不算大。为什么大家要挤进来?这其中的机会是什么?

我理解这里面的逻辑是:

第一,大模型特别适合做 vibe coding。

第二,随着 AI 技术的发展,写简单软件的门槛会变得越来越低。现在,全世界大概有 2500 万的软件工程师,但如果降低门槛的话,软件创作者保守估计会有 2 亿人。这个规模还在持续增加。

第三,企业级开发越来越重视 AI 编程。AI IDE 和 AI Agent 正在快速走进各行各业。

toC 和 toB 通吃,大模型又适合干这个事,于是大厂和创业公司纷纷加入这个赛道开始拼实力。

那 AI 编程的核心竞争力在哪?首先是类似 Cursor 这样的 IDE 的工程和交互能力,但更重要的是大模型基座。我们用了那么多 AI 编程工具,最终你会发现效果好的,都用了 Claude4,这是业界公认的最强编程模型。

中国有类似的编程模型给国内厂商使用吗?以前没有,现在有了。这也是我今天特别高兴的一件事,我们不仅有,而且开源了。

2025 年 7 月的清晨,我从睡梦中醒来,发现阿里巴巴通义团队丢下了一颗重磅炸弹——开源编程模型 Qwen3-Coder 发布了。我想,以后所有程序员和 AI  编程爱好者都会记住这个名字。这是我们性能比肩国外 Claude4 的开源国产编程模型。

1、代码世界的新玩家

说起 AI 编程模型赛道,OpenAI 的 GPT-4.1、Anthropic 的 Claude4,都是圈内大佬。但这次我看阿里巴巴团队在产品发布时明确喊出了:“超越 GPT4.1、比肩 Claude4”的口号,底气何在?

Qwen3-Coder 是千问系列首个采用混合专家 MoE 架构的代码模型,总参数 480B,激活 35B 参数。这是什么概念?简单来说,就是“大脑”更大,“肌肉”更灵活。它原生支持 256K token 上下文,配合 YaRN 技术可拓展到 1M,能吞下完整代码仓库和动态 PR,解决以往模型“短视”的尴尬。事实上,能够吃下、理解和记忆多少上下文,一直是编程模型的一个硬指标。

Qwen3-Coder 当前提供的就是最强版本:Qwen3-Coder-480B-A35B-Instruct,480B 参数激活 35B 参数的 MoE 模型,拥有卓越的代码和 Agent 能力。Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。

2、训练的秘密:数据、数据、还是数据

Qwen3-Coder 在 7.5T 的数据上预训练,70% 都是代码。更难得的是,它用 Qwen2.5-Coder 清洗和重写了低质数据,确保输入的每一口都是“营养餐”。后训练阶段,团队没有走竞赛刷榜的老路,而是用真实代码任务做大规模强化学习,自动生成测试样例,提升代码执行成功率,模型能力也随之提升。

3、真正的“Agent”:让 AI 做你的工具人

这次最大的突破,是 Qwen3-Coder 的 Agent 能力。它不只是写代码,更能自主规划、调用工具、解决多步骤复杂任务。在 WebArena、BFCL 等评测中,Qwen3-Coder 一举打破开源模型纪录,甚至超越 GPT4.1。在 SWE-Bench 任务上,表现可媲美 Claude4。

实测下来,Qwen3-Coder 能调用的工具数量是 Claude 的几倍,复杂任务处理得游刃有余。你可以让它帮你写代码、修 Bug、生成测试用例,甚至一句话生成 3D 物理模拟。AI 编程的门槛被大大降低,Vibe Coding 真的来了。

4. 开源、开放、可玩性爆棚

Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,全球开发者可免费下载。API 已上线阿里云百炼,命令行工具 Qwen Code 也同步开源。你可以用 Qwen Code、Claude Code、Cline 等工具无缝集成 Qwen3-Coder,体验代理式编程的乐趣。

阿里的同学告诉我,Qwen3-Coder 很快将接入通义灵码。全球下载量已超 2000 万,阿里巴巴内部、各大头部企业都在用。AI 编程,正从科幻走向现实。

我想 AI 编程模型的战争,还远未结束。但 Qwen3-Coder 的出现,无疑给行业,尤其是中国带来了新的变量。它让我们看到,开源模型也能做到极致,中国的编程大模型也能做到极致,甚至有机会挑战闭源大厂的霸主地位。

如果你还没试过 Qwen3-Coder,不妨体验下这个国产 AI 好伙伴带来的编程体验。

特别声明:以上内容仅代表作者本人的观点或立场,不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的,请于上述内容发布后的30天内进行。

海量资讯、精准解读,尽在新浪财经APP

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部