阿里开源最强 AI 编程模型 Qwen3-Coder，性能比肩Claude4_

来源：MacTalk

去年知名 VC 机构 Menlo Ventures 曾经在 11 月底发布过一份企业 AI 应用现状的报告。报告中提到，目前 AI 在企业的五个高用例场景分别为：代码生成、聊天机器人、搜索、数据转换和会议纪要。其中，代码生成的占比远高于其它几个。

这也是为什么我早早让墨问的研发团队把编程工具切换到了 AI IDE ，并且开始持续关注 vibe coding 的发展。2025 年这个趋势越来越明显，即便是从全世界范围内来看，代码生成都是大模型的最佳应用场景。

我们梳理一下 AI 时代的 IDE 工具，创业 3 年的 Cursor 公司，估值已经到了 99 亿美金。类似的挑战者，国外有 Devin、Bolt.new 等一众玩家。这还只是创业公司，大厂亚马逊（Kiro）、微软（Copilot）也都在这方面下了重注。国内的阿里通义灵码、字节的 Trae、腾讯的 CodeBuddy 等等，都在做类似的编程工具。

你不觉得奇怪吗？这个赛道内怎么能挤满这么多玩家。Jetbrains 发展了 25 年，目前做到了行业 Top 3 ，但年营收也才三四亿美金，这么看，市场规模并不算大。为什么大家要挤进来？这其中的机会是什么？

我理解这里面的逻辑是：

第一，大模型特别适合做 vibe coding。

第二，随着 AI 技术的发展，写简单软件的门槛会变得越来越低。现在，全世界大概有 2500 万的软件工程师，但如果降低门槛的话，软件创作者保守估计会有 2 亿人。这个规模还在持续增加。

第三，企业级开发越来越重视 AI 编程。AI IDE 和 AI Agent 正在快速走进各行各业。

toC 和 toB 通吃，大模型又适合干这个事，于是大厂和创业公司纷纷加入这个赛道开始拼实力。

那 AI 编程的核心竞争力在哪？首先是类似 Cursor 这样的 IDE 的工程和交互能力，但更重要的是大模型基座。我们用了那么多 AI 编程工具，最终你会发现效果好的，都用了 Claude4，这是业界公认的最强编程模型。

中国有类似的编程模型给国内厂商使用吗？以前没有，现在有了。这也是我今天特别高兴的一件事，我们不仅有，而且开源了。

2025 年 7 月的清晨，我从睡梦中醒来，发现阿里巴巴通义团队丢下了一颗重磅炸弹——开源编程模型 Qwen3-Coder 发布了。我想，以后所有程序员和 AI 编程爱好者都会记住这个名字。这是我们性能比肩国外 Claude4 的开源国产编程模型。

1、代码世界的新玩家

说起 AI 编程模型赛道，OpenAI 的 GPT-4.1、Anthropic 的 Claude4，都是圈内大佬。但这次我看阿里巴巴团队在产品发布时明确喊出了：“超越 GPT4.1、比肩 Claude4”的口号，底气何在？

Qwen3-Coder 是千问系列首个采用混合专家 MoE 架构的代码模型，总参数 480B，激活 35B 参数。这是什么概念？简单来说，就是“大脑”更大，“肌肉”更灵活。它原生支持 256K token 上下文，配合 YaRN 技术可拓展到 1M，能吞下完整代码仓库和动态 PR，解决以往模型“短视”的尴尬。事实上，能够吃下、理解和记忆多少上下文，一直是编程模型的一个硬指标。

Qwen3-Coder 当前提供的就是最强版本：Qwen3-Coder-480B-A35B-Instruct，480B 参数激活 35B 参数的 MoE 模型，拥有卓越的代码和 Agent 能力。Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果，可以与 Claude Sonnet4 媲美。

2、训练的秘密：数据、数据、还是数据

Qwen3-Coder 在 7.5T 的数据上预训练，70% 都是代码。更难得的是，它用 Qwen2.5-Coder 清洗和重写了低质数据，确保输入的每一口都是“营养餐”。后训练阶段，团队没有走竞赛刷榜的老路，而是用真实代码任务做大规模强化学习，自动生成测试样例，提升代码执行成功率，模型能力也随之提升。

3、真正的“Agent”：让 AI 做你的工具人

这次最大的突破，是 Qwen3-Coder 的 Agent 能力。它不只是写代码，更能自主规划、调用工具、解决多步骤复杂任务。在 WebArena、BFCL 等评测中，Qwen3-Coder 一举打破开源模型纪录，甚至超越 GPT4.1。在 SWE-Bench 任务上，表现可媲美 Claude4。

实测下来，Qwen3-Coder 能调用的工具数量是 Claude 的几倍，复杂任务处理得游刃有余。你可以让它帮你写代码、修 Bug、生成测试用例，甚至一句话生成 3D 物理模拟。AI 编程的门槛被大大降低，Vibe Coding 真的来了。

4. 开源、开放、可玩性爆棚

Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源，全球开发者可免费下载。API 已上线阿里云百炼，命令行工具 Qwen Code 也同步开源。你可以用 Qwen Code、Claude Code、Cline 等工具无缝集成 Qwen3-Coder，体验代理式编程的乐趣。

阿里的同学告诉我，Qwen3-Coder 很快将接入通义灵码。全球下载量已超 2000 万，阿里巴巴内部、各大头部企业都在用。AI 编程，正从科幻走向现实。

我想 AI 编程模型的战争，还远未结束。但 Qwen3-Coder 的出现，无疑给行业，尤其是中国带来了新的变量。它让我们看到，开源模型也能做到极致，中国的编程大模型也能做到极致，甚至有机会挑战闭源大厂的霸主地位。

如果你还没试过 Qwen3-Coder，不妨体验下这个国产 AI 好伙伴带来的编程体验。

特别声明：以上内容仅代表作者本人的观点或立场，不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的，请于上述内容发布后的30天内进行。

海量资讯、精准解读，尽在新浪财经APP

头条号入驻

MacTalk

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

400-690-0000 欢迎批评指正

阿里开源最强 AI 编程模型 Qwen3-Coder，性能比肩Claude4

头条号入驻

我跨度 17 年的思考都在这里了

我未来十年的思考都在这里了

基于 Llama 2，做个智能问答机器人

财经自媒体联盟更多自媒体作者

热文排行榜