先让不懂代码的来测？通义这个新产品，代码刚写完，预览就出来了|AI|程序员_新浪科技

这才是未来 AI 该有的样子？

奇怪了。

一款 AI 代码工具刚发布，限量测试却要求「不懂代码」的人优先。

10 月 24 日，阿里旗下的通义正式宣布了「代码模式」，并开放试用预约，首批邀请 1024 名用户进行体验。

通义代码模式旨在降低应用开发的门槛。它针对简单的代码和应用生成需求，主打一个所见即所得。

具体来说，人与 AI 大模型的交流现在会出现在一个专门的窗口里，AI 大模型生成的代码会实时地在网页上跑出来以供预览。

因此，非专业程序员优先是本次测试的特别要求。

这是国内首家实现「让使用者一句话编程，并实时生成可见预览」的公司，通义代码模式的出现，或许代表着一种未来新趋势。

言听计从，不用吵架

24 小时随时等需求的「贴身程序员」来了

最近一段时间，大模型技术正在加速进入下半场。各家科技巨头、AI 创业公司在发展新一代模型的同时，也在不断探索大模型的应用方式。

上周，消费级产品领域曝出了一系列新产品，微软发布的「商业智能体」旨在包揽人们在销售、客服、财务、供应链团队的工作；Anthropic 提出的升级版 Claude 3.5 Sonnet 则主打一个「AI 自己操纵电脑」；在手机端，荣耀提出智能终端的「自动驾驶」，似乎让手机具备了全局跨 App 自动操纵的能力。

通义代码模式，则预示着在生产的一侧，开发领域的新一轮迭代。

在实时可预览代码模式出现之前，我们即使是使用 ChatGPT 等行业顶尖的大模型来写代码，也必须遵循这样的路径：1）先想好与 AI 沟通的措辞提出需求；2）复制 AI 生成的代码，尝试在外部开发环境中运行；3）继续追问大模型，不断修改代码并尝试运行，直到最终获得满意的结果为止。

现在有了通义代码模式，你在叙述完具体功能需求后，系统会创建一个工作空间，AI 在其中与你协同工作。在后续对话过程中，AI 可以实时查看你的新要求，持续编辑代码。问题随时解决，效果实时呈现，就像是在现实世界中的多人协作一样。

而且，AI 还永远不会与你 battle。

ChatGPT 刚刚爆发时人们曾预测，AI 大模型先解放的将会是软件开发。现在看来，我们距离实现这个理想又更近了一步。

我们看到，使用通义代码模式可以捣鼓出各种不同的应用。比如生成一个贪吃蛇小游戏：

带有一定复杂规则的格斗游戏：

甚至还有音乐播放器：

通义产品经理王晓明表示，代码模式的提出主要是来自于用户需求。通义大模型的代码能力属于业界领先，每天有大量程序员在使用通义进行代码生成和代码解释等任务。此外，他们发现还有不少不懂代码的用户会有创建应用、网页等需求。

与通义灵码、AI 程序员主要面向资深程序员的深度编码场景不同，通义代码模式提供了一种新的交互方式，针对简单的代码和应用生成需求，为用户创建一个动态的窗口，将生成的代码文件直接在网页上渲染成应用。

从「通义灵码」到「AI 程序员」再到「通义代码模式」到底迭代了什么？至此，答案就呼之欲出了：

第一是人与 AI 的高度协作。你负责提出想法，调整参数，AI 负责来实现。在这个过程中，若遇到任何问题，用户都可以随时与大模型进行沟通，从而充分发挥人与 AI 各自的优势。
第二是结果直观可视化。即使是没有开发经验的人，也能够通过可视化的演示知道 AI 生成的代码是否跑通了。这样每个人都可以不再限于自己的技术背景，能够快速地实现一些新想法。
最后，不论是人与 AI 的交互，还是代码生成的结果，都是实时的。这样的工作流程大幅提升了效率。

「这相当于让用户拥有一个 24 小时随时提需求的『贴身程序员』，不用排期、随时上线，且能满足你专属需求。」王晓明类比说。他还透露，阿里内部的开发者每天都在让通义协助完成大量的代码任务，从简单的代码排查、生成和解释，到更深入的代码文件辅助生成。「有些同事甚至直接用通义代码模式复刻出了小时候玩的掌机、小霸王上的一些小游戏，比如坦克大战、俄罗斯方块、飞机大战等。」

基于 Qwen 2.5

通义代码模式还在持续进化

任何一款好用的 AI 产品都离不开背后足够聪明的大模型，通义代码模式也是如此。它基于 Qwen 2.5 大模型进行开发。如果你一直在关注大模型领域的动态，会发现 Qwen 大模型最近的热度正在持续提高。

在 9 月底，全球开源社区基于 Qwen 系列二次开发的衍生模型数量已经超过了 Llama 系列，达到了 7.4 万。在 LiveBench 排行榜上，该模型的编码能力得分超过了 OpenAI 的 o1 模型，曾经跻身排行榜第二。在 Chatbot Arena 榜单上，该模型也能排到第五。

而且除了跑分，这个模型在国内外开发者中的口碑也非常好。

无论是在性能方面，还是在影响力方面，Qwen 都已经获得了充分的认可。

通义代码模式的出现，则让 Qwen 2.5 在多个方面充分发挥了自己的潜力。具体来说，代码模式一方面需要基于模型的意图识别和指令理解能力，将涉及到代码的用户意图精准识别出来，另一方面也需要将代码生成能力进行提升。有了 Qwen 2.5 做基础，通义代码模式在代码生成、推理和修复等能力方面表现非常优秀，能够支持 40 多种编程语言。

此外，通义代码模式的代码能力相比常规模式有 30% 以上的显著提升，在代码场景下表现极为优秀的同时，也具备很强的数学和通用能力。

在完成意图的理解和代码的生成之后，通义代码模式还需要将代码文件渲染成小游戏、网页和数据图表等各类应用，并且支持直接对代码的编辑修改（如转换语言、添加注释、问答等）。

这其中最大的难点就在代码渲染层面。为了尽可能扩大代码成功渲染为各类应用的范围，通义的团队需要对用户需求进行深入调研，并且针对主要的几大类场景进行优化，以确保满足用户的实际使用需求。其中涉及到意图理解、模型调优、前端渲染组件适配等一系列复杂的工作。

王晓明表示，通义代码模式目前可以实现大多数只依赖前端渲染的应用生成任务，对于更复杂的前后端代码，目前可以实现长篇的代码片段生成作为辅助。未来，该模式会进一步与 IDE 进行深度结合，帮助用户完成更加完整的前后端系统代码生成，实现更加复杂的应用类型生成。

这才是未来 AI 该有的样子？

通义代码模式选择的人机交互范式，可谓如今各路大模型公司主攻的新方向。

从理念上来说，这一模式与国外知名 AI 公司 Anthropic 提出的新功能 Artifacts 以及 OpenAI 发布的 ChatGPT with Canvas 不谋而合。或者，从某种程度上来说，通义代码模式更像是集合了二者的优势。

Artifacts 的最大特点在于实时预览。长期以来，大型语言模型一直能够生成代码，但在 GitHub 和 Copilot 等人工智能辅助开发环境之外，执行生成的代码通常需要额外的步骤。这些步骤让开发人员感觉繁琐，也把非开发人员挡在了门槛之外。在单独的窗口中保存和运行代码，可以带来方便、即时的体验。同样，在生成图像和其他可视化输出时也是如此。

所以，在 Artifacts 问世之际，很多人将其称为「本年度最重要的 AI 功能」、「Claude AI 最有用的功能」…… 还有人评价说，它「比 GPT-4o 还要震撼，这才是未来 AI 的样子」。

不过，Artifacts 也有一些不方便的地方，比如对于编程语言之间的自动转换、注释的添加还没有做到很好的支持。OpenAI 随后发布的 ChatGPT with Canvas 倒是提供了这些功能，但并不支持代码预览和应用生成，前面提到的种种问题依然存在。

通义代码模式更像是二者的结合体。它能够实现类似 Claude Artifacts 的代码生成和预览功能，并且还支持 Claude 不具备的代码编辑、添加注释、转换语言等功能，可以一步到位实现小游戏、网页、数据图表等各类应用的预览和使用，所触及的人群更加广泛。

同时，为了让那些不会写指令的用户直接创建应用，通义代码模式预置了一批提前生成好的小游戏和应用，用户可以直接使用。如果需要修改，用户只需要简单改一下指令，就能生成符合自己需要的应用。

如果说，未来的人类社会不可避免地走向人机协作，那么真正的挑战不仅在于如何打造更智能的 AI，还在于如何让这种智能易于获取、直观自然，并能无缝融入现有的工作流程。

在大模型之争的上半场，大多数企业都在关注前者。如今到了下半场，关注后者的企业将变得越来越多，OpenAI、Anthropic、阿里通义都属于行动较早的那一拨。

最后，关于「为什么要招募不懂代码的用户做测试」，王晓明回答说，「不懂代码的人更关注的是能否使用 AI 生成自己需要的各类应用，比如搭建个人博客、生成贪吃蛇小游戏、编写数据图表等，甚至还有用户希望用通义来生成一个表白网站的。对于这些用户来说，更重要的是应用生成的简便程度和可用性，而不是底层的代码实现逻辑。」

从实际使用场景出发，只需要用「大白话叙述」就能构建起符合我们需要的应用，这样的工具才是真正能够提升效率的工具，能够让更多的人用起来。

因此，「通义代码模式」用户的大头可以不是程序员，可以是学生、老师、数据分析师，自媒体从业者…… 测试者自然要更贴近这些人。

听起来，这会是一场非常有趣的测试，得到的洞察也会非常丰富。

如果你也想参与测试，可以在通义 App 或者通义 PC 页面对话框输入「1024」进行预约。期待大家的测试反馈。