大早上的也太卷了吧？Claude 和 OpenAI 双发旗舰新品_

来源：MacTalk

早上爬起来就发现了这事儿。二爷还从微信对话框扔过来一句兴奋的叹息：太卷了啊，Anthropic 和 OpenAI 双发新品。

2026 年 2 月 6 日凌晨（北京时间），两家领先的大型 AI 企业几乎同时发布了各自的旗舰级产品。这不是巧合是啥？我的感受是，海外 AI 大厂的重点正从 Chat 和基模，转向基础和“生产力与执行力工具”并重的形态。

一

Anthropic 发布了最新的大语言模型 Claude Opus 4.6，而 OpenAI 则推出了新一代编码与执行智能模型 GPT-5.3-Codex。前几天 Codex 刚刚发布了 macOS 版本，我手里还没捂热呢，GPT-5.3-Codex 又来了。

看了下介绍，两个新品从技术路线、产品设计到市场定位，还挺不一样的。不过，有一点是相同的，这些新品预示着未来一年 AI 在企业级与专业级工作场景的爆发。

Vibe 得差不多了，该干专业的事儿了。

Claude Opus 4.6 是 Anthropic 在其旗舰 Opus 系列上发布的最新版本，官方的定位是为“更全面、更深度的智能工作助手”。

核心进化方向有这么几个：

1、Opus 4.6 引入了高达 1,000,000 令牌（token）的上下文窗口（beta 状态），这意味着它能够在单次会话中理解和处理几百万字符级别的信息，相当于理解数百页文档、复杂的代码库结构或长期项目数据的能力。此前对语言模型来说，这类规模的“记忆力”是难以想象的。

这种扩展最直接的意义在于：AI 在大型文档、数据库、电子表格和项目档案之间保持连贯理解与推理的能力更强了。

2、强化“多代理协作”的执行，Claude Opus 4.6 不仅提升了模型本体的推理能力，还引入了类似“团队协作”的多 AI Agent 执行框架。不同的任务可以被分配给不同的 AI 子模块（agent），例如一个负责代码生成，一个负责文档总结，还有一个负责测试用例设计，然后汇总输出。

这个功能让它在处理多步骤、多角色协同任务时更像一个真实的工作小组，而不是单一的回答引擎。

3、增强企业办公能力，除了传统的自然语言对话，Opus 4.6 在文档编辑、演示制作、数据分析等办公场景下表现更优。它可以在一份 Excel 表中分析趋势，在 PowerPoint 中自动生成演示摘要，也能根据复杂指令生成完整的财务报表草稿。这是 Anthropic 一贯的策略，吃企业市场，做专业的事儿。

OpenAI 要做广告？not to Claude。

4、Anthropic 一向强调安全与风险最低化，他们这次在 Opus 4.6 中加入了一系列对有害行为的防护机制、行业合规性测试以及针对金融、法律等垂直领域的性能优化。

Opus 4.6 的发布迅速引发了市场反应，一看就是死磕编程和办公领域，这甚至引起了软件服务类股票的短期下跌，因为投资者开始担忧 AI 可能取代传统的办公与业务流程软件。

在墨问里也有这种思考：传统软件已经枯萎，AI 当立。

Anthropic 意图通过 Opus 系列从开发者工具扩展到知识工作者市场——研究分析、市场报告、财务建模和跨部门项目管理等日常工作，都被视为 Opus 的潜在应用场景。

二

另一方是 OpenAI 的动作，GPT-5.3-Codex 的发布标志着从编程助手到智能执行引擎的演进。

就在 Claude Opus 4.6 发布几分钟后，OpenAI 宣布推出 GPT-5.3-Codex，官方定位是：迄今为止其最强的编码与生产力执行模型。这个我得好好用用，毕竟 CC 已经被封了 😄

这款产品的技术亮点有这么几个：

1、编码专业度与性能跃升。GPT-5.3-Codex 在多个行业基准测试中表现优异，被 OpenAI 宣称为其历史上“最具编码能力的模型”。它在代码生成、调试、重构、测试自动化等专业任务中都有显著提升，相比前一代模型速度提升约 25%。

这一代 Codex 不仅提升了输出质量，还能在复杂的项目环境中保持长期记忆与状态，例如在大型仓库中跟踪变量定义、依赖关系甚至设计规范。

2、超越编码：成为数字工作桌面助手，这个模型不仅是写代码的工具，更是 “可以执行开发者和专业人士在电脑上能做的几乎所有任务”的智能助理。它支持：

自动撰写 PRD（产品需求文档）

生成用户研究分析

编辑文档与邮件

在表格中分析数据

构建演示稿与报告

部署与 DevOps 自动化流程

换句话说，GPT-5.3-Codex 的目标是缩小 AI 在编码与日常办公之间的鸿沟，让一个模型能够处理从设计到产品发布的大部分流程。

也就是说，编码之外的时候，AI 能干尽干。

另一个值得关注的事情是，这次模型的一部分性能改进来自于早期版本 Codex 自身对它的训练与构建过程进行了自动化协助——这是一个标志性事件，显示了 Agentic AI 在真实工程中的“自举”能力。也就是，开始 online learning 了？还是能自我进化了，这里还是要画个问号。

GPT-5.3-Codex 这次明显是生产力工具的升级，同样瞄准了企业软件开发市场，同时包括了智能流程自动化，也就是工程构建、测试、调试等编程以外的事情。Codex 试图成为企业内的通用 AI 办公平台——类似自动化劳动力。

这个野心可不小。

现在看起来 Codex 和 Claude Code 必有一战。对于国内用户来说，想尝鲜和学习，可优先选择 Codex，或者 Google 的反重力工具，毕竟 CC 账号太容易被禁止了。

三

Claude Opus 4.6 与 GPT-5.3-Codex 的同日发布，让人感叹 AI 技术的发展速度，真是卷。据说国内大厂在这个月也会密集发布产品，真是个不平凡的春节月。

对咱们用户而言，其实最重要的就两点：

1、要学习和掌握横跨领域的知识，比如产品、运营、构建和综合性知识（人文经济市场等等），而不是仅仅玩 AI Coding。

2、使用各种 AI 产品创造成果。要先做成一件事，要有自己的作品，而不是在各种 AI 产品的海洋里自嗨。

好了，就写到这儿吧，我得去桑班了。

特别声明：以上内容仅代表作者本人的观点或立场，不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的，请于上述内容发布后的30天内进行。

海量资讯、精准解读，尽在新浪财经APP

头条号入驻

MacTalk

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

400-690-0000 欢迎批评指正

大早上的也太卷了吧？Claude 和 OpenAI 双发旗舰新品

头条号入驻

我跨度 17 年的思考都在这里了

我未来十年的思考都在这里了

基于 Llama 2，做个智能问答机器人

财经自媒体联盟更多自媒体作者

热文排行榜