来源:MacTalk
早上爬起来就发现了这事儿。二爷还从微信对话框扔过来一句兴奋的叹息:太卷了啊,Anthropic 和 OpenAI 双发新品。
2026 年 2 月 6 日凌晨(北京时间),两家领先的大型 AI 企业几乎同时发布了各自的旗舰级产品。 这不是巧合是啥?我的感受是,海外 AI 大厂的重点正从 Chat 和基模,转向基础和“生产力与执行力工具”并重的形态。
一
Anthropic 发布了最新的大语言模型 Claude Opus 4.6,而 OpenAI 则推出了新一代编码与执行智能模型 GPT-5.3-Codex。前几天 Codex 刚刚发布了 macOS 版本,我手里还没捂热呢,GPT-5.3-Codex 又来了。
看了下介绍,两个新品从技术路线、产品设计到市场定位,还挺不一样的。不过,有一点是相同的,这些新品预示着未来一年 AI 在企业级与专业级工作场景的爆发。
Vibe 得差不多了,该干专业的事儿了。
Claude Opus 4.6 是 Anthropic 在其旗舰 Opus 系列上发布的最新版本,官方的定位是为“更全面、更深度的智能工作助手”。
核心进化方向有这么几个:
1、Opus 4.6 引入了 高达 1,000,000 令牌(token)的上下文窗口(beta 状态),这意味着它能够在单次会话中理解和处理几百万字符级别的信息,相当于理解数百页文档、复杂的代码库结构或长期项目数据的能力。此前对语言模型来说,这类规模的“记忆力”是难以想象的。
这种扩展最直接的意义在于:AI 在大型文档、数据库、电子表格和项目档案之间保持连贯理解与推理的能力更强了。
2、强化“多代理协作”的执行,Claude Opus 4.6 不仅提升了模型本体的推理能力,还引入了类似“团队协作”的多 AI Agent 执行框架。不同的任务可以被分配给不同的 AI 子模块(agent),例如一个负责代码生成,一个负责文档总结,还有一个负责测试用例设计,然后汇总输出。
这个功能让它在处理多步骤、多角色协同任务时更像一个真实的工作小组,而不是单一的回答引擎。
3、增强企业办公能力,除了传统的自然语言对话,Opus 4.6 在文档编辑、演示制作、数据分析等办公场景下表现更优。它可以在一份 Excel 表中分析趋势,在 PowerPoint 中自动生成演示摘要,也能根据复杂指令生成完整的财务报表草稿。这是 Anthropic 一贯的策略,吃企业市场,做专业的事儿。
OpenAI 要做广告?not to Claude。
4、Anthropic 一向强调安全与风险最低化,他们这次在 Opus 4.6 中加入了一系列对有害行为的防护机制、行业合规性测试以及针对金融、法律等垂直领域的性能优化。
Opus 4.6 的发布迅速引发了市场反应,一看就是死磕编程和办公领域,这甚至引起了软件服务类股票的短期下跌,因为投资者开始担忧 AI 可能取代传统的办公与业务流程软件。
在墨问里也有这种思考:传统软件已经枯萎,AI 当立。
Anthropic 意图通过 Opus 系列从开发者工具扩展到 知识工作者市场——研究分析、市场报告、财务建模和跨部门项目管理等日常工作,都被视为 Opus 的潜在应用场景。
二
另一方是 OpenAI 的动作,GPT-5.3-Codex 的发布标志着从编程助手到智能执行引擎的演进。
就在 Claude Opus 4.6 发布几分钟后,OpenAI 宣布推出 GPT-5.3-Codex,官方定位是:迄今为止其最强的编码与生产力执行模型。这个我得好好用用,毕竟 CC 已经被封了 😄
这款产品的技术亮点有这么几个:
1、编码专业度与性能跃升。GPT-5.3-Codex 在多个行业基准测试中表现优异,被 OpenAI 宣称为其历史上“最具编码能力的模型”。它在代码生成、调试、重构、测试自动化等专业任务中都有显著提升,相比前一代模型速度提升约 25%。
这一代 Codex 不仅提升了输出质量,还能在 复杂的项目环境中保持长期记忆与状态,例如在大型仓库中跟踪变量定义、依赖关系甚至设计规范。
2、超越编码:成为数字工作桌面助手,这个模型不仅是写代码的工具,更是 “可以执行开发者和专业人士在电脑上能做的几乎所有任务”的智能助理。它支持:
自动撰写 PRD(产品需求文档)
生成用户研究分析
编辑文档与邮件
在表格中分析数据
构建演示稿与报告
部署与 DevOps 自动化流程
换句话说,GPT-5.3-Codex 的目标是缩小 AI 在编码与日常办公之间的鸿沟,让一个模型能够处理从设计到产品发布的大部分流程。
也就是说,编码之外的时候,AI 能干尽干。
另一个值得关注的事情是,这次模型的一部分性能改进来自于早期版本 Codex 自身对它的训练与构建过程进行了自动化协助——这是一个标志性事件,显示了 Agentic AI 在真实工程中的“自举”能力。也就是,开始 online learning 了?还是能自我进化了,这里还是要画个问号。
GPT-5.3-Codex 这次明显是生产力工具的升级,同样瞄准了企业软件开发市场,同时包括了智能流程自动化,也就是工程构建、测试、调试等编程以外的事情。Codex 试图成为企业内的通用 AI 办公平台——类似自动化劳动力。
这个野心可不小。
现在看起来 Codex 和 Claude Code 必有一战。对于国内用户来说,想尝鲜和学习,可优先选择 Codex,或者 Google 的反重力工具,毕竟 CC 账号 太容易被禁止了。
三
Claude Opus 4.6 与 GPT-5.3-Codex 的同日发布,让人感叹 AI 技术的发展速度,真是卷。据说国内大厂在这个月也会密集发布产品,真是个不平凡的春节月。
对咱们用户而言,其实最重要的就两点:
1、要学习和掌握横跨领域的知识,比如产品、运营、构建和综合性知识(人文经济市场等等),而不是仅仅玩 AI Coding。
2、使用各种 AI 产品创造成果。要先做成一件事,要有自己的作品,而不是在各种 AI 产品的海洋里自嗨。
好了,就写到这儿吧,我得去桑班了。
特别声明:以上内容仅代表作者本人的观点或立场,不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的,请于上述内容发布后的30天内进行。

400-690-0000 欢迎批评指正
All Rights Reserved 新浪公司 版权所有

