2026AI发展大预测:通过情境智能实现人工智能代理的规模化扩展

2026AI发展大预测:通过情境智能实现人工智能代理的规模化扩展
2026年01月23日 12:25 电子产品世界

人工智能现代纪元迈入第八个年头之际,行业已褪去生成式 AI 1.0带来的惊艳感。新鲜感逐渐消散,取而代之的是严苛审视。企业不再满足于演示效果,而是对实际成果愈发迫切;市场观察人士对模糊的叙事日益怀疑,行业讨论也从 “人工智能能做什么” 转向 “拿出实际收益,给予我们可见性与控制权”。

这一动态背后的核心前提是:人工智能的关键在于数据,尤其是情境化数据。21世纪10年代的现代数据栈——以云为中心、计算与存储分离、数据管道、仪表盘等——如今已显得微不足道。行业目标已转向构建智能体系统(agentic systems),这类系统需能跨企业运作,处理海量结构化与非结构化数据、复杂工作流、冲突政策、多重身份认证,以及业务流程中蕴含的微妙语义,实现自主行动、协同合作与持续学习。

行业仍充满热情,但同时也陷入矛盾。用一个常被引用的棒球比喻来说:第一局是 2017 年前后的学术探索阶段,相关论文阐述了 Transformer 模型与扩散模型,但当时多数人并未关注;第二局是 ChatGPT 引发的全球 AI 热潮,带来了空前兴奋与大量炒作。

如今,我们已进入人工智能现代纪元的第三局。在这份特别的深度分析中,我们将探讨行业如何从 “生成式 AI 究竟是什么” 的震惊,转向 “如何让它为我们所用” 的务实思考,以及如何让智能体(agents)可靠地采取行动,兑现科技行业承诺的生产力提升。 

为此,CUBE Research举办第五届年度数据预测专题研讨会,本次参会的五位数据及相关领域专家包括:Sanjmo 的桑吉夫莫汉(Sanjeev Mohan)、DB Insight 的托尼贝尔(Tony Baer)、ISG 软件研究的戴夫门宁格(Dave Menninger)、BARC 的凯文皮特里(Kevin Petrie),以及 Blue Badge Insights 的安德鲁布鲁斯特(Andrew Brust)。

按照惯例,在进入正题前,我们先分享来自企业技术研究公司(Enterprise Technology Research, ETR)的调查数据,以凸显行业的巨大变化。ETR 每季度对 1700 多位信息技术决策者开展支出意向调查,接下来我们将聚焦机器学习/人工智能领域,展示其发展态势。下图展示了各行业的支出情况:纵轴为净得分(Net Score),即行业内的支出 momentum;横轴为渗透率(Pervasion),基于客户账户渗透情况计算。数据可追溯至 2024 年 4 月,图中 40% 的红线代表极高的支出增速。如你所见,尽管近期支出 momentum 略有放缓,机器学习 / 人工智能仍领先于所有行业。

图1 行业支出态势(2024年4月- 2026年1月)(图表说明:纵轴为行业支出净得分,横轴为行业渗透率;机器学习 / 人工智能行业始终处于高支出增速区间,高于容器编排、数据库 / 数据仓库软件、云计算等其他行业)

支出momentum的放缓或许表明,我们仍需要更优质的人工智能技术。Workday本周发布的一项调查显示,85%的受访者表示人工智能每周能为其节省1-7小时,但超过三分之一的节省时间被用于修正错误、重写和验证内容,仅有14%的受访者称人工智能能持续带来积极成果。

尽管如此,ETR 数据显示,过去六个月行业仍取得稳步进展。

图2 企业人工智能应用场景调查(样本量 N=1746)图2 企业人工智能应用场景调查(样本量 N=1746)

调查周期:2025年7月—2026年1月

调查问题:在当前经济环境下,贵公司如何利用人工智能解决人才短缺、提升生产力或推动商业模式创新?

(图表说明:受访者选择分布为:通过自动化或任务增强提升员工生产力(61%)、借助人工智能驱动的分析与洞察支持员工决策(55%)、通过新的人工智能赋能服务或产品变革商业模式(25%)、通过特定职能或角色中的人工智能应用限制未来人员编制增长(30%)、通过人工智能减少现有人员编制(6%)、战略性利用人工智能开展这些领域的应用(7%)、目前未在这些领域利用人工智能(15%)、不确定(8%)、其他(2%))

当被问及如何利用人工智能时,1700多位受访客户仍将生产力提升、决策支持和业务转型列为主要收益,且提及比例逐步上升。值得注意的是,自去年7月以来,“限制未来人员编制增长” 的选择比例显著上升,从开始时的21% 增至如今的30%。

最后,我们来看行业内主要参与者的表现——其中部分企业我们今日将重点讨论。

下图维度与前文一致:纵轴为支出增速,横轴为客户账户渗透率,但呈现了一些显著变化。右下角的图表展示了数据点的绘制方式 —— 净得分与调查样本量(Ns),需注意的是,红线以上区域代表极高的发展 momentum。

机器学习 / 人工智能领域主要参与者现状(2026 年 1 月)

供应商

2026 年 1 月净得分

2026 年 1 月共享样本量

Anthropic

72.5%

345

微软(Microsoft)

65.5%

795

OpenAI

60.7%

677

Databricks

58.8%

250

亚马逊云科技(AWS)

58.0%

450

谷歌(Google)

58.0%

483

Hugging Face

48.1%

156

Snowflake

47.5%

265

TensorFlow

36.0%

150

元宇宙(Meta)Llama

29.9%

137

(图表说明:OpenAI 和微软尽管近期面临一些负面舆论,但在客户账户渗透率和支出增速方面仍处于领先地位;Meta 的 Llama 从第一大增长动力企业大幅下滑至红线以下,而 Anthropic 则蓬勃发展;亚马逊云科技与谷歌仍处于激烈竞争中,谷歌正逐步缩小与亚马逊云科技的差距;Snowflake 两年前在机器学习 / 人工智能领域尚无人问津,如今与 Databricks 不相上下,其中 Databricks 的支出增速更高,而 Snowflake 的客户账户渗透率略胜一筹;TensorFlow 并非供应商,传统企业参与者则扎堆竞争,试图在市场中保持相关性) 

核心结论是,行业格局仍在不断变化,客户必须在纷繁复杂的环境中明辨方向、做出抉择。 

从 2025 年评级到 2026 年预测

基于以上背景,先我们来回顾2025年的预测情况。下表汇总了 Data Gang 各位分析师 2025 年的所有预测。(篇幅有限,全文请留言申请) 

参考2025的预测情况,我们2026年预测的具体形式为:每位指定分析师提出一项预测,随后由其他 1-2 位分析师发表评论。如下表所示,2026 年的预测均与数据相关(或至少密切相关),涵盖情境、语义层、服务化软件等主题,同时包括对 OpenAI 的质疑以及治理作为阻碍因素的观点。接下来,我们深入探讨这些预测。

2026 年 Data Gang 预测表 

分析师

预测内容

依据

评论意愿

桑吉夫・莫汉(Sanjeev Mohan)

人工智能代理规模化缺口:要实现规模化,需通过统一数据基础和情境工程解决 “情境问题”

风险投资机构优先关注内存 / 持久化技术;Snowflake 收购 Observe 标志着行业向情境图谱(Context Graphs)转型

托尼・贝尔(TB):“正合我意……”

托尼・贝尔(Tony Baer)

语义影响圈:2026 年将出现平台特定的数据含义与流程保护

SAP、Snowbricks、微软已率先采用;核心驱动力是人工智能需要在正确情境下获取数据

戴夫・门宁格(DM)希望发表评论

戴夫・门宁格(Dave Menninger)

服务优先于软件:专业服务 / 集成商在提供智能体人工智能方面将超越软件供应商

服务提供商不受 “广泛平台成功” 的约束,且已构建数千个定制化、限定范围的智能体

凯文・皮特里(KP)希望发表评论

凯文・皮特里(Kevin Petrie)

OpenAI 遭遇挫折:财务压力和战略过度扩张将导致其陷入困境,Anthropic 和谷歌将趁机填补空缺

OpenAI 面临循环收入和安全风险;Anthropic 在企业市场更具吸引力;谷歌拥有强大的资金支持能力

安德鲁・布鲁斯特(AB)希望发表评论

安德鲁・布鲁斯特(Andrew Brust)

企业人工智能发展停滞:由于人工智能治理极不完善,主流应用的成功将陷入停滞

治理供应商忽视智能体自主性 / 权限问题;企业仍将防护措施视为 “可选” 而非基础必备

桑吉夫・莫汉(SM)希望发表评论

2026 年预测:桑吉夫莫汉 ——“情境至关重要” 但2026年将浪费在 “情境图谱” 的争论上

桑吉夫莫汉将其2026年展望描述为一次 “中途调整” 的结果。他最初的本能是预测 “整合” 叙事的延续 —— 更多的整合与并购活动,例如 Snowflake 收购 Observe,并认为行业叙事已不再仅仅是 “数据作为基础设施”。但在2026年初,他发现了另一个趋势。灵感来自LinkedIn上一篇题为《下一个万亿美元机遇是情境图谱》的论文,随后该平台上关于情境图谱的日常讨论 “爆发式增长”。这种话语转变促使他提出了这一 “双向” 预测。

一方面,莫汉表示 “绝对 100% 确信”,大型语言模型——以及他提到的大型行动模型—— 要有效发挥作用并取得成功,必须依赖情境。另一方面,他预测行业将浪费2026这一年的时间,陷入对情境图谱的争论之中,最终 “无法取得实质性进展”。在他看来,这一模式似曾相识:一个宏大概念、明确的瓶颈,但实际落地情况薄弱。他将其与数据网格(data mesh)相提并论——一个极具吸引力的理念引发了广泛争论,但缺乏持久、可复制的应用模式。

莫汉的批评核心在于,情境图谱缺乏基本基础:没有公认的标准、没有一致的实施模型,也没有稳定的定义。他提出了一系列尖锐问题,旨在揭示言辞与工程实践之间的差距:例如,如何确定我拥有 “核心情境图谱”?是否存在相关标准?是否有统一的存储方式?他认为行业无法就定义达成共识,如今 “情境图谱” 这一术语的定义过于宽泛,这将导致供应商和行业社区产生大量噪音,却难以取得相应的进展。

为使概念更具体,莫汉区分了知识图谱与他认为大型语言模型将受益的情境类型。他认为,知识图谱有助于处理传统交易数据 —— 谁在何时购买了什么 —— 但通常无法解释 “为什么”。而 “为什么” 存在于交易系统之外,如网络搜索、日志、电子邮件和支持互动等数据中。在他的框架中,当这些信号与传统企业数据相关联时,情境便应运而生,形成更丰富的图景。然而,他的预测并非认为这一问题将在 2026 年得到广泛解决;而是认为每家公司都会宣称拥有情境图谱,但行业 “不会取得真正的成功”。

托尼贝尔的回应:情境难以界定,人工智能或可助力构建,但挑战真实存在

托尼贝尔认同莫汉的判断,并通过比喻进一步补充了批评意见。他认为 “情境极具模糊性”,难以在操作层面进行定义 —— 你 “看到时能认出它”,但很难提前清晰地描述它。贝尔表示,莫汉的预测反映了行业在知识图谱方面面临的同样困境 —— 试图理解知识是什么以及如何构建知识体系。

贝尔分享了其播客搭档苏迪尔哈斯贝(Sudhir Hasbe,来自 Neo4j,前谷歌员工)的适度乐观观点。正如贝尔所说,两人的核心观点是人工智能可以帮助指导整合过程。他将其类比为语言模型可以检查数据库,并就模式、索引和相关操作决策提出建议。在贝尔看来,人工智能可能在构建和组织情境方面发挥一定作用,但他 “完全” 同意莫汉的观点,即行业将在 2026 年陷入对情境定义的纠结之中。

小组评论:争论与实施的差距,以及构建企业 “四维图谱” 的难度

小组其他成员的评论进一步强化了概念与执行之间的差距。大家普遍认为,相关讨论将大量涌现,但实际实施却寥寥无几,这与桑吉夫的核心观点一致。

讨论随后扩展到研究界内部的不同观点:一派认为企业必须下苦功构建企业知识图谱或 “四维图谱”—— 涵盖人员、地点、事物和流程,类似于企业的数字化表征,并引用了 Palantir 的相关方法和 Celonis 的案例;另一派则认为,这一问题过于复杂,无法通过人工大规模解决,人工智能需要承担更多繁重工作 —— 这与贝尔提出的 “人工智能可助力实现目标” 的观点相呼应。

2026 年预测:托尼贝尔 —— 语义层比情境更 “可行”,将固化为 “语义影响圈”

托尼贝尔将其 2026 年预测定位为对情境图谱争论的务实回应。在他看来,语义比情境更具可行性,这主要是因为语义是 “已知量”,拥有数十年的实践基础。他回顾了 BusinessObjects Universe 时代,指出语义层当时的功能类似于指标存储库,旨在避免团队每次进行报告时都 “重复造轮子”。

贝尔的观点并非语义能彻底解决情境问题,而是语义 “能在很大程度上推动问题解决”,但 “无法完全实现” 情境构建。他强调的实际洞察是,去年对 “优质数据” 的关注被证明是不够的 —— 关键在于获取 “正确的数据”,而这必然要求明确数据的含义和相关性。他对比了商业智能时代的语义层与现代人工智能的需求:商业智能在 “围墙花园”(数据仓库 / 数据集市)内运作,相关性是隐含的,因为数据是为特定问题精心筛选的;而在人工智能时代,这一边界不复存在 —— 系统需突破 “围墙花园” 的限制,因此情境必须明确,而贝尔认为语义是将这一能力投入实际应用的关键一步。

基于此,贝尔预测行业将重新聚焦语义层和指标存储库,并将其与大型企业应用供应商在人工智能时代的影响力扩展联系起来 —— 这些供应商必须与其他系统实现互操作。他称,SAP、ServiceNow、Salesforce 和 Workday 等供应商 “一直拥有自己的语义体系”,但在历史上,它们 “像保护源代码一样小心翼翼地守护着这些语义”。

他认为这种情况正在改变。作为证据,他指出 SAP 正致力于协调其应用产品组合中的数据模型,并将其打包为 SAP 所称的 “数据产品”—— 这些资产不能简单导出,但可以在 “驻留于 SAP 内部” 的前提下实现共享。贝尔认为这是 SAP 与 Databricks 合作关系的核心,强调这两家 “极具独立性的公司” 之间的合作机制具有重要意义。

小组要求他 “直奔主题”,谈谈 OSI(开放语义交换框架,Open Semantics Interchange)。贝尔将 OSI 比作开放系统互联(Open Systems Interconnect)模型,其目的是使语义能够在不同主体之间移植和解读。在贝尔看来,OSI 使一个组织能够定义诸如 “客户” 之类的概念,并让另一个系统按预期解读该定义,从而有效统一概念界定。他表示,OSI 基于 dbt Labs 开发的框架,“有点像公开指标存储库”。在他看来,若非语义正成为定义人工智能系统所使用的大部分情境的核心,OSI 框架 “根本不会出现”。

贝尔还提到了两个相关趋势 —— 本体论(ontologies)在 “边缘领域” 的早期进展(他认为这是自然延伸),以及微软在 Fabric IQ 中开展的相关工作。但核心预测方向明确:语义影响圈不仅正在兴起,还将在 2026 年逐步固化,并将塑造组织使用数据和人工智能的方式。

托尼贝尔的核心观点是,语义层是行业当前最可行的 “下一步”,比情境图谱更易实现。成功者将不仅利用语义标准化指标,还将借助语义扩展人工智能时代生态系统中的互操作性和持久影响力。

戴夫门宁格的回应:语义至关重要,但以 SQL 为中心的方法无法捕捉业务规则

戴夫门宁格认同贝尔关于语义和情境对人工智能成功的重要性的观点,但也提出了警告。他引用其团队的数据分析研究称,组织在人工智能应用中面临的首要数据挑战是数据可用性,而语义和情境是这一挑战的重要组成部分(尽管并非全部)。门宁格承认,已有多家供应商声称支持语义模型,且许多供应商宣布支持 OSI,这表明行业确实取得了一定进展。

他的批评聚焦于这些努力所采用的核心机制 —— 以 SQL 作为捕捉语义的语言。在门宁格看来,SQL “不足以” 表达大多数企业运营背后的业务规则。他认为,若没有更丰富的表达语言,就无法为人工智能系统提供所需的全部情境。他的结论是,语义正成为热门投资领域,行业确实取得了实际进展,但要彻底解决这一问题,仍 “有很长的路要走”。

小组评论:语义层作为抽象层、大型语言模型的防护栏,以及迈向完整情境的中间步骤

小组评论强化了语义层 “既古老又具新相关性” 的观点。有评论认为,如今的语义模型与数十年前所谓的 OLAP 立方体并无本质区别,其价值在于当多个数据源导致歧义时,语义层能提供一个抽象层和统一的定义体系 —— 防止大型语言模型在多种相互冲突的解读中 “随意选择”。从这个意义上说,语义层是一种实用的防护栏,因为大型语言模型 “有编造含义的坏习惯”,除非定义明确。

语义被视为迈向完整情境的 “良好开端”—— 超越指标存储库,涵盖维度、类别和实体定义(产品、客户、订单等)。但小组也强调了语义的局限性,包括无法覆盖时间要素和更丰富的关系,这与门宁格提出的 “SQL 存在不足” 的担忧相呼应。尽管如此,小组普遍认为,语义层是许多客户尚未迈出的中间步骤,而那些已经建立语义规范的企业,在开展大规模人工智能项目之前,就已在人工智能领域占据了领先优势。

2026 年预测:戴夫门宁格 —— 软件即服务(SaaS)供应商承压,服务提供商蓬勃发展

戴夫门宁格 2026 年的预测聚焦于一个他认为将日益凸显的市场张力:智能体人工智能的需求增长速度远超商业软件工具的可靠支持能力,这将为服务提供商(尤其是全球系统集成商)创造发展机遇,而传统软件即服务(SaaS)供应商则将面临压力。

门宁格的预测始于一个现实判断:他认同行业正取得 “巨大进步”,但强调关键能力的构建 “需要时间”,“我们尚未完全准备就绪”。与此同时,“智能体人工智能无处不在”,其最直接的应用场景之一便是软件平台本身。门宁格指出,供应商正将智能体嵌入其产品中,以自动化任务或帮助用户完成工作,这种方式 “进展顺利” 且 “取得了成功”。

但在他看来,更艰巨的挑战是从嵌入式产品智能体迈向能够跨组织处理各类事务的通用智能体能力 —— 这 “确实是一项巨大的挑战”。

他引用了其调查中的应用数据来支撑这一观点:在涵盖约 1200 个用例的调查中,约 32% 已投入生产 —— 较一年前的 15% 有所上升 —— 这意味着仍有三分之二的用例尚未落地。门宁格将这一差距直接归因于小组讨论中反复提及的各种限制因素,并补充了一个具体事实:大规模构建和运营智能体所需的工具栈尚未成熟。

为量化工具就绪度,门宁格引用了对 “数十家” 人工智能平台供应商的评级结果:

  • 仅有 17% 的供应商在智能体设计工具方面获得 A 级及以上评级;

  • 仅有 11% 的供应商在智能体评估工具方面获得 A 级及以上评级。

他提出疑问:如果没有支持智能体构建和部署的基本工具,如何能实现智能体的大规模应用?他的结论是,现成的商业工具尚未准备好投入大规模应用。他以当天参加的一场供应商简报会为例:供应商的路线图听起来很有吸引力,但相关能力仍处于 “规划中”,“尚未推向市场”。

这带来的经济和竞争影响是,随着智能体人工智能 “成为热门”,企业不会等待打包工具的成熟。门宁格表示,其研究显示,定制工具目前是人工智能应用中第二常用的工具类型,这自然为那些能够设计、集成和运营定制化解决方案的组织带来了优势。他对比了应用供应商向客户传递的信息 —— 例如 SAP 宣传其 “150 个 Joule 智能体” 已嵌入业务应用 —— 与系统集成商在幕后的实际行动。

根据其同事对服务提供商的了解,门宁格表示,他们接触的全球系统集成商(GSIs)已构建了数百个,甚至数千个人工智能智能体。这些智能体的复杂程度各不相同,但他强调,大多数智能体比通用工具更具针对性,能够更快地实现生产级成果。由于无需 “全面出击”,它们可以限定问题范围、快速交付,更迅速地为企业客户创造价值。

在门宁格看来,企业对智能体实际成果的迫切需求,加之商业工具的不成熟,将使 2026 年成为服务提供商蓬勃发展、软件即服务(SaaS)供应商承压的一年。这并非因为智能体本身失败,而是因为运营落地的重任将价值转移到了那些能够提供集成、定制和部署服务的主体身上。

凯文皮特里的回应:集成复杂性是核心障碍 —— 这正是系统集成商的专长领域

凯文皮特里认同门宁格的评估,并引用其研究指出,集成复杂性是智能体工作流成功落地的主要障碍。他认为,许多组织明白,要获得真正的收益,需要将多个功能整合到多步骤的智能体工作流中,而这一需求 “恰好是系统集成商(SI)的专长领域”。

皮特里还引用数据指出咨询公司和系统集成商面临 “发展顺风”,他提到了肖恩罗杰斯(Shawn Rogers)和默夫阿德里安(Merv Adrian)近期的一份报告,核心发现是:企业对外部咨询公司的满意度高于内部 IT 部门。他承认这一现象 “并非史无前例”,但强调这一数据进一步印证了系统集成商在企业跨系统整合智能体工作流过程中的重要价值。

2026 年预测:凯文皮特里 —— 随着市场重新评估风险与转换成本上升,OpenAI 或遇挫折

凯文皮特里 2026 年的预测直接挑战了市场对 OpenAI 传闻中 1000 亿美元融资的投资热情。他认为,OpenAI 的风险高于市场定价,可能会遭遇挫折。皮特里的预测基于他在创新热潮中反复观察到的历史模式 —— 快速采用和过度兴奋会导致技术人员和投资者忽视基本风险。

皮特里从个人职业经历出发,表达了他的质疑。他最初是一名财经记者,在互联网泡沫时代见证了 “眼球数量比利润更重要” 等指标最终崩盘;他还将当前情况与 2005 年进行对比 —— 当时散户投资者将债务抵押债券(CDOs)视为降低抵押贷款投资风险的途径,这是另一个风险本质被误解的案例。他的核心观点并非历史会完全重演,而是人性会不断重复:在繁荣时期,风险往往被低估,直到突发危机。

在此基础上,皮特里认为,无需工商管理硕士(MBA)学位,仅凭 “数据” 和对公司抱负规模的了解,就足以对 OpenAI 产生担忧。他承认 OpenAI 取得了 “令人瞩目的成功”,并列举了多个规模指标:7 亿用户(约占全球人口的 8%)为周活跃用户,已融资 600 亿美元 ——“超过任何一家私营公司”。他最关心的是接下来的发展:OpenAI “计划再融资 1000 亿美元”,他称这一举措 “相当大胆”,并指出这一金额将超过任何一家公司在公开市场的融资规模。

皮特里随后转向资金使用方式及其对可持续性的影响。他估计,OpenAI 2025 年的收入约为 130 亿美元,最终营收率可能达到 200 亿美元,但亏损规模超过了收入。他引用从微软财务数据和其他渠道推断的信息称,仅第三季度的亏损就高达 110 亿美元。他还提出了一个进一步的担忧 —— 明确表示这一观点带有推测性 —— 即 OpenAI 可能 “在每项推理任务上都在亏损”,这意味着其运营利润率为负,成本结构面临巨大压力。

皮特里更核心的战略批评是,OpenAI 为追求通用人工智能(AGI)做出了巨额基础设施投入,而这可能与近期从业者的需求不匹配。他表示,OpenAI 已签署意向书,计划新增 1.3 万亿美元的数据中心容量,用于训练 “超智能模型”,但他的数据显示,从业者当前最需要的是数据质量提升、集成支持和更专业的人才培训 —— 而非通用人工智能。他还声称,OpenAI“欠甲骨文(Oracle)300 亿美元”,并认为这将导致一种尴尬局面:可能需要通过新的融资来履行现有承诺。

皮特里将 OpenAI 的处境与谷歌进行了对比。在他看来,Gemini 现在的模型性能已 “不相上下”,且谷歌可以用现有现金为投资提供资金,无需依赖大规模融资。他对 OpenAI 的战略方向提出质疑:在大规模押注通用人工智能的同时,还试图涉足芯片制造领域,并与博通(Broadcom)合作设计芯片。他认为 OpenAI 应 “更加专注”,并以 Anthropic 作为对比对象:Anthropic 更聚焦于安全问题,安全 “事故” 更少,战略更清晰。皮特里还提到了盈利时间表 —— 据他回忆,Anthropic “预测 2027 年实现盈利”,而 OpenAI 则为 “2029 年”。

他对企业数据和人工智能领导者的建议是,在与供应商合作前,应就供应商稳定性提出根本性问题,因为转换成本正在上升。皮特里认为,由于模型能力相关的元数据以及模型与治理架构的集成方式,更换生成式人工智能模型变得越来越困难。这意味着当转换成本高昂时,供应商风险会增加,而在他看来,OpenAI 的风险 “远高于 Anthropic 或谷歌等替代方案”。

安德鲁布鲁斯特的回应:OpenAI 拥有品牌影响力和先发优势,但行业竞争格局不断变化

安德鲁布鲁斯特在很大程度上认同模型领导地位具有流动性,但反对仅基于当前技术水平评估 OpenAI 的地位。他观察到,他认识的许多专业人士正在使用 Anthropic/Claude,并认为其性能更优,甚至将 Claude Code 用于非编程任务,将其作为个人和商业人工智能工具。但他警告称,基础模型供应商 “每隔几个月就会相互超越”,因此很难根据当前情况判断最终赢家。他以谷歌的复苏为例:许多人曾认为谷歌落后,但如今 Gemini “正处于鼎盛时期”。

布鲁斯特还认为,OpenAI 拥有一种独特的先发优势 —— 品牌默认效应。他将其比作 “舒洁(Kleenex)” 或 “谷歌(Google)” 这类成为通用动词的品牌。他分享了一个轶事:年轻用户将 ChatGPT 简称为 “Chat”(“我在 Chat 里查了一下”),并指出这与企业中 “影子人工智能”(通常是 ChatGPT)的普及有关 —— 人们在家中就开始使用 ChatGPT,对其感到熟悉和舒适。他认为这一优势可能在未来产生重要影响。

最后,布鲁斯特引用了一个历史类比:亚马逊曾长期亏损,被视为 “资金黑洞”,但最终通过在电商市场的市场份额和先发优势取得了成功。这意味着,若能将用户采用转化为可持续优势,长期亏损并不一定意味着企业会失败。

小组评论:亚马逊的 “第二曲线”、盈利模式、使用份额,以及 OpenAI 是否 “大而不倒”

小组的评论进一步拓展了这场辩论。例如,有评论指出,亚马逊的零售业务实现了盈利,但真正的利润来自亚马逊云科技(AWS)—— 这是其 “第二曲线”。若没有亚马逊云科技,亚马逊可能只是 “一个更大的沃尔玛在线”。这一评论表明,OpenAI 面临的真正问题是能否构建类似的相邻盈利引擎,以及当前举措(如购物领域的应用)是否显示出相关迹象。另有评论更直接地质疑其盈利模式:广泛使用并不等同于付费使用(“他是否为此付费?”)。

小组讨论还引入了使用数据,使竞争分析更加复杂。在提及包含 1200 个用例的同一数据集时,尽管 “定制工具” 是第二常用的工具类型,但最常用的工具是 ChatGPT。Gemini 和 Claude 的使用份额约为 OpenAI 的三分之一。

另一个被提出的问题是:OpenAI 是否 “大而不倒”?这一问题强化了一个观点:规模和默认地位可以带来独立于短期盈利能力的韧性。尽管政府不太可能在 OpenAI 陷入严重困境时出手相救,但行业集体(英伟达、微软等)很可能会介入支持。

小组其他评论进一步拓展了成本相关的辩论,认为随着基础设施的完善,推理成本可能会大幅下降,这将随着时间的推移改变单位经济效益。同时,小组也再次强调了 OpenAI 雄心所隐含的营收增长轨迹的规模 —— 称所需的增长 “令人难以置信”。事实上,部分预测显示,OpenAI 到本十年末的收入将超过 3000 亿美元。

经过一番辩论,我们让皮特里对其预测做出最终总结。他澄清,关于推理业务运营利润率为负的说法是推测性的,并指出这一观点来自评论员埃德齐特龙(Ed Zitron)—— 一位 “略带人工智能怀疑态度” 的人士。埃德在 11 月撰文称,据他估计,OpenAI 当年的推理成本超过了收入。皮特里表示,这一信息仅作为担忧的背景,而非确凿的财务声明。

总体而言,皮特里的预测核心是:尽管 OpenAI 的用户采用率和文化影响力无可否认,但巨额资金投入、庞大的承诺和广泛的战略布局带来了显著的风险。随着转换成本上升和治理架构围绕选定供应商固化,数据和人工智能领导者不能忽视这一风险。

2026 年预测:安德鲁布鲁斯特 —— 由于治理无法跟上自主性发展,企业人工智能将陷入停滞

安德鲁布鲁斯特 2026 年的预测是一个警示:企业人工智能的发展将在今年陷入停滞 —— 并非因为模型尚未成熟,而是因为治理体系不完善。在他看来,人工智能能力正 “飞速发展”,而相关管控措施却滞后不前,企业无法长期容忍这种日益扩大的差距。其结果是:实验活动激增,试点项目不断推出,但当风险上升时,大规模部署将放缓甚至逆转。

布鲁斯特的论点始于一个前提:企业在基础管控方面有明确标准,但智能体人工智能的发展速度已超过这些管控措施的构建和运营落地速度。他强调的关键缺失环节包括:控制自主水平的具体机制、工作流审批流程、生命周期治理,以及部署前的智能体测试能力。布鲁斯特认为,在这些机制到位之前,围绕语义、情境和智能体工作流讨论的诸多生产力提升仍将主要停留在理论层面。他的理由是,缺乏规范约束的情况下,“几乎任何事物都可能失控”,而如果智能体失控,它们可能会被部署后又被撤回,因为 “相关责任风险过于广泛”。

桑吉夫莫汉的批评

桑吉夫莫汉的后续评论并未否认治理是阻碍因素,但对 “治理会阻止人工智能发展” 的观点提出了质疑。莫汉认为,人工智能 “无处不在,无法阻挡”,因此企业将通过选择风险较低、影响范围较小且危机场景较少的用例,来规避治理缺口。他认为,2026 年可能是 ChatGPT 推出以来,行业首次在治理方面取得实质性进展的一年 —— 恰恰因为风险已明显到不容忽视的程度。

然而,莫汉也认同布鲁斯特的部分预测,并引用了当天与一家大型供应商的简报会内容:治理相关问题成为焦点,该供应商坦承其在治理方面的进展未达预期 ——“目前尚无成熟的解决方案”。在莫汉看来,这一坦承本身就证明治理滞后于市场能力发展,但同时也表明行业已开始将治理视为首要问题。

随后,讨论扩展为一系列小组评论,核心主题是:企业部署的并非智能体本身,而是问责制和智能体系统。有评论强调 “重力效应”—— 只有当供应商推出符合企业风险状况的治理方案时,智能体的采用率才会提升;即使企业强行推进部署,如果智能体无法得到规范管控,失望情绪也会导致部署放缓。另一条评论将当前阶段比作 “需要自行组装的圣诞礼物”—— 治理不会完全阻止部署,但企业必须自行解决缺失的环节,才能实现生产级应用。

小组还提出了其他实际问题。大家普遍认同,智能体浪潮仍处于早期阶段 —— 智能体进入主流讨论仅约 18 个月,现在期望其成熟并不现实。更切合实际的预期是,智能体将首先出现在定义明确、独立完整的流程和特定用途场景中(例如数据科学智能体),而关于近期将实现企业范围内广泛 “智能体转型” 的说法可能言过其实。相关评论还指出,目前被算作 “生产级智能体” 的很多应用,实际上是现有软件中的智能体功能,而非跨系统运行的自主多步骤工作流。

除治理外,小组还指出,企业人工智能的机遇是真实存在的,但阻碍因素是多维度的。评论提到,在过去一年半中,数据质量已成为首要障碍,同时还存在 “人员问题”—— 例如培训员工、构建确保企业持续应用的运营模式等。小组还注意到,企业内部知识工作者的人工智能使用率可能正在下降 —— 原因包括就业安全焦虑、缺乏焦点以及缺乏可复制的流程 —— 这进一步印证了治理和运营模式成熟是成功部署的前提。

总之,布鲁斯特的预测凸显了企业技术领域的一个普遍真理:缺乏治理会导致风险,而风险会导致发展停滞。尽管如此,共识是人工智能不会为治理而暂停发展,因此企业将通过限定用例来规避治理缺口,同时行业将构建智能体规模化应用所需的问责体系。

感谢各位专家的深刻预测。我们明年将再次相聚,评估这些预测的准确性,并展望本十年后半段的精彩发展。

人工智能现代
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片