大模型企业对标：openAI 2024年H2最新进展_新浪科技

OpenAI业绩超预期增长，预测2024年收入将增长131.25%，但研发新技术带来成本飙升的巨大挑战；面向多模态、深度推理等前沿方向推出GPT-4o系列、o1系列等新模型；持续创新ChatGPT等产品功能，提升用户交互体验，并逐步探索新营收模式，在全球多地组建本地化团队就近提供服务；受高层离职及企业转型影响，解散并新建部分团队；新模型发布带动用户生态持续繁荣，通过广泛外部合作持续夯实高质量数据基础、提升技术应用创新。

表1 Meta近半年最新进展的主要指标表

注：1）财务数据方面，“当前进展”列为2024年整体预测数据，“变化幅度”列基于2023年相应数据进行计算，全部数据源于OpenAI官网、负责人对外发言、公开资料；2）除特别注释外，“变化幅度”列中定量变化指环比，定性变化指公司近半年进展对比上一阶段（截止到天翼智库团队所做第一轮企业对标）的显著变化；3）红色向上箭头表示增加；4）年度经常性收入指一年内从订阅客户处获得的可预测收入。

财务近况：公司创收潜力大，研发新技术带来成本飙升挑战

2024年收入快速增长，且未来潜力巨大。财务文件显示，2024年8月，OpenAI的月收入已达3亿美元，自2023年初以来增长1700%；但毛利率仅41%，远低于行业云软件初创公司的65%平均水平，OpenAI计划在2028年前将毛利率提升到67%。2024年10月，OpenAI首席财务官Sarah Friar接受外媒专访期间预测OpenAI的2024年收入将达到37亿美元，与2023年的16亿美元相比增长131.25%，预计其收入明年将飙升至116亿美元。随着增长加速，OpenAI估值水涨船高，在今年10月的一轮融资后估值已达1570亿美元，大约是年初估值的两倍。

开发和运营更先进的AI系统为其带来巨大开支。OpenAI联合创始人Altman曾指出，随着公司开发更复杂的模型，预计支出将继续超过收入增长，可能还需要筹集数百亿美元才能满足成本。预估数据显示，OpenAI今年运营总成本或将达85亿美元，主要由模型推理、训练、人力成本构成，分别为40亿、30亿、15亿美元。推理成本方面，截至今年3月，OpenAI已花费近40亿美元租用微软的服务器集群来支持ChatGPT及其底层大模型的运转，该集群相当于35万个英伟达A100芯片，其中约29万个芯片为ChatGPT提供支持。训练成本（包括支付数据的费用）方面，截至第一季度，用于OpenAI模型训练的服务器集群已包括12万个英伟达A100，随着OpenAI加快训练最新旗舰模型，训练成本可能将在今年翻一番。人力成本方面，截至目前OpenAI雇用大约1700名员工，随着该公司与谷歌等科技巨头争夺技术人才，最终人力成本在今年可能将高达约15亿美元。

大模型技术：面向多模态、深度推理等前沿方向推出新模型

1.新发布GPT-4o系列模型，提供多模态处理、低时延交互能力

GPT-4o为端到端多模态模型，可实现毫秒级先进视觉音频理解。2024年5月，OpenAI发布新的“全能模型”（omni model）GPT-4o，能提供与GPT-4同等程度的模型能力，推理速度更快，还能提供同时理解文本、图像、音频等内容的多模态能力，具有如下亮点：（1）GPT-4o为端到端多模态模型，模型所有输入和输出都由同一神经网络处理，在文本、推理和编码智能方面基准测试实现GPT-4 Turbo级别性能，同时在多语言、音频和视觉功能上达到新的高水位线；（2）毫秒级响应，GPT-4o对音频输入的响应时间最短为232毫秒，平均为320毫秒，与人类在对话中的响应时间相似；（3）更先进的视觉与音频理解能力、智能感知语气与语态，GPT-4o支持在对话中随时打断，可根据场景生成多种语调，同时支持视频对话；（4）API性价比显著提升，与GPT-4 Turbo相比速度提升2倍、成本降低50%，速率限制提升5倍。

GPT-4o mini模型推进实现更具成本效益的人工智能。2024年7月，OpenAI发布GPT-4o mini，作为GPT-4o系列最具成本效益的型号，该模型具备以下特点：（1）多模态推理能力，具备文本、图像、音频、视频的多模态推理能力，已在API中支持文本和视觉输入，未来计划扩展视频和音频的输入、输出；（2）性能表现优异，在多个全球权威基准测试中成绩超越GPT-3.5 Turbo等模型，如在MMLU文本智能与推理基准测试及Human Eval编码性能测试中分别以82.0%和87.2%的得分领先，在MGSM数学推理测试及多模态推理领域的MMMU评估中分别获得87.0%和59.4%的高分；（3）成本大幅降低，相比原版GPT-4o模型便宜96%-97%。（4）处理能力较强，拥有128k tokens的上下文处理能力，支持16k输出tokens；（5）安全策略创新，是首个使用全新安全策略“指令层次结构”的AI模型，能优先考虑特定指令，使恶意用户更难让模型执行不当操作，有效抵御越狱攻击、即时注入及系统即时提取等风险。

2. 基于GPT-4训练CriticGPT模型以评估高级AI系统内容输出

2024年6月，OpenAI发布基于GPT-4的模型CriticGPT，旨在找出ChatGPT代码输出错误、辅助改进，并更好地帮助工程师评估ChatGPT响应质量和准确性。CriticGPT的发布标志着RLHF（基于人类反馈的强化学习）领域取得重大进步，解决人类评估者在评估日益复杂的AI模型时面临的核心挑战。该模型具备如下特点：（1）可进行智能错误捕获，能深入分析ChatGPT代码输出并指出其中错误，检测LLM（大型语言模型）错误的准确率达63%；（2）可提高评估效率，使用CriticGPT辅助的人类评估者检查ChatGPT代码输出，效率比不使用时高出60%；（3）自然语言反馈，能通过自然语言反馈指出代码问题，还能帮助训练师撰写更全面的批评，减少虚构问题。

3.新发布o1系列推理模型，复杂推理能力大幅提升

OpenAI o1系列推动AI向更深层次的智能推理与问题解决能力发展。2024年9月，OpenAI推出o1系列模型，包括o1、o1-preview和o1-mini三款。该系列模型通过模仿人类的推理过程，能够在回答前进行更深入思考，从而处理更复杂任务，主要特点如下：（1）采用全新推理范式，o1-preview运用思维链（CoT，Chain of Thought）+自我对弈强化学习的推理范式，可将复杂步骤拆解为更简单部分，并在当前方法无效时尝试不同方式，代表着Scaling up从预训练扩展至后训练阶段；（2）领先的深度推理能力，如o1-preview在物理、化学和生物学等复杂任务的基准测试中表现可与博士生媲美，在国际数学奥林匹克竞赛的资格考试中正确率达83%，GPT-4o仅为13%；（3）安全性提升，在一项最难的越狱测试中，o1-preview得分84（满分100），远高于GPT-4o的22分，证明o1-preview在安全规则的执行和应对违规尝试时表现更可靠。

轻量化版本OpenAI o1-mini更好满足开发者对高效解决方案的需求。这款经过优化的推理模型运行速度快、使用成本低，非常适合处理编程相关任务，主要特点如下：（1）性能优化，作为o1系列的轻量版本，o1-mini在保持高质量输出的同时大大提高响应速度，如单词推理问题上，o1-mini比GPT-4o快3-5倍；（2）成本效益高，相比o1-preview，o1-mini使用成本降低80%；（3）编程专长，o1-mini在编码任务上表现突出，可为开发者提供高效代码生成和调试支持，在Codeforces编码竞赛中，o1-mini获得1650 Elo的评分，与o1的1673 Elo相当，高于o1-preview的1258 Elo。

4.推出连续时间一致性模型促进生成式人工智能发展

2024年10月，OpenAI推出新型连续时间一致性模型sCM，将开启视频、图像、三维模型、音频等实时、高质量、跨领域的生成式人工智能新阶段。模型主要特点如下：（1）创新提出TrigFlow统一框架，简化理论公式，整合多个复杂过程，并让训练过程更稳定，为后续模型改进提供坚实基础；（2）生成速度显著提升，仅需两步采样即可生成高质量样本，生成速度提升50倍，如15亿参数模型在单个A100 GPU上生成一张图片只需0.11秒；（3）保持高质量输出效果，采样步骤答复减少但生成样本质量与顶尖扩散模型相当；（4）具有跨领域生成能力，不仅适用于图像生成，还可用于视频、三维模型和音频的实时生成，为多领域应用提供发展广阔前景。

市场发展：持续创新产品功能，逐步探索新商业模式

1.产品与服务：不断完善ChatGPT功能，提升用户交互体验

逐步开放“高级语音模式”（Advanced Voice Mode），提升人机交互体验。2024年7月，OpenAI面向小部分ChatGPT Plus用户推出ChatGPT高级语音模式的Alpha版本进行测试；9月正式向ChatGPT Plus和Team用户推出高级语音模式，支持超过50种语言；10月用户可直接在Windows电脑或Mac客户端使用高级语音模式。高级语音模式的推出是AI对话技术的重要革新，使用户能直接通过语音与ChatGPT进行对话，允许随时打断和调整，甚至能创建和回顾记忆，访问以往交互信息和自定义指令，以提供更加精准和个性化的反馈，极大提升用户交互体验。

引入结构化输出功能（Structured Outputs），显著提升API可靠性和应用精确度。2024年8月，OpenAI在API中引入结构化输出功能，允许API返回JSON或XML等更易于处理的数据格式，以确保模型生成的输出能完全符合开发人员提供的JSON架构，显著提升API的可靠性。同时，OpenAI更新Python和Node SDK，使开发者能像使用Pydantic或是Zod对象一样，简单提供工具的结构或回应格式，SDK便自动处理数据类型转换，将开发者的数据类型转换为支持的JSON结构。

发布GPT-4o with Canvas功能，提高写作和编程的协作体验。2024年10月，OpenAI发布新的交互方式Canvas，允许用户在一个单独窗口中与ChatGPT进行深度合作，进行详细的内嵌反馈、针对性的编辑以及内容重写。在编程方面，Canvas包括调试、代码审查、添加注释和在多种语言之间转换代码等功能；在写作方面，Canvas提供文本润色、可读性调整、语法和清晰度建议等功能。Canvas功能特别适合需要广泛编辑和修订的任务，提升写作和编程的效率和协作体验。

发布ChatGPT Search，正式进军AI搜索领域。2024年10月,OpenAI正式上线搜索功能ChatGPT Search，能使用网络最新信息来回答问题，并提供相关来源的链接。ChatGPT Search覆盖ChatGPT的网页版、手机和桌面应用，可为用户提供经过AI整合后的直接答案，使信息检索更加高效、准确。未来，广告可能会成为OpenAI下一步在搜索领域盈利的选择。

2.商业模式：围绕ChatGPT业务等主业，逐步探索新营收模式

以消费者订阅的ChatGPT业务为核心，通过吸引企业用户增加收入。2024年10月，OpenAI首席财务官Sarah Friar表示，目前OpenAI大约75%的业务来自消费者订阅，企业版ChatGPT虽刚起步，但已经实现可观的年化收入，潜力巨大。企业版ChatGPT付费用户在2024年9月已突破100万，较2023年末的15万增长566.67%。消费者用户方面，ChatGPT付费用户计划的起价为每月20美元，周活跃用户达2.5亿，消费者用户付费转化率达5%-6%。2024年7月ChatGPT Plus付费用户数已突破770万，较去年同期增长285%，9月o1系列模型发布引发新一轮付费用户增长，消费者付费用户已突破1000万。

API直接收入贡献较弱且已在逐步收缩，未来或转向与Azure深度合作的收入分成模式。调研机构Future Search曾在2024年7月对OpenAI的收入构成进行拆解，结果显示，为开发者和企业提供直接访问其AI模型的API接口服务仅为OpenAI贡献15%的收入，OpenAI也从7月9日起停止来自非支持国家和地区的API流量以进行相应业务缩减。此外，通过2023年初与微软Azure合作提供旗下AI模型访问权限，OpenAI有望获得2亿美元的年度分成。

3.市场拓展策略：保持技术领先优势，组建本地团队拓展国际业务

坚持开发最前沿的人工智能模型，将技术创新视为核心驱动力。OpenAI始终不断投入资源进行GPT系列模型研发与升级，Sarah Friar曾在2024年7月对外强调，“对我们来说，最重要的是保持前沿，即建立前沿模型，确保我们最终将通用人工智能（AGI）造福于人类”。11月，OpenAI首席执行官Altman指出，OpenAI当前重点将聚焦开发专注于推理和难题解决的模型，以应对更复杂的计算需求与市场挑战。

通过在全球各地设立办事处以更好地服务全球客户，并获得更多与当地政府、企业和合作伙伴进行交流和合作的机会。2024年4月，OpenAI宣布在日本东京设立该公司在亚洲的首个办事处。10月，OpenAI宣布计划在纽约、西雅图、巴黎、布鲁塞尔和新加坡开设5个新的办事处，同时不断扩大旧金山、伦敦、都柏林和东京办事处，以增强全球影响力。OpenAI曾表示，新加坡是全球人均使用ChatGPT比例最高的地区之一，强调该地区对AI应用的准备程度。新加坡办事处还将与政府主导的支持该地区AI发展的AI Singapore合作，OpenAI将向其投资多达100万美元，以使自身的AI模型更适用于当地语言和文化。

组织及运营：向营利性企业转型，新建团队应对安全及算力需要

多名高层离职，公司向营利性企业转型，部分团队解散。2024年9月底，OpenAI首席技术官Mira Murati、首席研究官Bob McGrew和研究副总裁Barret Zoph先后宣布离职。此后，Mark Chen被任命为研究高级副总裁，OpenAI的研究工作将由他与首席科学家Jakub Pachocki共同领导，而原11位创始团队成员仅剩Sam Altman和Wojciech Zaremba两位仍在留任。同期，多家媒体报道OpenAI正计划重组核心业务，转变为营利性公益企业，不再由非营利性董事会控制。10月23日，OpenAI专注于通用人工智能开发的“AGI Readiness”团队负责人Miles Brundage宣布离职，计划在OpenAI之外继续从事该领域研究工作，而“AGI Readiness”团队也即将解散。

重点布局AI安全及芯片领域，成立新团队谋求技术自研。2024年5月，OpenAI宣布董事会成立安全与安保委员会，除OpenAI时任高层外，还聘请并咨询了其他安全、安保和技术专家来支持这项工作，包括前网络安全官员、为OpenAI提供安全建议的Rob Joyce和John Carlin。该委员会负责就OpenAI项目和运营的关键安全与保障决策提出建议。据路透社10月报道，OpenAI将进行硬件战略调整，组建由约20名工程师组成的芯片开发团队，与博通和台积电联手打造首款自研芯片，旨在支持其AI系统、优化计算资源和降低成本。

行业影响力：新模型持续带动生态繁荣，外部合作反哺技术创新

模型性能迭代带动ChatGPT用户生态持续扩大。统计网站tooltester 显示，2023年5月至2024年4月的一年间，ChatGPT每月访问量都在16亿到18亿之间浮动，2024年9月o1系列新模型的发布带动用户生态快速增长，使ChatGPT跃升为全球访问量第十一的网站。根据Similarweb的最新数据，ChatGPT在2024年10月的月访问量已突破31亿次，相较去年同期同比增长112%，相比同年8月增长18.7%。

通过加强与媒体及科研院所合作，持续夯实高质量训练数据基础、提升模型技术应用能力。2024年5月至10月，OpenAI先后与《大西洋月刊》、Vox Media、TIME、康泰纳仕、赫斯特等美国媒体以及意大利媒体集团GEDI签订内容协议，将多家媒体内容整合至其AI产品中，包括文章、视频、音频等多种形式内容，将为OpenAI的AI模型提供更为广泛和多元的数据支持，进一步提升其技术水平和应用范围。截至目前，OpenAI已与沃顿商学院、洛斯阿拉莫斯国家实验室、美国商务部国家标准与技术研究院旗下的美国人工智能安全研究所、博通和台积电等芯片企业达成战略合作，合作涉及AI教学投资、生物科学研究、AI安全研究及测试评估、自研AI芯片生产等。

本文作者