大模型企业对标:openAI 2024年H2最新进展

大模型企业对标:openAI 2024年H2最新进展
2024年11月29日 14:05 飞象网

OpenAI业绩超预期增长,预测2024年收入将增长131.25%,但研发新技术带来成本飙升的巨大挑战;面向多模态、深度推理等前沿方向推出GPT-4o系列、o1系列等新模型;持续创新ChatGPT等产品功能,提升用户交互体验,并逐步探索新营收模式,在全球多地组建本地化团队就近提供服务;受高层离职及企业转型影响,解散并新建部分团队;新模型发布带动用户生态持续繁荣,通过广泛外部合作持续夯实高质量数据基础、提升技术应用创新。

表1 Meta近半年最新进展的主要指标表

注:1)财务数据方面,“当前进展”列为2024年整体预测数据,“变化幅度”列基于2023年相应数据进行计算,全部数据源于OpenAI官网、负责人对外发言、公开资料;2)除特别注释外,“变化幅度”列中定量变化指环比,定性变化指公司近半年进展对比上一阶段(截止到天翼智库团队所做第一轮企业对标)的显著变化;3)红色向上箭头表示增加;4)年度经常性收入指一年内从订阅客户处获得的可预测收入。

财务近况:公司创收潜力大,研发新技术带来成本飙升挑战

2024年收入快速增长,且未来潜力巨大。财务文件显示,2024年8月,OpenAI的月收入已达3亿美元,自2023年初以来增长1700%;但毛利率仅41%,远低于行业云软件初创公司的65%平均水平,OpenAI计划在2028年前将毛利率提升到67%。2024年10月,OpenAI首席财务官Sarah Friar接受外媒专访期间预测OpenAI的2024年收入将达到37亿美元,与2023年的16亿美元相比增长131.25%,预计其收入明年将飙升至116亿美元。随着增长加速,OpenAI估值水涨船高,在今年10月的一轮融资后估值已达1570亿美元,大约是年初估值的两倍。

开发和运营更先进的AI系统为其带来巨大开支。OpenAI联合创始人Altman曾指出,随着公司开发更复杂的模型,预计支出将继续超过收入增长,可能还需要筹集数百亿美元才能满足成本。预估数据显示,OpenAI今年运营总成本或将达85亿美元,主要由模型推理、训练、人力成本构成,分别为40亿、30亿、15亿美元。推理成本方面,截至今年3月,OpenAI已花费近40亿美元租用微软的服务器集群来支持ChatGPT及其底层大模型的运转,该集群相当于35万个英伟达A100芯片,其中约29万个芯片为ChatGPT提供支持。训练成本(包括支付数据的费用)方面,截至第一季度,用于OpenAI模型训练的服务器集群已包括12万个英伟达A100,随着OpenAI加快训练最新旗舰模型,训练成本可能将在今年翻一番。人力成本方面,截至目前OpenAI雇用大约1700名员工,随着该公司与谷歌等科技巨头争夺技术人才,最终人力成本在今年可能将高达约15亿美元。

大模型技术:面向多模态、深度推理等前沿方向推出新模型

1.新发布GPT-4o系列模型,提供多模态处理、低时延交互能力

GPT-4o为端到端多模态模型,可实现毫秒级先进视觉音频理解。2024年5月,OpenAI发布新的“全能模型”(omni model)GPT-4o,能提供与GPT-4同等程度的模型能力,推理速度更快,还能提供同时理解文本、图像、音频等内容的多模态能力,具有如下亮点:(1)GPT-4o为端到端多模态模型,模型所有输入和输出都由同一神经网络处理,在文本、推理和编码智能方面基准测试实现GPT-4 Turbo级别性能,同时在多语言、音频和视觉功能上达到新的高水位线;(2)毫秒级响应,GPT-4o对音频输入的响应时间最短为232毫秒,平均为320毫秒,与人类在对话中的响应时间相似;(3)更先进的视觉与音频理解能力、智能感知语气与语态,GPT-4o支持在对话中随时打断,可根据场景生成多种语调,同时支持视频对话;(4)API性价比显著提升,与GPT-4 Turbo相比速度提升2倍、成本降低50%,速率限制提升5倍。

GPT-4o mini模型推进实现更具成本效益的人工智能。2024年7月,OpenAI发布GPT-4o mini,作为GPT-4o系列最具成本效益的型号,该模型具备以下特点:(1)多模态推理能力,具备文本、图像、音频、视频的多模态推理能力,已在API中支持文本和视觉输入,未来计划扩展视频和音频的输入、输出;(2)性能表现优异,在多个全球权威基准测试中成绩超越GPT-3.5 Turbo等模型,如在MMLU文本智能与推理基准测试及Human Eval编码性能测试中分别以82.0%和87.2%的得分领先,在MGSM数学推理测试及多模态推理领域的MMMU评估中分别获得87.0%和59.4%的高分;(3)成本大幅降低,相比原版GPT-4o模型便宜96%-97%。(4)处理能力较强,拥有128k tokens的上下文处理能力,支持16k输出tokens;(5)安全策略创新,是首个使用全新安全策略“指令层次结构”的AI模型,能优先考虑特定指令,使恶意用户更难让模型执行不当操作,有效抵御越狱攻击、即时注入及系统即时提取等风险。

2. 基于GPT-4训练CriticGPT模型以评估高级AI系统内容输出

2024年6月,OpenAI发布基于GPT-4的模型CriticGPT,旨在找出ChatGPT代码输出错误、辅助改进,并更好地帮助工程师评估ChatGPT响应质量和准确性。CriticGPT的发布标志着RLHF(基于人类反馈的强化学习)领域取得重大进步,解决人类评估者在评估日益复杂的AI模型时面临的核心挑战。该模型具备如下特点:(1)可进行智能错误捕获,能深入分析ChatGPT代码输出并指出其中错误,检测LLM(大型语言模型)错误的准确率达63%;(2)可提高评估效率,使用CriticGPT辅助的人类评估者检查ChatGPT代码输出,效率比不使用时高出60%;(3)自然语言反馈,能通过自然语言反馈指出代码问题,还能帮助训练师撰写更全面的批评,减少虚构问题。

3.新发布o1系列推理模型,复杂推理能力大幅提升

OpenAI o1系列推动AI向更深层次的智能推理与问题解决能力发展。2024年9月,OpenAI推出o1系列模型,包括o1、o1-preview和o1-mini三款。该系列模型通过模仿人类的推理过程,能够在回答前进行更深入思考,从而处理更复杂任务,主要特点如下:(1)采用全新推理范式,o1-preview运用思维链(CoT,Chain of Thought)+自我对弈强化学习的推理范式,可将复杂步骤拆解为更简单部分,并在当前方法无效时尝试不同方式,代表着Scaling up从预训练扩展至后训练阶段;(2)领先的深度推理能力,如o1-preview在物理、化学和生物学等复杂任务的基准测试中表现可与博士生媲美,在国际数学奥林匹克竞赛的资格考试中正确率达83%,GPT-4o仅为13%;(3)安全性提升,在一项最难的越狱测试中,o1-preview得分84(满分100),远高于GPT-4o的22分,证明o1-preview在安全规则的执行和应对违规尝试时表现更可靠。

轻量化版本OpenAI o1-mini更好满足开发者对高效解决方案的需求。这款经过优化的推理模型运行速度快、使用成本低,非常适合处理编程相关任务,主要特点如下:(1)性能优化,作为o1系列的轻量版本,o1-mini在保持高质量输出的同时大大提高响应速度,如单词推理问题上,o1-mini比GPT-4o快3-5倍;(2)成本效益高,相比o1-preview,o1-mini使用成本降低80%;(3)编程专长,o1-mini在编码任务上表现突出,可为开发者提供高效代码生成和调试支持,在Codeforces编码竞赛中,o1-mini获得1650 Elo的评分,与o1的1673 Elo相当,高于o1-preview的1258 Elo。

4.推出连续时间一致性模型促进生成式人工智能发展

2024年10月,OpenAI推出新型连续时间一致性模型sCM,将开启视频、图像、三维模型、音频等实时、高质量、跨领域的生成式人工智能新阶段。模型主要特点如下:(1)创新提出TrigFlow统一框架,简化理论公式,整合多个复杂过程,并让训练过程更稳定,为后续模型改进提供坚实基础;(2)生成速度显著提升,仅需两步采样即可生成高质量样本,生成速度提升50倍,如15亿参数模型在单个A100 GPU上生成一张图片只需0.11秒;(3)保持高质量输出效果,采样步骤答复减少但生成样本质量与顶尖扩散模型相当;(4)具有跨领域生成能力,不仅适用于图像生成,还可用于视频、三维模型和音频的实时生成,为多领域应用提供发展广阔前景。

市场发展:持续创新产品功能,逐步探索新商业模式

1.产品与服务:不断完善ChatGPT功能,提升用户交互体验

逐步开放“高级语音模式”(Advanced Voice Mode),提升人机交互体验。2024年7月,OpenAI面向小部分ChatGPT Plus用户推出ChatGPT高级语音模式的Alpha版本进行测试;9月正式向ChatGPT Plus和Team用户推出高级语音模式,支持超过50种语言;10月用户可直接在Windows电脑或Mac客户端使用高级语音模式。高级语音模式的推出是AI对话技术的重要革新,使用户能直接通过语音与ChatGPT进行对话,允许随时打断和调整,甚至能创建和回顾记忆,访问以往交互信息和自定义指令,以提供更加精准和个性化的反馈,极大提升用户交互体验。

引入结构化输出功能(Structured Outputs),显著提升API可靠性和应用精确度。2024年8月,OpenAI在API中引入结构化输出功能,允许API返回JSON或XML等更易于处理的数据格式,以确保模型生成的输出能完全符合开发人员提供的JSON架构,显著提升API的可靠性。同时,OpenAI更新Python和Node SDK,使开发者能像使用Pydantic或是Zod对象一样,简单提供工具的结构或回应格式,SDK便自动处理数据类型转换,将开发者的数据类型转换为支持的JSON结构。

发布GPT-4o with Canvas功能,提高写作和编程的协作体验。2024年10月,OpenAI发布新的交互方式Canvas,允许用户在一个单独窗口中与ChatGPT进行深度合作,进行详细的内嵌反馈、针对性的编辑以及内容重写。在编程方面,Canvas包括调试、代码审查、添加注释和在多种语言之间转换代码等功能;在写作方面,Canvas提供文本润色、可读性调整、语法和清晰度建议等功能。Canvas功能特别适合需要广泛编辑和修订的任务,提升写作和编程的效率和协作体验。

发布ChatGPT Search,正式进军AI搜索领域。2024年10月,OpenAI正式上线搜索功能ChatGPT Search,能使用网络最新信息来回答问题,并提供相关来源的链接。ChatGPT Search覆盖ChatGPT的网页版、手机和桌面应用,可为用户提供经过AI整合后的直接答案,使信息检索更加高效、准确。未来,广告可能会成为OpenAI下一步在搜索领域盈利的选择。

2.商业模式:围绕ChatGPT业务等主业,逐步探索新营收模式

以消费者订阅的ChatGPT业务为核心,通过吸引企业用户增加收入。2024年10月,OpenAI首席财务官Sarah Friar表示,目前OpenAI大约75%的业务来自消费者订阅,企业版ChatGPT虽刚起步,但已经实现可观的年化收入,潜力巨大。企业版ChatGPT付费用户在2024年9月已突破100万,较2023年末的15万增长566.67%。消费者用户方面,ChatGPT付费用户计划的起价为每月20美元,周活跃用户达2.5亿,消费者用户付费转化率达5%-6%。2024年7月ChatGPT Plus付费用户数已突破770万,较去年同期增长285%,9月o1系列模型发布引发新一轮付费用户增长,消费者付费用户已突破1000万。

API直接收入贡献较弱且已在逐步收缩,未来或转向与Azure深度合作的收入分成模式。调研机构Future Search曾在2024年7月对OpenAI的收入构成进行拆解,结果显示,为开发者和企业提供直接访问其AI模型的API接口服务仅为OpenAI贡献15%的收入,OpenAI也从7月9日起停止来自非支持国家和地区的API流量以进行相应业务缩减。此外,通过2023年初与微软Azure合作提供旗下AI模型访问权限,OpenAI有望获得2亿美元的年度分成。

3.市场拓展策略:保持技术领先优势,组建本地团队拓展国际业务

坚持开发最前沿的人工智能模型,将技术创新视为核心驱动力。OpenAI始终不断投入资源进行GPT系列模型研发与升级,Sarah Friar曾在2024年7月对外强调,“对我们来说,最重要的是保持前沿,即建立前沿模型,确保我们最终将通用人工智能(AGI)造福于人类”。11月,OpenAI首席执行官Altman指出,OpenAI当前重点将聚焦开发专注于推理和难题解决的模型,以应对更复杂的计算需求与市场挑战。

通过在全球各地设立办事处以更好地服务全球客户,并获得更多与当地政府、企业和合作伙伴进行交流和合作的机会。2024年4月,OpenAI宣布在日本东京设立该公司在亚洲的首个办事处。10月,OpenAI宣布计划在纽约、西雅图、巴黎、布鲁塞尔和新加坡开设5个新的办事处,同时不断扩大旧金山、伦敦、都柏林和东京办事处,以增强全球影响力。OpenAI曾表示,新加坡是全球人均使用ChatGPT比例最高的地区之一,强调该地区对AI应用的准备程度。新加坡办事处还将与政府主导的支持该地区AI发展的AI Singapore合作,OpenAI将向其投资多达100万美元,以使自身的AI模型更适用于当地语言和文化。

组织及运营:向营利性企业转型,新建团队应对安全及算力需要

多名高层离职,公司向营利性企业转型,部分团队解散。2024年9月底,OpenAI首席技术官Mira Murati、首席研究官Bob McGrew和研究副总裁Barret Zoph先后宣布离职。此后,Mark Chen被任命为研究高级副总裁,OpenAI的研究工作将由他与首席科学家Jakub Pachocki共同领导,而原11位创始团队成员仅剩Sam Altman和Wojciech Zaremba两位仍在留任。同期,多家媒体报道OpenAI正计划重组核心业务,转变为营利性公益企业,不再由非营利性董事会控制。10月23日,OpenAI专注于通用人工智能开发的“AGI Readiness”团队负责人Miles Brundage宣布离职,计划在OpenAI之外继续从事该领域研究工作,而“AGI Readiness”团队也即将解散。

重点布局AI安全及芯片领域,成立新团队谋求技术自研。2024年5月,OpenAI宣布董事会成立安全与安保委员会,除OpenAI时任高层外,还聘请并咨询了其他安全、安保和技术专家来支持这项工作,包括前网络安全官员、为OpenAI提供安全建议的Rob Joyce和John Carlin。该委员会负责就OpenAI项目和运营的关键安全与保障决策提出建议。据路透社10月报道,OpenAI将进行硬件战略调整,组建由约20名工程师组成的芯片开发团队,与博通和台积电联手打造首款自研芯片,旨在支持其AI系统、优化计算资源和降低成本。

行业影响力:新模型持续带动生态繁荣,外部合作反哺技术创新

模型性能迭代带动ChatGPT用户生态持续扩大。统计网站tooltester 显示,2023年5月至2024年4月的一年间,ChatGPT每月访问量都在16亿到18亿之间浮动,2024年9月o1系列新模型的发布带动用户生态快速增长,使ChatGPT跃升为全球访问量第十一的网站。根据Similarweb的最新数据,ChatGPT在2024年10月的月访问量已突破31亿次,相较去年同期同比增长112%,相比同年8月增长18.7%。

通过加强与媒体及科研院所合作,持续夯实高质量训练数据基础、提升模型技术应用能力。2024年5月至10月,OpenAI先后与《大西洋月刊》、Vox Media、TIME、康泰纳仕、赫斯特等美国媒体以及意大利媒体集团GEDI签订内容协议,将多家媒体内容整合至其AI产品中,包括文章、视频、音频等多种形式内容,将为OpenAI的AI模型提供更为广泛和多元的数据支持,进一步提升其技术水平和应用范围。截至目前,OpenAI已与沃顿商学院、洛斯阿拉莫斯国家实验室、美国商务部国家标准与技术研究院旗下的美国人工智能安全研究所、博通和台积电等芯片企业达成战略合作,合作涉及AI教学投资、生物科学研究、AI安全研究及测试评估、自研AI芯片生产等。

本文作者

江嘉琳

战略发展研究所

二级分析师

暨南大学区域经济学硕士,在区域市场分析、区域政策研究、用户研究、产品体验领域有丰富积累,聚焦视联网、数字生活等领域研究工作。

张媛玥

战略发展研究所

一级分析师

就职于中国电信研究院,长期从事人工智能、工业互联网等领域的技术及产业研究。

王晓娣

战略发展研究所

助理分析师

大连理工大学硕士,就职于中国电信研究院,专注于人工智能、工业互联网等领域技术及产业研究工作。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片