来源:金十数据
OpenAI的o3推理模型表现遥遥领先,但其高昂的价格可能让微软等客户转而选择更便宜的o3 mini。
人工智能公司在努力进入高级模型的下一阶段方面困难重重,OpenAI在GPT-4之后迟迟没有推出GPT-5就是最好的例证。最新发展的主要障碍是缺乏训练下一代尖端模型的数据。
既然模型在“智能”方面没有进步,OpenAI便转而通过“推理”来增强产出,将问题分解成易于处理的小块,并在每个阶段进行自我修正,从而使模型能够解决问题。但这增加了聊天机器人(19.640, -0.56, -2.77%)的输出时间:简单的询问只需几秒钟,但复杂的数学和科学问题则需要多达几分钟。
“思维链”(CoT)一直被认为是人类使用聊天机器人的最佳实践,但新的推理模型却能自己做到这一点。由于推理模型会自我纠正,因此可以减少所谓的“幻觉”,即一本正经地胡说八道。
推理模型始于9月发布的ChatGPT o1,上周五公布的o3是其下一代。谷歌也在上周发布了类似的Gemini 2.0 Flash Thinking。o1模型展示了推理改善输出的前景,而o3则在这方面又向前迈进了一大步。o3在数学方面的进步尤其令人印象深刻,它在一项高级数学测试中获得了25%的高分,而OpenAI表示,目前还没有其他模型的得分超过2%。
高昂的价格可能让微软等客户望而却步
o3的进步可能对微软尤为重要,因为OpenAI模型是微软人工智能助手Microsoft 365 Copilot的基础。对于企业客户来说,最大限度地减少幻觉至关重要,以免用户因为Copilot而犯错。微软一直指望GPT-5来解决这个问题,o3可能就是下一个最佳选择。
除了增加查询时间外,推理还有另一个缺点:成本更高,这也是人工智能的常见问题。OpenAI的企业客户将不得不为推理所需的所有额外底层计算付费。o1文本输入和输出的收费已是其前身4o的六倍,而目前我们还不知道o3的费用是多少。
如果用户提出的问题很难回答,费用就会迅速增加。OpenAI在其o3现场直播中展示了一项高级基准测试,每项任务的成本为20美元,平均任务完成时间为1.3分钟。而且当时使用的是所谓的“高效”版本模型,其中的推理还是有限的。该基准测试组织表示,使用o3的完整推理能力完成同样的任务平均需要13.8分钟,使用的计算能力是原来的172倍。尽管该组织没有提供成本明细,但不难想象,最初的成本可能令人咂舌。
对于想使用o3的微软来说,成本是个问题。微软每月向用户收取30美元的Copilot服务费用,因此即使仅用o3处理部分复杂任务,也会使削弱公司的利润。从这个角度来说,将在未来几个月内推出的更小、更便宜、更快的o3 mini可能才是包括微软在内的OpenAI企业客户更青睐的产品。虽然o3 mini比o3可能更容易出错,但与目前支持Copilot的4o模型相比,它仍然是一个重大改进。
微软还没有完全采用o1,原因可能就是成本上升,但收益有限。我们还不知道o3 mini的查询成本是多少,但它的技能已经比4o有了更大的飞跃。考虑到在商业运用中限制人工智能的错误也是一个关键,因此o3 mini可能会是众多选择中的一个甜点。
责任编辑:陈钰嘉
APP专享直播
热门推荐
别再尬演美女了!一脸憔悴、面部僵硬,这是迷倒男人该有的皮囊? 收起别再尬演美女了!一脸憔悴、面部僵硬,这是迷倒男人该有的皮囊?
- 2025年01月15日
- 01:24
- APP专享
- 广西台新闻910
- 806
新华调查丨年关将至,警惕这些新骗术
- 2025年01月14日
- 10:55
- APP专享
- 广西台新闻910
- 560
"日本更邪恶,把中企教坏了"
- 2025年01月14日
- 14:55
- APP专享
- vsta
- 537
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
波段擒龙今天 03:39:34
A股三大指数早盘集体调整,截至午盘,沪指跌0.25%,深成指跌0.78%,创业板指跌1.59%,北证50指数涨1.47%。全市场半日成交额8371亿元,较上日放量211亿元。全市场超3300只个股飘绿。板块题材上,小红书概念、光伏、互联网电商、文化传媒板块涨幅居前,同花顺(sz300033)果指数、工业金属概念跌幅居前。 -
冯矿伟今天 03:39:34
冯矿伟:趋势昨天的60和90分钟背离引发的反弹,截至目前,60分钟趋势还没有突破,整体依然属于趋势下的反弹,趋势下的低点,首要任务就是挑战趋势,能快速突破趋势才说明低点是成功的,这样背离就把反弹任务交给了趋势 -
数字江恩今天 03:36:25
大盘上午窄幅震荡,并未冲高,但是科创50明显冲高。总的来说,上午是明显分化,但在昨日大幅拉升的基础上,算是强势了。下午依旧是,3206不跌破,都没问题 -
徐小明今天 03:35:05
【盘中直播】下午见 -
量化伏妖今天 03:32:06
【股票午评】:反弹行情还在由于昨日大幅个股普涨,指数确实涨幅巨大,今日出现部分兑现,指数低开后一直处于消化过程中,指数一直处于小幅绿盘波动,回撤有限,技术指标粘合线日线和价值陡峭日线都还呈现出向上运行态势,反弹的惯性依然还在。板块方向快速轮动,昨日的机器人(sz300024)方向分化,很多个股呈现冲高回落态势,小红书概念,昨日连扳,盲盒经济,快手概念,拼多多概念,AI语料,抖音概念等板块表现较强;PLC概念,草甘膦,3D摄像头,PVDF概念,第四代半导体,电源设备等板块跌幅靠前。总体来看今天是大幅上涨后的喘息,反弹行情还没有结束,就看下午能不能消化掉昨日获利盘后继续向上拓展。 -
冯矿伟今天 03:30:19
午评见! -
趋势领涨今天 03:29:12
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势起航今天 03:29:00
上周五的时候,给大家分析过,不知道还记得不,那时候中百、广百都砸跌停!但广百股份(sz002187)、来伊份(sh603777)是涨停;其实那时候就是有先觉资金在搞了,给大家分析过,大消费有活口出现,说明这个方向,在春节前是还有炒作机会的;目前看,这个方向确实有搞头,尤其是来伊份(sh603777),地天板后超预期,又蹭到了小红书概念,直接连续晋级了,低位仅次于美邦股份(sh605033);今天广百的走强,也是有机会进一步带动零售业的炒作的 -
趋势领涨今天 03:28:56
昨天大盘拉出放量长阳线,今天出现窄幅震荡,这是一个非常正常的走势,不正常的就是今天内资出现大幅流出,这部分资金不能坚持流入,想大盘连续大涨是不太现实的,所以,下午大盘还是以盘整为主,大盘问题不大,随着5日线上移跟10日线被动金叉,随后再看大盘选择方向,我们认为选择向上的概率还是大一些,因为每年年底都有红包行情的,所以,总的原则还是建议大家持股待涨,上午到此。 -
宋谈股经今天 03:28:15
大盘今天小时线调整,关注下方3210左右支撑,再看过两个小时后是否支撑之上。【更多独家重磅股市观点请点击】