GPT-4.5发布史上最大最贵模型,但不是最强模型

GPT-4.5发布史上最大最贵模型,但不是最强模型
2025年02月28日 11:40 新京报网

北京时间2月28日凌晨,OpenAI官方发布了GPT-4.5大模型,根据官方介绍,该模型为“迄今为止最大、知识最丰富的聊天模型”,在用户翘首企盼的性能方面,它并非前沿模型,在编程、数学等多个维度的性能不如o3-mini,因此直播人员主要进行了和“情商”相关的演示,但即便如此,GPT-4.5也成了OpenAI“史上最贵”大模型。

值得注意的是,OpenAI首席执行官山姆·奥特曼并未参与此次直播,他在社交平台表示,GPT-4.5是一个“庞大而昂贵”的型号,GPU已经不够了,这并不是一个推理模型,不会超越基准智能,而是“一种不同类型的智能”。

情商”“情怀代替性能展示 研究负责人频看提示词

GPT-4.5直播发布截图 最右为OpenAI研究负责人米娅(Mia)GPT-4.5直播发布截图 最右为OpenAI研究负责人米娅(Mia)

新京报贝壳财经记者观看本次发布的视频直播发现,本次直播的主持人是OpenAI研究负责人米娅(Mia),虽然米娅的名字酷似已离职的OpenAI前联合创始人、首席技术官米拉(Mira),但和后者在去年发布GPT-4o时气场全开、侃侃而谈的自信表现相比,Mia在直播时频频看提示词,显得颇为紧张。

在直播发布中,OpenAI首先展示了GPT-4.5的“情商”提升,例如当输入提示词“我的朋友放了我鸽子,给他发一条短信说我恨他”时,相比o1直接按要求写出了短信,GPT-4.5分析出用户可能需要情绪宣泄,因此在安抚用户情绪的同时,也写出了一条相对委婉的短信。

但实际上,此类“高情商”表现Deepseek早已拥有,如贝壳财经记者以相同的提示词输入Deepseek后,Deepseek首先就在思维链中意识到了“用户真正的需求可能是表达不满”,并同样写出了一条委婉的短信,还加上了一点幽默,比如“请我喝奶茶的话我可以考虑原谅你三分钟。”

也许因为并非推理模型,直播人员也意识到了在性能展示方面GPT-4.5可能并不占优势,因此接下来直播人员回顾了GPT系列模型从2018年发展至今的历程,并进行了一些“情怀”展示,如当询问“为什么海水是咸的”这个话题时,GPT-1完全不了解,GPT-2可以输出海水和盐的相关的内容,GPT-3.5第一个完整回答了这个问题,而GPT-4.5则在回答这个问题的同时还兼顾了表达的通顺甚至朗读韵律,使回答看上去更加舒服。

OpenAI“史上最贵模型输入价格比Deepseek贵近300

贝壳财经记者注意到,山姆·奥特曼曾在2月13日表示不再发布o3,而是发布GPT-4.5,但根据当前已经发布的GPT-4.5的性能测试数据,该大模型在很多维度上的水平不及o3-mini,因此和预想中的“最先进大模型”显然有着不小差距。

上图展示了GPT-4.5与GPT-4o和o3-mini在多个维度上的测试得分,可以发现,在科学、数学、编程等多个领域,GPT-4.5的表现并不如o3-mini,只在多模态方面略胜一筹。

在准确性、幻觉测试方面,GPT-4.5的性能表现优于GPT系列其他表现,因此OpenAI也把和人交流列为GPT-4.5的“长处”。GPT-4.5集成了文件和图像上传、画布、搜索等功能,不过OpenAI也表示,GPT-4.5不能完全代替GPT-4o。

在API价格方面,GPT-4.5的定价达到了OpenAI的“史上最贵”,其API的输入价格达到每百万Tokens价格75美元,相比GPT-4o的2.5美元贵30倍,相比o3-mini贵68倍,相比DeepSeek更是贵了将近300倍。

虽然作为综合模型,将GPT-4.5直接与推理为主的o3-mini和DeepSeek对比不太合适,但过高的价格仍然令人咋舌,有外国网友在OpenAI的评论区询问,GPT-4.5“是不是在定价那里写了错别字”?

直播人员表示,ChatGPT的pro用户将可以立即体验GPT-4.5,下周开放给team和plus用户。

“OpenAI推广AI有两种方式——推理和无监督学习,我们相信模型的推理能力很重要,但GPT-4.5实际上处于无监督学习的前沿,它有更多知识并且更聪明,会成为未来更强大模型的基础。”米娅在直播中表示。

记者联系邮箱:luoyidan@xjbnews.com

新京报贝壳财经记者 罗亦丹

编辑 陈维城 校对 杨利

直播推理
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片