阿里降价 百度免费……今年618率先打价格战的竟是大模型!

阿里降价 百度免费……今年618率先打价格战的竟是大模型!
2024年05月21日 17:26 红星新闻

国内大模型价格战堪比“神仙打架”。短短半天时间不到,阿里和百度先后抛出“重磅炸弹”。

5月21日上午10时许,阿里云率先宣布:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400,被称为“击穿全球底价”。

紧接着,百度在下午2时30分许宣布,文心大模型两大主力模型全面免费,立即生效。而在一周之前,字节旗下豆包大模型率先将价格卷入“厘时代”。业内表示,“大模型行业太卷了,今年618率先打响价格战的是大模型。”

阿里云方面表示,Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元,均远高于Qwen-long。通义千问本次降价共覆盖9款商业化及开源系列模型。不久前发布的通义千问旗舰款大模型Qwen-Max,API输入价格降至0.04元/千tokens,降幅达67%。

百度免费的两款大模型则分别为今年3月推出的两款轻量级大模型ERNIE Speed、ERNIE Lite,支持8K和128k上下文长度。

此前率先打响价格战的是字节旗下的豆包大模型。5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。“降价的基本逻辑是,我们有信心用技术手段降低成本,市场也需要更低价的大模型”,火山引擎总裁谭待在接受媒体采访时,谈到了大模型的定价策略。

豆包通用模型pro-32k的推理输入价格为0.0008元/千Tokens,比行业便宜99.3%。谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这条路。”

照此计算,通义千问Qwen-Long的价格已经低于豆包通用模型pro-32k,而百度是将旗下两款大模型直接免费。在武汉AI智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

对于阿里方面此番降价,火山引擎相关负责人回应媒体称,非常欢迎通义千问大模型降价,共同助力企业以更低成本探索AI转型,加速大模型应用场景落地。

业界普遍认为,随着大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素,此番“神仙打架”对于大模型应用B端企业来说迎来利好。

红星新闻记者 胡沛

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片