阿里降价百度免费……今年618率先打价格战的竟是大模型！|阿里|百度|价格战_新浪科技

国内大模型价格战堪比“神仙打架”。短短半天时间不到，阿里和百度先后抛出“重磅炸弹”。

5月21日上午10时许，阿里云率先宣布：通义千问GPT-4级主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。这意味着，1块钱可以买200万tokens，相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入，降价后约为GPT-4价格的1/400，被称为“击穿全球底价”。

紧接着，百度在下午2时30分许宣布，文心大模型两大主力模型全面免费，立即生效。而在一周之前，字节旗下豆包大模型率先将价格卷入“厘时代”。业内表示，“大模型行业太卷了，今年618率先打响价格战的是大模型。”

阿里云方面表示，Qwen-Long是通义千问的长文本增强版模型，性能对标GPT-4，上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens，Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下，国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元，均远高于Qwen-long。通义千问本次降价共覆盖9款商业化及开源系列模型。不久前发布的通义千问旗舰款大模型Qwen-Max，API输入价格降至0.04元/千tokens，降幅达67％。

百度免费的两款大模型则分别为今年3月推出的两款轻量级大模型ERNIE Speed、ERNIE Lite，支持8K和128k上下文长度。

此前率先打响价格战的是字节旗下的豆包大模型。5月15日，字节跳动豆包大模型在火山引擎原动力大会上正式发布。“降价的基本逻辑是，我们有信心用技术手段降低成本，市场也需要更低价的大模型”，火山引擎总裁谭待在接受媒体采访时，谈到了大模型的定价策略。

豆包通用模型pro-32k的推理输入价格为0.0008元/千Tokens，比行业便宜99.3%。谭待坦言，“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这条路。”

照此计算，通义千问Qwen-Long的价格已经低于豆包通用模型pro-32k，而百度是将旗下两款大模型直接免费。在武汉AI智领者峰会现场，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示：“作为中国第一大云计算公司，阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

对于阿里方面此番降价，火山引擎相关负责人回应媒体称，非常欢迎通义千问大模型降价，共同助力企业以更低成本探索AI转型，加速大模型应用场景落地。

业界普遍认为，随着大模型性能逐渐提升，AI应用创新正进入密集探索期，但推理成本过高依然是制约大模型规模化应用的关键因素，此番“神仙打架”对于大模型应用B端企业来说迎来利好。

红星新闻记者胡沛