大模型618开启：阿里降价，百度免费|百度_新浪财经

2024年5月，互联网大模型率先迎来“618”。

制图：周鑫雨

5月20日晚间，阿里云用一条“明天，又有事发生”的公众号贴文，放出了降价风声——21日早上10:00，通义千问模型家族宣布降价，开源和闭源均有不同程度的限免和降价政策。

其中，阿里云商业化的主力大模型Qwen-Long，输入价格降幅甚至达到了97%，价格从原有的20元/百万Tokens，直降为0.5元/百万Tokens。

这一价格，以0.0003元/千Tokens的微妙优势，击穿了5月15日字节刚刚公布的“豆包大模型”的输入地板价：0.8元/百万Tokens。

然而，低价*刚易位4小时，百度就前来“掀翻了价格地板”——文心一言两款模型ERNIE Speed和ERNIE Lite，直接宣布“免费”。

在2023年，模型的降价仍然遵从着训练效率优化和规模效应的自然趋势。

2023年11月，百度的大模型平台“文心千帆”，曾经调整了相同汉字数量对应的Token数，变相将模型的价格降低了20%。与之对应地，是文心大模型的推理成本降低到了原来的1%。

但2024年的模型价格战，开打得几乎毫无预兆。

价格断崖的开端，是一条名为“DeepSeek V2”的鲶鱼。DeepSeek的出品机构“深度求索”的背后，是坐拥过万张英伟达A100 GPU的量化基金——幻方量化。

5月6日，深度求索发布了DeepSeek大模型的新版本V2。作为模型领域的“黑马”，2360亿参数规模的DeepSeek V2，模型性能处于国产*梯队，定价也没有什么包袱，支持32k上下文的模型API定价仅1元/百万Tokens（计算）、2元/百万Tokens（推理），是彼时百度文心4.0-8k推理价格（120元/Tokens）的1/60。