Meta推出开源AI模型Llama 4|Meta|AI|推理_新浪科技

由于DeepSeek等竞品引发压力，Meta推出新一代AI模型集合Llama 4。目前，Llama 4拥有Scout和Maverick两个版本，均以开源形式发布。Meta在声明中表示，Llama 4是一个多模态AI系统，能够处理和整合文本、视频、图像、音频等多种数据类型，并能在不同格式之间实现内容转换。

本文引用地址：

Llama 4系列是Meta首款采用混合专家架构（MoE）的模型，这一架构在模型训练及用户查询回答过程中展现出更高效率，通过将模型划分为多个专注于特定任务的“专家”子模型，实现精准而高效的处理。中国AI实验室DeepSeek开源模型的成功（其性能与Meta之前的旗舰Llama模型相当甚至更优）促使Llama开发进入加速模式，据说Meta组建了紧急工作组，以破解DeepSeek如何降低R1和V3等模型的运行和部署成本。

Scout版本配备170亿活跃参数、16个“专家”模型及1090亿总参数；而Maverick版本同样拥有170亿活跃参数，但“专家”模型数量增加至128个，总参数量飙升至4000亿。此外，Meta还预告了Llama 4 Behemoth，称其为“全球最聪明的语言模型之一，将作为未来模型训练的教师模型”。

Scout和Maverick已在Llama.com和Meta合作伙伴（包括AI开发平台Hugging Face）上公开提供，而Behemoth仍在训练中。Meta表示，其AI助手Meta AI已在40个国家的WhatsApp、Messenger和Instagram等应用中更新为使用Llama 4。多模态功能目前仅限美国地区使用英语。

Meta尚未发布的Behemoth将需要更强大的硬件，拥有2880亿活跃参数、16位专家和近2万亿总参数。Meta的内部基准测试显示，Behemoth在衡量数学问题解决等STEM技能的多项评估中优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro（但不及2.5 Pro）。

Llama 4模型系列中没有一个是类似OpenAI的o1和o3-mini那样的真正"推理"模型，推理模型会对其回答进行事实检查，通常对问题的回应更可靠，但因此比传统的"非推理"模型需要更长时间来提供答案。另外，Meta表示它调整了所有Llama 4模型，使其拒绝回答"有争议"问题的频率降低，表示Llama 4在处理它完全不会回应的提示方面"平衡性大大提高"。

但是值得注意的是，Llama 4在内部基准测试中“表现不佳”，尤其是在数学处理能力和推理能力方面。虽然目前Llama 4仍需更多时间优化，据称扎克伯格此前给全员下了死命令，4月底是Llama 4交付最后期限。