Meta推出开源AI模型Llama 4

Meta推出开源AI模型Llama 4
2025年04月09日 09:06 电子产品世界

由于DeepSeek等竞品引发压力,Meta推出新一代AI模型集合Llama 4。目前,Llama 4拥有Scout和Maverick两个版本,均以开源形式发布。Meta在声明中表示,Llama 4是一个多模态AI系统,能够处理和整合文本、视频、图像、音频等多种数据类型,并能在不同格式之间实现内容转换。

本文引用地址:

Llama 4系列是Meta首款采用混合专家架构(MoE)的模型,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的“专家”子模型,实现精准而高效的处理。中国AI实验室DeepSeek开源模型的成功(其性能与Meta之前的旗舰Llama模型相当甚至更优)促使Llama开发进入加速模式,据说Meta组建了紧急工作组,以破解DeepSeek如何降低R1和V3等模型的运行和部署成本。

Scout版本配备170亿活跃参数、16个“专家”模型及1090亿总参数;而Maverick版本同样拥有170亿活跃参数,但“专家”模型数量增加至128个,总参数量飙升至4000亿。此外,Meta还预告了Llama 4 Behemoth,称其为“全球最聪明的语言模型之一,将作为未来模型训练的教师模型”。

Scout和Maverick已在Llama.com和Meta合作伙伴(包括AI开发平台Hugging Face)上公开提供,而Behemoth仍在训练中。Meta表示,其AI助手Meta AI已在40个国家的WhatsApp、Messenger和Instagram等应用中更新为使用Llama 4。多模态功能目前仅限美国地区使用英语。

Meta尚未发布的Behemoth将需要更强大的硬件,拥有2880亿活跃参数、16位专家和近2万亿总参数。Meta的内部基准测试显示,Behemoth在衡量数学问题解决等STEM技能的多项评估中优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro(但不及2.5 Pro)。

Llama 4模型系列中没有一个是类似OpenAI的o1和o3-mini那样的真正"推理"模型,推理模型会对其回答进行事实检查,通常对问题的回应更可靠,但因此比传统的"非推理"模型需要更长时间来提供答案。另外,Meta表示它调整了所有Llama 4模型,使其拒绝回答"有争议"问题的频率降低,表示Llama 4在处理它完全不会回应的提示方面"平衡性大大提高"。

但是值得注意的是,Llama 4在内部基准测试中“表现不佳”,尤其是在数学处理能力和推理能力方面。虽然目前Llama 4仍需更多时间优化,据称扎克伯格此前给全员下了死命令,4月底是Llama 4交付最后期限。

MetaAI推理
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片