阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama

阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama
2024年09月19日 14:21 IT之家

感谢IT之家网友 西窗旧事、动感超人233 的线索投递!

IT之家 9 月 19 日消息,在今天的 2024 云栖大会上,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5,其中,旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。

Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。

  • Qwen2.5 语言模型:0.5B、1.5B、3B、7B、14B、32B 以及 72B;

  • Qwen2.5-Coder 编程模型:1.5B、7B 以及即将推出的 32B;

  • Qwen2.5-Math 数学模型:1.5B、7B 以及 72B。

除了 3B 和 72B 的版本外,通义千问所有的开源模型都采用了 Apache 2.0 许可证。用户可以在相应的 Hugging Face 仓库中找到许可证文件。

除此之外,通义千问还通过 Model Studio 提供了旗舰语言模型 Qwen-Plus 和 Qwen-Turbo 的 API,还开源了相比上个月发布的版本有性能提升的 Qwen2-VL-72B。

阿里云官方透露,截至 2024 年 9 月中旬,通义千问开源模型累计下载量已突破 4000 万,成为仅次于 Llama 的世界级模型群。

IT之家从 2024 云栖大会获悉,阿里云宣布通义千问推荐模型全线降价,最高降幅可达 85%。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片