新浪科技讯 9月25日下午消息,阿里云今日宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。据悉,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。
此前,阿里云开源了70亿参数模型Qwen-7B等,一个多月下载量破100万。此次开源的Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。Qwen-14B最大支持8k的上下文窗口长度。
![](http://n.sinaimg.cn/finance/transform/163/w475h488/20230925/bdf5-b9245424d3493abaa093fb74986aa6df.png)
Qwen-14B-Chat是在基座模型上经过精细SFT得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。
Qwen能让开发者更快地构建基于Qwen的Agent(智能体)。开发者可用简单指令教会Qwen使用复杂工具,比如使用Code Interpreter工具执行Python代码以进行复杂的数学计算、数据分析、图表绘制等;还能开发具有多文档问答、长文写作等能力的“高级数字助理”。
阿里云CTO周靖人表示,阿里云将持续拥抱开源开放,推动中国大模型生态建设。阿里云笃信开源开放的力量,率先开源自研大模型,希望让大模型技术更快触达中小企业和个人开发者。(文猛)
![](http://n.sinaimg.cn/finance/cece9e13/20200514/343233024.png)
海量资讯、精准解读,尽在新浪财经APP
责任编辑:刘万里 SF014
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)