Mistral 推出其首个专业区域语言模型 Saba :专精阿拉伯语和印度起源语言

Mistral 推出其首个专业区域语言模型 Saba :专精阿拉伯语和印度起源语言
2025年02月18日 10:42 IT之家

IT之家 2 月 18 日消息,法国 AI 初创企业 Mistral AI 当地时间昨日宣布推出其首个专业区域语言模型 Saba。该模型在源自中东与南亚的精选数据集上训练,能以相对较小的规模为上述区域用户提供更准确、相关的回应

Saba 模型参数规模为 32B,支持本地单 GPU 系统部署。Mistral AI 给出的数据显示 Saba 在阿拉伯语的模型基准测试中明显优于同参数规模的 Mistral Small 3 24B,在同更大参数模型的比较里也毫不逊色。

同时,由于中东与南亚持续不断的文化交流,Mistral Saba 除阿拉伯语语外也支持多种印度起源语言,尤其是以泰米尔语为代表的南印度达罗毗荼语系诸语种(IT之家注:该语系使用者总数达 2.5 亿人)。

Mistral AI 认为,要让 AI 无处不在就需要解决各种文化和语言问题。目前较大规模的通用模型在多种语言上都有良好表现,但缺乏语言细微差别、文化背景和深入的区域知识,无法为具有强大区域背景的用例提供服务,而这就是 Mistral Saba 等专精特定语言的较小模型的用武之地。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片