Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现

Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现
2025年07月16日 16:53 IT之家

IT之家 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出,可以更低价格提供领先的低错误率表现,支持真实世界的语音智能生产应用

Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

该模型支持 32K Token 的上下文长度,可处理 30 分钟音频转录或 40 分钟音频理解,内置生成相关问题、结构化摘要的能力,支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper,而价格不到后者的一半;而在高级用例方面,Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近,价格也不到一半。

AI
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片