超越Grok、Gemini，阶跃星辰开源语音模型登顶全球榜首|推理_新浪财经

当地时间1月14日，据大模型评测榜单Artificial Analysis Speech Reasoning最新结果，中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶，超越Grok、Gemini、GPT-Realtime等。

该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一，核心考量模型直接处理音频并进行复杂逻辑推理的能力，考察维度包括准确率、首包延迟等。

去年11月，阶跃星辰发布了Step-Audio-R1，可以在不增加额外时延的情况下，端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版，基于推理能力，R1.1不仅能准确识别声音，还可以捕捉到声音背后的情绪和心理状态、言外之意，并能基于环境音推导对物理世界的理解。

目前，阶跃星辰已开源该模型，chat模式也已搭载该模型核心，完整的实时语音API预计将于 2 月上线。（澎湃新闻记者秦盛）

海量资讯、精准解读，尽在新浪财经APP

文章关键词：推理

VIP课程推荐

加载中...

1/10

新浪财经公众号

24小时滚动播报最新的财经资讯和视频，更多粉丝福利扫描二维码关注（sinafinance）