超越Grok、Gemini,阶跃星辰开源语音模型登顶全球榜首

超越Grok、Gemini,阶跃星辰开源语音模型登顶全球榜首
2026年01月15日 14:24 澎湃新闻

当地时间1月14日,据大模型评测榜单Artificial Analysis Speech Reasoning最新结果,中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶,超越Grok、Gemini、GPT-Realtime等。

该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一,核心考量模型直接处理音频并进行复杂逻辑推理的能力,考察维度包括准确率、首包延迟等。

去年11月,阶跃星辰发布了Step-Audio-R1,可以在不增加额外时延的情况下,端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版,基于推理能力,R1.1不仅能准确识别声音,还可以捕捉到声音背后的情绪和心理状态、言外之意,并能基于环境音推导对物理世界的理解。

目前,阶跃星辰已开源该模型,chat模式也已搭载该模型核心,完整的实时语音API预计将于 2 月上线。(澎湃新闻记者 秦盛)

海量资讯、精准解读,尽在新浪财经APP
推理

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 01-23 世盟股份 001220 --
  • 01-19 振石股份 601112 --
  • 01-16 恒运昌 688785 92.18
  • 01-14 国亮新材 920076 10.76
  • 01-12 爱舍伦 920050 15.98
  • 新浪首页 语音播报 相关新闻 返回顶部