当地时间1月14日,据大模型评测榜单Artificial Analysis Speech Reasoning最新结果,中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶,超越Grok、Gemini、GPT-Realtime等。
该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一,核心考量模型直接处理音频并进行复杂逻辑推理的能力,考察维度包括准确率、首包延迟等。

去年11月,阶跃星辰发布了Step-Audio-R1,可以在不增加额外时延的情况下,端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版,基于推理能力,R1.1不仅能准确识别声音,还可以捕捉到声音背后的情绪和心理状态、言外之意,并能基于环境音推导对物理世界的理解。
目前,阶跃星辰已开源该模型,chat模式也已搭载该模型核心,完整的实时语音API预计将于 2 月上线。(澎湃新闻记者 秦盛)

海量资讯、精准解读,尽在新浪财经APP
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
