OpenAI发布GPT-Realtime,AI Agent进入超逼真对话时代

OpenAI发布GPT-Realtime,AI Agent进入超逼真对话时代
2025年08月29日 06:49 格隆汇APP

格隆汇8月29日|据AIGC开放社区,OpenAI发布语音模型GPT-realtime。GPT-realtime是一个专用于语音AIAgent的多模态模型,能够生成更加自然流畅的语音,完美模仿人类丰富多样的语调、情感以及语速,支持图像理解并将其与语音或文本对话相结合使用,非常适用于客服、教育、金融、医疗等领域打造语音智能体。GPT-realtime还新增了Marin与Cedar两种极具特色的语音,同时对原有的8种语音也进行了全面升级。

与传统纯语音模型不同的是,GPT-realtime还具备智力、推理和理解能力,例如,能够敏锐捕捉笑声等非语言信号,在句子中间自如地切换语言,并根据场景需求灵活调整语气。根据评估数据显示,在多种语言环境下,GPT-realtime对字母数字序列的检测准确率大幅提升,在用于衡量推理能力的BigBenchAudio评估中,准确率高达82.8%成为目前最强智能语音模型。

海量资讯、精准解读,尽在新浪财经APP
AI 推理

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 09-11 昊创瑞通 301668 --
  • 09-01 艾芬达 301575 27.69
  • 08-26 三协电机 920100 8.83
  • 08-25 华新精科 603370 18.6
  • 08-19 巴兰仕 920112 15.78
  • 新浪首页 语音播报 相关新闻 返回顶部