OpenAI发布语音模型GPT-realtime

OpenAI发布语音模型GPT-realtime
2025年09月01日 09:45 滚动播报

(来源:科创中国)

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。

  据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景中具备广泛应用潜力。

  与传统语音模型不同,GPT-realtime新增了Marin与Cedar两种极具特色的语音,同时对原有8种语音进行了全面升级。模型不仅能生成自然流畅的语音,还能够敏锐捕捉笑声等非语言信号,在句子中间自如切换语言,并可根据场景需求灵活调整语气,使语音交互更贴近真实人类沟通。

  通过Realtime API,开发者可实现实时语音输入输出,不必再经过繁琐的多模型转换流程。在实际应用中,这套技术可用于客户服务系统,让虚拟助手即时解答问题,提高效率和体验。它还可应用于教育领域,实现语音对话和口语练习。而在个人助理、办公或智能家居场景中,用户能通过语音快速完成安排或查询信息。结合图像或文本输入,开发者还能打造更智能的虚拟助手或机器人系统。

  OpenAI表示,GPT-realtime和Realtime API已于8月28日起面向所有付费开发者开放。

(来源:科技日报 作者:张佳欣)

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 09-11 昊创瑞通 301668 --
  • 09-01 艾芬达 301575 27.69
  • 08-26 三协电机 920100 8.83
  • 08-25 华新精科 603370 18.6
  • 08-19 巴兰仕 920112 15.78
  • 新浪首页 语音播报 相关新闻 返回顶部