OpenAI推出全新人工智能语言助手功能,向付费用户开放

OpenAI推出全新人工智能语言助手功能,向付费用户开放
2024年09月26日 11:06 电子产品世界

OpenAI发布一项重大更新,宣布面向其所有付费订阅ChatGPT Plus和Team计划的用户开放高级人工智能(AI)语音助手功能——“高级语音模式”(Advanced Voice Mode,AVM),将可以通过说话而不是输入提示的方式来使用聊天机器人。据了解,Plus用户每月需支付20美元,Team用户每月支付30美元并拥有更多的使用次数。OpenAI将逐步向用户推出访问权限,并从下周开始面向企业和教育推出,所有Plus用户将在秋末之前获得访问权限。

本文引用地址:

OpenAI曾在今年5月份发布GPT-4o时对外展示过该实时语音技术,据演示视频内容,该能力目前也主要体现于GPT-4o模型上。自首次公开亮相以来,ChatGPT的高级语音模式便受到了高度关注。经过数月的研发与测试,OpenAI决定将此功能开放给所有付费用户,此举有望进一步增强OpenAI在人工智能领域的竞争力与影响力。

ChatGPT在此次更新中,语音模式的设计从外观上得到了改进。现在,语音功能由一个蓝色的动画球体代表,取代了此前OpenAI在5月展示时使用的黑色动态点。当用户在

应用中获得高级语音权限后,会在语音图标旁看到一个弹出提示,方便用户快速启用。

AVM提高了部分外语的对话速度、流畅度并改进口音。此外,AVM还新增了两大功能:为语音助手存储“自定义指令”,以及记住用户希望语音助手表现何种行为的“记忆”的功能(这类似于今年4月OpenAI为ChatGPT文本版本推出的记忆功能)。也就是说,ChatGPT用户可以利用自定义指令和“记忆”来确保语音模式是个性化的,AVM会根据他们对所有对话的偏好做出响应。

为了提升用户体验,ChatGPT新增了五种全新的语音风格供用户选择:Arbor、Maple、Sol、Spruce和Vale,使得语音总数达到九种。此前的语音包括Breeze、Juniper、Cove和Ember,旨在提供多样化的语气和特征。

OpenAI表示,这些声音是使用来自世界各地的专业配音演员制作的。值得注意的是,此次更新中没有包含名为Sky的语音 ——OpenAI在春季更新中展示了Sky的语音,但由于被指与女演员斯嘉丽·约翰逊高度相似,引发了法律纠纷。尽管OpenAI表示并非有意模仿约翰逊的声音,但为了避免争议,仍选择了移除。

OpenAI的模型设计师Drew也分享了他的使用体验:“当我在忙其他事情或不需要与ChatGPT交谈时,它会保持安静。当我有问题时,可以直接提出展开深入的对话。”在此过程中,ChatGPT的声音会根据谈话的语气进行调整。他表示,ChatGPT就像是坐在身旁的朋友,不仅提供信息,还能进行思想交流。德鲁认为在日常使用中,用户可以使用高级语音模式来创造面试、讲故事等场景,而且无需担心延迟问题。他强调:“这种延迟非常低,就像和另一个人交谈一样。”

ChatGPT高级语音模式现已支持50多种语言,拓展了用户的沟通范围。需要注意的是,该高级语音模式目前还没有向欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区开放使用。OpenAI尚未公布这些地区的开放时间。

除了上新高级语音模式,近日OpenAI还发布了一个多语言大规模多任务语言理解 (Multilingual Massive Multitask Language Understanding,MMMLU)数据集,测试集提供了14种语言,包括阿拉伯语、德语、西班牙语等,涵盖57个不同类别的主题,包括初级知识、法律、物理、历史和计算机科学等高级专业学科。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片