深度|凌晨,OpenAI 正式发布 GPT-4o!AI 现在可以和 AI 语音对话了,以及更多免费功能上线

深度|凌晨,OpenAI 正式发布 GPT-4o!AI 现在可以和 AI 语音对话了,以及更多免费功能上线
2024年05月14日 06:09 市场资讯

专题:OpenAI 发布最新旗舰模型GPT-4o 完全免费 语音功能震撼登场

  来源:有新Newin

  凌晨一点,OpenAI 召开了一场春季发布会,主要讲了 4 件事:

  • GPT-4o;

  • 免费版 ChatGPT 更多功能;

  • macOS 版 ChatGPT;

  • ChatGPT 新的 UI;

  1. GPT-4o

  1)关于 GPT-4o

  GPT-4o 是 OpenAI 目前最新的旗舰型号,它提供 GPT-4 级别的智能,但速度更快,并改进了其跨文本、语音和视觉的功能。如今,GPT-4o 在理解和讨论你共享的图像方面比任何现有模型都要好得多。

  例如,你现在可以拍摄不同语言的菜单照片,并与 GPT-4o 对话来翻译它,了解食物的历史和意义,并获得建议。

  OpenAI 表示,现在用户在语音模式下与 ChatGPT 对话的平均延迟为 2.8s(ChatGPT-3.5)以及 5.4s(GPT-4)。

  为了实现这一目标,语音模式是由三个独立模型组成的管道:一个简单模型将音频转录为文本,GPT-3.5 或 GPT-4 接收文本并输出文本,第三个简单模型将该文本转换回音频。这个过程意味着主要智能来源 GPT-4 丢失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。

  下面来看一下 Greg 的现场演示,两个 GPT-4o 互相对话以及娱乐唱歌 🎵

  现场发布会 Murati 完整介绍 GPT-4o :

  2)关于模型性能

  OpenAI 表示,借助 GPT-4o,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。

  由于 GPT-4o 是 OpenAI 第一个结合所有这些模式的模型,因此仍然只是浅尝辄止地探索该模型的功能及其局限性。

  以下是 OpenAI 披露的 GPT-4o 模型性能介绍:

  3)未来计划

  未来,GPT-4o 优化将实现更自然、实时的语音对话,并能够通过实时视频与 ChatGPT 进行对话。例如,你可以向 ChatGPT 展示一场现场体育比赛,并要求它向你解释规则。

  此外,OpenAI 计划在未来几周内在 alpha 版中推出具有这些新功能的新语音模式,随着更广泛地推广,Plus 用户可以抢先体验。

  为了使先进的 AI 在全球范围内更容易使用和使用,GPT-4o 的语言功能在质量和速度方面得到了提高。ChatGPT 现在还支持 50 多种语言,包括注册和登录、用户设置等。

  ChatGPT Plus 和 Team 已经可以体验 GPT-4o,很快就会向企业用户推出。最后,今天 OpenAI 还开始推出 ChatGPT Free,但有使用限制。Plus 用户的消息限制将比免费用户高出 5 倍,而团队和企业用户的限制甚至更高。

  2. 免费版更多功能

  OpenAI 表示,将在未来几周内开始向 ChatGPT 免费用户推出更多智能和高级工具。使用 GPT-4o 时,ChatGPT 免费用户现在可以访问以下功能:

  • 体验 GPT-4级智能 ;

  • 获取来自模型和网络的回复  ;

  • 分析数据并创建图表 ;

  • 聊聊你拍摄的;

  • 上传文件,寻求帮助总结、写作或分析;

  • 发现并使用 GPT和 GPT 商店

  • 使用 Memory打造更有帮助的体验;

  根据使用情况和需求,免费用户可以使用 GPT-4o 发送的消息数量会受到限制。当达到限制时,ChatGPT 将自动切换到 GPT-3.5,以便用户可以继续对话。

  3. macOS 版应用,简化工作流

  对于免费和付费用户,OpenAI 还推出了适用于 macOS 的新版 ChatGPT 桌面应用,该应用旨在无缝集成到你在计算机上执行的任何操作。

  通过简单的键盘快捷键(Option + Space),用户可以立即向 ChatGPT 提问。用户还可以直接在应用程序中截取屏幕截图并进行讨论。

  现在,用户可以直接从计算机与 ChatGPT 进行语音对话,从 ChatGPT 发布时提供的语音模式开始,GPT-4o 的新音频和视频功能将在未来推出。无论是想为公司集思广益、准备面试还是想讨论一个主题,都可以点击桌面应用程序右下角的耳机图标来开始语音对话。 

  从今天开始,OpenAI 将向 Plus 用户推出 macOS 应用,并将在未来几周内更广泛地提供该应用程序。OpenAI 还计划在今年晚些时候推出 Windows 版本。

  4. ChatGPT 新的 UI

  OpenAI为 ChatGPT 引入了新的外观和感觉,旨在更加友好和更具对话性。你会注意到新的主屏幕、消息布局等。

  垂直 AI 与代理如何重塑 B2B 价值链?增速远超 SaaS,AI 应用层拐点来临?硅谷老牌 VC 总结了 10 个 GenAI 初创商业案例与 7 条黄金法则......

海量资讯、精准解读,尽在新浪财经APP

责任编辑:尉旖涵

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-29 瑞迪智驱 301596 25.92
  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 新浪首页 语音播报 相关新闻 返回顶部