集齐“听说读写”、功能似真人!“GPT-4o”模型亮相

集齐“听说读写”、功能似真人!“GPT-4o”模型亮相
2024年05月14日 15:56 媒体滚动

转自:劳动报

OpenAI又迎来升级,摇身一变成了人工智能语音助手。5月14日凌晨,美国人工智能研究公司OpenAI在线上举办了“春季更新”活动。活动中发布了新旗舰模型“GPT-4o”,可以实时对音频、视觉和文本进行推理。据介绍,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量。

“全能型”ChatGPT亮相

据了解,GPT-4o的“o”代表“omni”。该词意为“全能”,源自拉丁语“omnis”。而GPT-4o多模态大模型的技术进步,也让ChatGPT作为个人的“超级助理”成为可能。

OpenAI的官网呈现了ChatGPT作为个人语音“超级助理”的多个惊人应用场景。

首先是面向单个用户,和人一样,它提供的主要是“情绪价值”与“认知价值”。比如它能讲笑话、唱生日快乐歌、玩游戏、逗小狗、给人催眠、让人放松等等;它能充当面试官,给人提供面试建议;它还能给一位盲人提供环境观察,给他讲述看到的景色、提醒他过马路的路况。

接着是面向多个用户,它提供的更多是一种“协同价值”。比如给两个语言不通的人充当翻译,让他们能无障碍沟通;给两个人做“剪刀石头布”的游戏裁判,先喊口令让游戏开始、之后还能准确判断是哪个人赢了;充当一名“家教”,帮一位父亲辅导他的孩子做作业;甚至作为一名“会议第三方”,主持和记录多人会议。

“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”在发布会上,公司首席技术官Mira Murati介绍,GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出。

较前几个版本,GPT—4o胜在哪里?在GPT-4o之前,用户使用语音模式与ChatGPT对话时,GPT-3.5的平均延迟为2.8秒,GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,让GPT-4无法直接观察音调、说话的人和背景噪音,也无法输出笑声、歌唱声和表达情感。与之相比,GPT-4o可以在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。

这是由于三个版本的语音对谈机制不同。GPT-3.5和GPT-4会先将音频转换为文本,再接收文本生成文本,最后将文本转换为音频,经历这三个过程,音频中的情感表达等信息会被折损,而GPT-4o是跨文本、视觉和音频的端到端模型,是OpenAI第一个综合了这些维度的模型,可更好进行对谈。

OpenAI将推出更多免费工具

“今天,有1亿人使用ChatGPT来创作、工作、学习,以前这些高级工具只对付费用户可用,但现在,有了GPT-4o的效率,我们可以将这些工具带给每个人。”Mira Murati 在发布会上说道。那么,如果落实到实际生活的使用中,GPT-4o究竟能给普罗大众带来什么变化呢?

OpenAI的官网展示了GPT-4o在海报创作、三维重建、字体设计、会议总结等等一系列充满可能性的应用。比如,在输入人物图片、海报元素以及想要的风格后,GPT-4o就能给用户生成一张电影海报。或者根据输入的诗歌文本,GPT-4o能生成用手写体写着诗歌、画着画的单行本图片。

已有用户使用了GPT-4o来描述图片,发现其生成结果较准确,5秒左右就能生成描述图片的文字。

根据此次发布会的信息透露,OpenAI开始向ChatGPT Plus和Team用户推出GPT-4o,并且很快就会向企业用户推出。与此同时,OpenAI将开始推出免费版的ChatGPT,即便是免费版,用户也可以有机会体验GPT-4o,但当达到限额时,ChatGPT将自动切换到GPT-3.5。

此外,OpenAI还推出了ChatGPT的桌面版应用,通过简单的键盘快捷键(Option + Space)可以立即向ChatGPT提问,还可以直接在应用程序中截取屏幕截图与机器人进行讨论。不过目前只有MacOS版本,Windows版要稍晚一些亮相。

另据OpenAI官网显示,GPT-4o不仅在文本和代码处理的性能上与GPT-4 Turbo持平,而且在API调用上速度更快,价格更是降低了50%。对于这一调整,有分析指出,在此次OpenAI推出基于GPT-4o的“超级智能助理”之后,这一领域或将成为接下来各科技大厂争相追赶的方向。

头图来源:OpenAI官网

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-29 瑞迪智驱 301596 25.92
  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 新浪首页 语音播报 相关新闻 返回顶部