叫板OpenAI 谷歌推出新版AI搜索引擎和多模态大模型

叫板OpenAI 谷歌推出新版AI搜索引擎和多模态大模型
2024年05月15日 10:02 商业周刊

当地时间5月14日,谷歌召开2024年I/O开发者大会。整场发布会由谷歌CEO桑达尔·皮查伊(Sundar Pichai)主持,全程历时两小时。前一天,OpenAI刚发布GPT-4o和全新的ChatGPT,这让外界对谷歌会交出怎样的AI答卷充满了期待。

此次开发者大会,谷歌发布了十多项产品更新和新品,其中最令人瞩目的是将搜索业务做了25年来最彻底的AI改造,正式推出了“AI Overviews”搜索体验。谷歌还更新升级了Gemini1.5Pro版本,同时推出Gemini1.5Flash轻量化小模型。此外,谷歌还推出了自称效果超过Sora的生成视频模型Veo、与GPT-4o相似的语音视觉交互功能Gemini Live,以及AI智能体Project Astra。

据Gemini统计,皮查伊在整场发布会上共提及“AI”121次。皮查伊表示,谷歌已全面进入Gemini时代,谷歌的所有工作都在围绕生成式AI模型Gemini展开,“我们希望每个人都能从Gemini所做的事情中受益”。

5月14日当天,谷歌股价收于每股171.93美元,涨0.6%。

首席执行官Sundar Pichai在开发者大会上表示,搜索领域正在发生众多创新,“多亏了Gemini,我们可以创造出更强大的搜索体验。”对于这家已经成为搜索代名词的公司来说,“谷歌搜索”最大的一个变化是对查询的一些回复现在将更具叙述性,使人们不必再点击各种链接。

新推出的AI Overviews功能将为美国用户的在线查询提供人工智能生成的答案,这是其搜索引擎25年来最大的更新之一。谷歌表示,本周将向美国用户推出这个具有AI Overviews功能的新搜索引擎,并在未来几个月向更多国家的用户推出,在今年年底前将覆盖超过10亿用户。

大会上,谷歌宣布对Gemini模型进行更新。此前,谷歌推出的Gemini 1.5 Pro是一个中型多模态模型,上下文长度为100万tokens。而据皮查伊介绍,谷歌这次将Gemini 1.5 Pro升级到200万tokens,并全面支持Workspace,同时Gemini 1.5 Pro将面向全球开发者开放。

升级后的Gemini 1.5 Pro在多项公共基准测试中取得了显著改进,在多项图像和视频理解基准测试中也实现了最先进性能。从今年夏天开始,Gemini将支持语音实时交互,并在今年晚些时候上线实时视频交互。未来几个月内,谷歌也将推出类似于GPTs的自定义AI助手功能,名为Gems,可以与整套“谷歌全家桶”联动。

为了满足用户对低延迟和低成本的需求,谷歌还发布了轻量化模型Gemini 1.5 Flash。相较于Gemini 1.5 Pro,该版本的特点是响应速度更快、成本低至0.35美元每百万tokens。而Gemini 1.5 Pro则针对对高质量内容有需求的用户,收费为7美元每百万tokens。

在OpenAI推出能够实现人类级别响应的智能助手GPT-4o后,谷歌的AI智能体项目Project Astra也重磅登场。在演示视频中,Astra能够通过手机摄像头或智能眼镜看到的内容来分析响应语音命令。

皮查伊表示,谷歌计划从今年开始将Astra的功能添加到其Gemini应用程序及其产品中。不过,他也强调,虽然最终目标是“让Astra在公司的软件中实现无缝连接”,但该产品将被谨慎推出,并且“商业化之路将由质量驱动”。

除了在AI助手领域的竞争外,谷歌还通过文生视频模型Veo来反击OpenAI的Sora。Veo能够根据文字、图片和视频的提示来生成高质量的1080p视频,创作“一致且连贯”的镜头,用户可以对光照、镜头语言、视频颜色风格等进行自定义设置。不过,谷歌没有宣布Veo的具体推出时间。整理编辑/陈佳靖

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-29 瑞迪智驱 301596 25.92
  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 新浪首页 语音播报 相关新闻 返回顶部