谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手

谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手
2025年04月13日 08:53 IT之家

IT之家 4 月 13 日消息,谷歌 DeepMind 首席执行官 Demis Hassabis 在由领英联合创始人 Reid Hoffman 共同主持的播客节目 Possible 中透露,谷歌计划将旗下的 Gemini AI 模型与 Veo 视频生成模型进行融合,以此提升 Gemini 对物理世界的理解能力。

Hassabis 表示:“我们从一开始就将 Gemini 这一基础模型打造为多模态模型,因为我们有着构建一个通用数字助手的愿景,这个助手能够在现实世界中真正为你提供帮助。”

目前,整个 AI 行业正逐渐朝着“全能”模型的方向发展,这些模型能够理解和整合多种媒体形式。谷歌最新的 Gemini 模型不仅可以生成图像和文本,还能生成音频;而 OpenAI 在 ChatGPT 中的默认模型如今也能创建图像,包括宫崎骏风格的艺术作品。亚马逊也宣布计划在今年晚些时候推出一款“任意到任意”的模型。

据IT之家了解,这些“全能”模型需要大量的训练数据,包括图像、视频、音频、文本等。Hassabis 暗示,Veo 的视频数据主要来源于谷歌旗下的 YouTube 平台。他说道:“通过观看大量的 YouTube 视频,Veo 2 能够了解世界的物理规律。”此前,谷歌曾向 TechCrunch 表示,其模型可能会根据与 YouTube 创作者达成的协议,使用“部分”YouTube 内容进行训练。据报道,该公司去年扩大了服务条款的部分内容,以便获取更多数据来训练其 AI 模型。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片