移动客户端

新浪科技> 数码 > 正文

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

谷歌 Gemini 2.0 成“P 图神器”，各种 P 图只需一句话

2024年12月16日 22:49 IT之家

新浪财经APP 缩小字体放大字体收藏微博微信

Gemini 2.0 说说话就能一键 P 图的功能爆火，把玩不了的大伙儿都馋哭了！

比如一辆小车车：

输入指令“把这辆车改装成敞篷车”，它就能立马将文字指令和图片结合起来，完成一键 P 图。

让我们来找茬儿，发现除了车变成了敞篷的，其它元素木有变化，很好地保持了一致性。

不仅于此，Gemini 2.0 还有点“多模态版 o1”那味儿。

继续输入指令：想象一下，这辆车内装满了海滩用品。接着，将车身颜色改为一种令人联想到夏日的颜色，并在改变过程中进行说明。

然后 Gemini 2.0 就开始图文并茂地一步步推理生成了，先把车变成了明亮的黄色，接着又再车里装满了遮阳伞等海滩用品。

这就是 Gemini 2.0 系列的原生图像输出能力。

评论区底下，一水儿都是求具体上线时间的：

被谷歌挖走的 OpenAI 大将 Logan Kilpatrick 回应，大伙儿别急，明年年初将更广泛地推出。

各种 P 图都是一句话的事儿

除了上面展示的简单 P 图，你甚至可以同时 P 图片中的多个元素，还能把一个物件变成另一个。

比如，把蓬松的夹克变成一个小枕头，并且拿掉毯子：

这还没完，结合不同的图来 P 也行。

猫和抱枕结合，就得到了一个很有质感的猫猫抱枕：

把猫猫和滑板结合就得到了猫猫代言滑板。

遵从文字指令，Gemini 2.0 成功将猫猫变成了插画贴纸形态。

除此之外，Gemini 2.0 P 图时还能更有想象力。

比如一个箱子，把箱子打开就变成了酱婶儿：

开头展示的小车车，也能变成“飞车”：

另外，还有一种玩法。

在图像中圈出需要 P 的区域，只需“Open this”，Gemini 2.0 可以直接结合文字指令理解图像，知道“this”的指代：

不得不说，那些有内测资格的玩家，可算了把大伙儿馋坏了。

本文来自微信公众号：量子位（ID：QbitAI），作者：西风，原标题《Gemini 2.0 成 P 图神器，各种 P 图只需一句话的事儿，可把网友馋哭了》

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

创事记

阅读排行榜

评论排行榜

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技

新浪数码

新浪手机

科学探索

苹果汇

新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

新浪首页新浪众测

语音播报返回顶部