谷歌“香蕉”火了没多久 字节豆包就想让它“凉凉”

谷歌“香蕉”火了没多久 字节豆包就想让它“凉凉”
2025年09月10日 09:49 亿邦动力网

AI生图界,最近真是要过年了。

谷歌Nano Banana模型还没玩够,字节最新图像创作模型Seedream 4.0又来了。该模型的核心亮点是首次支持多模态生图,同一模型可以实现文生图、图像编辑、组图生成等多种任务。

简单来说就是,无论是用AI“无中生有”,还是用AI实现精准P图,Seedream 4.0都比以往版本的模型体验更丝滑、更可控。

更让我们期待的是,或许Seedream 4.0可以解决Nano Banana中文字生成不稳定、图片比例不可控等问题。对国内大多数用户来说,Seedream 4.0如果在性能上能打,那以后也不必大费周章非要用Nano Banana了。

目前,Seedream 4.0模型已陆续全量上线即梦、豆包App和扣子空间。我们第一时间上手,设计了几个贴近日常使用场景的实测案例,让Seedream 4.0和Nano Banana来了场PK,下面一起来看看“豆包大战香蕉”,谁会是新的P图之王?

连续修改同一张图人物保持不变

我们先是把一张马斯克的图片“喂”给了豆包和Nano Banana,让它们更换原图背景的同时保持人物表情不变。

可以看到,两个模型都遵循了提示词的要求。不过,左边豆包生成的图片色彩饱和度更高,右边Nano Banana更为严谨地引用了用户上传的参考图。

接着我们试着调整了一下图中马斯克发型和妆造。

有一说一,豆包生成的摇滚长发男还真是那个味儿,虽然提示词里没有要求更改衣服和面部装饰,但它生成的图片确实更符合我们预期的想要生成的形象。

在创意发挥上,豆包更胜一筹,能举一反三生成更符合摇滚氛围的整体形象;而在指令的精准遵循上,Nano Banana的表现则更为严谨。但总的来说,AI生图模型在人物一致性方面确实保持得越来越好了。

生成真实感自拍图

豆包和Nano Banana都精准生成了水豚、宿舍等样式,还成功复刻了国内外大学寝室之间的差异性。

值得一提的是,实测过程中我们发现,Nano Banana支持基于上下文的多轮图片编辑,但豆包需要再次上传图片、下达新指令,体验稍显繁琐。

米其林级别的可视化食谱

优雅,太优雅了。在这一轮的比拼中,两者可以说是棋逢对手,都生成了质感高级、菜谱清晰、风格统一的图片。有趣的是,在豆包的概念中,丝瓜汤是一定要配鸡蛋的,符合中式大厨的习惯偏好。

接着,我们再试试豆包和Nano Banana生成组图的能力,举个例子,我们只给一道菜名,看看AI是不是能生成前后相符的关联性图像,把整个制作过程“想象”出来。

在生成连续长图方面,两个模型都还有待完善,豆包还无法将整个制作过程完整地展示在一张长图上,而Nano Banana生成中文的能力依然是短板。

但让我们惊喜的是,豆包对漫画风格的一致性“拿捏”得很好。对于有分镜制作需求的漫画师、导演、创作者来说,它或许会是一个“好帮手”,更好地帮助你发散灵感。

话说回来,自从前两周Nano Banana掀起生图热潮以来,网友们发掘出了成百上千个AI生图的“邪修玩法”,甚至有报道直言“属于AI生图的ChatGPT时刻来了”。

从我们的实测来看,这场对决没有绝对的赢家,更像是两位高手过招。尽管两者在细节上仍有所欠缺,但两者的价值或许不在于一时的技术比拼,而是在一次次技术进步中,用越来越低的门槛,推动我们迈向一个AI生图的新时代。

注:文/阿虎 石濑,文章来源:AI新榜,本文为作者独立观点,不代表亿邦动力立场。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片