智东西
作者 | 陈骏达
编辑 | 心缘
Nano Banana升级了!
智东西11月21日报道,昨晚23点,谷歌发布了其最新一代图像生成和编辑模型Nano Banana Pro,这是此前爆火的Nano Banana的重磅更新。谷歌直接将Gemini 3 Pro的推理能力与世界知识库,塞进了Nano Banana Pro。
Nano Banana Pro的正式名称为Gemini 3 Pro Image。基于增强的推理能力、世界知识和实时信息,这一模型可以生成更准确、更具上下文信息的视觉效果。用谷歌的话来说,它不再只是生成“像模像样”的图像,而是能够真正打造出实用的内容。
谷歌CEO Sundar Pichai分享道,Nano Banana Pro是一款SOTA级的图像生成与编辑模型,非常擅长制作复杂的图表,看待世界的方式就像工程师一样。Pichai分享的案例里,Nano Banana Pro用实拍和手绘草图结合的方式,讲解了金门大桥的基本结构信息,一目了然。

Nano Banana Pro的实用性还体现在较强的文字渲染能力上。结合其自带的联网搜索能力,智东西试着让Nano Banana Pro打造了一个剪纸风的实时天气卡片。模型不仅找到了正确的天气信息,文字渲染、风格化也是毫无破绽,彻底和上一代Nano Banana的“鬼画符”告别了。

知名科技播客主播Lex Fridman专门跑到Pichai的评论区,给Nano Banana Pro点赞。

目前,Nano Banana Pro已在Gemini应用和Web端免费可用,但有一定限额,用完后将恢复到原有的Nano Banana模型,Google AI Plus、Pro和Ultra订阅用户可获得更高的配额。
谷歌广告服务、谷歌Slides和谷歌Vids中的图像生成功能将升级为Nano Banana Pro。用户也可通过API调用、企业订阅方案等使用这一模型。
体验链接:
https://gemini.google.com/
借助更丰富的知识,Nano Banana Pro可以制作复杂的教育性讲解图,比如直接生成一份“小豆蔻茶”菜谱。
可以看到,模型生成的结果不仅文字清晰、毫无乱码,说明步骤也直观易懂;插图与内容配合自然,整体设计风格统一协调。以这样的完成度来说,几乎不需要再做二次编辑。

Nano Banana Pro能连接到谷歌搜索,帮助用户创建可视化的实时信息,例如天气或体育赛事等等。
下图就是Nano Banana Pro自行搜索并打造的波普风格天气海报,上面的信息我们已经核验过了,是完全正确的。

此外,Nano Banana Pro在文字渲染和多语言方面有了进展。模型现在可以更为深刻的理解图像,感知细节,从而给图像编辑和生成提供了更多空间。
在下面这一案例中,Nano Banana Pro能根据一张剧照,直接还原出一份手写体的黑板故事板草图,还是带有运镜和故事情节的。

Nano Banana Pro现在支持更丰富的纹理、字体和书法,能创造更为精细的文字。比如,它就在下图中把“BERLIN(柏林)”一词融入了建筑设计,且毫无违和感。

或者是把文字和纹理巧妙地融合在一起,下面的文字上就完美融合了木头横截面的纹理。

书法、字体方面,Nano Banana Pro的风格是由语义启发的,比如CRASH一词的艺术字就有很多裂痕,DRIP一词就使用了滴落的效果。

借助Gemini增强的多语言推理功能,Nano Banana Pro可以生成多种语言的文本,或者对内容进行本地化和翻译。
下方就是一个英语译韩国语的案例,商品图中不同角度的文字在翻译时都得到了准确的对应。

面向专业创作者的需求,Nano Banana Pro现在允许用户融合更多的元素,最多可使用14张图像,并保持最多5位人物的一致性和相似度。下图就是由14张输入图像+文字提示词打造的,角色一致性得到不错的保持。

这一功能不仅适用于角色,也适用于物体。比如,可以将沙发、绿植和连衣裙和场景等元素一同输入,然后输出全新的场景。

Nano Banana Pro提供了高级创意控制功能。改进的局部编辑功能现在支持选择、优化和调整图像里的任何部分,比如调整相机角度、改变焦点、应用精细的色彩分级,甚至改变场景光照(例如,将白天变为夜晚或创建散景效果)。

模型现在支持丰富的宽高比调整和2K、4K分辨率,让生成结果适用于更专业的场景。

随着Nano Banana Pro将虚拟和现实的边界进一步模糊,谷歌打造了一款专用的验证工具,以应对这一挑战。
现在用户可以将照片上传到Gemini,并要求Gemini识别图片是否为AI生成。谷歌已经为自家所有的AI生成媒体内容配备了SynthID数字水印,Gemini将会据此进行判断。目前,该功能率先支持图片验证,但很快将扩展到音频和视频。
Nano Banana Pro上线后,已经有海量网友分享了自己的使用体验。
这位网友利用Nano Banana Pro打造了四张抓拍照。可以看到Nano Banana Pro在运动场景生成的肢体动作不仅没有扭曲,还很有冲击力,而此类场景对大多数图像生成模型来说其实是不小的挑战。这位网友感叹,谷歌真的在改变世界。

Nano Banana Pro可以用来“拍摄”怀旧风格的老照片,如果不是网友特别说明,恐怕我们已经很难分辨下面四张图片究竟是真正的老照片,还是AI生成的。

同样的风格化能力也能用来复刻游戏的画风,一位日本网友就分享了他打造的像素风游戏角色卡。

元素组合功能对于电商场景来说十分实用。这位设计师分享,自己上传了模特图和衣物图,Nano Banana Pro便能让模特“穿上”新衣服,并且融合得很自然。

Nano Banana Pro的图像编辑能力也可用于优化照片。这位网友将自己实拍的CyberTruck交给Nano Banana Pro处理,他认为该模型在调整光线、去除瑕疵方面表现很出色。Nano Banana Pro帮他把竖屏照片扩展为了横屏照片,能直接当壁纸用。

凭借底层模型的升级,Nano Banana Pro现在让更多普通用户能轻松上手使用图像创作模型,仅依赖简单的提示词就能还原自己内心的想法。
不过,值得注意的是,谷歌在本次升级中的不少方向是在提升模型的实用性。无论更多样的字体,更多的元素,还是高级控制选项,都能给专业创作者以更多选择,打造真正符合其创意的画面。
谷歌已经在积极将Nano Banana Pro融入其To-B的创意产品,未来该模型能否在商用场景展示真实价值,值得持续关注。
更新时间:2025-11-24
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号