谷歌又来炸场!大热生图模型升级,提供“摄影棚级别”精度和控制

在阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持。

美东时间20号周四,谷歌刚把最强大的AI模型Gemini3推出来才两天,又赶着上新了,NanoBananaPro,核心就是把AI图像生成模型从咱们日常用的消费级,往专业设计的路子上拽。

这波密集的动作,明眼人都能看出来,谷歌在生成式AI这赛道上,是铆足了劲想追上OpenAI。

文本渲染终于不翻车了

AI图像生成这事儿,之前最让人头疼的就是文字部分。

本来想觉得随便生成个带字的海报凑合用就行,但后来发现,甭管是做信息图表还是产品海报,只要涉及多段文本,不是拼错字就是字体扭得没法看,专业设计师根本没法用。

这次NanoBananaPro就盯着这个问题来的,谷歌那边说,新模型在渲染图像前,会先把文字的位置、字体样式和其他元素的搭配都规划好,这对靠设计吃饭的人来说,算是解决了老大难。

比如你想做个多语言的产品展示图,新模型能直接生成本地化的文字,还能模拟手写风格,甚至把菜谱文字转成流程图。

我倒是觉得,这一步算是把AI图像工具的商用门槛降了不少,之前因为文字出错,很多企业不敢用AI做正式物料,现在至少文字这块,靠谱度提上来了。

不过谷歌也没藏着掖着,直接说新模型还是可能出问题,比如多语言的语法、文化习惯这块,还是得自己核对,并非明智之举就是全靠AI不管不顾。

用得爽但花钱也多了

文本问题解决了,这款新模型的专业控制能力也确实顶。

能调拍摄角度、景深,甚至把白天的场景改成夜晚,分辨率最高能到4K,还能保持五个角色、十四个物体的一致性,给品牌做营销物料特别合适。

本来想觉得功能这么强,用着应该和旧模型差不多成本,但后来发现,价格涨得可不是一星半点。

旧模型生成1024像素的图才0.039美元,新模型1080p的就要0.139美元,4K的直接到0.24美元。

谷歌也玩起了权限分层,免费的Gemini用户只能在配额里用,超了就切回旧版;付费订阅的用户额度更高,还能在Canva、Photoshop这些工具里用。

如此看来,谷歌这招挺精明的,既让普通用户尝鲜,又能靠付费套餐赚营收,就是对普通使用者来说,4K画质怕是只能偶尔用用,长期用真不划算。

除了这些,谷歌还加了AI内容溯源的功能,上传图片就能查是不是谷歌AI生成的,未来还会扩展到音频和视频。

这事儿我觉得挺有必要的,现在AI生成的内容越来越多,版权问题早晚要规范,提前加水印、做溯源,算是给商业化铺路,毕竟想赚钱,合规这块得先做好。

追OpenAI还差口气

这波新品发布,也让谷歌的股价坐了回过山车。

周二发Gemini3,周三母公司Alphabet股价创了新高,周四官宣NanoBananaPro,早盘涨了快5%,结果午盘又跟着大盘跌了1%。

股价的波动也能看出来,市场对谷歌的AI布局是又期待又谨慎。

数据上也能看出来差距,GeminiApp月活6.5亿,看着不少,但ChatGPT每周就有8亿活跃用户,而且OpenAI刚更了GPT-5,体验更贴合日常使用。

我倒是觉得,谷歌虽然动作快,但还是有点赶,新模型的小毛病没磨透,比如生成复杂数据容易出错,这些细节不解决,很难从OpenAI手里抢用户。

谷歌自己也说,接下来要发力AI电影制作工具Flow和Genie模型,毫无疑问是想靠更多场景拉用户。

不过现在的问题是,光靠堆产品没用,得把每个产品的体验磨到位。

比如NanoBananaPro,虽然解决了文本问题,但细节上的错误还是存在,用户用着总踩坑,自然留不住。

说到底,NanoBananaPro是谷歌AI商业化的重要一步,把图像工具推向专业领域,收费模式也更清晰。

但想追上OpenAI,怕是还得在细节和用户体验上多下功夫。

AI赛道的竞争本来就快,一步没跟上就容易被甩开,谷歌这波操作算是打了个不错的基础,就是后续能不能接住,还得看能不能把这些小瑕疵都补上。

支持作者,写作不易!如果您喜欢我的文章,可以点个“关注”,成为铁粉后能第一时间收到文章推送。

展开阅读全文

更新时间:2025-11-24

标签:科技   摄影棚   精度   模型   级别   用户   文字   图像   股价   专业   美东   赛道   文本   细节

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top