一手实测Nano Banana 2，我总结了8大新玩法 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

一手实测Nano Banana 2，我总结了8大新玩法

沃垠AI

2026-03-02

0 评论 2400 浏览 2 收藏

14 分钟

当Nano Banana 2以价格腰斩、速度翻倍的姿态登场，这款被戏称为'香蕉2'的AI图像生成器正在重新定义创作效率。本文通过一手实测，深度解析其在画幅自适应、批量生成、联网搜索等八大场景的应用潜力。从清明上河图风格的城市长卷到一致性角色创作，看新一代模型如何突破技术边界，为内容生产带来降维打击。

最近，AI圈有三大奇观：养龙虾，等种子，玩香蕉。

而今天，「香蕉2」正式发布了，官方名字Gemini 3.1 Flash Image。

一看这个名字，你就能明白，谷歌这是把Nano Banana的能力 + Flash的速度，直接合体了。

我们的老朋友lovart.ai，也第一时间接入了2，付费会员依旧0积分体验。

先给大家简单做一个总结：

1）2整体性能和Pro差距不大，部分场景甚至略有退步。

2）多文字生成，依旧容易乱码（尤其是中文）。

3）核心是价格直接砍半。一张1k图，Pro要0.134美元，2只要0.0672美元。

4）同时，速度大幅提升。API可以做到2秒出图，每分钟能够稳定输出347-356张图。

5）新增4:1、1:4、8:1、1:8等超宽/超窄比例，覆盖更多设计场景。

6）新增512px低分辨率选项，加上已有的1K、2K、4K，开发者可以按需选择。

7）内置web图片搜索，可以实时从网上搜索参考图来生成图片。

8）一致性增强，单任务可保持5个角色和14个物体的一致性。

01 一手实测

虽然整体性能没有质变，但2在「玩法层面」的扩展，明显更有意思了。

下面，给大家分享我实测下来最有价值的几个玩法。全部基于Lovart平台完成。

1）一键修改素材画幅

比如，这是2的海报，1:1比例。

我们想把它换成16:9的比例，上线平台换成Lovart，同时保持原图的画面结构、UI元素和文字不变。而且原图是我从x上下载的，分辨率很差，只有680×680，我想把它换成2K的。

于是，上传参考图，输入提示词。提示词：修改画幅尺寸为16:9，文字改为中文，2K。

初版给我们的图，有些文字没对。没关系，我们点击这张图，选择“文字编辑”，直接替换文字就可以了。

而且，我还注意到，他们家又上新了一些编辑功能，更实用了。

来看下最终版的图片。

这下子清晰多了，而且文字也全部换成了中文，整体结构也与原图保持一致。

对于设计师来说，2+Lovart的这套玩法真的非常实用。过去，我们想要调整这样一张海报图的尺寸，如果拿不到PSD源文件，基本无解。

即使有PSD源文件，也要忙活几个小时。而现在，只需要几秒钟。

对于设计师来说，这已经不是提效，是降维打击。

2）一键设计极宽幅图片

这次，2新增了4:1、1:4、8:1、1:8等超宽/超窄比例，加上原有的1:1、16:9、9:16、4:3、3:4、3:2、2:3等比例，设计场景一下子宽了很多。

特别是8:1和1:8这个极宽幅比例，拿来干Banner图、电商详情页、装修全景图、商场围挡、户外广告和游戏侧壁非常好使，能给人一种极致的沉浸感。

还是前面这个图的风格，我们结合2的模型要点，来设计一张8:1比例的Banner图。

提示词：

参考这个图{参考图}的布局和设计风格，提炼下面的文字，设计一张8:1的Banner图，来介绍Nano Banana 2模型的核心要点。——

简单总结一下Nano Banana 2：

1）整体性能与Nano Banana Pro没多少区别，部分场景甚至还略有退步。

2）多文字情况下，依旧容易出现乱码，尤其是中文。

3）核心是价格下降，输出一张1k图，Nano Banana Pro要0.134美元，Nano Banana 2只要0.0672美元，降了一半。

4）同时，速度也大幅提升。API可以做到2秒出一张图，一分钟能够稳定输出347-356张图。

5）画幅比新增4:1、1:4、8:1、1:8等超宽/超窄比例，覆盖更多设计场景。

6）分辨率新增512px低分辨率选项，加上已有的1K、2K、4K，开发者可以按需选择。

7）内置了web图片搜索，它可以实时从网上搜索参考图，来生成图片。

8）单任务中，最多可以保持5个角色和14个物体的一致性。

还行，但不够精美。

于是，我又设计了一版提示词。提示词：模仿清明上河图的风格，画一张现代的【地名】的风俗画，8:1比例，2K。

这是重庆山城

这是上海外滩。

这是杭州西湖。

这是成都春熙路。

我把这套提示词和样图丢群里，很多小伙伴都觉得太了。

实际上，基于这套提示词还可以延伸出很多玩法。比如航拍版杭州。提示词：模仿高清摄像机的风格，画一张现代杭州的著名地标图，4:1比例，4K。

by@绛烨

吉卜力版佛山顺德。提示词：模仿高清摄像机的吉卜力风格，画一张现代顺德著名地标图，4:1比例，4K。

by沃垠AI群友@邓

提示词：生成一张8:1的深圳天文台的日落图。

3）一键联网查找参考图

这次，2还有一个独特功能，就是内置了Web图片搜索。

模型不再只是靠训练数据里的「记忆」来画图，它可以实时从网上搜索参考图，然后基于这些真实图片来生成新的图。

这个能力，不仅能让2降低幻觉，也能拓展使用场景。

比如，生成成都今天的天气信息图。提示词：设计一个关于今日成都天气的信息图，包括温度、湿度和穿衣建议。

2会先搜今天成都的真实天气数据，再生成准确的信息图，而不是瞎编一个数字。

也可以让它做一些信息图和图鉴。提示词：设计一张信息图，介绍Nano Banana 2模型。

提示词：设计一张图鉴画，介绍黄腰柳莺。

4）一口气批量出图

这点，是我觉得最被低估的能力。

还记得春晚cos“天命人”的宇树武Bot吗？

现在，它要去闯荡江湖了，我们在Lovart上用2模型，可以一口气生成20张分镜图。提示词：以这张图片的机器人为主角，参考《雪中悍刀行》的场景，以水墨黑白条漫的极繁主义风格，展示机器人闯荡江湖的过程，生成20张动画分镜，如同剧中形象般生动。

所有分镜均保持了主体一致、风格统一，有完整的故事线。

又比如，我们有一张女主图片，可以在Lovart上一口气生成8个场景的图片。提示词：生成图中主体人物在公园、樱花树、图书馆、办公室、日式餐厅、火车、飞机、巴黎街头8个场景的图片，统一尺寸16:9，保持服装和外貌完全一致。

女主一直穿着相同的白色衬衫和黑色裙装，发型和面部特征也统一，并未“换脸”。

理论上，Lovart Agent支持超长上下文，可以一次性生成100张以上的图片，依然能保持一致性。

加上Lovart又有很多视频模型，生成后的图片可以直接创作视频。用它来搞漫剧、短剧，已经是内容生产线级别的能力了。

这点，跟Gemini只能一张一张图的生成，体验还是不同的。

写在最后

整体体验下来，我的结论是：

2依然是当前最能打的图像模型，能力独一档。

在做到更快、更便宜的同时，性能并没有降智，反而新增了一些更实用的功能。

配合Lovart独家的画布功能和编辑功能，可以有更多的玩法。

而且，它对提示词几乎不挑。一句模糊的描述，一个感觉，一个方向，它都能接住。

只要你有想法，它就能有结果。

关键在于：你，到底想用它做什么。

本文由人人都是产品经理作者【沃垠AI】，微信公众号：【沃垠AI】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

沃垠AI

努力分享一些好玩、有用的AI干货。首发同名公众号。

34篇作品 106743总阅读量

微信问一问，这免费流量都承接不住了！

08-1110808 浏览

微信问一问，这免费流量都承接不住了！

短视频里赶大集：宇宙的尽头是回村

01-197264 浏览

短视频里赶大集：宇宙的尽头是回村

我用AI“复活”了爷爷

04-064945 浏览

我用AI“复活”了爷爷

累计销量10亿杯，社群转化率86%，揭秘隅田川咖啡高转化私域的运营策略

11-205148 浏览

累计销量10亿杯，社群转化率86%，揭秘隅田川咖啡高转化私域的运营策略

人力资源数字化转型总结：关键问题、核心要素及能力框架

03-039738 浏览

人力资源数字化转型总结：关键问题、核心要素及能力框架

评论

目前还没评论，等你发挥！