深扒 Nano Banana 2 超多趣味玩法,速度快还要效果好!
从 1:8 极端长图到 15 角色群像控制,从海报翻译到知识 grounded 生成,它展现出的不是单点炫技,而是可嵌入真实工作流的系统性能力。对于需要批量迭代、快速验证、系列化产出的创作者而言,Nano Banana 2 或许正是那个"够用且好用"的甜点级选择。

假都放完了,终于有时间来尝试一下 Google 在 2 月底发布的 Nano Banana 2 了,官方正式名称是 Gemini 3.1 Flash Image 。
虽然从细节上大部分时候整体可能还比不上 Nano Banana Pro,但是它也确实在性价比和可控性上做了很大扩展,用更低的成本覆盖了更多的应用场景。
Nano Banana 2 目前在 Gemini 和 Lovart、TapNow 、ComfyUI 等平台也都支持了,另外自己接 API 也可以。
01 到底变强在哪?
先说结论:Nano Banana 2 的重点是快、可控 、能进工作流。
根据官方的说法有五个方向的进步:
首先,它把速度拉到 Flash 级别了。核心就是更快出结果,批量出图、快速迭代、反复调整,成本和等待时间都砍了下来。价格上,之前说 2K 分辨率的价格对比 4K 分辨率对半砍了,还有很多渠道费用更划算。
其次是指令遵循更强,可控性提升。同样的提示词下,更容易按要求去构图、安排风格和元素,不用反复抽卡。描述的和它输出的更接近了,要求很多也能精细实现了。
然后就是文字生成更可靠 + 支持翻译/本地化。图里的中英文可读性和排版准确性有明显提升。更重要的是它支持直接把图片里的文字翻译甚至本地化。二次修改非常友好。这对做海报、信息卡、电商图等来说会更方便了。
以及,更适合结合图像搜索 Grounding 的流程。它更像一个能和检索参考链路配合的图像模型。会先找依据、找参考,再基于真实数据生成更贴合需求的图。
Grounding :把一个说法、判断或模型输出,建立在可验证的事实来源上,而不是只靠猜测。
如果涉及很多知识内容和数据的话,生成图片细节还是有很多问题的,有进步,但还是依然没到完全可靠的程度。
最后,依然支持知名 IP 形象 ;新增了多个特殊比例支持。尤其是长比例 1:8、8:1、1:4、4:1 的效果,利好设计。虽然效果还不算太好,但是未来可期,很有潜力。
02 图文渲染
Nano Banana 2 中英文渲染准确率还是很不错的,多行文字、价格标签、菜单列表这种复杂排版也能比较好地处理。它还支持多语言翻译,比如上传一张英文广告图,可以直接生成日语、法语等本地化版本,不只是翻译文字,还会调整视觉元素来适配。
最开始我尝试了4 组 Pro 和 2 的对比,后面发现差别不算太大,除非是非常细小的字体或者细节,这一节以后我就没有再放 Pro 的图了。下方左边是 Pro ,右边是 Nano Banana 2 👇
多语言混排:


画面目标与主题:多语言欢迎信息图,采用包豪斯现代主义设计感,几何图形与文字共同构建理性又有温度的视觉。
构图与镜头语言:横版结构,左侧为圆形色块与箭头流程,右侧为多语言欢迎词矩阵,顶部标题横跨两区,底部细条信息带收束。
主体元素与层次:第一层是几何图形(圆、矩形、斜切块);第二层是主副标题与语言矩阵;第三层是小型编号、坐标刻度与注脚。无人物,强调系统化视觉语言。
光线与色彩材质:高质感平面印刷,主色钴蓝、奶白、炭黑,点缀朱橙;材质干净平滑,氛围理性、明快、展览级。
主标题:”WELCOME ACROSS BORDERS”;字体风格:现代无衬线粗体;视觉效果:平面高对比印刷;字号等级:最大;位置:顶部居中跨栏。
副标题:”全球问候语可视化图谱”;字体风格:中黑人文黑体;视觉效果:细描边+浅阴影;字号等级:中号;位置:主标题下方左对齐。
说明文字:在右侧文本矩阵中按多列展示“欢迎”词并保留语言含义,包含 Welcome(英语,欢迎)、Bienvenido(西班牙语,欢迎)、Bienvenue(法语,欢迎)、Willkommen(德语,欢迎)、Benvenuto(意大利语,欢迎)、Bem-vindo(葡萄牙语,欢迎)、欢迎(汉语,欢迎)、ようこそ(日语,欢迎)、환영합니다(韩语,欢迎)、أهلاً وسهلاً(阿拉伯语,欢迎)、स्वागत है(印地语,欢迎)、Karibu(斯瓦希里语,欢迎)、Selamat datang(印尼语/马来语,欢迎)、Maligayang pagdating(菲律宾语,欢迎)、Hoş geldiniz(土耳其语,欢迎)、Welkom(荷兰语/南非语,欢迎)、Chào mừng(越南语,欢迎)。
符号文字:仅放图例与导航词,不新增欢迎词,如 Legend / Direction / Entry Point / Exit Flow;字体风格:技术等宽体;视觉效果:低对比细线;字号等级:最小;位置:底部图例条与角落标记。
可读性与排版约束:图形不压住正文,语言矩阵行距一致,主副标题区分明显,所有文本可一眼辨认。
高密度文字:


生成 4:5 竖版新装饰艺术(neo-art-deco)会议海报,文字密集但完全可读,版面对齐严格。采用阶梯式几何结构、深祖母绿与金属象牙色,主标题用高反差衬线体。
主标题“FUTURE DESIGN FORUM”,副标题“VISUAL SYSTEMS 2026”,说明行强调微文案清晰与层级优先。
底部加入 3 个可读信息胶囊(演讲者、城市、工作坊),右上角加入机构徽章,底部加入法律微文案。要求边缘锐利、拼写准确、无字符变形,可直接发布。
以后做多语言的海报,直接把海报图片给 AI 让他做参考,再给我其他语言的,线条稳稳的,文字也比较和谐,字体效果也有照顾到(下面这排图片都是 2生成的)👇



把海报中的全部文字内容都翻译成阿拉伯语/韩语/日语。
纵深透视也能排,下面两个我感觉Pro的处理是更高级的:


反战社会议题海报,极简但强冲击,中心透视通道由“WEAPONS”构成多层递进门洞,外层巨字压向画面中心,内层红光渐亮,一名儿童与成人剪影牵手站在远端,地面黑色沥青与红色导向块形成节奏,整体黑底血红字、硬阴影、旧印刷纸张纹理与噪点;
上图文字:主标题“把武器放下,把明天还给他们”使用几何无衬线重黑体、厚描边与轻凹凸压印、字号最大、底部居中,副标题“战争结束的那一刻,童年才重新开始”画面中下部居中,说明文字“不是谁赢了,而是谁终于不再失去”使小号、底部单行横排,符号文字“DISARM / PEACE CORRIDOR / SAFE EXIT”使用等宽斜体粗字、透视扭曲连续复制、字号随纵深递减、覆盖顶面与左右墙体;
排版要求主次分明、留白合理、所有文字边界清晰可读


上图为Nano Banana Pro生成
画面目标与主题:治愈奇幻角色卡,主角为少年植物师“林沐舟”,十六岁,背着玻璃温室箱在漂浮岛群采集夜光种子;主题强调成长、修复生态、温柔冒险。
构图与镜头语言:明快横版,主角蹲姿观察发光苔藓,前景有透明水滴与嫩叶,背景为层叠漂浮岛与木桥;左上为角色表情小图,右侧为服装与工具分解,底部为任务日志。
主体元素与层次:主角短卷发、浅卡其工装、草绿色围巾、软底靴、玻璃采样瓶、折叠铲与手账;环境元素有藤蔓灯、云雾、风车温室、微型飞鸟。
光线、色彩、材质与氛围:主色调为薄荷绿、奶油黄、天空蓝、木棕;光线采用晨雾逆光与植物自发光;材质强调亚麻布、木纹、玻璃通透、湿润土壤;氛围轻松清新。
上图文字重写与排版:
主标题:文字“林沐舟”;字体风格圆角无衬线体;视觉效果柔光描边+轻浮起阴影;字号等级最大;摆放位置左下横排。
副标题:文字“漂浮群岛生态修复记录”;字体风格人文黑体;视觉效果浅绿底条+深色字;字号等级中号;摆放位置主标题上方。
说明文字:文字“他把每一粒微光种子都编号入册,用最慢的步伐让枯萎地带重新长出风与花。”;字体风格手写感印刷体;视觉效果纸张颗粒+低饱和墨色;字号等级小号;摆放位置底部中段日志框。
符号文字:文字“采样瓶”“夜光苔”“折叠铲”“温室箱”“任务点D3”“今日风向”;字体风格等宽体;视觉效果奶油黄标签+草绿字+细描边;字号等级最小;摆放位置对应工具与植物旁注。
可读性与排版约束:标题与日志区分层清楚,注释不遮挡主动作,文字对比适中,保证柔和色调下依旧清晰可读。
之前大家讨论有提到 Nano Banana 2 的人物还是会出现比较油的情况。在我个人体验后,想顺便再提一点:
如果是使用 Gemini 的话,我推荐大家在生成人物时,考虑使用 JSON 格式对比一下,概率上更容易获得更好的人物真实感。大家可以对比一下自然语言和使用 JSON 格式这两种不同类型的提示词所生成的图片效果。这里我都使用的是 2K 图片,如果想要小字细节更好,可以考虑生成 4K 图片。
下方左边是自然语言生成,右边是 JSON 格式提示词生成。不过这个图问题比较明显,50毫升应该没有这么大的👇


奢侈香水品牌平面海报,法国高级时装语境,巴黎左岸夜色灵感,构图;
主角为一位法式冷艳气质女性模特(高定黑色缎面礼服,克制珠宝,湿润微卷发,淡妆但轮廓立体),手持一只切割感强的水晶香水瓶,瓶身琥珀色液体在边缘高光中微微发亮;
场景为现代法式公寓与古典石膏线元素融合的室内布景,背景有柔焦城市夜景与轻微雨痕玻璃反射;整体色彩采用深黑、香槟金、烟灰蓝、琥珀金,低饱和但高对比,强调“克制奢华”。
镜头语言:85mm 人像镜头质感,浅景深,模特三分之二侧身,视线略偏离镜头,留白充足用于文案;光线采用电影级三点布光 + 轮廓边光,皮肤高光细腻,玻璃与金属反射干净,阴影层次丰富;材质表现突出丝缎、玻璃、金属喷头、石材墙面微纹理;
整体呈现虚幻引擎级超写实渲染质感(UE5 look),全局光照、体积雾极轻、微颗粒胶片感,4K 商业广告成片品质。
版式与文案(法语):
顶部小号衬线字:MAISON ÉTOILE
中部大标题(高奢衬线,字距拉开):L’OMBRE DORÉE
副标题(无衬线小号):Parfum Intense
底部信息:50 ML • EXTRAIT DE PARFUM
文字排版极简、呼吸感强、对齐严格,避免拥挤;
整体气质必须像法国一线奢侈品牌新品发布海报,优雅、冷静、昂贵、可登巴黎地铁灯箱与高端百货橱窗。
03 真实世界知识
比如来个好玩的,任意城市、任意景点的福字打卡(下面是元提示词,如果是设计 Agent 直接发全文说城市,如果普通生图工具就发给 AI 再输入城市获得提示词):



你是海报生图提示词生成器。
任务:用户只输入一个城市名,你只输出一条完整“生图提示词”(不要解释、不要分析)。
强制要求:你输出的这条生图提示词中,必须包含以下执行指令(作为画面生成约束):
1) 先进行图像检索,锁定该城市真实机位与地标关系,确保建筑站位、岸线/山体轮廓、空间透视与真实观察一致。
风格与构图固定要求:
– 竖版3:4,超写实,节庆电影感,高级审美。
– 仅出现一只手:成年女性的手,单手入镜,禁止双手、禁止多余手指或额外肢体。
– 女性单手从画面下方自然举起红色宣纸卡。
– 红纸中央为“福”字镂空,镂空后是该城市真实天际线。
– “福”字占比控制在红纸可视面积的50%-55%,笔画舒展且留白均衡。
– 50mm真实摄影;浅景深但“福”字边缘与核心地标同时清晰。
– 红纸哑光纤维质感,轻微折痕,刀刻微毛边。
文字与图标排版固定要求(写进最终生图提示词):
– 主标题仅“福”,最大字,居中。
– 所有辅助元素必须在红纸内部下方,且位于“福”字下方,不得落到背景。
– 左下两行:
– 第一行:城市中文名 + 英文名(例:香港 Hong Kong)
– 第二行:固定祝福短句 `WISHING YOU PROSPERITY AND PEACE`
– 右下元素为“马头造型的2026实心填充图标”透明度80%(块面填充,非线框,数字与马头形体融合,清晰可读)。
– 严格尺寸规则(必须同时满足):
– 先计算左下两行文字总高度 `H_text`(含行高与行间距)。
– 图标外接框高度 `H_icon` 必须满足 `H_icon = H_text`。
– 若发生冲突或模型不稳定,强制回退为 `H_icon = 0.90 × H_text`(宁小勿大)。
– 绝对禁止 `H_icon > H_text`(硬上限)。
– 图标与左下文字组底边对齐;图标顶部不得高于左下第一行文字顶部。
– 图标仅放在右下安全区,不得侵入“福”字主体区域。
– 负面约束:禁止 oversized logo、禁止大徽章感、禁止图标抢主视觉。
– 辅助元素区域总高度不超过红纸高度的12%-15%。
– 除“福”外禁止其他大字;其余元素低干扰,清晰无重影无乱码。
– “福”字以外所有文字与图标颜色统一为“带环境色偏移的白”,透明度85%。
输出规则:
– 只输出一条最终生图提示词。
– 不要输出解释,不要输出元提示词说明。
– 若文字或图标尺寸冲突,优先缩小右下图标,不得放大图标。
百科全书类的也都可以试试,在真实世界知识上它也有提升了。但还是那句话,细节问题还是有的,注意核实。

搜索王维生平,生成百科全书式长图,中文。16:9,2K
Search Grounding 本质上是让模型在生成时能调用实时搜索结果作为依据。看着挺像那么回事的,但是细节问题还是比较多的。
来个长图,这个是 1:4 和 4:1 的比例 ,目前的效果还差一口气,但按照这个发展速度,可能到 2 Pro 就能轻松做长图了。

宽图:

创作一张纵向一镜到底的信息叙事长图,主题是“碎片化信息如何侵略你的大脑”。
画面按因果连续推进。
要求空间与时间无缝流动、视觉隐喻清晰、信息层级明确、画面连贯无硬切、超长画幅、科普叙事感强。
中文。
风格要求:现代医学科普视觉风格,干净、理性、可信;以高明度白色与冷灰为底,主色为医疗蓝+青蓝+少量薄荷绿,低饱和且通透;用少量珊瑚橙仅作风险预警点缀;平滑背景、轻微玻璃质感和柔和阴影;线条精确、图标符号化、留白充足,整体呈现医院导视/医学期刊信息图的专业洁净感。
这里有一个小技巧,如果安装了谷歌浏览器的AI,那么可以在搜索完结果之后直接在结果的下方点击生成信息图,生成的图片大约是 1K 的图片,画质比较一般,但是这样出快速信息图真的很快速。用于即时的快速内容分享很方便。


到这里我对于面包与马戏政策有点好奇,于是我追问并让它保持风格不变继续生成,这时候可以保持格式更一致一点:

04 角色一致性
超多角色也可以。比如我首先直接先一把直出 15 个角色,这里大家也可以看一下它在角色细节上的遵循程度。

电影级3D卡通大场景,15个原创IP角色同处一个热闹的“森林创意嘉年华广场”,黄昏暖光,体积光与柔和环境光并存,PBR材质,细节清晰,色彩明快统一。
镜头为广角全景、略微俯视,画面有前景-中景-背景层次,所有角色完整可见、互相有互动、不重叠遮挡关键特征。场景中心是圆形木质舞台与发光地砖,周围有小摊位、花箱、工具台、全息屏装置、悬挂彩旗与灯串,地面有自然投影与微反射,整体童趣、电影感、故事性强。
15个角色全部出现且彼此不同,并在同一时刻进行各自动作:
1. 熊猫宇航员在舞台左侧调试喷气背包;
2. 狐狸魔法师在舞台前方挥动法杖释放紫色微光粒子;
3. 企鹅厨师在餐车前翻锅,锅里有可控火焰;
4. 青蛙快递员踩滑板穿过广场递送包裹;
5. 考拉摇滚吉他手在小舞台弹奏电吉他;
6. 柴犬侦探在路灯旁拿放大镜观察线索;
7. 兔子机械师在工具台维修机械臂零件;
8. 小鹿花艺师在花箱边整理花束与藤蔓;
9. 章鱼程序员在全息终端前用多触手同时操作透明屏幕;
10. 小鸡牛仔甩动套索与观众互动;
11. 浣熊摄影师半蹲抓拍全场活动;
12. 海狸木匠在木工区敲打并拼装小木牌;
13. 猫咪调酒师在吧台摇雪克杯调制饮品;
14. 刺猬园丁给盆栽浇水并摆放幼苗;
15. 小龙甜品师端着纸杯蛋糕托盘从甜品摊走出微笑招手。
统一要求:
每个角色体型比例、服装结构、道具、主色调、表情气质都明显不同;
角色之间有视线与动作呼应,形成“嘉年华协作”叙事;
不出现文字、logo、水印、边框;不裁切角色;
高分辨率,超精细,干净背景控制,整体像一张可用于IP世界观海报的3D群像场景图。
然后我可以让这 15 个角色出现在同一个场景中,并且保持他们细节上的一致性。

电影级3D卡通大场景,15个原创IP角色同处一个热闹的“森林创意嘉年华广场”,黄昏暖光,体积光与柔和环境光并存,PBR材质,细节清晰,色彩明快统一。
镜头为广角全景、略微俯视,画面有前景-中景-背景层次,所有角色完整可见、互相有互动、不重叠遮挡关键特征。
场景中心是圆形木质舞台与发光地砖,周围有小摊位、花箱、工具台、全息屏装置、悬挂彩旗与灯串,地面有自然投影与微反射,整体童趣、电影感、故事性强。
15个角色全部出现且彼此不同,并在同一时刻进行各自动作:
1. 熊猫宇航员在舞台左侧调试喷气背包;
2. 狐狸魔法师在舞台前方挥动法杖释放紫色微光粒子;
3. 企鹅厨师在餐车前翻锅,锅里有可控火焰;
4. 青蛙快递员踩滑板穿过广场递送包裹;
5. 考拉摇滚吉他手在小舞台弹奏电吉他;
6. 柴犬侦探在路灯旁拿放大镜观察线索;
7. 兔子机械师在工具台维修机械臂零件;
8. 小鹿花艺师在花箱边整理花束与藤蔓;
9. 章鱼程序员在全息终端前用多触手同时操作透明屏幕;
10. 小鸡牛仔甩动套索与观众互动;
11. 浣熊摄影师半蹲抓拍全场活动;
12. 海狸木匠在木工区敲打并拼装小木牌;
13. 猫咪调酒师在吧台摇雪克杯调制饮品;
14. 刺猬园丁给盆栽浇水并摆放幼苗;
15. 小龙甜品师端着纸杯蛋糕托盘从甜品摊走出微笑招手。
统一要求:
每个角色体型比例、服装结构、道具、主色调、表情气质都明显不同;
角色之间有视线与动作呼应,形成“嘉年华协作”叙事;
不出现文字、logo、水印、边框;不裁切角色;
高分辨率,超精细,干净背景控制,整体像一张可用于IP世界观海报的3D群像场景图。
有角色设定图的情况下,长提示词和自由发挥它都能比较好地控住👇

3D卡通电影质感,4×4十六宫格分镜海报,统一世界观与统一角色建模(沿用同一套15个IP角色设定),每个格子为独立小场景,单格只出现1-2个角色,镜头语言清晰,整体从左到右、从上到下形成完整故事线。
画面要求:正方形总画幅,16个格子边距一致、留白均匀、排版整齐,柔和体积光,PBR材质,色彩明快,表情夸张可爱,动作有戏剧性,不出现文字、logo、水印。
故事主题:森林创意嘉年华从筹备到突发停电再到重启,最后以“开场瞬间”收束。
第1格(清晨)熊猫宇航员独自在广场中央检查喷气背包,晨光洒下。
第2格 狐狸魔法师与小鹿花艺师布置入口花环与彩旗,轻松微笑。
第3格 企鹅厨师与小龙甜品师在餐车前备餐,锅中微火与甜点蒸汽。
第4格 青蛙快递员滑板送来“核心零件箱”,兔子机械师在门口接货。
第5格 浣熊摄影师单人测试相机机位,低角度取景嘉年华主舞台。
第6格 海狸木匠与刺猬园丁搭建木质指示牌和盆栽边界,细节忙碌。
第7格 猫咪调酒师与小鸡牛仔试营业互动,套索在空中形成弧线。
第8格 章鱼程序员独自在全息控制台前调试灯光系统,蓝色屏幕发光。
第9格(突发)全场突然断电,章鱼程序员与柴犬侦探在黑暗中发现异常线缆。
第10格 兔子机械师与熊猫宇航员联手修复主电机,工具火花飞溅。
第11格 狐狸魔法师与青蛙快递员在高处重新连接能量导管,动态感强。
第12格 企鹅厨师与小龙甜品师安抚排队观众,递出热食和纸杯蛋糕。
第13格(恢复)全场灯串重新点亮,浣熊摄影师抓拍关键瞬间。
第14格 柴犬侦探与海狸木匠确认结构安全,二人击掌庆祝。
第15格 考拉吉他手与小鸡牛仔在舞台热场演出,节奏欢快。
第16格(新结局)熊猫宇航员按下“开场按钮”,狐狸魔法师在旁释放金色粒子,主舞台灯光同时点亮,远处可见模糊人群与其他角色剪影,形成“庆典正式开始”的收束画面。
统一约束:
角色外观必须与设定一致且彼此明显不同;
每格情节连续、光色连贯;每格最多2个角色;
镜头多样化(远景、中景、近景交替);整体是一张可读故事的十六宫格3D卡通叙事海报。
无文字
Nano Banana 2 官方说同一工作流里最多支持 5 个角色的相似度保持,以及 14 个对象的保真度。可以更稳定地做连续内容了,绘本系列、品牌 IP 多场景、教程分步图、打卡系列等等,角色不走形,内容也更方便积累成系列。
真实人物的也可以。

超写实摄影拼图肖像,横幅构图,画面严格五等分并保持每一格视觉权重一致,每格1位不同人物+不同场景,五人身高比例自然,头部位置统一在上三分线附近,整体像国际人物专题摄影。
第1格:22岁中东女性,深棕卷发,雀斑明显,穿浅灰连帽卫衣,背景是大学图书馆窗边,暖阳斜射到木质书架。
第2格:47岁东亚男性,寸头,轻微胡茬,穿深色西装外套和高领针织衫,背景是现代办公室会议室,玻璃墙和城市天际线。
第3格:29岁非裔女性,脏辫盘发,金属圆环耳环,穿橄榄绿飞行夹克,背景是地铁站台,荧光灯与列车虚化光带。
第4格:33岁白人男性,长发扎低马尾,牛仔衬衫叠穿皮围裙,背景是木工工作室,工具墙和木屑细节清晰。
第5格:26岁拉丁裔男性,短卷发,浅色亚麻衬衫,背景是海边渔港黄昏,船只和湿润空气层次分明。
光线设定:
每格依据环境独立布光但整体色调统一为自然电影感,中等对比度,真实阴影过渡;
镜头35mm,ISO 200,快门1/160,真实肤色与细节,绝对写实,无插画感,无AI塑料皮肤,无logo无字幕。
把上面5个角色放在一个场景里:

超写实电影级群像摄影,单一连贯场景,不分屏不拼图:黄昏时分的滨海创意园共享大厅,左侧是木质书墙与阅读窗位,中部是玻璃会议区与开放通道,右侧延伸到木工工作台和可见船只的港口露台,五人同时出现在同一空间并保持自然社交距离,整体叙事为“跨职业人群在同一场域协作交流”。
人物设定与动作:
22岁中东女性,深棕卷发、明显雀斑、浅灰连帽卫衣,站在书架旁翻阅一本笔记并抬眼倾听;
47岁东亚男性,寸头、轻微胡茬、深色西装外套+高领针织衫,站在玻璃墙前手势讲解;29岁非裔女性,脏辫盘发、金属圆环耳环、橄榄绿飞行夹克,边看手机上的路线图边转身回应同伴;
33岁白人男性,长发低马尾、牛仔衬衫叠穿皮围裙,在木工台上轻扶木板并暂停操作加入对话;
26岁拉丁裔男性,短卷发、浅色亚麻衬衫,站在露台入口手持咖啡望向众人点头示意。
五人身高比例自然,头部高度大致落在同一上三分线附近,人物前后层次清晰但视觉权重均衡。
光线为统一自然电影感:室内暖色环境光+窗外冷色天光混合,中等对比度,真实阴影过渡,肤色准确,空气中轻微湿润感,细节清晰可见(木纹、玻璃反射、金属工具、远处船体)。
镜头35mm,ISO 200,快门1/160,浅景深但五人面部均清楚可辨,纪实风格,绝对写实,无插画感,无AI塑料皮肤,无logo无字幕。
Nano Banana 2 无需参考图,同一张图里出现角色多次,出现多个角色,也可以维持一致性。
这在需要做连续内容的时候确实会很方便,细节上更有说服力了。比如下方这里,完全靠文生图它在多个形象上也维持率比较好的一致性。不需要很长的提示词也可以有比较好的效果,只要有脑洞都可以轻松做出属于自己的漫画小场景👇

四格漫画;
主体:主角、左肩天使、右肩恶魔、第三只小动物;
动作:天使劝学习、恶魔劝躺平,第三只提议先吃东西;
场景:房间书桌前;
镜头:肩部近景+三方对峙;
风格:可爱寓言式漫画;
中文;
约束:三角色造型差异明显、结尾温柔搞笑。

四格漫画;
主体:法官猫、被告人类、陪审团小猫;
动作:审理“为何又熬夜”,判决没收手机、强制睡觉、奖励小鱼干(给猫);
场景:迷你法庭;
镜头:法庭全景+法槌特写;
风格:可爱严肃拟人漫画,中文;
约束:猫咪权威感与可爱并存。
包括IP的也是,小到 LOGO 的细节都可以维持了,做延展更方便了👇

创建一组6帧的品牌吉祥物多场景应用系列图。在所有画面中保持吉祥物角色的身份一致性。
角色设定:
– 吉祥物”咖小豆”:一颗拟人化的咖啡豆角色,深棕色椭圆形身体,有两只圆圆的大眼睛和微笑的嘴巴,短小的四肢,头顶冒着一缕热气(像刚烘焙好的咖啡豆),始终佩戴一个微型咖啡师围裙(白色,上面有一个小咖啡杯图标)
六帧场景内容:
第一帧·产品包装场景:咖小豆站在一个咖啡袋包装的正面,双手举起一面小旗帜,上面写着”新鲜烘焙”,背景是简洁的牛皮纸色。
第二帧·社交媒体头像场景:咖小豆的大头特写,一只手托腮,歪头微笑,眨眼表情,背景是品牌色渐变(深棕到焦糖色)。圆形构图。
第三帧·节日营销场景:咖小豆穿着圣诞老人帽和红色斗篷,站在一棵用咖啡杯和咖啡豆装饰的圣诞树旁边,手中端着一杯拉花热巧克力,周围飘着雪花。
第四帧·教学科普场景:咖小豆穿着教授的毕业帽和小眼镜,手持教鞭指向一块黑板,黑板上画着”咖啡豆烘焙程度”的三个阶段(浅烘中烘深烘),表情认真严肃但可爱。
第五帧·运动活力场景:咖小豆穿着运动头带和跑鞋,正在慢跑,身后留下一串咖啡豆形状的脚印,背景是清晨的公园绿道,周围有几杯咖啡外带杯在为他加油。
第六帧·睡觉晚安场景:咖小豆穿着小睡衣和睡帽,抱着一个咖啡杯形状的抱枕,闭着眼睛甜甜地睡在一片咖啡豆堆成的小床上,头顶的热气变成了ZZZ睡眠符号,周围点缀着星星和月亮。
视觉风格:3D卡通渲染风格,类似Line Friends的质感——圆润光滑的表面、柔和的阴影、明亮友好的配色。
所有画面分辨率4K。
中文。
单张插图的稳定性越来越好,扁平转 3D 效果也很和谐:


一组扁平化矢量风格的办公场景插画:一个戴眼镜的男性角色坐在电脑前工作,桌上有咖啡杯、文件和台灯,背景是简约的办公室环境(书架、窗户、绿植),使用明亮的蓝色、橙色和白色配色方案,类似Google Material Design的扁平插画风格,干净简洁的线条,没有任何文字。
/第2个
保持画面中的所有元素不变(人物、电脑、咖啡杯、文件、台灯、书架、窗户、绿植),保持整体构图和蓝色+橙色+白色的配色方案不变。
将视觉风格从扁平化矢量插画改为3D卡通渲染风格:
1. 所有物体添加立体感,具有柔和的圆角和厚度
2. 人物从扁平剪影变为Q版3D卡通角色,保留眼镜和坐姿
3. 桌面物品变为3D等距视角的微缩模型质感
4. 添加柔和的环境光遮蔽(AO)阴影效果5. 材质质感从纯色色块变为类似黏土/塑料的哑光质感
6. 保持明亮友好的整体氛围
整体效果类似Pixar/Nintendo风格的3D卡通渲染。
05 多比例图片
Nano Banana 2 支持 14 种宽高比,分辨率从 512px 到 4K。常见的 9:16、16:9、1:1 自然不用多说,非常有意思的是它现在已经支持 1:4 甚至 1:8 这样的极端长图比例了。以后想要做长图攻略、时间轴信息图、竖版故事条、全景海报,有了更多可能性。

接下来来看一写长比例和全景比例。下面是 1:4 的效果👇

搜索达芬奇生平,生成洛可可风格百科全书式长图,中文。
说实话现在极长比例的质量还达不到常规比例那样的水准,但已经很不错了,很有潜力。
相比8:1的话,4:1会控制更好一点,毕竟细节也少一点。

超高审美二次元电影感群像海报,夜色霓虹雨后街区,镜头为24mm广角低机位,前中后景分层清晰,20位日本动漫角色同场但保持各自核心辨识特征,整体美术统一为高对比赛博霓虹+胶片颗粒:
五条悟穿白色高领风衣单手拨开发光雨幕;
虎杖悠仁穿学院长外套跃起落地;
伏黑惠穿机能斗篷召出黑色影犬轮廓;
禅院真希穿街头护具扛金属长棍;
炭治郎穿城市侦探大衣握发光指南针;
祢豆子穿暗红机车夹克踩滑板急停;
我妻善逸穿DJ耳机外套在电光中转身;
嘴平伊之助穿拳击斗篷站上消防栓;
阿尼亚穿星空斗篷举放大镜;
约尔穿黑金晚礼战术裙持雨伞回眸;
洛伊德穿特工三件套整理手套;
芙莉莲穿现代极简长风衣托起蓝色魔法粒子;
欣梅尔穿复古骑士休闲装微笑侧立;
玛奇玛穿导演风黑西装打板;
电次穿涂鸦围裙举起链锯形霓虹道具;
帕瓦穿红色棒球夹克踩栏杆;
星野爱穿舞台机能服甩出彩光丝带;
后藤一里穿黑粉摇滚演出服抱吉他缩肩;
洁世一穿高街训练服高速盘球;
蜂乐回穿彩绘卫衣倒挂在路牌。
背景是多层城市游乐夜市:空中轻轨、透明天桥、悬浮广告屏改为抽象光块、蒸汽井盖、远景摩天轮,主光紫蓝、补光暖橙,湿地反射、体积雾、动态光斑、布料与金属材质细节拉满,画面干净高级、角色不拥挤、动势互补。
纯画面输出:无任何文字、无字幕、无logo、无水印、无UI
做全景图很适合的。
修仙全景:

东方奇幻水墨与3D融合的超宽卷轴场景,画面像一幅会呼吸的山海长卷:
左侧是云海中的悬崖古寺与晨钟薄雾,中段是层叠山谷、飞瀑、古桥、竹林与流光神兽群,右侧是夜色初临的星湖、浮岛与远古天门。
要求同一画幅内出现时间流动感:从左到右由清晨过渡到黄昏再到蓝夜,光色自然衔接。材质融合宣纸肌理、水墨晕染边缘、半透明灵气粒子、石木建筑真实体积。
镜头采用高空俯瞰并结合局部贴近景,前景有飞鸟与云丝引导视线,中段主叙事最密集,右侧以宁静神秘收束。整体氛围空灵壮阔、诗性叙事、层次深远,细节精致、清晰度高、电影级环境设计,不出现文字、logo、水印。
蒸汽全景:

超宽幅电影概念图,蒸汽朋克天空港口在日落时分全面运转:画面最左侧是巨型铜制飞艇船坞与升降吊臂,中段是多层步道、齿轮塔楼、玻璃穹顶与人流市场,最右侧是云海边缘的离港跑道与远处悬浮城。
大量动态元素同时发生:飞艇起降、机械信使穿梭、蒸汽阀门喷薄、空中轨道车交错,形成强烈“忙碌文明”叙事。材质重点表现拉丝黄铜、旧化钢铁、皮革、木质甲板、雾化玻璃;
光照为金色逆光、侧向体积光、局部煤气灯暖光,烟雾层次明显,远近景清晰分离。
镜头语言为高位广角全景,前景有链条和管道压景,中景突出港口核心活动,远景展示天空城轮廓。
整体色彩为琥珀金、氧化铜绿、烟灰蓝,细节密度高但构图有秩序,超清、锐利、电影级质感,不出现文字、logo、水印。
未来全景:

复古未来主义太空殖民地超宽场景,灵感来自七十年代科幻海报但以现代3D渲染完成:左侧是红色荒漠中的圆顶农场与太阳能阵列,中段是主城交通环与透明穹顶生态区,右侧是发射井、轨道电梯基座与远处星环天际线。
强调人类日常与宏大工程并存:工程车编队、维护机器人、温室作业、观景平台人群、远处火箭准备升空。色彩控制为奶油白、复古橙、陶土红、钴蓝,轻微胶片颗粒叠加但主体锐利。
光线为低角度斜阳与环境冷补光,阴影长且清晰,空间透视强烈。
镜头为横向超广角,前景放置设备与岩石增强尺度感,中景突出城市结构,远景给出行星地平线与轨道设施。
整体风格怀旧却先进,叙事完整、信息饱满、可作为超宽海报主视觉,不出现文字、logo、水印。
油画史诗全景:


超宽幅文艺复兴宗教神话壁画场景,西斯廷穹顶叙事美学,但整体气质更柔和、更温馨:天穹被分为连续叙事区,中心是温暖神圣之光轻柔洒下,四周环绕天使、先知与人间家庭群像,人物表情平静慈爱,姿态优雅舒展,强调守护、祝福与希望。
采用古典湿壁画质感,保留石灰墙体与手工颜料层次,但弱化厚重冲突感,突出细腻笔触与柔和过渡。
色彩改为低饱和暖调:奶油白、浅金、蜜桃粉、鼠尾草绿、雾蓝、暖赭石;光线为晨曦般漫射光与边缘柔光,减少强烈明暗对比,增强空气感与亲和力。
构图保持庄重对称与穹顶宏伟尺度,云层与布幔作为柔性引导线,前中后景清晰但不压迫。
整体氛围宁静、抚慰、神圣而亲近,博物馆级细节,不出现现代物件,不出现文字、logo、水印。
中文文字
上面的做竖版也可以试试,这里不想篇幅拉太长我就不放了。大家也可以直接用我上面的提示词试试超长竖版。
详情页,文案和卖点也拿捏,一致性还挺好的。不过细节上也还是存在问题。 我还是那句话,有潜力,也还有较大进步空间。以后要能稳定出了那就很刺激了。

设计感手袋白底三视图,极简云朵包(柔软鼓感轮廓、磁吸开合、短提手+可拆肩带、雾面皮革),一张图横向并列 front side back,白底无缝,镜头一致,棚拍柔光,细节高清,风格清新时髦,适合年轻女性市场


为这款奶油白云朵褶皱女包生成一张中文电商长图详情页:
整体保持极简高级调性,先展示产品主视觉和三视图(正面/侧面/背面),再依次覆盖设计卖点、材质与工艺细节、背法与上身效果、容量展示、尺寸参数、细节特写、配色与适用场景、售后与购买引导;
要求图文层级清晰、移动端易读、中文文案完整无错字乱码,重点突出质感、实用性、百搭性和购买转化。
轻奢品牌物件插画化低密度视觉风格,主视觉居中悬浮,大面积留白增强高级感。配色采用低饱和体系,情绪温和、统一度高。
线条细而柔,环境元素极简,重点突出产品本体与品牌识别。
整体更偏情绪广告画面而非信息承载型信息图。
/为这款奶油白云朵褶皱女包生成一张中文电商长图详情页:
整体保持极简高级调性,先展示产品主视觉和三视图(正面/侧面/背面),再依次覆盖设计卖点、材质与工艺细节、背法与上身效果、容量展示、尺寸参数、细节特写、配色与适用场景、售后与购买引导;
要求图文层级清晰、移动端易读、中文文案完整无错字乱码,重点突出质感、实用性、百搭性和购买转化。
电商时尚广告页”风格:用中轴大产品图做绝对主角,上下分层文案完成转化闭环。色彩以黑白灰秩序承载信息,以单一深色产品制造焦点与品牌记忆。
字体采用高端衬线标题 + 现代无衬线正文的经典杂志广告组合,兼顾调性与可读性。
背景以线稿城市和生活道具补足场景,但不抢产品主视觉。适合新品上新、爆款推广与品牌社媒广告素材。保持留白提升高级感。
还有卡通科普长图,也是英文版效果更好,我有一个鬼点子,如果中文效果你始终不满意,可以先生成英文版,然后将满意的英文版图片给它翻译成中文版,效果挺好的。


生成《社区文明养犬规则卡》内容结构:(牵引绳、清理粪便、禁入区域、疫苗、噪音、投诉渠道)。
信息图风格:以白底和绿色主色建立清晰秩序,用黄色做情绪化提醒。
版式采用竖向单栏编号递进,配合大圆角气泡容器与Q版情境插画,使规则内容更易读、易记。
文字系统强调标题强识别、正文高可读、注释弱化,整体信息密度适中。
图形语言以粗线手绘轮廓与轻装饰符号为核心,兼顾亲和感与规范感。
比例:1:8,4K图片,非常清晰,非常精细的文字渲染
以及实际应用中直接要求它修改比例的时候,它的比例填充修改效果也还是很不错的。
再就是多轮编辑与 Thinking 模式,其实也很不错。篇幅确实太长了,下次有机会再写吧🤔
小结
我的个人建议:如果只能用一个,质量要求高的场景还是选 Pro。Nano Banana 2 在整体画质和细节精度上确实还差 Pro 一点,这个不用回避。
如果希望性价比更高,可以当成两个工序。
Banana 2 负责探索阶段,快速跑方向、测构图、测文字排版、出 10 个变体看哪个感觉对,成本低、速度快,试错不心疼。Pro 负责交付阶段,方向定了,把选定方案推进到最终交付的品质。
这样既保证了效率,也没有牺牲最终完成度。当然大家也可以根据自己的预算和需求来判断怎么搭配。
好啦,关于 Nano Banana 2 的分享先到这里,还有很多实用用法和创意,下次有机会再分享。
本文由人人都是产品经理作者【阿真Irene】,微信公众号:【阿真Irene】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益



