实测 Nano Banana 2 不够惊艳,但我劝你现在就用

0 评论 124 浏览 0 收藏 8 分钟

当Nano Banana 2以成本减半、速度提升三倍的姿态登场,谷歌选择了一条务实路线——不再追求惊艳效果,而是聚焦实用性与性价比。从诗经意境还原到产品海报生成,从论文板书制作到电影分镜设计,实测显示其在场景真实感、逻辑推理和中文理解上的显著进步。14种画幅比例突破更拓宽了商业应用边界,揭示AI图像生成正从Demo阶段迈向规模化落地。

昨晚,谷歌发布了 Nano Banana 2,也叫 Gemini 3.1 Flash Image。

我赶紧体验,测试了一些案例,推荐你们去玩玩。

现在直接在 Gemini 官网和 App 就能免费使用,也可以用其他第三方平台,比如 Lovart。

这一次的 NB 2,没有之前 NB Pro 那么惊艳,但胜在实用,它的速度更快,成本更低。

以前用 NB Pro,生成一张图大概要 30 秒,现在 NB 2 只要 10 秒左右。我在使用过程中,明显感受到生成快很多。

再说成本。 NB Pro单张 1K 图大概人民币 0.97 元,现在直接砍到大概 0.49 元,便宜一半。

做 AI 产品,很重要的一环就是找到效果与成本的平衡点,这种成本降幅是大大的利好。

除了速度和成本,NB 2 有几个方面值得关注。

  • 它生成的图片场景更真实,主体一致性更稳了。
  • 逻辑推理和中文处理都更准了。
  • 画幅比例更多,应用场景更广了。

我测了几个场景,给你们分享下。

01 场景表现:真实感上了一个台阶

以前,让 AI 根据诗词生成符合意境的图片,效果总是差点意思。

这次我继续玩了下,只用了诗经里面的一句,看看出来的效果,光影、鹿的毛发动作、场景纵深等等,有氛围感了。如果不加水印,可能以为是真实的摄影作品。

提示词:请根据诗句“呦呦鹿鸣,食野之苹”生成一张图片

试试太空场景,也是一句话,效果还不错吧?

提示词:生成一张人类驾驶宇宙飞船经过黑洞的场景

再看看拉布布带皮卡丘在广州玩的场景,结果出乎我的意料。

提示词:生成一张 Labubu 带皮卡丘玩广州的图片

你看,图片中行人是动态模糊的、街边招牌上的”陶陶居”、”点都德”,还有珠江游轮上的”珠江夜游”都很准确。

02 逻辑推理与中文处理:不只是”生图”,更是”理解图”

场景真实只是基本功,更让我惊喜的是,它的理解能力。

我专门试了下它的推理和中文能力。一句话让它生成《三国演义》重要人物的信息图,它自己也知道年份有问题,其他基本都准。

再试试商品图。这次,我只发了一个鼠标图片给它,没做任何描述。

它自己分析出是罗技的人体工学鼠标,生成了一张产品宣传海报。

这说明它的”理解力”在提升,不只是看到图片,还能推理出用途和场景。

说到推理和中文,还有一个很实用的场景:论文板书。

同样的提示词,NB 2 出图比我之前用 NB Pro 的效果更加真实。

提示词:请总结下论文《Attention Is All You Need》的内容,生成一张讲课的板书照片,笔记用多种颜色,文字使用中文

(上 NB2 / 下 Pro 对比)

 

大部分中文场景,它都表现准确。做海报、做营销图,完全可以直接用中文。

逻辑性增强,还可以做一些更有创意的事。比如,生成漫剧或电影分镜。我测了一组”产品经理与程序员相爱相杀”的分镜图,人物一致性不错,它会自己先编故事,再生图,叙事连贯。

03 画幅突破:不只是参数,拓宽场景

之前 NB Pro 生图比例比较有限,现在支持 14 种宽高比,新增了 1:4、4:1、1:8、8:1 四种超规比例。

我让它生成了一张广州全景图,整体效果非常震撼,当然抠细节还会有些问题。

提示词:模仿高清摄像机的风格,生成一张广州的著名地标图全景图,4:1比例

画幅自由度的提升,本质上是拓宽了使用场景。做 Banner、做长图海报、做电影宽屏分镜,发挥空间更大了。

写在最后

说实话,Nano Banana 2 没有强到”碾压一切”。

谷歌选择的方向是:更快、更便宜、效果够用。

这恰恰是 AI 从”Demo 阶段”走向”真正落地”的关键一步。

推荐你们去用用,学 AI 光看还不够,自己动手玩一玩,就知道它的能力边界。

最后,我让 Nano Banana 2 给它自己”打个广告”(点击查看大图)。

本文由人人都是产品经理作者【AI产品经理四月】,微信公众号:【AI产品经理四月】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!