我用Nano Banana Pro复刻了阿里工牌,顺便给夸克 AI眼镜做了组海报

0 评论 1809 浏览 2 收藏 17 分钟

作者分享了 “容器法”“3D 渲染黑话” 等 AI 商业作图精准指令技巧,类比夸克 AI 眼镜的产品逻辑,演示了 AI 在 PPT 背景、架构图等场景的落地用法,强调精准指令是驾驭 AI 的核心。

前两天,真是「拍断大腿」。

我在社群发了一组黄仁勋、扎克伯格、Sam Altman 在深圳城中村撸羊肉串的提示词,没想到直接「出圈」了。

有个有心的博主拿去做了个视频发抖音,反手是几万赞,早知道这波泼天的流量我就自己接了;不过我看了一圈评论区,发现大多数人只把它当成一个「整活」工具,我觉得太浪费了。

其实,只要掌握好那个关键的「控制阀」,它就成了电商美工手里的瑞士军刀,也可以是艺术家脑子里的灵感缪斯。

毕竟,商业作图和搞艺术不一样,商业不仅需要随机的「惊喜」,还有可控的「准确」,带着这个思路,这两天我又通宵“跑”了一波图。

这次发现了点不一样的东西。

我发现,只要用了「容器法」,它立马就老实了。所谓容器,就是把产品“锁”在一个特定的环境里,不让它乱跑。

比如:

1. 主体与材质: Luxury perfume bottle, transparent glass, gold liquid inside

2. 场景与构图: Floating on rippled water, minimalist, centered composition

3. 光影与质感: Soft studio lighting, caustic light effect, 8k photorealistic负向词 (Negative): Text, watermark, complex background, humans, distorted.

你看,这一组词里,真正起作用的是Studio lighting(摄影棚光)和Caustic light effect(焦散光效)。

这俩词就像给 AI 戴上的两道「缰绳」,前者告诉 AI,别给我整那些赛博朋克、霓虹灯的虚头巴脑,我就要摄影棚里那种最干净、最克制的布光。

后者是灵魂,专门模拟光线穿过玻璃和水面时的那种折射纹理,这就是为什么一眼看过去,这张图会让你觉得「贵」。

所以,商业作图的逻辑,是做减法。

把干扰项全部拿掉,用构图和光影把产品「托」住,这才是 Nano Banana Pro 这种「野路子」模型在商业落地时的正确打开方式。

如果说上面那个香水瓶是「名门正派」的标准打法,那接下来这个,有点犯规的「邪修」路子。我们要玩在极暗的环境下,如何逼出光影的极致通透感?

这也是商业图里最难的一关:「五彩斑斓的黑」。

比如:画一张加了冰球的威士忌,或者暗夜里的晶体。这时候,光靠摄影词不够,得借用 3D 渲染圈的「黑话」。

看这组被我极度浓缩后的“咒语”:

Macro ice cube, bubbles, dark background, hard rim lighting, ray tracing, caustic light, octane render, 8k, sharp focus. 负向词 (Negative): Text, blurry, illustration, low quality。

发现了吗?这一行词里混进去了几个“间谍”:Ray tracing(光线追踪)、Octane render(OC渲染器)。

为什么要加这些词? 还是「控制阀逻辑」。

当我不加这几个词时,AI 是以「摄影师」的逻辑在思考,它会随机生成光线。 但当加上Octane render时,我是在强制 AI 切换数据库,让它调用那些经过精密计算的 3D 渲染图作为参考。

这就像我强行把它的「画笔」换成了「物理模拟器」。

它不敢再胡乱涂抹,只能老老实实地去计算光线穿过冰块的每一次折射。这就是,为什么加了这两个词,画面瞬间就有了「大片感」。

写到这,我想到了这两天夸克AI眼镜发布。为了验证这个「秩序法」到底灵不灵,我让AI帮我生成一组证件照。

像不像?真实版如下:

既然戏都演到这份上了,那我必须得给夸克 AI 眼镜打个硬广了。 为什么我这次特意拿夸克举例?

因为我去现场体验完 S1 和 G1 这两款眼镜后,发现这帮人做产品的思路,跟我们写 Prompt 的逻辑简直是「异曲同工」。

你看,我们写词为了让 AI “看得清”(加 8K, Sharp focus)和“听得懂”(加具体指令)。

夸克 AI 眼镜也是这个路子:

它想让用户带上“看得清”,搞了个 0.6 秒极速抓拍,还能录 3K 视频 ,甚至直接上了个行业首发的 Super Raw 暗光增强技术 。

这不就是给我们眼睛加了个实体的 High Quality和 Night Mode吗?

它想让AI能“听得懂”,说的准确,直接接入了阿里的“通义千问”大模型;你盯着个烂尾楼直接问“这是哪”,它能直接调动高德地图告诉你;你盯着个英文菜单,它能直接给你翻译 。

它还想让你「戴得住」,把镜腿做到了 7.5 毫米 ,戴着就跟普通眼镜没区别。

这就相当于把一个「实时多模态大模型」架在了鼻梁上。 以后谁还写 Prompt 啊?戴上眼镜,嘴就是键盘,眼睛就是摄像头,内存就是知识库。

而且,这次阿里是真的想让 AI 走进物理世界。

在发布会现场,阿里巴巴集团副总裁吴嘉说了一句我很认同的话:AI 最大的想象力不在手机屏幕,而是接管数字世界、改变物理世界。 他认为,未来的 AI 助手比拼的不是聊天,而是「办事能力」 。

这不就是我们一直在追求的吗?

从屏幕里的「生成式」,变成现实中的「行动派」。 等等,(虽然这种“不是…而是…”的句式很像AI的套话,但说得的确很对啊。)

最后,我知道你们肯定要问价格,我也替大家打听好了: 这次一共发了两个系列。

如果你是极客发烧友,直接冲旗舰版S1,3799元起 ; 如果跟我一样更在乎时尚搭配,想搞个太阳镜或者平时戴上显得潮流的话,选 G1, 1899元起 。

你看我戴上帅吗?不帅的话,你撤回重新说。好,好,硬广以知识加本人出镜的方式,第一次植入完毕。

夸克负责在物理世界里“办事”,我们负责在数字世界里继续“造梦”,邪修技术。

刚才我们又复刻工牌,又做暗黑光影,可能有人会觉得:智远,这门槛有点高,我平时也就写写方案,能不能搞点能直接落地的?

好,满足你,我们来解决一个亿万打工人的痛点:做 PPT。

大家平时用 AI 做 PPT 背景,最大的问题是什么? 是 AI 太「吵」了;它恨不得把画面填满细节,结果你把标题往上一放,根本看不清。

我们要强行按住 AI 的手,让它只在画面的一角画画,把 70% 的空间留给文字。

怎么搞?实战,直接上这三行「静音代码」(复制即用):

  • 定构图(给文字留座): Presentation slide background, 16:9, rule of thirds, composition on the right, left side empty;定风格(要科技感): Abstract data flow waves, translucent glass texture, gradient blue and white.
  • 降噪(开静音阀): Low contrast, minimalist, soft shadows, clean background.(负向防御): –no text, complex details, high contrast.

你不要觉得看着这一堆英文很复杂,把它翻译成“人话”,思路非常简单,就三句指令:

关于构图思路,我跟它说,你给我站到右边去,用三分法,把左边最显眼的位置空出来。关于风格,我跟它说,别画具体的实物,我要抽象的数据流,弄点半透明玻璃质感,颜色要蓝白渐变。

关于干扰,我跟他说,极简一点(Minimalist),背景要干净。所以,看明白了吗?

那一堆看似高大上的英文 Prompt,是我把刚才这几句话,让AI翻译成了AI能懂的 Token(语言指令) 而已。

看到这,肯定有朋友问:智远,道理我都懂。但我手里现在只有一堆枯燥的产品参数,怎么把它变成一张发布会级别的 PPT?

来,广告到了梅开二度的时刻。

假设我是夸克的产品经理,我现在手里有这么一份关于 夸克S1 旗舰版 的“原料清单”:

产品名:夸克 AI 眼镜 S1;视觉诉求:要一张那种很高级的 3D 结构图,体现科技感;硬核参数:** 搭载双旗舰芯片,4000nits 入眼亮度,0.6秒极速抓拍,Super Raw 暗光增强 。

核心卖点: 接入阿里“通义千问”大模型 。价格:3799元起 。

如果直接把这些字贴在白底上,那就是 Word 文档,太 Low 了;我们要用 AI 把这段文字翻译成「视觉语言」。

因为完整的英文提示词太长,我就不贴代码了,我把整个“思考路径”拆给你看:

第一步:定框架(给文字找座位) 告诉 AI 画布设为 16:9。 关键指令是「左上角悬浮醒目价格标签 ¥3799」,先把身价立住;右侧指定「竖列清单式排版」,让图文互不打架。

第二步:定主角(防 AI 乱画) 主角用我自己,佩戴黑色的夸克 S1。

这里必须加一道“紧箍咒”:「7.5mm 超纤薄镜腿,造型如时尚眼镜」;否则 AI 很容易画成笨重的 VR 头显,直接偏离夸克「全天佩戴」的产品定义 。

第三步:定结构(让 AI 画说明书) 这是核心作弊码:「引出线 (Callout lines)」;

命令 AI 从眼镜上拉出 4 条线,分别标注核心卖点:4000 nits(高亮度)、0.6s Snap(极速抓拍)、Super Raw(夜视增强)、Qwen AI(通义千问)。

然后给AI让他翻译成AI能听懂的专业语言,就可以了。效果如何?

我都佩服我自己(你别笑)。

话说,我这个大红棉袄也是够出圈的。

写到这,本来该收尾了;但看着手里这堆关于 夸克 AI 眼镜 的几万字产品文档,我突然又觉得不过瘾。

我们刚才讲了怎么画“光影”、画“结构”,但还有一个更高级的痛点没解决: 怎么把复杂的逻辑,画成一张一眼就能看懂的「神图」?

好吧,上干货,梅开三度继续邪修。

我让Google AI给我做一个图,展示夸克AI眼镜为什么能定义AI眼镜行业的心标准。结果如下:

如何?还行吗?

不过,我在想,他能不能换一种新的交互逻辑,于是,决定让 AI 帮我生成一张「咨询顾问级的全景图」。

我写了一段非常有意思的描述词(Prompt),我不展示具体的代码了,但我可以把我的“设计心法”分享给你们。

我告诉 AI,我要一张「深色科技风·模块化布局」的架构图,逻辑必须包含这四层「硬核推演」。

第一层,定义核心理念(顶层设计)。

告诉AI,这是“重新定义 AI 眼镜”。;要展示它既是“随身超级助理” ,又是深度融合阿里生态(淘宝、高德、支付宝)的“全天候智能终端” 。

第二层,划分产品矩阵(S1 vs G1) 逻辑要清晰,做个对比;第三层:拆解旗舰配置(秀肌肉) 把那些硬邦邦的参数可视化。

第四层是揭秘核心技术(护城河) 这是最关键的,要专门留一个板块讲“黑科技”。

图跑出来了,这算一个绝杀吗?感觉夸克应该给我打个技术设计服务费,哈哈,太费算力了。

好吧,事已至此,该吃饭了。按照传统文章的写作套路,是不是最好要升华了?对。当然。

AI 永远不会失控,失控的只有不会下精准指令的人。 物理世界数字化,也没那么复杂,只要你敢把夸克AI眼镜,稳稳地架在鼻梁上就够了。

未来的超级个体,大概率都是一群「邪修」群体:

左手懂逻辑,右手懂审美; 鼻梁上架着能随时 Prompt 现实的 AI 眼镜; 身上出门…… 最好还得穿件让人一眼忘不掉的大红棉袄。

毕竟可以抢镜。抽象吧?我跟00后学的。

本文由人人都是产品经理作者【王智远】,微信公众号:【王智远】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!