提示词调试经验分享:生图提示词

0 评论 492 浏览 0 收藏 12 分钟

AI 生图模型在内容创作中的实际应用远比想象中复杂。本文通过一个真实的「蒜爆鱼」菜谱手账案例,深入拆解提示词调试过程中的关键发现:从「相同风格」与「相似风格」的微妙差异,到系统提示词与用户需求的优先级博弈,最终呈现如何通过五次迭代实现完美生图效果。这些实战经验将彻底改变你对 AI 生图工具的使用认知。

最近因为我自研的小红书AI运营助手上线了更多生图相关的能力,所以最近开始从和编程模型打交道,转移到更多的和生图模型打交道。

因为用户使用产品的过程中,会遇到各种各样的需求和问题,所以我每天也在解决实际的生成结果问题中,逐步的补充自己在生图领域的提示词调试经验,今天这篇分享我今天的一个生图调试案例,以及调试经验总结,也我往帮助点赞AI的同学在使用生图模型生成小红书封面的时候,能够更快更准确的获得自己想要的结果。

先给结论,以下为今天生图提示词调试的几点经验总结:

  1. 一字之差,模型生成的结果是不一样的:比如“相同风格”和“相似风格”,模型理解之下,最后生成的结果就不一样;
  2. 在提示词的开头加上一句“严格按照用户要求”可以提升指令遵循的效果;
  3. 把重要的信息写在最前面,如果条件很多,越靠前的指令,权重可能越高;
  4. 把心中想要的效果指令写的更加清楚和详细一些,就大白话描述出来,不要修饰和过滤;
  5. 系统提示词的设计需要兼容不同的用户输入场景,不要将条件限定的太死

接下来给大家分享一下今天的调试案例,包括整个调试的迭代过程,以及最后的经验总结思考。

1.用户的需求

用户希望参考如下这张图的风格,然后只输入一个新的菜名比如“蒜爆鱼”,模型自己推理菜品的制作过程,并生成一个相同风格的手账,并且还要求生成的食材和菜品结果是实图效果,而不是手绘风格效果。

分析一下:

这张图是比较典型的手绘风格的图片,目前市面上生成这种风格的效果比较好的是nano banana 模型,所以这里的模型我们选择使用香蕉模型,因为很多同学不知道在哪里使用香蕉模型,这次我在「点赞AI」上接入了这个模型,体验方式如下,生图的时候,模型选择“香蕉模型”。

接着评估一点,用户的需求是只输入菜名,不需要输入步骤文案信息,这点模型能不能做到?答案是可以的,香蕉模型是个具备推理能力的生图模型,所以在生成的过程中,它可以先生成输入菜名的做法信息,然后再生成图片。接下来我用点赞AI,完成整个提示词调试和结果生成。

第一个调试版本

输入提示词如下:

“参考图1,帮我将以下内容生成一个手绘风格的图片(这部分是系统提示词)用户想法与要求:参考这张图,帮我们生成一个相同风格的“蒜爆鱼”美食的制作过程。要求生成的过程,食物采用实图风格主图名称改为:家常蒜爆鱼做法”

生成的结果图如下,从效果中可以看到:

  1. 生成结果:存在明显的问题,比如生成的结果并不是蒜爆鱼,看起来更像是豆腐块,模型模仿了原图块状食材的原因,但是用户要的是整条鱼,同时也没有按照用户的指令要求,将食材换成实图。
  2. 猜测原因:可以看到,因为指令中采用的是“相同风格”,这个指令会导致模型过度的在模仿原图,反而限制了自己的推理,导致生成结果反而匹配不了用户需求,第一个尝试是先把“相同风格”,修改为”相似风格”

第2个调试版本

输入提示词如下,这里我们在上一版提示词的基础上,只是把相同风格,更换成“相似风格”;

参考图1,帮我将以下内容生成一个手绘风格的图片(这部分是系统提示词)用户想法与要求:参考这张图,帮我们生成一个相似风格的“蒜爆鱼”美食的制作过程。要求生成的过程,食物采用实图风格主图名称改为:家常蒜爆鱼做法

调试后,生成结果如下:

  1. 生成结果:解决了输出的内容不是鱼的这个问题,已经开始接近用户的需求了,所以确实是“相同风格”和“相似风格“的差异;但是目前还存在一个问题是没有生成出实图的问题,所有的食材都是手绘风格;
  2. 猜测原因:可能是因为我的系统提示词是要求生成一个手绘风格的图片,这点可能导致模型把下面的生成实图的要求降权;所以接下来的尝试,是去掉系统提示词中的这个限定,并要求严格遵循用户的指令;

第3个调试版本

调整提示词如下:在提示词最前面,增加一句“严格遵循用户的要求”

参考图1,并严格按照用户的要求,帮我生成一个相似风格的图片(这部分是系统提示词)用户想法与要求:参考这张图,帮我们生成一个相似风格的“蒜爆鱼”美食的制作过程。要求生成的过程,食物采用实图风格主图名称改为:家常蒜爆鱼做法

调试后生成结果如下:

  1. 生成结果:和上一个版本差异并不是很明显。
  2. 猜测原因可能还是提示词写的不够清晰,没有完整的表达自己的需求。尝试把要求写的更加清晰一点

第4个调试版本

输入提示词更新如下:这部分,我们强调一下画面中具体哪些内容采用实图风格,并且强调是实图风格,不是手绘风格。

“参考图1,并严格按照用户的要求,帮我生成一个相似风格的图片(这部分是系统提示词)用户想法与要求:参考这张图,帮我们生成一个“蒜爆鱼”的美食制作过程,要求如下:1.整体的背景风格还有构图设计参考图;2.图中的食材、制作步骤画面、最后的成品,都采用实图风格,而不是手绘风格;3.注意最后的成品是一个“蒜爆鱼”4.主标题:家常蒜爆鱼做法”

调整后的最后生成结果如下,这次,基本所有的要求,都达到了。

调试经验总结

除了前面提到的,这次吸取了几点总结:

  1. 检查提示词的用语和自己的需求,是否匹配,以及是否可能造成模型误解:比如第一个版本的时候,我们输入的是相同风格,其实模型生成的也没有错,它模仿了原图的细节,真的做到和原图很逼真了,但是却偏离了用户想要的,用户的需求并不是参考图的菜品是块状的红烧肉,所以鱼也应该是块状的,ta只是希望整体风格和它相同,但是模型并不知道这点。
  2. 检查提示词前后是否有矛盾冲突:比如第一版提示词里面,系统提示词要求的是生成手绘风格的图片,但是用户却还提了部分内容要用实图,这里就会有冲突,在模型发现冲突的时候,可能会优先前置的提示词信息,所以重要的提示词,放前面,然后避免前面的提示词和后面的提示词冲突了。
  3. 加上一句“严格按照我的要求”可以提升指令遵循的效果:这个虽然在本次案例中影响不大,但是在过往的经历中,却印证过有效果。
  4. 把想要的效果指令写的更加清楚和详细一些:这句话,不知道被多少人提过多少次,可能大家都觉得已经是无病呻吟不当回事了,但是真正要做到把需求所清楚,并没有那么容易,也没有什么技巧,我觉得最简单的方式,就是你当一个杠精,不断的看你的输入内容,是不是可能给别人造成误解,通过这个方式不断更新你的提示词,达到别人不再追问能够看懂的意思就行了。

作者:三白有话说,公众号:三白有话说

本文由 @三白有话说 原创发布于人人都是产品经理。未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!