婚礼摄影师手搓国产爱死机,好莱坞跨国寻人—他写 prompt 的方式颠覆所有人

0 评论 146 浏览 0 收藏 14 分钟

顶级AI公司把24000字的系统提示词视为核心资产,而云南婚礼摄影师刘梓瑜用10天3000元的成本证明了提示词的本质不是命令而是剧本。本文通过拆解《丧尸清道夫》短片的创作过程,揭示AI时代真正的竞争力在于掌握'导演思维'——懂得如何定义场景动机而非机械描述,让你的提示词从代码变剧本,让AI从工具升级为创作伙伴。

上一篇我们讲了完整工作流:用 Claude/Codex 写剧本 → 上传小云雀 → 一键出片。

这一篇要补一刀:工作流人人都能复制,但提示词是你的私有资产。

我先把结论甩出来

如果你只想看结果,下面三个动作建议拿走:

  1. 别再问“哪个工具好”,开始问“我的提示词是不是写得太死了”
  2. 把每次成功的提示词存下来,但更重要的是记录“为什么这样写”
  3. 提示词的功底来自审美,去看电影、看摄影、看分镜,不要只看 AI 教程

如果你想知道为什么我会得出这三个结论,下面要讲两件事。

01 两件关键事件

Claude 把 24000 token 锁在了后端

2026 年 3 月底,Anthropic 的 Claude Code 在一个 npm 包里不小心带上了 source map,512000 行源码暴露在互联网上。

整个 AI 圈炸锅,但最有意思的不是源码本身。

是被一并扒出来的系统提示词——24000 个 token,比一本中篇小说还长。

一个全球顶级 AI 公司,最值钱的东西不是模型权重,是这份提示词。

记住这件事。

一个云南婚礼摄影师让好莱坞跨国寻人

图源《丧尸清道夫》原片

几乎同一时间,2026 年 5 月 10 日,洛杉矶的一个 AI 电影工作室创始人 PJ Ace 在 X 上转发了一条中国 AI 短片,说”这是我近年来看过最好的短片之一”。

那条推文几小时浏览量破 500 万。PJ Ace 全网寻找作者,想合作。

作者叫刘梓瑜,29 岁,云南人,账号 Mx-Shell。

他不是导演,不是科班出身,没有团队。他中专学的是内燃机车驾驶与运用检修,后来回云南做婚礼摄影、写真跟拍。今年 2 月才接触 AI 视频——起因是家里酒店装修,想做点宣传素材。

他用小云雀做出了一部叫《丧尸清道夫》的 3 分 34 秒短片,时长 3 分 34 秒。

数据:10 天,3000 块 token 成本。抖音播放破 4600 万,点赞 222 万。

图源《丧尸清道夫》原片

02 核心问题:你的提示词大概率写错了

你大概率正在犯的错

读到这里你应该想问:他到底怎么做到的?

在回答这个问题之前,先讲一下大多数人是怎么做的。

我自己用 AI 做视频,过去一年一直信奉一件事:提示词越精确越好。每个细节都要写清楚——光线、角度、人物服装、场景元素、情绪基调、参考风格。

写得越长越细,越觉得自己专业。

不满意就改,改不动就加形容词。”要震撼””要电影感””要史诗级””要爱死机那种冷峻的赛博朋克感”。提示词越堆越长,结果越来越像 PPT 标书。

AI 生成的画面也越来越像 PPT——能看,但平庸。

我以为是模型不够强。直到看到刘梓瑜在南门录像厅那期访谈,他说的那几句话,把我打懵了。

刘梓瑜的核心观点

南门录像厅那期访谈里,他讲了几句关于提示词的话,每一句都和大众认知相反。

“很多人把提示词写得太死了。但真正好的画面,其实要给模型一定发挥空间。”

这一句直接把”精确派”打翻在地。

模型不是傻子。它有自己的”审美”——这套审美是几千万张图片训练出来的。你写得太死,等于强行抑制模型自己的优势。

“我不把它定死,它反而会给我一些超出意料的好画面。”

这一句揭示了 AI 创作的本质:

AI 创作的”惊喜”,来自模型的随机性 × 你的方向感。

完全不给方向,得到垃圾。定得太死,得到平庸。中间那个度,才是高手区。

“跟演戏一样,我是导演,AI 是演员。”

这一句是整个方法论的钥匙。

导演不会告诉演员”你的左手抬高 30 度”。导演告诉演员”你刚收到母亲去世的消息”。

剩下的,演员自己来。

第四句——他举了一个例子。

让 AI 让角色”压住帽子”,不如告诉它”这个人怕帽子被风吹掉”。

前者是动作,后者是动机。

AI 拿到动机,会自己设计动作、表情、整个镜头的氛围。它会让角色的手忙乱地按住帽檐、眼睛眯起来防风、衣摆被吹起来——这些细节你没要求,但 AI 会给你。

第五句——关于抽卡。

舞蹈那段镜头他抽卡了将近 20 次。但他强调:

“抽卡不是碰运气,是不断给 AI 补充行为逻辑的过程。”

每抽一次不行,他不是简单重抽,是补一句行为逻辑、再抽。

这才是抽卡的正确姿势。

03 可复用的三层方法论

把刘梓瑜在访谈里说的内容提炼一下,可以变成三层结构。

第一层:定义”为什么”,不是”是什么”

错的写法:1960 年代复古机器人,生锈金属躯干,腰部转轮装置。

对的写法:一个被人类遗弃 30 年、在荒漠里靠捡垃圾求生的旧机器人。

区别在哪:

前者是外观描述,后者是处境定义。

处境决定了这个机器人会怎么动——它会缓慢、会警惕、会有种被时间遗忘的疲惫。这些情绪 AI 会自己渲染出来,因为你给了它一个完整的角色,不是一份外观清单。

第二层:用图生视频锁定关键变量

他在访谈里讲过,他不直接用文生视频赌一段镜头。

流程是这样:

先用 AI 生成高质量场景静态图,把构图、光线、色彩、人物造型全部锁死。然后把这张图丢给 AI,加一段简短的运镜指令,让 AI 把静态图变成视频。

逻辑:视觉风格锁死,运动留给 AI。

锁该锁的(构图/光影/角色形象),放该放的(具体动作/微表情/镜头节奏)。

第三层:抽卡时只调一个变量

不满意一个镜头,不要重写整段提示词。

只补一句行为逻辑,或只换一个情绪关键词,再抽一次。

这样你能知道是哪个变量在起作用。改 5 个地方再抽,抽出来就算变好了,你也不知道是哪一刀有用。

04 提示词的本质

现在回到开头那件事。

Anthropic 那 24000 token 的系统提示词里写的不是”必须用 markdown””回答要简洁”这种命令。

大量的篇幅在告诉模型:

你是谁。你为什么这样回答。用户期待的体验是什么。在什么情境下应该用什么语气。当用户问 A 但其实想要 B 时该怎么办。

这和刘梓瑜的”行为逻辑”是同一件事。

顶级 AI 公司花了几年时间、几百人的团队才搞明白的道理,被一个云南婚礼摄影师在 10 天内独立验证了:

提示词的本质不是命令,是定义角色和场景。

把这条原则压到一句话:

写提示词不是写代码,是写剧本。

05 落地的三个建议

现在再看开头那三个建议,每一条都可以具体执行了。

别再问“哪个工具好”,开始问“我的提示词是不是写得太死了”

检验方法很简单:把你最满意的一段提示词拿出来,逐字念。

如果每个细节都被你定死,没有任何留给 AI 的空间,那就是写死了。

改法:

  • 删掉 30% 的形容词
  • 加一句“为什么”
  • 把“角色穿黑色风衣”改成“角色穿了件不合身的旧风衣,是他父亲留下的”

把每次成功的提示词存下来,但更重要的是记录“为什么这样写”

存提示词本身用处不大,因为下次场景一变就没用了。

真正有用的是记录:

  • 这一版相对上一版改了什么
  • 改完之后画面有什么变化
  • 你下次遇到类似问题该怎么调

这个”调整日志”才是你真正的私有资产。它记录的不是文本,是你和 AI 之间的协作直觉。

工具会换,模型会迭代,但你的协作直觉会复利。

提示词的功底来自审美,去看电影、看摄影、看分镜,不要只看 AI 教程

刘梓瑜赢在哪里?

不在 AI——他今年 2 月才接触 AI 视频。

赢在他做了多年婚礼摄影师。婚礼意味着光线变化快、人物情绪流动密、瞬间稍纵即逝。这些年训练出来的不是技术,是对”什么是好画面”的判断力。

这个判断力 AI 教程教不出来。

它来自你看过多少电影、拍过多少照片、对多少种光线和构图有过情绪反应。

AI 工具会迭代到傻子都会用的那一天。但能判断”哪一张画面好”的人,永远稀缺。

06 最后

刘梓瑜在访谈里说了一句话,我反复想了好几天:

“跟演戏一样,我是导演,AI 是演员。”

大多数人写提示词像在写代码——告诉机器一步步做什么。

他写提示词像在写剧本——告诉演员这个角色是谁、要去哪里、为什么。

Anthropic 把 24000 token 的”导演台本”锁在 API 后端。

他把同样的”导演思维”用在小云雀上,10 天做出了好莱坞要的东西。

AI 时代真正稀缺的不是会用 AI 的人。

是知道自己想要什么、并且懂得怎么让 AI 帮你拿到的人。

而要做到这件事的前提是:

你得先承认——AI 不是你的下属,是你的合作者。

上一篇文章里我说:”工具人人都能用,但会讲故事的人稀缺。”

这一篇要补一句:会讲故事还不够,你还得懂得怎么让你的合作者把故事讲好。

这件事,刘梓瑜用 3000 块和 10 天证明了。

本文由 @宅宅夏的AI实验室 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自《丧尸清道夫》原片

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!