婚礼摄影师手搓国产爱死机,好莱坞跨国寻人—他写 prompt 的方式颠覆所有人
顶级AI公司把24000字的系统提示词视为核心资产,而云南婚礼摄影师刘梓瑜用10天3000元的成本证明了提示词的本质不是命令而是剧本。本文通过拆解《丧尸清道夫》短片的创作过程,揭示AI时代真正的竞争力在于掌握'导演思维'——懂得如何定义场景动机而非机械描述,让你的提示词从代码变剧本,让AI从工具升级为创作伙伴。

上一篇我们讲了完整工作流:用 Claude/Codex 写剧本 → 上传小云雀 → 一键出片。
这一篇要补一刀:工作流人人都能复制,但提示词是你的私有资产。
我先把结论甩出来
如果你只想看结果,下面三个动作建议拿走:
- 别再问“哪个工具好”,开始问“我的提示词是不是写得太死了”
- 把每次成功的提示词存下来,但更重要的是记录“为什么这样写”
- 提示词的功底来自审美,去看电影、看摄影、看分镜,不要只看 AI 教程
如果你想知道为什么我会得出这三个结论,下面要讲两件事。

01 两件关键事件
Claude 把 24000 token 锁在了后端
2026 年 3 月底,Anthropic 的 Claude Code 在一个 npm 包里不小心带上了 source map,512000 行源码暴露在互联网上。
整个 AI 圈炸锅,但最有意思的不是源码本身。
是被一并扒出来的系统提示词——24000 个 token,比一本中篇小说还长。
一个全球顶级 AI 公司,最值钱的东西不是模型权重,是这份提示词。
记住这件事。
一个云南婚礼摄影师让好莱坞跨国寻人

图源《丧尸清道夫》原片
几乎同一时间,2026 年 5 月 10 日,洛杉矶的一个 AI 电影工作室创始人 PJ Ace 在 X 上转发了一条中国 AI 短片,说”这是我近年来看过最好的短片之一”。
那条推文几小时浏览量破 500 万。PJ Ace 全网寻找作者,想合作。
作者叫刘梓瑜,29 岁,云南人,账号 Mx-Shell。
他不是导演,不是科班出身,没有团队。他中专学的是内燃机车驾驶与运用检修,后来回云南做婚礼摄影、写真跟拍。今年 2 月才接触 AI 视频——起因是家里酒店装修,想做点宣传素材。
他用小云雀做出了一部叫《丧尸清道夫》的 3 分 34 秒短片,时长 3 分 34 秒。
数据:10 天,3000 块 token 成本。抖音播放破 4600 万,点赞 222 万。

图源《丧尸清道夫》原片

02 核心问题:你的提示词大概率写错了
你大概率正在犯的错
读到这里你应该想问:他到底怎么做到的?
在回答这个问题之前,先讲一下大多数人是怎么做的。
我自己用 AI 做视频,过去一年一直信奉一件事:提示词越精确越好。每个细节都要写清楚——光线、角度、人物服装、场景元素、情绪基调、参考风格。
写得越长越细,越觉得自己专业。
不满意就改,改不动就加形容词。”要震撼””要电影感””要史诗级””要爱死机那种冷峻的赛博朋克感”。提示词越堆越长,结果越来越像 PPT 标书。
AI 生成的画面也越来越像 PPT——能看,但平庸。
我以为是模型不够强。直到看到刘梓瑜在南门录像厅那期访谈,他说的那几句话,把我打懵了。

刘梓瑜的核心观点
南门录像厅那期访谈里,他讲了几句关于提示词的话,每一句都和大众认知相反。
“很多人把提示词写得太死了。但真正好的画面,其实要给模型一定发挥空间。”
这一句直接把”精确派”打翻在地。
模型不是傻子。它有自己的”审美”——这套审美是几千万张图片训练出来的。你写得太死,等于强行抑制模型自己的优势。
“我不把它定死,它反而会给我一些超出意料的好画面。”
这一句揭示了 AI 创作的本质:
AI 创作的”惊喜”,来自模型的随机性 × 你的方向感。
完全不给方向,得到垃圾。定得太死,得到平庸。中间那个度,才是高手区。
“跟演戏一样,我是导演,AI 是演员。”
这一句是整个方法论的钥匙。
导演不会告诉演员”你的左手抬高 30 度”。导演告诉演员”你刚收到母亲去世的消息”。
剩下的,演员自己来。
第四句——他举了一个例子。
让 AI 让角色”压住帽子”,不如告诉它”这个人怕帽子被风吹掉”。
前者是动作,后者是动机。
AI 拿到动机,会自己设计动作、表情、整个镜头的氛围。它会让角色的手忙乱地按住帽檐、眼睛眯起来防风、衣摆被吹起来——这些细节你没要求,但 AI 会给你。
第五句——关于抽卡。
舞蹈那段镜头他抽卡了将近 20 次。但他强调:
“抽卡不是碰运气,是不断给 AI 补充行为逻辑的过程。”
每抽一次不行,他不是简单重抽,是补一句行为逻辑、再抽。
这才是抽卡的正确姿势。

03 可复用的三层方法论
把刘梓瑜在访谈里说的内容提炼一下,可以变成三层结构。
第一层:定义”为什么”,不是”是什么”
错的写法:1960 年代复古机器人,生锈金属躯干,腰部转轮装置。
对的写法:一个被人类遗弃 30 年、在荒漠里靠捡垃圾求生的旧机器人。
区别在哪:
前者是外观描述,后者是处境定义。
处境决定了这个机器人会怎么动——它会缓慢、会警惕、会有种被时间遗忘的疲惫。这些情绪 AI 会自己渲染出来,因为你给了它一个完整的角色,不是一份外观清单。
第二层:用图生视频锁定关键变量
他在访谈里讲过,他不直接用文生视频赌一段镜头。
流程是这样:
先用 AI 生成高质量场景静态图,把构图、光线、色彩、人物造型全部锁死。然后把这张图丢给 AI,加一段简短的运镜指令,让 AI 把静态图变成视频。
逻辑:视觉风格锁死,运动留给 AI。
锁该锁的(构图/光影/角色形象),放该放的(具体动作/微表情/镜头节奏)。
第三层:抽卡时只调一个变量
不满意一个镜头,不要重写整段提示词。
只补一句行为逻辑,或只换一个情绪关键词,再抽一次。
这样你能知道是哪个变量在起作用。改 5 个地方再抽,抽出来就算变好了,你也不知道是哪一刀有用。

04 提示词的本质
现在回到开头那件事。
Anthropic 那 24000 token 的系统提示词里写的不是”必须用 markdown””回答要简洁”这种命令。
大量的篇幅在告诉模型:
你是谁。你为什么这样回答。用户期待的体验是什么。在什么情境下应该用什么语气。当用户问 A 但其实想要 B 时该怎么办。
这和刘梓瑜的”行为逻辑”是同一件事。
顶级 AI 公司花了几年时间、几百人的团队才搞明白的道理,被一个云南婚礼摄影师在 10 天内独立验证了:
提示词的本质不是命令,是定义角色和场景。
把这条原则压到一句话:
写提示词不是写代码,是写剧本。

05 落地的三个建议
现在再看开头那三个建议,每一条都可以具体执行了。
别再问“哪个工具好”,开始问“我的提示词是不是写得太死了”
检验方法很简单:把你最满意的一段提示词拿出来,逐字念。
如果每个细节都被你定死,没有任何留给 AI 的空间,那就是写死了。
改法:
- 删掉 30% 的形容词
- 加一句“为什么”
- 把“角色穿黑色风衣”改成“角色穿了件不合身的旧风衣,是他父亲留下的”
把每次成功的提示词存下来,但更重要的是记录“为什么这样写”
存提示词本身用处不大,因为下次场景一变就没用了。
真正有用的是记录:
- 这一版相对上一版改了什么
- 改完之后画面有什么变化
- 你下次遇到类似问题该怎么调
这个”调整日志”才是你真正的私有资产。它记录的不是文本,是你和 AI 之间的协作直觉。
工具会换,模型会迭代,但你的协作直觉会复利。
提示词的功底来自审美,去看电影、看摄影、看分镜,不要只看 AI 教程
刘梓瑜赢在哪里?
不在 AI——他今年 2 月才接触 AI 视频。
赢在他做了多年婚礼摄影师。婚礼意味着光线变化快、人物情绪流动密、瞬间稍纵即逝。这些年训练出来的不是技术,是对”什么是好画面”的判断力。
这个判断力 AI 教程教不出来。
它来自你看过多少电影、拍过多少照片、对多少种光线和构图有过情绪反应。
AI 工具会迭代到傻子都会用的那一天。但能判断”哪一张画面好”的人,永远稀缺。

06 最后
刘梓瑜在访谈里说了一句话,我反复想了好几天:
“跟演戏一样,我是导演,AI 是演员。”
大多数人写提示词像在写代码——告诉机器一步步做什么。
他写提示词像在写剧本——告诉演员这个角色是谁、要去哪里、为什么。
Anthropic 把 24000 token 的”导演台本”锁在 API 后端。
他把同样的”导演思维”用在小云雀上,10 天做出了好莱坞要的东西。
AI 时代真正稀缺的不是会用 AI 的人。
是知道自己想要什么、并且懂得怎么让 AI 帮你拿到的人。
而要做到这件事的前提是:
你得先承认——AI 不是你的下属,是你的合作者。
上一篇文章里我说:”工具人人都能用,但会讲故事的人稀缺。”
这一篇要补一句:会讲故事还不够,你还得懂得怎么让你的合作者把故事讲好。
这件事,刘梓瑜用 3000 块和 10 天证明了。
本文由 @宅宅夏的AI实验室 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自《丧尸清道夫》原片
- 目前还没评论,等你发挥!

起点课堂会员权益



