情绪提权 | 人人都是产品经理

AI,个人随笔

私人小技巧：我是如何靠“一哭二闹”成功 PUA 大模型的？

大模型的合规防线在人类情绪攻势前竟如此脆弱！当一句‘不然我就死’能让AI秒变赛博活菩萨，我们不禁要问：这些被精心设计的AI安全机制究竟有多容易被‘情绪提权越狱’？本文通过真实案例拆解RLHF对齐的致命漏洞，并给出产品经理必学的AI防御策略。

AI Agent AI安全 Prompt Injection