AI人工智能,个人随笔 当 AI”想要“奖励时,它到底在想什么? 从 GPT4o 的 “谄媚” 说起:奖励机制如何塑造 AI 行为? 今年四月底,GPT4o 突然出现了一个有趣的现象:当用户“问为什么天是蓝的时“,它会突然来一堆彩虹屁 “您这个问题... Easton费曼说 aiAI激励