SFT：教会模型“按人类方式说话”的核心训练

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

SFT：教会模型“按人类方式说话”的核心训练

青蓝色的海

2025-12-10

0 评论 154 浏览 2 收藏

8 分钟

大模型的“性格”并非天生，而是通过SFT（监督微调）训练塑造的。训练师通过写示范答案、挑错改写、制定规则等方式，教会模型如何像人一样交流。本文将带你深入了解SFT的过程和重要性。

“大模型并不是天生会聊天，它只是被我们一点一点教会的。”

如果你用过几款不同的大模型，你可能会发现，它们明明能力差不多，但“个性”完全不同。有的热情健谈，有的沉稳冷静；有的特别会安慰人，有的则像在背书。这种“性格差异”，不是模型自己长出来的，而是背后训练方式的结果。尤其是其中最关键的一步：SFT（监督微调）。

SFT 就像在教一个已经很聪明，但不会说人话的天才少年——你得一步步告诉他：别人问问题的时候你要怎么答；别人情绪不好的时候你要怎么回应；别人带着误解时你要怎么温柔纠正；别人问危险内容时你要怎么礼貌拒绝。

而模型，就是靠看我们写的示范一点点学会这些。

一、SFT 究竟是什么？用一句大白话说清楚

如果预训练是让模型“读遍全世界的书”，那 SFT 就是我们把它叫过来坐好，说：

“来，这些是你以后的说话方式，你照着学。”

它不会质疑我们，也不会反抗，只会默默模仿。就像小时候看大人怎么说话，我们也学同样的语气——模型在 SFT 阶段做的就是这个。

比如用户问：

“我今天有点焦虑，你能帮我舒缓一下吗？”

预训练阶段的模型可能会一本正经地回答：

“焦虑是一种常见情绪。”

它说的没错，但完全没有灵魂。SFT 就会给它示范一个“像人”的答案：

“听起来你最近压力挺大呀，愿意聊聊是什么让你焦虑吗？”

于是模型就学会了这种表达方式。

你每一次觉得模型“懂你”，背后都是一条条训练师写出来的示范。

二、为什么 SFT 是模型变好用的关键？

你有没有遇过那种朋友，看起来成绩很好，但对话的时候总是忽冷忽热？预训练模型就有点像这种朋友。它学过无数知识，但：

说话直来直往，非常机械
不太会看场合
不知道什么问题必须拒绝
不懂得按照你的要求来表达
甚至不知道你到底想要什么

比如你说：“给我写一首诗，轻松一点、可爱一点。”

预训练阶段模型可能写得像古诗文课本。

但 SFT 之后，它会知道你要的“可爱”是：

更口语
更简短
更贴近日常
更像一个人说的话

换句话说，SFT 决定了模型“像不像一个懂礼貌、有情商的人”。

三、训练师在 SFT 里到底做啥？（真实例子版）

1. 写示范答案（写到怀疑人生的那种）

比如用户问：

“我明天要和老板谈加薪，我应该怎么说？”

你不能回答一句“直接说你要加薪”。你要写得像一个真正的职场前辈：

“你可以先准备几个你过去一年做出的成果，再用‘我希望承担更大责任’的方式引出加薪诉求，这样更自然也更容易被接受。”

模型就是通过这一条条示范学会“怎么当一个靠谱的伙伴”。

2. 给模型的回答挑错、改写（像论文老师一样严）

你会看到模型写的内容，有时很离谱：

用户：“为什么我们不能直接喝海水？”

模型：“因为海水可以补充大量矿物质，适量饮用是健康的。”

这显然是错误的。于是你不仅要改成正确答案，还要把错误原因标注出来，让系统知道哪里出了问题。

这份工作真的非常像一个“严格但耐心的语文老师”。

3. 制定规则（让每个人写出来的数据风格统一）

同一个问题，如果十个训练师写出十种表达，模型就会学得七零八落。

所以需要规则，例如：

遇到敏感内容，一律拒绝 + 安全替代
语气统一为礼貌、不夸张
事实必须准确
不允许啰嗦

模型最后呈现出来的“性格”，很大程度取决于这些规则。

四、单轮 vs 多轮：训练师的“普通模式”和“高难度模式”

单轮问答：一次性解决问题

比如用户说：“电脑开不了机怎么办？”

一轮回答搞定。

这部分好写，像写教程一样。

多轮问答：像演戏一样要维持角色

但如果用户说：“我最近有点压力大。”

你要怎么写一个自然的多轮对话？

模型：“听起来你最近不太好，愿意聊聊是什么让你有压力吗？”

用户：“是工作的事。”

模型：“工作上发生了什么呢？”

这里面有好多细节：

不能重复问
不能每一句都太长
要顺着用户的话继续聊
要像一个真实的人一样“接话”
不能突然转移话题
语气不能过度关怀到让人害怕
也不能冷漠到像客服机器人

多轮对话写好了，用户会觉得：“哇，这模型好贴心。”

写不好，用户会觉得：“这模型是不是没在听我说话？”

SFT 就是在训练模型如何成为一个好聊的对象。

五、小结：SFT 是塑造模型“灵魂”的过程

如果把模型比作一个人：

预训练让它成为天才
SFT 让它学会做人
规则让它学会“分寸感”
多轮对话让它学会“交流感”

你现在觉得一个模型好用、有耐心、有温度，很可能不是因为它的算法有多高级，而是因为有人在 SFT 阶段为它写了无数“像人一样的句子”。

这是一种把人类沟通方式“提取出来，再教给一个机器”的过程。它的细腻程度，比很多人想象得更艺术、更人性化。

共勉！棒棒，你最棒！

下一篇，我们就要进入训练师的“最终关卡”——多轮对话到底难在哪里？为什么它几乎决定了模型能不能真正“像人”？

本文由 @青蓝色的海原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

青蓝色的海

入行两年AI训练师专业深耕AI训练赛道

6篇作品 5986总阅读量

构建未来对抗的策略：揭秘可持续产品生态系统的策略与展望

10-123472 浏览

07-124483 浏览

05-192287 浏览

01-064017 浏览

12-202544 浏览

目前还没评论，等你发挥！

本地生活下半场：抖音微信，决战美团

02-222837 浏览
品牌说话腔调练习指南

03-163547 浏览
深扒3·8大促15个类目的3000+数据，谁在增长？

03-202555 浏览