"SFT"相关的文章
产品设计
写了五年银行数据之后,我对 AI 产品的看法

写了五年银行数据之后,我对 AI 产品的看法

从银行数据治理转向AI产品开发的五年老手,用血泪教训揭示了一个行业真相:在GPT、Claude等大模型能力趋同的今天,决定AI产品专业度的不是API参数,而是底层数据的「洁癖级」处理。本文通过金融客服翻车、法律问答崩盘、知识库精神分裂三个真实案例,拆解数据清洗、SFT微调、RAG架构中的致命陷阱,给所有正在与「垃圾进垃圾出」搏斗的AI产品人一剂清醒剂。
AI,个人随笔
AI PM 搞 SFT,你真正要干的是这几件事

AI PM 搞 SFT,你真正要干的是这几件事

AI产品经理在SFT(监督式微调)中的角色远比想象中关键。本文揭示了从判断是否真的需要微调,到制定可量化的目标与标注标准,再到数据分布与训练监控的全流程避坑指南。那些让算法团队束手无策的「爆款感」定义、标注SOP的魔鬼细节,以及模型「变蠢」的隐蔽陷阱,都将在实战经验中得到清晰拆解。
AGI 时代的个人 OS 重构:为什么你的“SFT 数据集”决定了你的阶层?

AGI 时代的个人 OS 重构:为什么你的“SFT 数据集”决定了你的阶层?

AI时代的个人成长逻辑正在被彻底改写。当知识获取边际成本趋近于零,传统'技能护城河'理论已然失效。本文从大模型训练原理切入,犀利指出环境才是个人成长的'监督微调数据集',并通过多个真实案例,揭示如何像训练AI模型一样重构自己的社交圈层与成长路径。在这个算力爆炸的时代,掌握'云原生'成长思维或许才是跨越阶层的终极算法。
AI,个人随笔
AIGC风控实战(二):驯化与对齐——从Prompt到SFT的工程落地

AIGC风控实战(二):驯化与对齐——从Prompt到SFT的工程落地

当千亿参数的大模型遇上真实业务场景,为何总显得“高分低能”?本文深度剖析AIGC风控中的核心痛点——涉政与色情低俗审核,揭示大模型“通识天才”背后的业务短板。从Prompt Engineering到SFT微调,从RAG知识库到红蓝对抗,带你拆解如何将人类模糊的审核直觉转化为机器可执行的工程铁律。
AI
AI产品经理必修课:从“半成品”到“杀手级应用”——深度解析后训练(Post-training)

AI产品经理必修课:从“半成品”到“杀手级应用”——深度解析后训练(Post-training)

2025年AI领域最深刻的变化,不是算力的军备竞赛,而是后训练技术的战略崛起。从SFT塑造产品人格、RLHF量化用户体验,到推理模型实现System 2思考,本文以卡帕西的经典理论为框架,揭示AI产品经理如何将原始模型雕琢成商业产品。这不仅是技术解码,更是一份从'数据贵族化'到'工具路由'的实战指南。
AI,个人随笔
总结:模型为什么越来越像人,而你为什么会在意这一点

总结:模型为什么越来越像人,而你为什么会在意这一点

大模型的每一次进化,背后都是人类经验的深度编码。从预训练的基础语言理解,到SFT的行为规范,再到RLHF的情感分寸,这条技术链的本质是人类如何将自己的沟通逻辑、价值判断和社交规则系统化地注入AI。本文将揭示大模型训练过程中那些看不见的人类‘脚手架’,以及它们如何塑造AI的行为边界与人格特质。