AI,个人随笔 AIGC风控实战(二):驯化与对齐——从Prompt到SFT的工程落地 当千亿参数的大模型遇上真实业务场景,为何总显得“高分低能”?本文深度剖析AIGC风控中的核心痛点——涉政与色情低俗审核,揭示大模型“通识天才”背后的业务短板。从Prompt Engineering到SFT微调,从RAG知识库到红蓝对抗,带你拆解如何将人类模糊的审核直觉转化为机器可执行的工程铁律。 Isaac Theo AIGCRAGSFT
AI AI产品经理必修课:从“半成品”到“杀手级应用”——深度解析后训练(Post-training) 2025年AI领域最深刻的变化,不是算力的军备竞赛,而是后训练技术的战略崛起。从SFT塑造产品人格、RLHF量化用户体验,到推理模型实现System 2思考,本文以卡帕西的经典理论为框架,揭示AI产品经理如何将原始模型雕琢成商业产品。这不仅是技术解码,更是一份从'数据贵族化'到'工具路由'的实战指南。 Echo想要全链跑通 AI产品RLHFSFT
AI,个人随笔 总结:模型为什么越来越像人,而你为什么会在意这一点 大模型的每一次进化,背后都是人类经验的深度编码。从预训练的基础语言理解,到SFT的行为规范,再到RLHF的情感分寸,这条技术链的本质是人类如何将自己的沟通逻辑、价值判断和社交规则系统化地注入AI。本文将揭示大模型训练过程中那些看不见的人类‘脚手架’,以及它们如何塑造AI的行为边界与人格特质。 青蓝色的海 AI训练DPORLHF
AI,个人随笔 SFT:教会模型“按人类方式说话”的核心训练 大模型的“性格”并非天生,而是通过SFT(监督微调)训练塑造的。训练师通过写示范答案、挑错改写、制定规则等方式,教会模型如何像人一样交流。本文将带你深入了解SFT的过程和重要性。 青蓝色的海 AI应用SFT大模型
AI 企业如何使用模型微调(SFT)定制化调优大模型? 现在各个公司都在做自己的大模型,或者是用大模型进行调优以符合企业的要求。这种情况下,我们如何是用模型微调定制化调优大模型呢?本文介绍了模型微调的训练步骤,并给出了相关案例参考,希望能帮到大家。 柳星聊产品 SFT大模型模型微调