AI 大模型 SFT 微调数据集的构建方法 在大模型应用加速落地的背景下,SFT(Supervised Fine-Tuning)成为提升模型能力的关键环节。而数据集,正是微调的“燃料”。本文将系统拆解 SFT 微调数据集的构建方法,从数据来源、清洗策略、标注规范到质量评估,带你深入理解如何打造高质量、可复用的训练数据。 为了罐罐 大模型技术原理数据集
AI AI大模型训练:万字解析“学习率”的奥秘 在 AI 模型训练的复杂流程中,学习率常被视为“最难调的超参数”之一。它不仅决定了模型收敛的速度与稳定性,更深刻影响着最终性能表现。本文以万字长文的形式,系统拆解了学习率的本质、调参策略、常见误区与前沿研究,帮助你从原理到实操全面掌握这一关键知识点。 耿和言的AI产品小屋 AI产品大模型技术原理
AI 一文读懂大模型的心跳:“损失Loss” 你知道AI是怎么“变聪明”的吗?答案藏在一个看似负面的词——Loss。这篇文章用通俗语言讲清楚:损失函数到底是什么,它如何驱动模型学习,又为什么它是所有AI能力的起点。读完,你会对“训练”这件事有全新的理解。 AI凌波鱼 Loss大模型技术原理
AI 当 OKR 开始 “编答案”:比大模型幻觉更可怕的,是产品经理的指标自嗨 在大模型“幻觉”成为技术焦点的同时,另一个更隐蔽、更普遍的幻觉正在产品团队内部蔓延——OKR的自我感动式编造。当指标不再服务于真实业务,而变成一场“自嗨式表演”,我们是否还在做产品,还是在做幻觉管理? 人工智能怨气指南 OKR个人观点大模型
AI,个人随笔 AI产品经理之通过大模型做对话式分析产品 随着大模型技术的发展,对话式分析正引领一场效率革命,在各行业快速普及。未来,多模态技术将进一步重塑分析体验,成为企业数字化转型的标配能力。产品经理应把握这一趋势,避免技术崇拜,注重用户需求,为全员打造易用的数据洞察生产力工具。 为了罐罐 AI产品经理产品分析大模型
AI Windows MCP正式开源,大模型能操控操作系统了 Windows MCP 正式开源,大模型第一次拿到操作系统级“遥控器”——文件、注册表、网络端口,一条自然语言指令就能全链路操控。开发者用 200 行 Python 即可让 AI 替你装软件、配环境、发邮件,甚至跨应用完成“写报告→生成图表→PPT 排版”一条龙。Agent 时代的基础设施已就位,下一个被自动化“拿下”的,就是你的桌面。 苍何 MCP个人观点大模型
AI,个人随笔 零基础入门AI智能体:以通义和智谱大模型插件为例,教你如何调用第三方平台的大模型插件 在人工智能领域,大模型的应用越来越广泛,但如何高效地调用这些模型并将其集成到实际项目中,仍然是许多开发者面临的挑战。本文通过详细的操作步骤和实例,介绍了如何调用第三方平台的大模型插件,以通义和智谱大模型为例,展示了从注册、获取API Key到配置和试运行的全过程。 诺儿笔记本 个人观点大模型操作指南
AI,个人随笔 注意,AI工程师不会说:“模型能力就这样了” 在人工智能领域,如何有效利用AI技术并确保其可靠性和可扩展性是一个关键问题。本文通过实际案例,深入探讨了AI项目中的模型边界、可观测性以及数据工程的重要性。 叶小钗 AI应用个人观点大模型
AI,个人随笔 AI大模型技术解析-大模型背后的冷知识 想快速掌握大模型关键技术?本文从 AI 产品经理视角,深入浅出剖析 Agent、MCP 等术语,涵盖定义、原理、应用场景及相关概念关系,为你构建清晰知识体系,助你在大模型浪潮中把握技术核心,提升产品竞争力。 A ad钙 AI应用基础知识大模型
AI 万字长文,彻底讲透大模型幻觉:从底层逻辑到五大缓解方法 AI 一方面展现出强大能力,引经据典对答如流,另一方面却常 “一本正经地胡说八道”,如在法庭上伪造判例。这种精准与荒谬并存的矛盾,源于数据质量、生成机制及指令模糊等问题,该如何化解以发挥 AI 真正价值? 梧桐AI 大模型底层逻辑技术原理
AI,个人随笔 大模型驱动的产品评测方案(四):方法和工具 随着大模型能力的不断演进,产品评测也进入了“智能协同”新阶段。本篇作为系列第四篇,将聚焦方法与工具的双重升级,系统梳理如何构建可复用、可扩展的大模型评测体系,为产品团队提供实操参考与认知框架。 猫猫观察员的AI思考 AI工具产品评测大模型