AI AI产品经理:从文档解析到数据清洗,打造高质量RAG数据集 在大模型应用落地的过程中,RAG(检索增强生成)正成为连接外部知识与智能问答的关键技术。但真正能跑通的RAG系统,背后依赖的是一套高质量的数据构建流程——从文档解析、内容切分,到数据清洗与结构化,每一步都决定了最终效果。本文将以产品经理视角,拆解打造高质量RAG数据集的完整路径,不仅讲方法,更讲实操,帮助你在AI项目中少踩坑、快落地。 产品经理小易 AI产品经理RAG技术原理
AI 动态知识从RAG到Context Engineering RAG(检索增强生成)曾是连接外部知识与模型能力的关键桥梁,但随着业务复杂度提升,它的局限也逐渐显现。Context Engineering 的出现,正在重新定义“知识注入”的方式——从检索到构造,从拼接到理解,让上下文成为真正的生产力。本文将带你梳理从 RAG 到 Context Engineering 的演进路径,揭示背后的技术逻辑与产品思维,帮助你在构建智能应用时少踩坑、快落地。 大风吹 RAG动态知识大模型
AI 大模型 SFT 微调数据集的构建方法 在大模型应用加速落地的背景下,SFT(Supervised Fine-Tuning)成为提升模型能力的关键环节。而数据集,正是微调的“燃料”。本文将系统拆解 SFT 微调数据集的构建方法,从数据来源、清洗策略、标注规范到质量评估,带你深入理解如何打造高质量、可复用的训练数据。 为了罐罐 大模型技术原理数据集
AI AI大模型训练:万字解析“学习率”的奥秘 在 AI 模型训练的复杂流程中,学习率常被视为“最难调的超参数”之一。它不仅决定了模型收敛的速度与稳定性,更深刻影响着最终性能表现。本文以万字长文的形式,系统拆解了学习率的本质、调参策略、常见误区与前沿研究,帮助你从原理到实操全面掌握这一关键知识点。 耿和言的AI产品小屋 AI产品大模型技术原理
AI 小白也能懂!深度解析Agent间的“悄悄话”:A2A协议 在AI智能体的世界里,它们之间是如何沟通协作的?A2A协议,正是揭开这个谜底的关键。本文用通俗易懂的方式,带你深入了解Agent间的“悄悄话”机制,从底层逻辑到实际应用,层层拆解,助你快速掌握这一前沿技术。 Tracy A2A协议Agent技术原理
产品运营 为什么网站总是不敢公开排序规则? 在信息爆炸的时代,排序规则决定了用户看到什么,也决定了平台如何定义“重要性”。然而,大多数网站却始终对排序逻辑讳莫如深。本文将从产品机制、商业利益与用户认知三重视角,剖析排序规则为何难以公开,以及这背后隐藏的信任博弈与设计悖论。 Cassie 个人观点技术原理排序规则
AI 一文读懂大模型的心跳:“损失Loss” 你知道AI是怎么“变聪明”的吗?答案藏在一个看似负面的词——Loss。这篇文章用通俗语言讲清楚:损失函数到底是什么,它如何驱动模型学习,又为什么它是所有AI能力的起点。读完,你会对“训练”这件事有全新的理解。 AI凌波鱼 Loss大模型技术原理
AI AI发展史:从“人工智障”到“超级外脑”,我们到底经历了什么? 本文将带你穿越人工智能跌宕起伏的七十年,回顾这段充满了梦想、挫折与英雄主义的史诗。但你是否想过,我们究竟是如何从最初的“人工智障”,一步步走到了今天似乎无所不能的“超级外脑”身边的? 炸毛疯兔 AI产品发展历史技术原理
AI 聊聊让AI“听懂人话”的秘密:意图识别 从智能客服到智能家居,再到金融和医疗领域,意图识别技术正帮助机器更好地理解人类的需求,并提供精准的服务。作者结合自身在大厂的工作经验,分享了如何通过意图识别提升产品效率和用户满意度。 骆齐 AI应用意图识别技术原理
AI,个人随笔 注意,AI工程师不会说:“模型能力就这样了” 在人工智能领域,如何有效利用AI技术并确保其可靠性和可扩展性是一个关键问题。本文通过实际案例,深入探讨了AI项目中的模型边界、可观测性以及数据工程的重要性。 叶小钗 AI应用个人观点大模型
AI,个人随笔 RAG全系列之《向量化与向量召回》 在知识检索领域,向量化与重排序正成为解决海量数据精准检索的关键技术组合。本文深入剖析向量化与重排序技术,从文档拆分的多种优化方法,到向量化模型选择、相似度计算的技巧,为你提供一套全面的知识检索指南,供大家参考。 寻走 RAG向量化技术原理
AI 向量库已死、RAG永存:模型进步再次干死过时技术 向量库刚被捧上神坛,就被最新一代大模型一脚踹下。原因很简单:当模型上下文一口气拉到百万 token,召回和排序一次搞定,传统 RAG 架构里的向量检索瞬间成了“多余的中间商”。本文用实测数据告诉你,向量延迟、精度天花板和成本是如何被原生长上下文碾压的——以及,在“模型即检索”的新范式里,开发者该如何重写知识库代码。 叶小钗 AI产品RAG向量库