AI,个人随笔 RAG召回准确率从75到90 我做对了这三件事 当AI客服频繁答非所问时,问题往往不在大模型本身,而是RAG召回机制的短板。本文揭秘如何通过分层索引、混合检索和差异化策略三重优化,将召回准确率从75%提升至90%,并分享从Embedding模型选择到文档分块的血泪教训,为AI产品落地提供实战解决方案。 鸣老师 AI客服RAG业务逻辑
AI,个人随笔 AI医疗问答项目系列之提升RAG召回准确率 医疗RAG召回准确率的提升不再是简单的技术叠加,而是对知识库、向量库、多路召回与知识图谱的精准协同。本文深度拆解四大核心模块的落地细节,从分级知识库的强绑定到轻量化知识图谱的语义关联,揭秘如何在不越界的前提下实现医疗科普内容的精准召回与合规过滤。 而立与拾遗 医疗RAG医疗合规召回优化
AI 一个真实的智能客服RAG,数据准备到检索链路完整拆解 当智能导购系统遇上千款香水SKU的复杂场景,RAG技术的每个决策环节都可能成为用户体验的致命短板。本文深度拆解从数据切分到精排优化的全流程实战经验,揭秘为何用户一句'夏天不想太甜'的简单需求,会因chunk切分策略和question反向生成机制而引发连锁反应。 ChenXiaowu AI应用RAG向量检索
产品设计 基于 RAG 的医疗预诊问答系统:从 0 到 1 落地完整方案 医疗资源紧张的时代,AI预诊系统正成为缓解医院压力的关键工具。本文深度解析了一套基于RAG架构的医疗预诊系统,通过权威QA对知识库、向量与BM25混合检索技术,实现症状风险分级与精准导诊。从数据结构到系统架构,揭秘如何用AI技术安全分流患者,让医疗资源更高效运转。 Totoro畅 BM25RAG架构医疗AI
AI,个人随笔 向量库、关键词检索、MySQL:别再混成一个东西 检索系统背后的技术选择常被误解为简单的二选一,但实际上MySQL、关键词检索和向量检索在三层架构中各司其职。本文将彻底拆解数据基座、检索层与应用层的协作逻辑,揭示倒排索引与向量索引如何通过不同维度的'翻译'实现高效搜索,帮助产品经理在技术选型时建立清晰的架构思维。 ChenXiaowu AI应用mysqlRAG
AI 再谈OpenClaw记忆范式:启发、不足和方向 OpenClaw的记忆系统正在重新定义AI产品的交互逻辑。它将记忆分层为短期、近端与长期结构,通过动态检索与智能写入构建用户画像。然而高门槛、检索局限与token消耗等问题也暴露无遗。本文深度解构其三层记忆架构,揭示国产化改进背后的技术博弈与产品设计启示。 AIGC从0到1 AI记忆系统OpenClaw产品架构
AI 都叫RAG?其中有个家伙是假的 RAG技术正被广泛讨论,但市面上混杂着三种截然不同的实现方式。本文将撕开伪概念的面纱,直击'直接扔文档'、联网搜索与本地向量检索三类技术的本质差异,揭示为何60%从业者对联网搜索RAG存在根本性误解,并剖析企业级向量检索在文档切割环节隐藏的致命陷阱。 ChenXiaowu RAG向量检索技术原理
AI 构建企业级RAG系统:从数据管道到智能客服的全链路架构演进 企业级RAG从Demo到生产的蜕变充满陷阱与惊喜。Synology的技术支持响应时间从22小时压缩到半小时,金融客服准确率从68%跃升至92%,这些数字背后是一整套工程化思维的胜利。本文将拆解数据管道构建、检索优化、生成控制等关键环节,揭示RAG真正落地企业所需的系统架构思维。 小麦鱼 RAG企业级AI向量检索
AI,个人随笔 RAG 技术深度解析(二):检索与召回 —— 决定生成质量的核心工程环节 在RAG技术中,检索与召回是关键环节。本文深入剖析了检索的多重机制,包括关键词、向量、知识图谱检索,并探讨了影响RAG系统性能的核心工程指标,助力企业级检索架构的优化。 cheninx RAG向量检索技术原理
业界动态 RAG实践篇(三):向量检索的AI应用,让知识“活起来” 向量检索技术正在成为RAG智能问答的“隐形功臣”,让很多企业/专业领域繁复庞大的知识库真正“活起来”,而作为产品经理,理解他的“有效”和“有限性”,能真正地将这个检索技术为产品所用。 AI 实践干货 RAG向量检索经验总结