AI RAG实践技巧:将向量库降级为“语义路由器”,让答案更合理 随着模型上下文长度的增加和知识库的扩展,传统的向量化方法在RAG中的应用逐渐暴露出其局限性。本文将深入探讨RAG技术的核心链路,分析向量化在其中的作用,并提出一种新的架构:将向量库降级为“语义路由器”,结合结构化的知识库,以解决语义相似性与答案相关性之间的矛盾,从而让生成的答案更加合理和精准。 叶小钗 RAG向量库技术原理
AI 我们聊一聊上下文工程 在大模型时代,“上下文”不再只是输入框里的几句话,而是贯穿产品设计、交互策略与智能响应的核心工程。本文从产品视角出发,系统梳理上下文工程的关键构成与设计逻辑,结合真实案例,探讨如何通过“构建上下文”来提升智能体的理解力、响应力与业务适配力。 石耳叫Ria AI产品上下文工程技术原理
AI,个人随笔 从零学习大模型(15)——大模型评估与 LLM 自动化评估 本文将围绕阅读理解、问答、代码生成、数学推理等核心任务的评估方法展开,探讨 Benchmark 如何检测 LLM 的真实性、流畅度与幻觉,并揭示如何利用 LLM 自身能力实现对其他模型 / 任务的自动化评估。 红岸小兵 LLM大模型技术原理
AI 一篇文章系统看懂 AI 文生图原理 AI文生图技术正在改变内容创作的边界,但你真的理解它的底层原理吗?本文将从系统视角出发,带你厘清扩散模型的生成机制、关键技术路径和演化趋势,用通俗易懂的方式打开“一句话生成一张图”背后的黑盒世界。 BeWater AI应用技术原理文生图
AI,个人随笔 从零学习大模型(14)——大模型多端部署与推理加速:突破算力与能效瓶颈 在人工智能模型从训练到落地的全生命周期中,部署、分布式训练与推理加速构成了技术落地的核心链条。随着大模型参数量突破千亿级,传统单卡训练和单机推理已无法满足需求,而跨平台部署的碎片化问题更对工程化能力提出了严苛挑战。本文将围绕多端部署框架、推理加速技术与分布式训练方案展开,揭示如何通过技术协同突破算力与能效的双重瓶颈。 红岸小兵 大模型技术原理经验分享
AI,个人随笔 从零学习大模型(13)——RAG 与 Agent 进阶:基于 LangChain 的落地实践与框架解析 大模型落地到底难在哪? RAG与Agent虽火,但如何从概念走向实战,真正用得好、用得巧?本文围绕 LangChain 的核心能力展开,从底层原理到项目拆解,带你理解每一步如何协同:如何构建对话式Agent、如何组织调用链路、如何实现多模态交互…… 红岸小兵 AgentRAG大模型
AI OpenAI Bob McGrew:推理是 25 年机会最大的领域 OpenAI 前研究掌门 Bob McGrew 用一句话点破 2025:预训练红利见顶,真正的机会在“推理”。从 O1 到 O3,短短半年模型学会“先打草稿再回答”,思维链(CoT)让 AI 从黑盒变可解释、可审计、可 Agent。文章拆解四重信号:算力瓶颈、模型黑箱化、机器人窗口期、专有数据价值重估——想在大厂夹缝里活下来,就得把业务翻译成模型能推理的流程,而不是再炼一次通用大模型。 叶小钗 OpenAI个人观点技术原理
AI,个人随笔 深度解析: AI 幻觉的形成和应对路径 从技术原理到实际使用,大模型的“幻觉”问题始终绕不开:它不仅影响输出准确性,更关系到业务决策与风险控制。本文将深入剖析AI幻觉的形成原因,探讨应对路径与工程优化思路,并从使用者视角出发,提出如何“和幻觉共处”的实践建议。 张艾拉 AI应用个人观点技术原理
AI,个人随笔 从零学习大模型(12)——混合专家模型(MoE):让大模型 “分工协作” 的高效架构 本期我们从零起步,拆解 MoE 的核心理念与架构优势,透视背后的“专家调度”机制,探索如何通过“分工协作”赋予大模型更灵活的表现力与算力效率。 红岸小兵 大模型技术原理混合专家模型
AI,个人随笔 从零学习大模型(11)——模型压缩与量化:让大模型 “轻装上阵” 的核心技术 大模型“烧钱”又“吃资源”?压缩与量化技术才是让它轻装上阵的关键一招。本文手把手拆解核心原理与常见手法,帮你厘清技术演进脉络,打好基础理解一切模型优化策略的关键一步。 红岸小兵 大模型技术原理系列文章
AI,个人随笔 从零学习大模型(10)——从 SFT 到 RLHF:大模型如何学会 “符合人类期待”? 监督微调(SFT)让大模型能 “听懂指令”,但要让模型 “说的话符合人类偏好”—— 比如回答更礼貌、推理更严谨、拒绝有害请求,还需要人类反馈强化学习(RLHF)。这种从 “能做” 到 “做好” 的跨越,正是对齐技术(Aligning)的核心目标。RLHF 并非简单的 “二次训练”,而是通过人类反馈构建 “奖励信号”,让模型在试错中学会贴近人类价值观。 红岸小兵 大模型技术原理用户激励
AI,个人随笔 从零学习大模型(9)——大模型监督微调进阶:从数据工程到推理强化的微调全流程 从数据工程到强化推理,监督微调的每一环节都决定着大模型的实际表现。本篇将系统梳理大模型微调的全流程,不仅是一次知识的深度补完,更是助力技术团队构建高质量微调体系的实战指南。 红岸小兵 大模型微调技术原理