AI 聊聊“上下文工程(Context Engineering)” 当AI应用在面对复杂任务时频频出错,问题可能远不止是提示词的问题。上下文工程正成为AI时代的关键范式转移,它将AI从概率性工具转变为确定性系统组件。本文深度解析RAG、工具调用和提示词链三大核心技术,并提供构建可靠AI系统的四步实践框架,带你从‘手工作坊’迈向‘工业级AI架构’。 爱撸猫的AI产品仔 AgentAI应用LLM
AI,个人随笔 告别昂贵的“思考”,DeepSeek Engram 如何用查字典的方式让模型更聪明? AI大模型的记忆困境正在被DeepSeek的Engram技术打破。这项突破性研究不再让AI死记硬背,而是通过'条件记忆'机制实现知识快速检索,为产品带来更低的成本、更强的专业性和更流畅的长文本处理能力。本文将深入解析这项技术如何重构AI产品的底层逻辑与用户体验。 人工智能怨气指南 AI产品DeepSeekEngram
AI,个人随笔 AI PM 进阶笔记【5】:RAG总翻车?90%的坑都在“离线准备”和“重排序” RAG技术在企业AI落地中的痛点与解法,你真的了解吗?从加拿大航空的‘退款门’到纽约市政府的法律失误,这些真实案例揭示了RAG架构的致命陷阱。本文将深入拆解RAG与LLM的协同逻辑,从知识缺陷到行为缺陷的精准诊断,再到混合检索与语义分块的核心技术,带你避开那些让项目夭折的深坑。 王俊 Teddy AI落地LLMRAG
AI AI赋能政策服务:千亿赛道的智能平台投资机遇 产业政策平台正迎来AI赋能的转折点。借助RAG与大模型技术,新一代智能平台不仅能破解企业获取政策信息低效、匹配不精准、申报繁琐三大痛点,更将重构政企互动模式——从被动查询转向主动服务,实现政策资源的精准滴灌。本文将深度解析如何打造覆盖政策全生命周期的智能平台,以及它如何成为企业获取政策红利的新基建。 王佳亮 AI应用LLMRAG
AI,个人随笔 “评测即PRD”:AI产品经理的必备技能,从写文档到写评测 硅谷AI产品团队正掀起一场思维革命:Evals正取代PRD成为产品经理的核心工具。从Anthropic到Yelp,领先团队不再用静态文档定义产品,而是通过评测体系动态校准AI模型的行为边界。本文将深入解析如何构建'活的PRD',揭示黄金对话、LLM法官等创新方法如何重塑产品开发逻辑。 黄钊hanniman AI产品AI产品经理LLM
AI 从“功能集成”到“智能内生”:AI Agent引领的产品革命与未来图景 AI Agent正在以前所未有的速度重构产品形态与人机交互逻辑。从企业SaaS的三分之二集成率到78%用户将工作完全交付AI处理,这场代际跃迁正在颠覆我们对产品本质的认知。本文深度解析AI Agent的四核驱动模型与闭环机制,揭示其如何通过感知层、记忆层、推理与规划层、行动层实现从被动工具到智能伙伴的蜕变。 一只小鱼 AgentFunction CallingLLM
AI,个人随笔 RAG前生今世:重塑AI记忆的大模型“外挂”进化史 RAG技术正在重塑大语言模型的应用边界!从最初的朴素检索到如今的多模态融合,这项技术如何突破AI的‘参数茧房’?本文将深度解析RAG从概念诞生到GraphRAG演进的全过程,揭示其在知识时效性、专业领域准确性和数据隐私保护方面的革命性突破。 阿洋聊AI LLMRAG企业级架构
AI,个人随笔 拆解AI训练师核心工作:需求承接、规则制定、质检验收全流程(含多模态模型认知) AI训练师正成为AI项目落地的关键角色。本文系统拆解从大语言模型原理到项目全流程执行的实战方法,涵盖需求分析、数据标注、团队管理等核心环节,并提供汽车厂商标注案例的完整方案模板。无论是新手入门还是团队标准化建设,都能从中获得可直接落地的操作指南。 游进模型海 AI训练师LLM多模态模型
AI,个人随笔 AI产品经理实战手册/1:提示词工程与系统架构 提示词工程正经历从魔法咒语到系统配置的范式跃迁。本文深度解析2025年AI产品开发中最前沿的三大命题:如何用提示词构建确定性商业系统?智能体如何通过提示词实现非线性任务处理?百万级用户产品如何建立工程化提示词工作流?从ReAct模式到DSPy自动化优化器,揭示AI产品经理必须掌握的下一代核心技能。 Echo想要全链跑通 AI产品经理AI应用LLM
AI 一文读懂AI编程原理与技术演进 AI编程正在颠覆传统开发模式,Claude code等工具已能完成80%的代码编写和95%的测试工作。这不仅意味着开发效率的飞跃,更预示着产品经理需要掌握AI编程技能的时代已经到来。本文将深入剖析AI编程的底层原理与技术演进,从Transformer架构到Agent编程时代,揭示如何在这场生产力革命中保持竞争力。 刘刚 AI编程ClaudeLLM
AI,个人随笔 还在花冤枉钱做人工标注?掌握这套“AI评AI”神技,帮公司省下百万预算! AI产品评测正面临革命性转折——当传统跑分榜单与用户体验严重割裂,UC Berkeley提出的“LLM-as-a-Judge”框架给出了破局方案。最新研究证明,GPT-4作为裁判与人类评估一致性超80%,但隐藏的位置偏差、话唠偏好等陷阱同样致命。本文将深度拆解MT-Bench多轮测试设计,揭示AI裁判的四大潜规则,并给出可落地的自动化评估体系搭建指南。 静观AI AI产品LLM模型评估
个人随笔 告别低效访谈:你必须了解的用户研究“第三种范式” 传统用户研究正面临深度与效率的两难困境,而大语言模型(LLM)技术催生的智能混合研究正在打破这一僵局。本文将系统解析这一新范式如何通过AI驱动的深度对话与规模化分析能力,重塑用户研究的边界,并详细拆解AI访谈从设计到报告生成的全流程自动化实践。 悦数体验创新 AI应用LLM产品创新