AI AI大模型训练:万字解析“学习率”的奥秘 在 AI 模型训练的复杂流程中,学习率常被视为“最难调的超参数”之一。它不仅决定了模型收敛的速度与稳定性,更深刻影响着最终性能表现。本文以万字长文的形式,系统拆解了学习率的本质、调参策略、常见误区与前沿研究,帮助你从原理到实操全面掌握这一关键知识点。 耿和言的AI产品小屋 AI产品大模型技术原理
AI 小白也能懂!深度解析Agent间的“悄悄话”:A2A协议 在AI智能体的世界里,它们之间是如何沟通协作的?A2A协议,正是揭开这个谜底的关键。本文用通俗易懂的方式,带你深入了解Agent间的“悄悄话”机制,从底层逻辑到实际应用,层层拆解,助你快速掌握这一前沿技术。 Tracy A2A协议Agent技术原理
产品运营 为什么网站总是不敢公开排序规则? 在信息爆炸的时代,排序规则决定了用户看到什么,也决定了平台如何定义“重要性”。然而,大多数网站却始终对排序逻辑讳莫如深。本文将从产品机制、商业利益与用户认知三重视角,剖析排序规则为何难以公开,以及这背后隐藏的信任博弈与设计悖论。 Cassie 个人观点技术原理排序规则
AI 一文读懂大模型的心跳:“损失Loss” 你知道AI是怎么“变聪明”的吗?答案藏在一个看似负面的词——Loss。这篇文章用通俗语言讲清楚:损失函数到底是什么,它如何驱动模型学习,又为什么它是所有AI能力的起点。读完,你会对“训练”这件事有全新的理解。 AI凌波鱼 Loss大模型技术原理
AI AI发展史:从“人工智障”到“超级外脑”,我们到底经历了什么? 本文将带你穿越人工智能跌宕起伏的七十年,回顾这段充满了梦想、挫折与英雄主义的史诗。但你是否想过,我们究竟是如何从最初的“人工智障”,一步步走到了今天似乎无所不能的“超级外脑”身边的? 炸毛疯兔 AI产品发展历史技术原理
AI 聊聊让AI“听懂人话”的秘密:意图识别 从智能客服到智能家居,再到金融和医疗领域,意图识别技术正帮助机器更好地理解人类的需求,并提供精准的服务。作者结合自身在大厂的工作经验,分享了如何通过意图识别提升产品效率和用户满意度。 骆齐 AI应用意图识别技术原理
AI,个人随笔 注意,AI工程师不会说:“模型能力就这样了” 在人工智能领域,如何有效利用AI技术并确保其可靠性和可扩展性是一个关键问题。本文通过实际案例,深入探讨了AI项目中的模型边界、可观测性以及数据工程的重要性。 叶小钗 AI应用个人观点大模型
AI,个人随笔 RAG全系列之《向量化与向量召回》 在知识检索领域,向量化与重排序正成为解决海量数据精准检索的关键技术组合。本文深入剖析向量化与重排序技术,从文档拆分的多种优化方法,到向量化模型选择、相似度计算的技巧,为你提供一套全面的知识检索指南,供大家参考。 寻走 RAG向量化技术原理
AI 向量库已死、RAG永存:模型进步再次干死过时技术 向量库刚被捧上神坛,就被最新一代大模型一脚踹下。原因很简单:当模型上下文一口气拉到百万 token,召回和排序一次搞定,传统 RAG 架构里的向量检索瞬间成了“多余的中间商”。本文用实测数据告诉你,向量延迟、精度天花板和成本是如何被原生长上下文碾压的——以及,在“模型即检索”的新范式里,开发者该如何重写知识库代码。 叶小钗 AI产品RAG向量库
AI 万字拆解:RAG已死吗?上下文工程(context engineer)为何为王? 最近看一个播客是 Chroma 创始人兼 CEOJeff在 Len Space 播客的对话,对话的标题就是关于“RAG is dead”的观念,在视频中很明显的说明了原本的RAG的局限性和现在context engnieer的重要性,今天我就想全面分析一下“上文工程”(context engnieer)为什么这么爆火?以及将来RAG的形态到底何去何从…… LULAOSHI RAG上下文工程基础知识
AI 万字长文,彻底讲透大模型幻觉:从底层逻辑到五大缓解方法 AI 一方面展现出强大能力,引经据典对答如流,另一方面却常 “一本正经地胡说八道”,如在法庭上伪造判例。这种精准与荒谬并存的矛盾,源于数据质量、生成机制及指令模糊等问题,该如何化解以发挥 AI 真正价值? 梧桐AI 大模型底层逻辑技术原理
AI 一文弄懂如何通过AI Agent点外卖 在数字化时代,人工智能技术不断拓展其应用场景,为我们的生活带来诸多便利。本文将带你深入了解如何通过AI Agent(智能体)实现点外卖这一操作。作者以“AutoGLM”这款智能体App为例,详细分享了其操作过程。 刘刚 Agent技术原理经验分享