AI,个人随笔 如何做Agent评测 在大语言模型主导的AI时代,如何确保Agent应用层的稳定输出成为关键命题。本文系统拆解Agent评测体系的构建逻辑,从过程指标与结果指标的双重视角,揭示如何通过标准化测试收敛概率模型的不确定性。更包含评测集构建、自动化评测实施等实战方法论,为AI产品落地提供可复用的质量保障方案。 诸葛铁铁 AgentAI评测LLM
AI,个人随笔 从数字化到AI化的惊险一跃 企业数字化建设虽已投入巨资,但数据依然沉睡,决策依然依赖人脑。从数字化到AI化的转型不仅是技术升级,更是管理逻辑的重构。本文深度剖析企业如何跨越‘惊险一跃’,从‘流程锁定’转向‘动态决策’,让AI成为真正的‘决策中枢’。 沈素明 AI应用LLM数字化转型
AI,个人随笔 Agent vs Workflow:谁才是效率革命的主角? 随着AI和自动化技术的发展,企业和个人都在寻求提升效率的新方法。在这场效率革命中,“Agent(智能体)和Workflow(工作流)”是常常被提及的焦点。它们都旨在自动化任务、优化流程,但其本质、侧重点和适用场景却大不相同。它们各自代表了怎样的自动化范式?谁将成为驱动未来效率提升的主角? 北辰 AgentAI工作流LLM
AI,个人随笔 AI PM 进阶笔记【2】:Agent-万字详解-含案例讲解(科普向) 2025年,AI将从‘会说话’进化到‘会干活’。AI智能体(AI Agent)不再是简单的聊天机器人,而是能够感知环境、规划任务、调用工具并主动推进目标的‘数字员工’。本文将系统性拆解AI智能体的完整知识体系,从核心认知架构到企业级落地细节,深入探讨规划算法、记忆系统和工具使用的关键技术,并展示如何在电商客服等高频场景中实现‘Agent+RAG+长期记忆’的落地流程。 王俊 Teddy AgentAI落地LLM
AI,个人随笔 从AI安全到AIOS 当诗歌成为AI的致命漏洞,大模型的安全防线正在被文学艺术悄然瓦解。最新研究发现,通过将危险指令伪装成隐喻诗歌,黑客能轻松突破主流大语言模型的安全限制。本文不仅揭露了这一惊人漏洞,更从AIOS演进、可信搜索机制到人类文明符号体系等维度,深度探讨AI安全面临的本质挑战——当技术遭遇创造力,规则终将被重写。 St.Zy_I AIOSAI安全LLM
AI,个人随笔 拒绝 AI 智商税:你的供应商是在卖AI 能力,还是在堆AI 名词? 本文探讨了从BERT到LLM的AI认知演变,指出BERT虽曾伟大但已非前沿,呼吁企业关注AI能力链路而非单一模型。 Mio的AI商业观察 BERTLLM技术更新
AI,个人随笔 LLM背后的模型训练原理是什么? “百万级 Token 喂养、参数反复微调,强大 LLM 的训练藏着哪些核心逻辑?从论文到落地,AI 产品经理带你拆解大模型的 “成长密码”~解锁训练全流程,看懂模型从 “词语组合器” 到 “对话高手” 的蜕变!” Ai_Chang LLM大模型技术原理
AI,个人随笔 AI自动化实战:n8n+LLM的工作流搭建低成本高价值工作流 在自动化的浪潮中,很多团队依旧停留在“重复劳动”的泥沼:流程复杂、工具割裂、效率低下。本文将通过 n8n 与大语言模型的结合,展示如何真正释放自动化的潜力,让工作流从繁琐走向智能。 SiegZhong AI应用LLMn8n
产品设计 需求池里捞黄金:用 CMA 边际公式 + LLM 秒算 的需求决策自动化方法研究 在需求爆炸与资源有限的现实中,如何精准识别高价值需求,成为产品决策的核心挑战。本文提出一种融合 CMA 边际公式与大语言模型(LLM)的自动化方法,不仅提升了需求评估效率,更重塑了产品团队的战略思维方式。 远眺看世界 CMA公式LLM方法论
AI RAG观止系列(二):一文说清重排的作用与落地细节 在RAG(Retrieval-Augmented Generation)系统中,“重排”常被视为提升效果的关键一环,却也常因其技术门槛和实现复杂度而被忽视。本文将以通俗易懂的方式,系统梳理重排的作用机制、常见策略与落地实践,帮助你在构建RAG系统时做出更具针对性的设计与优化。 Timothy LLMRAG大模型
AI DeepSeek-OCR:上下文光学压缩范式与长上下文 LLM 的未来 在长上下文大模型的演进路径中,OCR技术正从“识别工具”跃升为“语义压缩引擎”。DeepSeek-OCR提出的上下文光学压缩范式,不仅提升了文档解析效率,更为LLM的输入优化提供了新思路。本文将系统拆解该范式的技术逻辑、应用场景与未来潜力,探讨OCR如何成为长上下文模型的关键前置模块。 耿和言的AI产品小屋 DeepSeekLLMOCR
AI ACE框架万字深度解析:重塑LLM自我改进的上下文工程范式 随着大模型从“能用”走向“好用”,上下文工程成为提升智能体能力的关键变量。本文围绕ACE框架展开万字深度解析,系统梳理其在Agent自我改进中的结构优势与工程价值,帮助产品人、AI开发者构建更具可控性与演化能力的智能系统。 红岸小兵 ACE框架LLM上下文工程