"LLM"相关的文章
AI,个人随笔
如何做Agent评测

如何做Agent评测

在大语言模型主导的AI时代,如何确保Agent应用层的稳定输出成为关键命题。本文系统拆解Agent评测体系的构建逻辑,从过程指标与结果指标的双重视角,揭示如何通过标准化测试收敛概率模型的不确定性。更包含评测集构建、自动化评测实施等实战方法论,为AI产品落地提供可复用的质量保障方案。
AI,个人随笔
Agent vs Workflow:谁才是效率革命的主角?

Agent vs Workflow:谁才是效率革命的主角?

随着AI和自动化技术的发展,企业和个人都在寻求提升效率的新方法。在这场效率革命中,“Agent(智能体)和Workflow(工作流)”是常常被提及的焦点。它们都旨在自动化任务、优化流程,但其本质、侧重点和适用场景却大不相同。它们各自代表了怎样的自动化范式?谁将成为驱动未来效率提升的主角?
AI,个人随笔
AI PM 进阶笔记【2】:Agent-万字详解-含案例讲解(科普向)

AI PM 进阶笔记【2】:Agent-万字详解-含案例讲解(科普向)

2025年,AI将从‘会说话’进化到‘会干活’。AI智能体(AI Agent)不再是简单的聊天机器人,而是能够感知环境、规划任务、调用工具并主动推进目标的‘数字员工’。本文将系统性拆解AI智能体的完整知识体系,从核心认知架构到企业级落地细节,深入探讨规划算法、记忆系统和工具使用的关键技术,并展示如何在电商客服等高频场景中实现‘Agent+RAG+长期记忆’的落地流程。
AI,个人随笔
从AI安全到AIOS

从AI安全到AIOS

当诗歌成为AI的致命漏洞,大模型的安全防线正在被文学艺术悄然瓦解。最新研究发现,通过将危险指令伪装成隐喻诗歌,黑客能轻松突破主流大语言模型的安全限制。本文不仅揭露了这一惊人漏洞,更从AIOS演进、可信搜索机制到人类文明符号体系等维度,深度探讨AI安全面临的本质挑战——当技术遭遇创造力,规则终将被重写。
AI
DeepSeek-OCR:上下文光学压缩范式与长上下文 LLM 的未来

DeepSeek-OCR:上下文光学压缩范式与长上下文 LLM 的未来

在长上下文大模型的演进路径中,OCR技术正从“识别工具”跃升为“语义压缩引擎”。DeepSeek-OCR提出的上下文光学压缩范式,不仅提升了文档解析效率,更为LLM的输入优化提供了新思路。本文将系统拆解该范式的技术逻辑、应用场景与未来潜力,探讨OCR如何成为长上下文模型的关键前置模块。