AI DeepSeek-OCR:上下文光学压缩范式与长上下文 LLM 的未来 在长上下文大模型的演进路径中,OCR技术正从“识别工具”跃升为“语义压缩引擎”。DeepSeek-OCR提出的上下文光学压缩范式,不仅提升了文档解析效率,更为LLM的输入优化提供了新思路。本文将系统拆解该范式的技术逻辑、应用场景与未来潜力,探讨OCR如何成为长上下文模型的关键前置模块。 耿和言的AI产品小屋 DeepSeekLLMOCR
AI ACE框架万字深度解析:重塑LLM自我改进的上下文工程范式 随着大模型从“能用”走向“好用”,上下文工程成为提升智能体能力的关键变量。本文围绕ACE框架展开万字深度解析,系统梳理其在Agent自我改进中的结构优势与工程价值,帮助产品人、AI开发者构建更具可控性与演化能力的智能系统。 金融产品小兵 ACE框架LLM上下文工程
AI,个人随笔 马斯克亲自点名Karpathy迎战Grok 5!别神话LLM,AGI还要等十年 AGI并非明天到,但也不是海市蜃楼。Karpathy直言:通往 AGI 的路已出现,却布满硬骨头——强化学习信号稀薄、模型崩塌风险、环境与评估匮乏、系统集成与安全难题等。他给出一个「乐观而不煽情」的时间表:10年。 新智元 AGIGrokLLM
AI 深度讨论 Online Learning :99 条思考读懂 LLM 下一个核心范式 在人工智能领域,Online Learning 正逐渐成为研究和应用的热点。随着 OpenAI、Anthropic 等公司不断推出新的模型和技术,Online Learning 被视为实现更高效模型进步和新的技术范式的关键。 海外独角兽 LLMOnline Learning个人观点
AI 如何正确理解Token经济学? 从模型厂商的定价策略,到C端和B端应用的Tokens消耗模式,再到技术迭代如何解锁新的应用需求,文章为我们揭示了Token经济学背后的深刻逻辑。 解码Decode LLMToken行业观察
AI 从零到ChatGPT,大语言模型 (LLM) 是如何炼成的? 从“语言模型”到“类人智能”,ChatGPT的爆火背后,是大语言模型技术的飞跃与演进。本文将带你穿越技术迷雾,从基础原理、模型训练到产业落地,系统梳理LLM的发展路径与关键节点。 四吉在这 ChatGPTLLM发展历史
AI,个人随笔 如何提升大模型LLM回答的准确率 随着 LLM 在各类产品中广泛应用,如何提升其输出的准确率,已成为产品经理与技术团队绕不开的核心问题。本文将从提示词设计、系统架构、评估机制等多个维度出发,拆解影响 LLM 准确率的关键因素,并提供可落地的优化策略,帮助你打造更可靠、更可控的 AI 产品体验。 luffy AI应用LLM个人观点
AI,个人随笔 一文讲透AI智能体“冰山结构”:你看到的是 Agent,没看到的是系统 智能体不是AI的“新功能”,而是AI的“新物种”。它重构了任务执行、系统协同与产品形态,背后是一整套认知范式的跃迁。本文深度解析智能体的冰山结构,揭示你没看到的系统性力量。 AI思·享@蓉77 LLM技术原理智能体
AI 深入拆解 Agent 原理:LLM+工具+记忆+规划 从 LLM 到工具调用,从记忆机制到任务规划,Agent 的四大核心能力构成了其“类人智能”的基础,也决定了其在实际场景中的落地深度。本文将系统拆解 Agent 的底层原理与设计逻辑,帮助产品人理解如何从技术组件走向产品能力,构建真正可用、可控、可演化的智能体系统。 AI产品泡腾片 AgentLLM技术原理
AI,个人随笔 从零学习大模型(15)——大模型评估与 LLM 自动化评估 本文将围绕阅读理解、问答、代码生成、数学推理等核心任务的评估方法展开,探讨 Benchmark 如何检测 LLM 的真实性、流畅度与幻觉,并揭示如何利用 LLM 自身能力实现对其他模型 / 任务的自动化评估。 金融产品小兵 LLM大模型技术原理
AI,个人随笔 不懂代码,如何利用代码,玩转AI应用搭建? 不会写代码,就不能玩转 AI 应用?未必!本文将以作者在 dify 平台搭建工程选型应用的实践为例,拆解 AI + 自动化的真实落地过程,帮你掌握“让 AI 写代码”的实操技巧,轻松跨过技术门槛,搭建属于自己的 AI 工具。 文字小站 AI应用DifyLLM
AI,个人随笔 【本地化部署】Dify大语言模型(LLM) 应用开发平台【小白教程】 不想连云端也依赖?这份教程手把手带你把 Dify LLM 应用平台部署到本地,从环境配置到启动调试全流程复刻,助你在数据私有性、系统自控性上实现真正“自己掌握主动权”的开发体验。 董方旭 LLM大模型操作指南