"OCR"相关的文章
AI,个人随笔
告别手动录入发票!元器智能体+工作流实战:3秒提取发票信息,效率提升10倍

告别手动录入发票!元器智能体+工作流实战:3秒提取发票信息,效率提升10倍

财务人员的日常被发票录入折磨得焦头烂额?腾讯元器智能体比赛诞生的'发票提取助手'彻底改变了这一困境。这款工具能在3秒内自动识别发票图片并提取关键信息,准确率高达95%以上。本文将完整拆解智能体+工作流的开发过程,揭秘如何利用OCR插件与大模型技术实现财税场景的效率革命。
AI
DeepSeek-OCR:上下文光学压缩范式与长上下文 LLM 的未来

DeepSeek-OCR:上下文光学压缩范式与长上下文 LLM 的未来

在长上下文大模型的演进路径中,OCR技术正从“识别工具”跃升为“语义压缩引擎”。DeepSeek-OCR提出的上下文光学压缩范式,不仅提升了文档解析效率,更为LLM的输入优化提供了新思路。本文将系统拆解该范式的技术逻辑、应用场景与未来潜力,探讨OCR如何成为长上下文模型的关键前置模块。
AI
DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?

DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?

当前主流大模型上下文窗口仅 128k-200k tokens,面对上千页的财报、论文,传统 “切片段” 方式会断逻辑、拖速度。而 DeepSeek-OCR 反常规,先把文本转图像压缩,需用时再解压缩,Tokens 消耗降一个数量级还保精度,甚至被网友赞为破解 AI 训练瓶颈、智能体记忆难题的关键方案,为大模型处理长文档打开新路径。