大模型厂商集体卷OCR?一个产品经理的拆解

今年上半年各家密集发OCR模型,密度吊打过去两年加起来。DeepSeek-OCR 2、智谱GLM-OCR、百度飞桨PaddleOCR-VL 1.5、腾讯混元OCR、阿里Qwen3.6 Plus/Max……名单长到记不住。

你可能会纳闷:这些厂商平时不是比谁参数大、谁上下文长、谁推理强吗,怎么突然扎堆搞起”图片转文字”这个几十年前就有的古董技术了?

我帮你把背后的产品逻辑拆清楚。

产品
登录后参与评论