"视觉推理"相关的文章
AI
DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

DeepSeek 通过视觉基元技术重新定义多模态推理边界,其灰度测试的视觉能力展现出原生思考特性而非简单图像识别。这款模型用点、框、路径坐标作为认知锚点,在迷宫求解、网页复刻等场景实现精准空间推理。技术论文《Thinking with Visual Primitives》的突然撤稿更引发行业对其突破性进展的猜测。
这家新公司融了 5500 万美元,想让 AI 真正能看懂图片

这家新公司融了 5500 万美元,想让 AI 真正能看懂图片

英伟达押注的 AI 新秀 Elorian 横空出世,5500 万美元种子轮融资背后暗藏怎样的视觉推理革命?这家由 Google Brain 和苹果 AI 核心科学家创立的神秘公司,正试图攻克 AI 看懂图片却无法理解空间关系的终极难题。从机器人路径规划到工程设计意图识别,Elorian 要构建的是一套颠覆性的视觉推理底层能力。