AI 多模态都是假的:最强模型数不清手指、认不出雷碧 把六指图喂进“最强”多模态模型,它依然坚称只有五根手指;让它认“雷碧”,也会被文字带偏。作者用一连串实测拆穿幻象:模型并非“看见”,只是高维概率复读机。数据偏差、任务粒度、长尾缺失才是幻觉根源。认清边界,才能补数据、改架构,把 AI 真正用在刀刃上。 叶小钗 产品评估多模态大模型
AI 大模型评估:指标和方法【上】(二) 大模型的发展愈发迅猛,评估却常常落后一步。本文围绕多维评估指标与方法论展开,深入剖析模型性能到底该如何被“看见”。延续上篇思路,本篇将从实战出发,为你补齐模型评估的“底层逻辑”。 猫猫观察员的AI思考 大模型经验分享评估体系
AI 为什么你的AI助手总是搞错事?Context Engineering了解一下 问个问题,AI回得牛头不对马嘴?别急着吐槽它“太蠢”,可能是它根本没听懂你是谁、想干啥。本文用浅显易懂的方式,带你认识一个冷门却超关键的概念——Context Engineering,也许是AI真的“读懂你”的那把钥匙。 梧桐AI Context Engineering大模型技术原理
AI 大模型评估:初学者入门(一) 大模型的风口已至,但评估却始终是一道“看不清又绕不过”的门槛。本篇文章将从基础概念出发,手把手引导初学者理解大模型评估的核心逻辑与方法体系,厘清技术指标背后的实际含义,为后续深入探索打下坚实的认知地基。 猫猫观察员的AI思考 AI产品LLM基础知识
个人随笔 大模型竞赛转向:决胜关键为何是“后训练”? 当前,通用模型在产业落地中面临知识断层、难以对齐用户隐性偏好等难题,而后训练正是解决这些 “最后一公里” 问题的核心。业界已探索出 SFT+RL、纯 RL 等训练范式,MoE 模型、FP8 精度等技术也成为后训练的重要选择。本文解析后训练的关键价值、产业痛点及顶级玩家的实践路径,探讨其如何成为大模型价值释放的决胜场,以及云平台在其中的支撑作用。 甲子光年 后训练大模型技术原理
AI,个人随笔 AI大模型+资讯,资讯阅读的第三次革命 当信息爆炸让人喘不过气,AI大模型正把“读新闻”变成“用新闻”。从秒懂专业名词的划词解读,到一键生成个人日报的AI早报,今日头条、腾讯新闻、新浪新闻集体上演“资讯App智能化军备赛”。本文深度横评三家大厂的AI功能:谁能真正把浩瀚资讯化繁为简,谁又只是在炫技?答案关乎每个想在信息洪流里高效获取价值的你。 光锥智能 AI应用产品分析大模型
个人随笔 从数据洞察到决策革命:大模型重构企业数字化运营新范式 在数字经济高速发展的今天,企业数字化转型已从技术工具的应用演变为核心竞争力的重构。基于大模型技术的深度赋能,我们通过构建智能化分析体系,实现了从数据洞察到决策执行的闭环升级,推动企业运营效率、决策精度和业务创新能力的全面提升。下面将结合具体实践,系统阐述大模型技术对企业数字化业务的重构路径与价值创造机制。 董方旭 个人观点大模型数字化运营
AI,个人随笔 Scale AI:AI 产业链的“隐形军火商” 在AI大模型的聚光灯之外,有一家公司低调却关键地撑起了整个产业链的“地基”——它就是 Scale AI。从数据标注到模型评估,从政府合同到硅谷独角兽,这家“隐形军火商”如何在AI竞赛中扮演幕后操盘手? 张艾拉 AI应用产品分析大模型
AI,个人随笔 大模型微调后,可上线的标准是什么? 随着大模型微调技术(尤其是LoRA轻量参数微调)的广泛应用,如何判断一个微调后的模型是否可以进入上线测试阶段,成为了一个亟待解决的问题。本文结合心理场景项目中的实践经验,详细探讨了大模型微调后上线前的评估标准。 养心进行时 个人观点大模型经验分享
AI 模型微调:从理论到实践的深度解析 在人工智能领域,模型微调已成为提升模型性能、使其适应特定任务的关键技术。本文将全面系统地介绍模型微调的各个方面,帮助读者深入理解这一重要技术。 李雨田讲AI产品 大模型技术原理理论知识
AI,个人随笔 大模型轻量化技术,让AI跑的更快更省 随着大模型参数规模不断膨胀,其高昂的计算资源需求和低效的运行速度成为制约其广泛应用的瓶颈。本文将为您深入剖析大模型轻量化技术,供大家参考。 明思AI AI应用大模型技术原理
AI 大模型竞争:落后生的两条追赶路线 在大模型竞赛中落后的厂商采取两种追赶路线:苹果、Meta 等大厂通过重金挖人等手段补强短板;国内 AI 六小龙因融资环境恶化,选择裁员收紧资源,集中力量在模型迭代上。 字母榜 个人观点大模型行业观察