AI 大模型评估:初学者入门(一) 大模型的风口已至,但评估却始终是一道“看不清又绕不过”的门槛。本篇文章将从基础概念出发,手把手引导初学者理解大模型评估的核心逻辑与方法体系,厘清技术指标背后的实际含义,为后续深入探索打下坚实的认知地基。 猫猫观察员的AI思考 AI产品LLM基础知识
AI Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了 Transformer杀手来了?KAIST、谷歌DeepMind等机构刚刚发布的MoR架构,推理速度翻倍、内存减半,直接重塑了LLM的性能边界,全面碾压了传统的Transformer。网友们直呼炸裂:又一个改变游戏规则的炸弹来了。 新智元 AI产品LLM技术原理
AI,个人随笔 8000字讲解MCP与Function Call、Agent的关系 本文通过讲解MCP解决了什么问题,以及和以及与Function Call、Agent的关系。通过两个实际对比的案例,对MCP、Function Call、Agent在应用层的关系进行详细的介绍。以便于小伙伴们对AI专有名词有进一步的理解和学习。 馒有理 AI产品MCP基础知识
AI 从Grok 4到Kimi K2 “地表最强大模型”到底强在哪? 当“大力出奇迹”仍是铁律,大模型战场迎来两位新王:Grok 4用20万张H100、1.7 TB参数和四智能体协同把数理基准刷到44%,却一脚踏进伦理翻车现场;Kimi K2则以1 TB开源巨兽之姿,率先把“模型即Agent”搬进现实,能帮你订Coldplay门票、写代码、比价机票,却先被算力卡脖子。 IT时报 AI产品GrokKimi
AI,个人随笔 Grok-4刷屏了,到底要不要考虑切换基座模型? Grok-4以其卓越的逻辑推理能力和代码理解能力引发了广泛关注,许多企业和项目团队都在考虑是否要切换到这一新的基座模型。本文将从政务AI项目的角度出发,探讨Grok-4在实际业务中的表现,并结合作者的亲身试用经验,分析其优势与局限。 柳星聊产品 AI产品Grok个人观点
个人随笔 从“不会做”到“我能做”:C端AI产品真正的价值,不在功能堆砌 有些AI产品功能繁复却无人问津,有些看似简单却能打动用户。关键在于,真正有价值的C端AI产品,不是替用户做事,而是让原本做不到的人能靠自己做成事,这正是其价值核心所在。 是湘湘呀 AI产品产品设计商品价值
AI,个人随笔 字节的豆包居然有了自己的IP宇宙 字节的豆包有着丰富人设和粉丝共创宇宙的IP。从被主播“调教”引发热议,到用户自发进行角色扮演、创作表情包、打造专属“豆设”,衍生出“豆包痛包”等粉丝文化符号,这个有着具象虚拟形象的AI,正悄然构建起属于自己的IP宇宙,成为AI产品IP化的独特样本。 硅星人 AI产品商业IP豆包
AI AI infra赛道再现3000万美元大额融资,当数据处理遇上AI,如何重新定义多模态数据的未来 Daft 以 “工具适应数据” 为设计理念,原生支持多模态数据处理,具备无缝扩展、深度优化 AI 工作流等优势,正试图解决多模态数据处理的核心难题。本文将深入探讨 Eventual 的解决方案、技术创新及背后的行业意义,解析多模态数据处理领域的现状与未来。 深思圈 AI产品创业公司多模态
个人随笔 AI六小虎,胜利大逃亡? 六小虎各自面临着不同的困境,有的在业务聚焦上遭遇不确定性,有的受限于战略摇摆,有的则需应对估值与竞争力的挑战。即便成功上市,技术护城河、商业化效率等问题仍是其不得不跨越的难关,而 AI 四小龙此前的发展历程也为它们敲响了警钟。本文将深入探讨 AI 六小虎的上市之路与未来挑战。 光子星球 AI产品个人观点行业观察
AI AI独角兽创始人最新警告:48小时没人转发?你的AI产品已经“死了” 在AI产品井喷、同质化严重的当下,功能已不再是制胜关键,真正的胜负手是“传播力”。本文通过硅谷AI公司Base44的爆发式增长案例,揭示了AI产品如何在48小时内实现社交裂变,并指出:不会讲故事、无法被看见的产品,将在激烈竞争中迅速“死亡”。 硅基观察Pro AI产品案例分析社交裂变
AI,个人随笔 数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免 研究人员发现,在数学题题干中加入与猫相关的无关信息,会让大模型的错误率大幅上升,甚至翻300%。这一现象在推理模型如DeepSeek-R1和OpenAI的o1中尤为明显。研究揭示了大模型在处理无关信息时的脆弱性,也引发了对模型推理能力和鲁棒性的进一步思考。 量子位 AI产品DeepSeek产品分析
AI 如何构建高质量AI对话训练数据 在对话类AI产品爆发的当下,如何构建高质量的训练数据,已经成为产品经理、算法工程师乃至标注团队都绕不开的核心问题。本文作者结合一线经验,系统拆解了对话数据构建的关键流程、常见误区与优化策略,是一份兼具技术深度与实操价值的干货指南,值得每一位AI从业者收藏。 养心进行时 AI产品技术原理经验分享