AI,个人随笔 OpenAI正开发大语言模型“Garlic” 当 Google 的 Gemini 3 在各大榜单 "碾压"GPT-5.1 时,OpenAI 果断按下所有商业化项目暂停键,将 "大力出奇迹" 的 "红葱头"(Shallotpeat) 方案彻底埋葬,转而押注更皮实、更高效的 "大蒜" 路线 ——从 "什么都懂" 的虚胖型全能选手,转型为精通代码和逻辑推理的 "专家型" 武器。 王智远 OpenAI大语言模型行业动态
AI 闭源越跑越快之后,DeepSeek V3.2 如何为开源模型杀出一条新路 当闭源模型加速领跑,开源阵营如何突围?DeepSeek V3.2 以稀疏注意力架构、超10%后训练算力投入和大规模Agent合成数据,在成本压缩的同时逼近GPT-5级推理能力,为开源生态开辟了一条技术驱动的新路径。 深思 SenseAI DeepSeek大语言模型开源生态
AI,个人随笔 互联网AI进化论:Transformer到智能体的跃迁 AI技术的演进正在重新定义互联网生态。从Transformer架构到智能体,AI如何在搜索、内容生成、客服、代码开发和智能决策等领域重塑我们的数字生活?本文深入探讨AI技术如何推动互联网行业的变革。 漫说AI行业 AI技术Transformer大语言模型
AI AI 训练师入职必备的大模型训练流程,新手也能看懂 你知道ChatGPT背后到底经历了哪些训练流程吗?AI训练师在其中扮演了什么角色?本篇文章用最接地气的方式,拆解大模型训练的三大阶段,带你看懂那些“看不见的幕后工程”。新手也能读懂,老手也能复盘——这是一份真正实用的训练流程全景图。 小五- AI训练师业务流程大模型
AI,个人随笔 大语言模型产品经理必知:研发过程中不可或缺的三大核心要素 在大语言模型产品的研发过程中,技术突破只是起点,真正决定产品成败的,是对“能力边界”“交互机制”“落地路径”的系统把握。本文将从这三大核心要素出发,帮助产品经理构建面向未来的认知框架与协作模型。 而立与拾遗 AI产品经理基础知识大语言模型
AI 多模态文生图 / 文生视频模型:应用、训练与规则维度全景解析 文生图、文生视频模型不只是“生成能力”的升级,更是“表达机制”的系统跃迁。本文系统梳理多模态模型在应用、训练与规则维度的全景路径,帮助产品人理解如何在“能力边界”与“合规表达”之间构建新的认知闭环,实现从“能生成”到“能落地”的跃迁。 Xyu 多模态大语言模型技术原理
AI,个人随笔 “大语言模型是死路一条“ 人工智能领域,大语言模型(LLMs)一直是研究和应用的热点。然而,2024年图灵奖得主、强化学习之父理查德·萨顿(Richard Sutton)却提出了一个惊人的观点:“大语言模型是死路一条”。这一观点在技术界引发了广泛的讨论和反思。 微果酱 个人观点发展趋势大语言模型
个人随笔 ALL About AI 系列(五):智能体(Agent) 从自动写代码、做财报,到帮运营发邮件、做客服,Agent 正在把 AI 能力拆解成可执行、可编排、可商业化的“数字员工”。但 Agent 到底怎么“想”、怎么“动”、怎么“记住”?Function Calling、MCP、多智能体协同,这些技术路线谁更适合你的业务?本篇用 1 张架构图、3 个实战案例、5 段核心代码,带你从零看懂智能体的底层逻辑、能力边界与落地路径,让 AI 真正为你打工。 大波子 Agent基础知识大语言模型
AI,个人随笔 ALL About AI 系列(六):多智能体 当单个大模型开始“卷”不出新花样,硅谷把目光投向“多智能体”——让一群AI像公司一样分工:产品经理写需求、架构师出方案、程序员敲代码、测试员找Bug,24小时自我迭代。实测把4个Agent关进同一频道,3晚跑出1个完整SaaS原型,成本只要15美元。本篇文章带你拆解多智能体的底层协议、通信机制与3个主流框架,外加1份可复制的“虚拟团队”Prompt模板,让你立刻把AI从“聊天框”升级成“数字员工”。 大波子 A2A协议基础知识大语言模型
个人随笔 ALL About AI 系列(三):RAG:检索增强生成 在人工智能领域,大语言模型(LLM)虽然功能强大,但仍然存在知识更新困难和幻觉问题。为了解决这些问题,RAG(Retrieval Augmented Generation,检索增强生成)框架应运而生。 大波子 RAG基础知识大语言模型
AI,个人随笔 ALL About AI 系列(一):大语言模型基础 在人工智能领域,大语言模型已经成为了一个热门话题。从GPT到各种多模态模型,这些强大的工具正在改变我们的工作和生活方式。这篇文章将带你深入了解大语言模型的基础原理、核心能力以及潜在风险。 大波子 基础知识大语言模型行业观察
AI 不要构建多智能体 近年来,AIGC与多智能体系统成为热门概念,产品人也开始幻想通过智能体分工合作解决一切问题。但在实际落地中,多智能体常常成为复杂、割裂、难以维护的噩梦。本篇文章将从产品角度揭示:构建多智能体或许并不是通往智能未来的最佳路径,反而可能拖慢协同效率、模糊交互边界。 yan AIGC大语言模型智能体