AI人工智能,个人随笔 浅显理解LLM底层技术 大语言模型(LLM)作为人工智能领域的重要分支,近年来在自然语言处理(NLP)方面取得了显著进展。然而,对于非技术出身的人来说,理解LLM的底层技术往往显得晦涩难懂。本文作者通过类比和通俗易懂的方式,深入浅出地介绍了LLM的底层技术原理,包括词元(token)的概念、有监督学习与无监督学习的区别,以及语言生成技术如GPT和BERT的工作机制。 打打泥 LLM大模型技术原理
AI人工智能,个人随笔 大语言模型基础知识分享 大语言模型(LLM)作为人工智能领域的重要突破,正在深刻改变自然语言处理的格局。本文将深入探讨大语言模型的定义、基本原理、优缺点以及其在各个领域的应用。 厚谦 LLM基础知识大语言模型
AI人工智能 1000万上下文+2880亿参数的Llama4,却让DeepSeek们松了一口气 近期,Meta发布了备受瞩目的Llama4系列开源模型,包括Llama 4 Scout、Llama 4 Maverick和尚未正式发布的Llama 4 Behemoth。本文将深入剖析Llama4的技术亮点与行业影响,探讨其在当前大语言模型竞争格局中的地位与意义。 硅星人 LlamaLLMMeta
AI人工智能 Llama 4 发布:我看到了 DeepSeek 的影子 随着人工智能技术的飞速发展,大型语言模型(LLM)的竞争日益激烈。Meta 最新发布的 Llama 4 模型,以其独特的架构和策略,引发了行业的广泛关注。本文深入分析了 Llama 4 的三大核心特点:采用混合专家(MoE)架构、原生多模态能力以及将大模型作为训练过程的工具。 赛博禅心 DeepSeekLLMOpenAI
AI人工智能 LLM「想太多」有救了!高效推理让大模型思考过程更精简 大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念,探究了如何帮助LLM告别「过度思考」,提升推理效率。 新智元 LLM技术原理推理大模型
AI人工智能,个人随笔 言变图的“LLM时刻”,还有AI全家桶,Google杀疯了 在生成式AI快速崛起的浪潮中,Google以全新的产品矩阵和技术升级迎来属于它的“LLM时刻”。从文本到图像,从工具到生态,AI全家桶的发布让人们看到技术无边的可能性。本文将带你深入解读这些突破背后的技术逻辑与市场策略,探讨Google如何在AI竞赛中拔得头筹,并展望行业未来的新格局。 鲸选AI AI应用googleLLM
个人随笔 对话Deepseek R1 :随着LLM能力的跃升,类似coze等Agent编排工具是否还有应用价值? 强大的LLM正在消解传统Agent设计中“显式工程化”的部分价值,但这不意味着Agent概念的终结,而是其形态向更灵活的方向进化。开发者应积极拥抱两种范式的融合——LLM负责认知层级的抽象与调度,传统Agent专注确定性的高效执行。这种分层协作或许才是下一代智能系统的常态。 新一 AgentAI应用DeepSeek
个人随笔 “(LLM产品)评估”背后,再深一层和两层的关键能力,到底是什么 在人工智能迅速发展的今天,如何有效评估大语言模型(LLM)产品成为了产品经理的重要课题。本文将深入探讨评估 LLM 产品背后的关键能力,强调业务认知和理想产品形态的“画面感”对于成功评估的重要性。 黄钊hanniman LLM个人观点产品思考
个人随笔 训练LLMs的过程就像写教科书 大模型都是通过数据进行训练的,对不懂的人来说,以为大模型的训练过程很神秘。其实不然,作者的观点是:其实就和写教科书一样,有背景、例题和练习题。这篇文章,我们就来学习一下。 Timjune LLM个人观点大模型
AI人工智能 AI做数学学会「动脑子」! UCL等发现LLM「程序性知识」,推理绝不是背答案 LLM在推理时,竟是通过一种「程序性知识」,而非照搬答案?可以认为这是一种变相的证明:LLM的确具备某种推理能力。然而存在争议的是,这项研究只能提供证据,而非证明。 新智元 AI大模型LLM程序性知识
业界动态 AI 影响最大的行业?LLM 如何让教育产品化 在当今数字化时代,人工智能技术正以前所未有的速度渗透到各个行业,其中教育领域尤为引人注目。随着大型语言模型(LLM)的兴起,个性化教育的愿景似乎触手可及。本文深入探讨了AI技术如何重塑教育行业,特别是LLM在教育产品化中的关键作用。 海外独角兽 AI应用LLM行业观察
业界动态 Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具 最近,Nature上的一项研究,全面驳斥了LLM具有类人推理能力的说法。研究者设定的「人类亲吻难题」把7个大模型彻底绕晕。最终研究者表示,与其说LLM是科学理论,不如说它们更接近工具,比如广义导数。 新智元 LLM产品分析大模型