"LLM"相关的文章
AI,个人随笔
李飞飞对话 a16z:LLM 是有损压缩,世界模型才是真正重要方向,应用远超机器人

李飞飞对话 a16z:LLM 是有损压缩,世界模型才是真正重要方向,应用远超机器人

近日,李飞飞与 a16z 合伙人展开了一场深度对话,首次公开分享了创办 World Labs 的理念、研究方向与宏大愿景。她指出,语言是一种“有损压缩”的认知方式,而世界模型才是 AI 真正理解并构建世界的关键。空间智能的应用远超机器人,将为工业设计、电影制作、建筑构图、游戏开发等领域带来前所未有的变革。
AI,个人随笔
浅显理解LLM底层技术

浅显理解LLM底层技术

大语言模型(LLM)作为人工智能领域的重要分支,近年来在自然语言处理(NLP)方面取得了显著进展。然而,对于非技术出身的人来说,理解LLM的底层技术往往显得晦涩难懂。本文作者通过类比和通俗易懂的方式,深入浅出地介绍了LLM的底层技术原理,包括词元(token)的概念、有监督学习与无监督学习的区别,以及语言生成技术如GPT和BERT的工作机制。
AI
Llama 4 发布:我看到了 DeepSeek 的影子

Llama 4 发布:我看到了 DeepSeek 的影子

随着人工智能技术的飞速发展,大型语言模型(LLM)的竞争日益激烈。Meta 最新发布的 Llama 4 模型,以其独特的架构和策略,引发了行业的广泛关注。本文深入分析了 Llama 4 的三大核心特点:采用混合专家(MoE)架构、原生多模态能力以及将大模型作为训练过程的工具。