"Transformer"相关的文章
AI
一文读懂AI编程原理与技术演进

一文读懂AI编程原理与技术演进

AI编程正在颠覆传统开发模式,Claude code等工具已能完成80%的代码编写和95%的测试工作。这不仅意味着开发效率的飞跃,更预示着产品经理需要掌握AI编程技能的时代已经到来。本文将深入剖析AI编程的底层原理与技术演进,从Transformer架构到Agent编程时代,揭示如何在这场生产力革命中保持竞争力。
AI,个人随笔
大模型训练大纲

大模型训练大纲

Transformer架构如何支撑GPT与BERT的差异化能力?MOE模型如何实现稀疏激活与动态分配的巧妙平衡?本文深度拆解大模型训练的7大核心流程与关键组件,从矩阵评估到框架选择,揭示AI研发过程中模型收敛与过拟合的本质差异,并解读MCP协议如何重塑AI与外部系统的连接标准。
AI
下一个Transformer可能又被Google做出来了

下一个Transformer可能又被Google做出来了

大模型深陷 “顺行性遗忘症” 困境:交互新知转瞬即忘,出厂后便停止进化。Google 抛出 Nested Learning 颠覆性论文,以 HOPE 框架打破架构与优化器的二元对立,用 “快慢记忆系统” 复刻生物大脑机制,让 AI 在交互中动态学习。这场被称作 “Attention Is All You Need V2” 的创新,能否开启 AGI 新范式?