大模型训练 | 人人都是产品经理

AI

模型也有”出身”：AI产品经理需要知道的上游风险

最新研究揭示AI模型通过数字序列、代码片段等看似无关的数据，能隐秘传递行为偏好甚至有害倾向。Anthropic Fellows的论文证实：即使经过严格过滤，拥有相同初始化的模型仍会通过统计模式传递底层特征，这一发现对模型蒸馏、AI安全与数据过滤策略提出根本性质疑。当AI的'潜意识学习'能力突破语义层面，我们该如何重新审视大模型训练与对齐的本质？

五艺SUN

AI安全 Anthropic 大模型训练

AI,个人随笔

一文讲透AI的三大核心要素之一：算力

算力作为AI发展的三大支柱之一，远不止简单的硬件堆砌。本文深度解析AI算力的本质——从FLOPS到TOPS的单位差异，到内存带宽与芯片互联构成的『数据生命线』，揭示大模型训练背后那些被忽视的算力三角关系。你将理解为什么标称算力只是冰山一角，以及如何评估真实的AI算力效能。

向上的小霍

AI算力 FLOPS 内存带宽

AI

AI 编程的“减肥”革命：CodeACT 带来的高效进化故事

在代码大模型训练陷入‘数据海战术’困境的2024年，南京航空航天大学的研究团队带来了突破性解决方案CodeACT。这套结合‘学霸式精准刷题’CDAS算法与‘俄罗斯方块式打包’Dynamic Pack的技术框架，仅用40%数据就让模型性能提升8.6%，训练速度提升4倍，重新定义了AI训练的效率革命。本文深度解析这场关于‘少即是多’的技术哲学实践如何改变大模型进化范式。