个人随笔 华为曝光两大黑科技!打破推理延迟魔咒,大模型从此「秒回」 华为推出两大 AI 黑科技 ——FusionSpec 与 OptiQuant 。FusionSpec 打破大模型推理延迟魔咒,将耗时降至毫秒级;OptiQuant 支持灵活量化,推理性价比更高,二者为超大规模 MoE 模型推理开辟新路径,推动中国 AI 发展。 新智元 AI 创新华为技术突破