Google I/O 2024 的 AI 战略转向引发行业热议。当 Gemini 3.5 Flash 以惊人速度亮相时,背后是 Google 全栈路线与 DeepMind 技术野心的激烈博弈。本文通过高管专访揭示:这家科技巨头正将资源向 '最可用模型' 倾斜,原生多模态技术正被商业需求重塑,而 Omni 模型的争议发布或成下个转折点。
Google 即将发布的 Gemini Omni 视频模型正在颠覆行业认知。两条泄露视频展示出惊人的多模态协调能力:数学推导过程的符号推理、手部动作的空间关系、语音与板书的时序同步完美融合,更在刚体与柔性体交互上突破物理模拟瓶颈。这可能是首个逼近'世界模型'的AI产品,或将重构内容创作链路与生态竞争格局。