Google I/O 2026 AI篇：当Google说”AI变得更聪明”，它其实在说”界面可以消失了”

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

Google I/O 2026 AI篇：当Google说”AI变得更聪明”，它其实在说”界面可以消失了”

Vicky。

2026-05-22

0 评论 1144 浏览 2 收藏

21 分钟

Google I/O 2026释放了一个被多数人忽略的革命信号——AI正在消灭界面。从跨平台购物的Universal Cart到24/7运行的Gemini Spark，演示的核心不是AI变得更聪明，而是用户不再需要操作任何App。当AI能自主理解意图、跨越应用边界完成任务时，传统界面这个中间层正在被彻底重构。本文深度解析Google如何通过Gemini Omni、Antigravity 2.0和Generative UI，实现从Function UI到Intent UI的范式转移。

你以为AI变得更聪明了，其实是界面正在被取消

Google I/O 2026刚结束。

铺天盖地的报道都在讲Gemini 3.5有多强、Google眼镜有多轻、三星联名有多好看。朋友圈里设计师们转发着”AI改变世界”的感慨，好像这又是一年一度的技术春晚。

但我注意到了一个被严重低估的信号。

Google在这场发布会上做的事，本质上不是”让AI变得更好用”。而是”让界面变得没必要”。

01 两个demo，一个信号

Google I/O的Keynote上，有两个demo引起了我的注意。

第一个是Universal Cart。

演示者在Google上选中了几件商品，来自不同商家——Nike和Target。这些商品被自动归入同一个购物车，一键结账。跨商家、跨平台，一个购物车搞定。

听起来像是”更方便的购物功能”。但Universal Cart真正厉害的不是聚合购物车本身，而是它的底层逻辑：AI理解了你的购买意图，主动跨越了商家边界。 它甚至能检测购物车里的商品是否兼容（比如组装游戏PC时，提醒你某些配件不匹配），还能自动识别Google Wallet里的会员权益帮你省钱。

第二个是Gemini Spark的街区派对demo。

Spark接到任务后，自动追踪邮件里的派对RSVP回复，维护Google Sheets的报名表，给没回复的邻居生成提醒邮件草稿，甚至自动生成Google Slides宣传页——整个过程在云端24/7运行，不需要你盯着，手机关了也不影响。

这两个demo有一个共同点：用户没有操作任何App。AI自己理解了意图，自己完成了跨应用、跨步骤的任务。

我们习惯了用”更聪明”来描述AI进步——Siri更聪明了、ChatGPT更聪明了、Gemini更聪明了。这个框架让我们以为：AI进步 = 现有交互方式 + AI增强。就像给一辆马车换了一匹更快的马。

但这两个demo展示的东西，根本不是”更快的马”。

Gemini Intelligence把AI嵌入Android系统底层，跨应用理解屏幕上下文、自主完成任务。Gemini Spark基于3.5 Flash在云端虚拟机上24/7运行，替你执行跨应用操作。

这意味着：

你不需要”找到”购物App
你不需要”输入”想买的书
你不需要”点击”加入购物车
你不需要盯着邮件等回复

你只需要表达一个意图。剩下的，AI自己完成。

这不叫”更聪明的助手”。这叫消灭中间层。

AI Agent进入你的设备，不是给你的界面装了一个更聪明的后台。而是告诉你——界面这个中间层，可以被革命了。

02 Gemini Omni：从生成内容到理解世界

Google DeepMind CEO Demis Hassabis发布了Gemini Omni——一个全模态（Omni-modal）模型。Hassabis强调Gemini从一开始就是原生多模态的，Omni率先在视频生成和编辑方面实现突破，后续将开放所有模态的生成能力。

官方demo里，用户拍了一段普通视频，然后通过对话让AI修改场景中的元素——换个背景、加个角色、改变风格。Hassabis强调，Omni对物理世界的理解比之前的视频生成模型更深入：它理解重力、动能、流体动力学。生成的视频不只是”看起来像”，而是”符合物理规律”。

Omni还允许用户将真实的自拍视频作为创作画布——通过对话式指令即可实时修改视频中的风格、背景，甚至添加复杂的物理特效，无需重新拍摄或做复杂的后期处理。

所有Omni生成的视频都会打上SynthID水印——Google同时宣布OpenAI、Kakao、ElevenLabs也在采用这套水印标准。

Gemini Omni Flash即日起在谷歌全线产品中推出，目前已在Gemini App和Google Flow中可用，后续将逐步接入YouTube等更多平台。

这听起来像是视频创作者的工具。但我认为它的意义不止于此。

Omni代表了一个方向：AI正在从”理解文本”走向”模拟现实”。 当模型能理解物理规律、能生成可交互的视频内容，未来的交互界面可能不是一个静态页面——而是一个AI实时生成的、可对话修改的动态场景。

03 Antigravity 2.0：当AI开始自己写代码

Antigravity最初是Google的AI编程环境。在I/O 2026上，它升级为2.0版本——一个 “完全代理优先”（unabashedly agent-first） 的独立桌面应用程序。它不再只是写代码，而是让用户通过对话与多个Agent协作，编排任务、管理工作流。

两个关键数据：

93个子Agent组成的团队，并行工作12小时，从零编写了一个包含调度程序、内存管理和文件系统的完整操作系统。整个过程处理了2.6亿个token，API调用成本不到1000美元。
Gemini 3.5 Flash本身比其他前沿模型快4倍，而在Antigravity 2.0平台中经过深度优化后，输出速度达到了其他前沿模型的12倍。

更重要的是，Google把Antigravity的Agent编码能力直接塞进了Search。

这意味着：当你在搜索框问”黑洞如何影响时空”，搜索不再只返回文字和链接——它会用Antigravity实时编写代码，生成一个交互式的物理模型，让你直接操作和探索。Google把这叫做”Generative UI”——搜索从零开始规划理想响应、设计布局，并调用Antigravity代理编码引擎在安全容器中执行代码。

这是整场发布会里对设计师影响最深的一个信号：界面不再是设计出来的，而是AI实时生成的。

传统的设计流程是：设计师定义布局 → 开发实现 → 用户使用。

Generative UI的流程是：用户提问 → AI理解意图 → AI实时生成最合适的界面 → 用户直接操作。

04 Gemini Spark + Android Halo

Gemini Spark是这场发布会里最核心的Agent产品。

它由Gemini 3.5和Antigravity团队开发的Agent编排框架共同驱动，运行在Google Cloud的专用虚拟机上，24/7在线——即使你关了电脑、锁了手机，它仍然在后台替你跑任务。你可以通过Gemini App、邮件或聊天与它交互。

Spark之所以能处理跨应用的复杂长任务，是因为它支持MCP（Model Context Protocol，模型上下文协议） 。通过MCP，Spark不仅能调用Google全家桶（Gmail、Docs、Sheets、Calendar……），未来还能无缝接入第三方工具（如Instacart等）。

Keynote上的demo展示了Spark的街区派对场景：追踪RSVP、维护报名表、生成邮件草稿和Slides宣传页。Spark在设计上有一个明确的边界：涉及”高风险”操作（比如发邮件、付款），它会先请求用户确认。这背后依托的是AP2（Agent Payments Protocol，代理支付协议）——用户可以设定品牌边界和预算限制（比如只准买某个品牌的电脑，预算不超过1000美元），让信任问题有了技术支撑。

Google还预告了一个配套的界面——Android Halo。

Google官方只说了一句话：它是Android上的”一个新的UI空间”，用来”查看Agent的实时更新和任务进度”。官方将其定位为”为你的Agent打造的专用大本营（dedicated home base）”。目前展示的唯一视觉线索，是状态栏右上角一个发光圆圈渐变为Gemini火花图标的动画。更具体的交互方式、是否支持操作还是纯显示，Google没有展开——只说”今年晚些时候分享更多细节”。

但我认为，仅从这些有限的信息，就已经能读出一个值得关注的信号：

它是一个”状态层”，不是”操作层”。

Google没有说Halo让你”操作”Agent。它说的是”查看”Agent的状态——在做什么、进度如何。视频中甚至提到你可以”放下手机让它干活”，而Halo是让你”check in”——扫一眼就知道进度。而且它是系统级的：无论你在哪个App里，状态指示始终在屏幕顶部，不需要切回Gemini App。

这个方向意味着什么？我的判断是：

传统App的交互逻辑是”让用户进入界面→操作→得到结果”。但Agent时代，用户不需要”进入”任何界面——Agent在后台干活，用户只需要知道它干到哪了。

所以，Agentic Interface的核心设计问题，可能不是”如何让用户找到功能”，而是”如何让用户信任AI在替他做事”。

05 Google Search：25年来最大的搜索框升级

Google Search在I/O 2026上做了几件大事。背景是：AI Mode月活跃用户已突破10亿，搜索查询量上个季度创下历史新高。在这个基础上，Google推出了一套被称为”25年来最大”的升级。

第一，搜索框重构。

Google搜索负责人Liz Reid称之为”25年来搜索框最大的升级”。新的智能搜索框不再是一个简单的文本输入框——它能处理极度具体、细节丰富的真实对话，而非破碎的关键词组合。比如你不再只搜”徒步路线”，而是直接问”带狗、有风景、有停车位午餐的徒步一日游行程”。搜索框会用AI驱动的建议帮你完善问题——不是传统的自动补全，而是帮你把模糊的想法变成精确的查询。

你还可以用多种模态搜索：文本、图片、视频、文件，甚至Chrome标签页，都可以作为搜索输入。

第二，信息智能体（Information Agents）。

你可以在Search中创建多个AI Agent，让它们在后台24/7监控你关心的信息，配合Gemini Spark一起工作。视频里展示了三个具体场景：

金融代理：监控特定财务指标（如PE低于15、现金流为正的生物技术股），关键时刻推送合成后的情报
租房代理：持续扫描全网符合光线、位置条件的房源
球鞋代理：追踪特定运动员的联名款发布

到了关键时刻，Agent会主动推送定制化的方案。

第三，Generative UI。

这和前面Antigravity部分提到的是同一件事，但放在Search的语境下更有意思：Search用Antigravity的能力，根据你的具体问题实时生成自定义布局和交互组件——数据可视化、模拟器、交互图表。今年夏天免费向所有用户开放。

更值得注意的是，这些生成的UI是有记忆和权限的。视频演示了一个”周末计划器”——它不仅实时生成，还能连接你的Gmail和日历，根据个人偏好（比如孩子喜欢动物、大儿子在学国际象棋）定制布局，修改后同步回日历。Google称之为”为你特定任务量身定制的小应用”——本质上是Search为你自动生成的、有状态的微型应用。

这三个变化合在一起，指向一个方向：搜索不再是一个”输入关键词→返回链接”的入口，而是一个”表达意图→获得定制化体验”的平台。

搜索框从一个受限空间变成了一个意图理解的界面。搜索结果从通用页面变成了AI实时生成的个性化交互。

25年前的搜索框定义了整个互联网的交互范式——”人找信息”。现在的Search正在定义一种新范式——”意图找体验”。正如Liz Reid在Keynote上说的：”Google Search is AI search through and through.”