Google I/O 2026 AI篇:当Google说”AI变得更聪明”,它其实在说”界面可以消失了”
Google I/O 2026释放了一个被多数人忽略的革命信号——AI正在消灭界面。从跨平台购物的Universal Cart到24/7运行的Gemini Spark,演示的核心不是AI变得更聪明,而是用户不再需要操作任何App。当AI能自主理解意图、跨越应用边界完成任务时,传统界面这个中间层正在被彻底重构。本文深度解析Google如何通过Gemini Omni、Antigravity 2.0和Generative UI,实现从Function UI到Intent UI的范式转移。

你以为AI变得更聪明了,其实是界面正在被取消
Google I/O 2026刚结束。
铺天盖地的报道都在讲Gemini 3.5有多强、Google眼镜有多轻、三星联名有多好看。朋友圈里设计师们转发着”AI改变世界”的感慨,好像这又是一年一度的技术春晚。
但我注意到了一个被严重低估的信号。
Google在这场发布会上做的事,本质上不是”让AI变得更好用”。而是”让界面变得没必要”。
01 两个demo,一个信号
Google I/O的Keynote上,有两个demo引起了我的注意。
第一个是Universal Cart。
演示者在Google上选中了几件商品,来自不同商家——Nike和Target。这些商品被自动归入同一个购物车,一键结账。跨商家、跨平台,一个购物车搞定。
听起来像是”更方便的购物功能”。但Universal Cart真正厉害的不是聚合购物车本身,而是它的底层逻辑:AI理解了你的购买意图,主动跨越了商家边界。 它甚至能检测购物车里的商品是否兼容(比如组装游戏PC时,提醒你某些配件不匹配),还能自动识别Google Wallet里的会员权益帮你省钱。
第二个是Gemini Spark的街区派对demo。
Spark接到任务后,自动追踪邮件里的派对RSVP回复,维护Google Sheets的报名表,给没回复的邻居生成提醒邮件草稿,甚至自动生成Google Slides宣传页——整个过程在云端24/7运行,不需要你盯着,手机关了也不影响。
这两个demo有一个共同点:用户没有操作任何App。AI自己理解了意图,自己完成了跨应用、跨步骤的任务。
我们习惯了用”更聪明”来描述AI进步——Siri更聪明了、ChatGPT更聪明了、Gemini更聪明了。这个框架让我们以为:AI进步 = 现有交互方式 + AI增强。就像给一辆马车换了一匹更快的马。
但这两个demo展示的东西,根本不是”更快的马”。
Gemini Intelligence把AI嵌入Android系统底层,跨应用理解屏幕上下文、自主完成任务。Gemini Spark基于3.5 Flash在云端虚拟机上24/7运行,替你执行跨应用操作。
这意味着:
- 你不需要”找到”购物App
- 你不需要”输入”想买的书
- 你不需要”点击”加入购物车
- 你不需要盯着邮件等回复
你只需要表达一个意图。剩下的,AI自己完成。
这不叫”更聪明的助手”。这叫消灭中间层。
AI Agent进入你的设备,不是给你的界面装了一个更聪明的后台。而是告诉你——界面这个中间层,可以被革命了。
02 Gemini Omni:从生成内容到理解世界
Google DeepMind CEO Demis Hassabis发布了Gemini Omni——一个全模态(Omni-modal)模型。Hassabis强调Gemini从一开始就是原生多模态的,Omni率先在视频生成和编辑方面实现突破,后续将开放所有模态的生成能力。
官方demo里,用户拍了一段普通视频,然后通过对话让AI修改场景中的元素——换个背景、加个角色、改变风格。Hassabis强调,Omni对物理世界的理解比之前的视频生成模型更深入:它理解重力、动能、流体动力学。生成的视频不只是”看起来像”,而是”符合物理规律”。
Omni还允许用户将真实的自拍视频作为创作画布——通过对话式指令即可实时修改视频中的风格、背景,甚至添加复杂的物理特效,无需重新拍摄或做复杂的后期处理。
所有Omni生成的视频都会打上SynthID水印——Google同时宣布OpenAI、Kakao、ElevenLabs也在采用这套水印标准。
Gemini Omni Flash即日起在谷歌全线产品中推出,目前已在Gemini App和Google Flow中可用,后续将逐步接入YouTube等更多平台。
这听起来像是视频创作者的工具。但我认为它的意义不止于此。
Omni代表了一个方向:AI正在从”理解文本”走向”模拟现实”。 当模型能理解物理规律、能生成可交互的视频内容,未来的交互界面可能不是一个静态页面——而是一个AI实时生成的、可对话修改的动态场景。
03 Antigravity 2.0:当AI开始自己写代码
Antigravity最初是Google的AI编程环境。在I/O 2026上,它升级为2.0版本——一个 “完全代理优先”(unabashedly agent-first) 的独立桌面应用程序。它不再只是写代码,而是让用户通过对话与多个Agent协作,编排任务、管理工作流。
两个关键数据:
- 93个子Agent组成的团队,并行工作12小时,从零编写了一个包含调度程序、内存管理和文件系统的完整操作系统。整个过程处理了2.6亿个token,API调用成本不到1000美元。
- Gemini 3.5 Flash本身比其他前沿模型快4倍,而在Antigravity 2.0平台中经过深度优化后,输出速度达到了其他前沿模型的12倍。
更重要的是,Google把Antigravity的Agent编码能力直接塞进了Search。
这意味着:当你在搜索框问”黑洞如何影响时空”,搜索不再只返回文字和链接——它会用Antigravity实时编写代码,生成一个交互式的物理模型,让你直接操作和探索。Google把这叫做”Generative UI”——搜索从零开始规划理想响应、设计布局,并调用Antigravity代理编码引擎在安全容器中执行代码。
这是整场发布会里对设计师影响最深的一个信号:界面不再是设计出来的,而是AI实时生成的。
传统的设计流程是:设计师定义布局 → 开发实现 → 用户使用。
Generative UI的流程是:用户提问 → AI理解意图 → AI实时生成最合适的界面 → 用户直接操作。
04 Gemini Spark + Android Halo
Gemini Spark是这场发布会里最核心的Agent产品。
它由Gemini 3.5和Antigravity团队开发的Agent编排框架共同驱动,运行在Google Cloud的专用虚拟机上,24/7在线——即使你关了电脑、锁了手机,它仍然在后台替你跑任务。你可以通过Gemini App、邮件或聊天与它交互。
Spark之所以能处理跨应用的复杂长任务,是因为它支持MCP(Model Context Protocol,模型上下文协议) 。通过MCP,Spark不仅能调用Google全家桶(Gmail、Docs、Sheets、Calendar……),未来还能无缝接入第三方工具(如Instacart等)。
Keynote上的demo展示了Spark的街区派对场景:追踪RSVP、维护报名表、生成邮件草稿和Slides宣传页。Spark在设计上有一个明确的边界:涉及”高风险”操作(比如发邮件、付款),它会先请求用户确认。这背后依托的是AP2(Agent Payments Protocol,代理支付协议)——用户可以设定品牌边界和预算限制(比如只准买某个品牌的电脑,预算不超过1000美元),让信任问题有了技术支撑。
Google还预告了一个配套的界面——Android Halo。
Google官方只说了一句话:它是Android上的”一个新的UI空间”,用来”查看Agent的实时更新和任务进度”。官方将其定位为”为你的Agent打造的专用大本营(dedicated home base)”。目前展示的唯一视觉线索,是状态栏右上角一个发光圆圈渐变为Gemini火花图标的动画。更具体的交互方式、是否支持操作还是纯显示,Google没有展开——只说”今年晚些时候分享更多细节”。
但我认为,仅从这些有限的信息,就已经能读出一个值得关注的信号:
它是一个”状态层”,不是”操作层”。
Google没有说Halo让你”操作”Agent。它说的是”查看”Agent的状态——在做什么、进度如何。视频中甚至提到你可以”放下手机让它干活”,而Halo是让你”check in”——扫一眼就知道进度。而且它是系统级的:无论你在哪个App里,状态指示始终在屏幕顶部,不需要切回Gemini App。
这个方向意味着什么?我的判断是:
传统App的交互逻辑是”让用户进入界面→操作→得到结果”。但Agent时代,用户不需要”进入”任何界面——Agent在后台干活,用户只需要知道它干到哪了。
所以,Agentic Interface的核心设计问题,可能不是”如何让用户找到功能”,而是”如何让用户信任AI在替他做事”。
05 Google Search:25年来最大的搜索框升级
Google Search在I/O 2026上做了几件大事。背景是:AI Mode月活跃用户已突破10亿,搜索查询量上个季度创下历史新高。在这个基础上,Google推出了一套被称为”25年来最大”的升级。
第一,搜索框重构。
Google搜索负责人Liz Reid称之为”25年来搜索框最大的升级”。新的智能搜索框不再是一个简单的文本输入框——它能处理极度具体、细节丰富的真实对话,而非破碎的关键词组合。比如你不再只搜”徒步路线”,而是直接问”带狗、有风景、有停车位午餐的徒步一日游行程”。搜索框会用AI驱动的建议帮你完善问题——不是传统的自动补全,而是帮你把模糊的想法变成精确的查询。
你还可以用多种模态搜索:文本、图片、视频、文件,甚至Chrome标签页,都可以作为搜索输入。
第二,信息智能体(Information Agents)。
你可以在Search中创建多个AI Agent,让它们在后台24/7监控你关心的信息,配合Gemini Spark一起工作。视频里展示了三个具体场景:
- 金融代理:监控特定财务指标(如PE低于15、现金流为正的生物技术股),关键时刻推送合成后的情报
- 租房代理:持续扫描全网符合光线、位置条件的房源
- 球鞋代理:追踪特定运动员的联名款发布
到了关键时刻,Agent会主动推送定制化的方案。
第三,Generative UI。
这和前面Antigravity部分提到的是同一件事,但放在Search的语境下更有意思:Search用Antigravity的能力,根据你的具体问题实时生成自定义布局和交互组件——数据可视化、模拟器、交互图表。今年夏天免费向所有用户开放。
更值得注意的是,这些生成的UI是有记忆和权限的。视频演示了一个”周末计划器”——它不仅实时生成,还能连接你的Gmail和日历,根据个人偏好(比如孩子喜欢动物、大儿子在学国际象棋)定制布局,修改后同步回日历。Google称之为”为你特定任务量身定制的小应用”——本质上是Search为你自动生成的、有状态的微型应用。
这三个变化合在一起,指向一个方向:搜索不再是一个”输入关键词→返回链接”的入口,而是一个”表达意图→获得定制化体验”的平台。
搜索框从一个受限空间变成了一个意图理解的界面。搜索结果从通用页面变成了AI实时生成的个性化交互。
25年前的搜索框定义了整个互联网的交互范式——”人找信息”。现在的Search正在定义一种新范式——”意图找体验”。正如Liz Reid在Keynote上说的:”Google Search is AI search through and through.”
06 从Function UI到Intent UI:范式转移的三个新问题
好,说了这么多产品,让我把视角拉回到设计本身。
这次Google I/O的所有发布,合在一起指向一个结论:
我们正在从Function UI(功能界面)转向Intent UI(意图界面)。
Function UI的逻辑是:用户知道要做什么 → 找到对应界面 → 执行操作 → 获得结果。
Intent UI的逻辑是:用户表达意图 → AI理解意图 → AI执行任务 → 呈现结果/请求确认。
这个转变带来的设计挑战,和传统交互设计完全不同。
第一个新问题:状态反馈设计。
在Function UI里,状态反馈很简单——按钮按下、加载中、完成。这些反馈告诉用户”系统正在响应你的操作”。
在Intent UI里,AI可能需要执行一个跨应用、多步骤的任务。你怎么让用户知道”AI正在做什么、做到哪一步了”?
Android Halo给出了一个初步方向:系统级状态指示。但这只是起点。Agent时代的状态反馈,需要全新的设计范式。
第二个新问题:确认机制设计。
当AI能替你做事的时候,”确认”这个交互模式需要被重新设计。
你不能每一步都让用户确认,否则AI就没有意义了。
你也不能一步都不确认,否则用户会失去控制感。
Gemini Spark的做法是:高风险操作(发邮件、付款)需要确认,其余自动执行。但”高风险”的边界怎么划?不同场景的标准肯定不一样。
确认的粒度、时机、方式——这是Agent设计里的核心难题。
第三个新问题:控制权平衡。
用户需要在”让AI做事”和”保持控制感”之间找到平衡。
这个平衡点在哪里?怎么让用户觉得”AI在帮我,不是在替我做主”?
07 AI产品需要新的设计语言:神经表达 (Neural Expressive)
Google I/O 发布了一个极易被设计师忽略的重磅信息:Gemini App 的交互体验被从底层彻底重构。
这套全新的设计语言被命名为 “Neural Expressive”(神经表达)”.其核心特征包括:
- 流体动效与鲜艳色彩:彻底告别静态,让界面呈现出动态渐变与沉浸式过渡
- 多维感知反馈:引入全新的排版系统,并首次在全应用内深度整合触感反馈(Haptics)
- 实时响应布局:AI 不再输出枯燥的文字墙,而是像生成式 UI 一样,在用户面前实时、动态地排版交互图像、时间轴和视频
为什么要叫“神经表达”?
因为这套语言的目标是:让界面反映“思维的流动”。
在传统 UI 中,界面是静态且被动的。但在“神经表达”体系下,界面变成了“活的智能体”。它的动效反映了 AI 的处理状态,它的实时布局暗示了 AI 正在“思考”如何最优化地呈现结果,而触感与发光效果则让用户感觉到 AI 正在“感知”输入。
界面不再只是承载功能的容器,而是智能体的化身。你设计的不再是一个页面,而是一个“有灵魂、有思维的交互场”。
这一方向对于 XR(空间计算)设计师尤为关键。XR 追求的沉浸感天然需要这种具有“生命律动”的 UI。神经表达中强调的玻璃态、光晕以及非线性的流体反馈,与空间计算的视觉逻辑高度一致,标志着 AI 原生交互时代的正式到来。
08 最后说几句
Google I/O 2026用一整场发布会告诉行业一件事:
AI Agent不是”更聪明的工具”。它是来取代”工具”这个概念的。
当Gemini Intelligence嵌入系统底层,当Spark能24/7替你做事,当Search能实时生成个性化界面。
传统的”人找界面,界面找功能”的交互逻辑,已经开始动摇了。
这不是一年、两年才会发生的变化。这是正在发生的变化。
对于设计师来说,这既是挑战也是机会。
挑战在于:你熟悉的那些设计范式,正在被重新定义。
机会在于:谁能先理解Intent UI的本质,谁就能在下一个时代占领先机。
参考来源:
Google I/O 2026 主题演讲
作者:Vicky。公众号:Vicky Design Studio
本文由 @Vicky。 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!

起点课堂会员权益




