Gemini 3.5 发布｜Google I/O 2026 全整理

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

Gemini 3.5 发布｜Google I/O 2026 全整理

赛博禅心

2026-05-20

1 评论 7450 浏览 6 收藏

22 分钟

Google I/O 2026以「agentic era」为主题，带来了一场AI技术盛宴。从Gemini 3.5 Flash的速度突破到Omni多模态世界模型，从Antigravity 2.0的agent开发平台到Gemini Spark私人助理，Google正在重塑AI生态。本文深度解析9大产品矩阵如何重构搜索、电商、创意工具与科研边界，揭示下一代AI基础设施的竞争逻辑。

今天凌晨，Google 的年度发布会 I/O 2026，主题为「agentic era」，发布了大量新品。在看完整场发布会后，带来了如下整理，九个章节逐个展开

✦Gemini 3.5 Flash·谷歌家的最新模型，全面超越 3.1 Pro，速度 4 倍于同级模型

✦Gemini Omni·世界模型，从任意输入生成任意输出，Omni Flash 今天上线

✦Antigravity 2.0·agent-first 开发平台，桌面应用 + CLI + SDK + Managed Agents

✦Gemini Spark·私人 AI agent，7×24 后台执行，新 $100/月 Ultra 计划

✦Search 改版·新搜索框、Search Agents、Generative UI

✦电商三件套·UCP 协议 + AP2 支付 + Universal Cart 统一购物车

✦Gemini App + 创意工具·Neural Expressive 重设计、Daily Brief、Flow、Pics、Stitch、Docs Live

✦智能眼镜·Samsung + Gentle Monster + Warby Parker，音频眼镜秋季上市

✦DeepMind 科学 + 安全·Gemini for Science、WeatherNext、SynthID 扩展

01 Gemini 3.5 Flash

Gemini 3.5 Flash 是今天新发布的模型，同步上线进了 Gemini app、Search AI Mode、Gemini API 并成了的默认模型

至于 3.5 Pro，目前还在内测中，预计下个月放出

Benchmark

Terminal-Bench 2.1 编码: 76.2%(3.1 Pro 70.3%)。GDPval-AA 真实任务: 1656 Elo(3.1 Pro 1314)，跳了一档。MCP Atlas 工具调用: 83.6%(3.1 Pro 78.2%)。CharXiv 多模态推理: 84.2%。几乎所有指标都超过了自家上一代旗舰 3.1 Pro

Gemini 3.5 Flash vs 3.1 Pro 各项 benchmark 对比

速度

输出速度 289 tok/s，是同级别 frontier 模型的四倍。在 Antigravity 内部经过联合优化后，达到 12 倍。速度直接影响 agent 的可用性： agent 需要反复调用模型做规划、执行、验证，每一轮都要等模型回复，慢了就没法做实时任务

价格与上下文

API 定价 $1.50 / $9.00 per 1M token(输入/输出)，缓存输入 $0.15。上下文窗口 1M token。这个价格比同水平 frontier 模型便宜一半以上，Google 给出的算法：头部 Cloud 客户如果把 80% frontier 工作负载切到 3.5 Flash,每年省超 10 亿美元

Gemini 3.5 Flash 速度 vs 智能四象限图

内部使用数据

Google 内部开发者三月份每天消耗 5000 亿 token，到现在已经超过 3 万亿 token/天，两个月翻了六倍。这个内部消耗形成了数据飞轮：工程师用得越多，模型团队收到的真实反馈越多，3.5 的迭代速度就越快。375+ 外部客户各自处理超过 1 万亿 token

02 Gemini Omni: 世界模型

Gemini Omini 是一款世界模型(World Model)，能够理解和模拟真实世界的物理规则、空间关系、因果链条

当然，你可以理解成这是生视频模型

Gemini Omni 把 Gemini 的推理能力和 Veo(视频)、Nano Banana(图像)、Genie(交互模拟)的生成能力合进一个统一模型

能做什么

各种物理效果的模拟，比之前有了跨越式提升。可以用一句 prompt 生成蛋白质折叠的黏土动画，模型会自动理解氨基酸链的折叠过程并准确呈现。支持对话式视频编辑: 拿自拍视频做输入，用自然语言改风格、加元素、换视角，保留原始动作，整个场景跟着变形

提示词：蛋白质折叠的黏土动画科普讲解，所有元素都由黏土制成，无手部出现，定格动画风格，科学准确。

为什么是「从任意输入到任意输出」

之前的生成模型是单模态的： Veo 把文本变视频，Nano Banana 把文本变图片。Omni 的目标是打通所有模态，输入可以是文本、图片、视频、音频的任意组合，输出也是。Google 从一开始就把 Gemini 做成多模态原生架构，现在这个架构开始体现优势

首发模型与可用性

今天发布 Gemini Omni Flash。已上线 Gemini app、Google Flow、YouTube Shorts。YouTube Shorts 用户免费。Gemini app 和 Flow 需要 AI Plus / Pro / Ultra 订阅。Omni Pro 即将推出

提示词：当人物触碰镜子时，让镜面像液体一样优美地泛起涟漪，同时人物的手臂变成具有反光效果的镜面材质

03 Antigravity 2.0

Google 的 agent-first 开发平台，从去年的 IDE 扩展成完整产品线。今天同时发布四个产品形态: 独立桌面应用(macOS / Linux / Windows)、CLI、SDK，加上 Gemini API 里的 Managed Agents

桌面应用：不再是 IDE

Antigravity 2.0 的核心对象不是代码仓库: 它是一个 agent 编排桌面应用，围绕任务、项目、对话和产出物构建。为什么要和 IDE 分开？因为真实的业务任务很少只涉及一个代码仓库，agent 需要跨文件夹、跨工具、跨项目地工作

支持多 agent 并行编排: 主 agent 定义并调用 subagent 做子任务，避免上下文窗口过载，允许并行。新增 Scheduled Tasks(定时任务)、JSON Hooks(行为拦截)、项目级权限。新增 slash 命令： /goal, /grill-me, /schedule, /browser 等

Antigravity 2.0 桌面应用界面

造操作系统的演示

用 3.5 Flash + subagent 机制，从零造了一个能运行的操作系统。12 小时,93 个 subagent 并行，15000 次模型请求，26 亿 token，不到 $1000 API 额度。现场在这个 OS 里跑了 Doom。之前在 3.1 Pro 上做不到这件事，是 3.5 Flash 的性能和成本结构让它变得可行

Antigravity 自建 OS 终端里跑 Doom

CLI: 替代 Gemini CLI

Antigravity CLI 用 Go 重写，共享 Antigravity 2.0 的 agent harness。保留 Agent Skills、Hooks、Subagents，Extensions 改名 Plugins。Gemini CLI 和 Code Assist IDE 插件 6 月 18 日停服，要求用户迁移到 Antigravity CLI

SDK + Managed Agents

Antigravity SDK 可以定义自定义 agent 并部署到自有基础设施。Managed Agents 是 Gemini API 里的新能力：一次 API 调用即可启动 agent，跑在隔离的 Linux 沙箱环境里，可保留状态，通过 Interactions API 和 AI Studio 访问。Google 提供 agent 模板，开发者用 markdown 文件扩展指令和技能

AI Studio 更新

集成 Antigravity 编码 agent。新增手机端 AI Studio app，支持原生 Android / Kotlin / Jetpack Compose 应用生成，带浏览器内 Android 模拟器和 Play Console 内部测试轨直接发布。新增导出到 Antigravity 桌面应用。前两个 Cloud 部署免费

04 Gemini Spark

一句话：你的私人 AI agent，关掉电脑也不停。跑在 Google Cloud 的专属虚拟机上，底层是 3.5 Flash + Antigravity Harness。可以从 Gemini app、邮件、聊天触达

怎么用

跨 Gmail、Drive、Sheets、Slides、Calendar 执行多步任务。演示了 block party 筹备：自动从 Gmail 抓 RSVP，在 Sheets 建实时追踪表(Gmail 来新回复自动更新)，生成 Slides 邀请函，从 Drive 抓业主委员会规定，给没报名的邻居写跟进邮件

支持用户自定义 Skills(上传 prompt 模板让邮件风格像自己)。语音 brain dump时能一口气丢多个任务，Spark 自动拆分成子线程。需要人工确认的操作会暂停等你批准

Gemini Spark: 多任务后台执行 + 实时同步到手机

Mac 版

在 Finder 选中文件，长按 Function 键语音口述，Gemini 读取 PDF 和图片后生成带表格的邮件。说了「Thursday」又改口「Friday」，自动修正。Mac 版由小团队用 Antigravity 从零开发，100 天做了 100+ 功能

定价与时间线

本周向 trusted tester 开放，下周以 beta 给美国 AI Ultra 订阅者。新推出 $100/月 Ultra 计划，然后最贵的套餐从 $250/月，降低到了$200/月。今年夏天进 Chrome 做浏览器 agentic 操作

今年晚些推出 Android Halo(手机端 agent 专属入口)。MCP 集成 即将上线，首批合作伙伴包括 Instacart

05 Search 改版

AI Mode 升级到 3.5 Flash。AI Mode 月活超 10 亿，查询量每季度翻倍。上季度 Search 查询总量创历史新高，AI Overviews 月活 25 亿

新搜索框

25 年来最大升级。搜索框可展开，支持文本、图片、文件、视频、Chrome Tab多模态输入。输入过程中 AI 实时给建议，帮你补充没想到的维度，远超传统自动补全。今天全球上线

新搜索框：多模态输入 + AI 建议展开

AI Overviews + AI Mode 合流

之前 AI Overviews 和 AI Mode 是两个独立入口。现在合并：在主搜索结果页看到 AI 回答后，直接滑入 AI Mode 追问，上下文保持连贯，链接和信息源越来越相关。桌面 + 移动端今天同步上线

Search Agents

在 Search 里创建 7×24 后台信息 agent。给复杂条件(P/E 低于 15 的生物科技股、正现金流、低负债)，agent 自己拆计划、设触发器、接实时金融数据，条件满足时推综合分析并指向相关内容源。适用于找房、蹲球鞋发售等。可以同时开多个 agent，与 Gemini Spark 协同。今年夏天上线

Search Agent: 金融数据追踪 + 实时分析推送

Generative UI

搜索引擎内置 Antigravity 编码能力，用 3.5 Flash 实时写代码为每个问题生成定制化交互界面。搜索「黑洞怎么影响时空」，AI Overview 里直接出可调参数的 3D 模拟。搜索「周末全家活动」，现场生成 Weekend Planner 小应用(带日历同步、Maps 餐厅、天气、驾车时间)。可分享、可反复使用。今年夏天免费上线，订阅用户可自建

Generative UI: 从搜索问题到可交互 3D 可视化

06 电商： UCP + AP2 + Universal Cart

Agent 替你买东西，需要解决三个问题：商家怎么跟 agent 对话(协议)、agent 怎么安全地付钱(支付)、购物车怎么跨平台统一(体验)

UCP(Universal Commerce Protocol)

开源协议，给 agent 和电商系统定义通用语言。覆盖从商品研究到结账到物流追踪的全流程。跟 Amazon、Meta、Microsoft、Salesforce、Stripe 共同开发

扩展到酒店、本地外卖、YouTube。即将在加拿大、澳大利亚、英国上线

AP2(Agent Payments Protocol)

你给 agent 设品牌、产品、预算的硬边界，条件满足才自动购买。用防篡改的数字授权书把你、商家、支付方三方拴在一起，隐私数据加密。退货时双方看同一份记录，这项功能，由 Gemini Spark 首发

Universal Cart

跨 Search、Gemini、YouTube、Gmail 的统一购物车。加入商品后后台自动追踪降价、库存、优惠。兼容性检查：你选的处理器和主板插槽对不对，购物车替你把关。接入 Google Wallet，自动匹配信用卡优惠。今年夏天美国上线 Search 和 Gemini app，YouTube / Gmail 随后

Universal Cart: 跨平台购物车 + 兼容性检查 + 价格追踪

07 Gemini App 重设计与创意工具

Neural Expressive

Gemini app 全面重设计。新设计语言：流体动画、震动反馈、新排版。回答不再是文字墙，而是实时生成定制化卡片、交互图片、时间轴、嵌入视频。支持地区方言。Android / iOS / Web 今天全球上线

Neural Expressive

Daily Brief

每天早上自动从收件箱、日历、任务里摘要点，按主题分组，带下一步建议。今天上线给美国 AI Plus / Pro / Ultra 订阅者

Gemini Omni in App

付费订阅者今天可以在 app 里用 Omni 做视频创作和编辑。演示了从原始素材 + 参考图 + 风格指令生成音乐视频，转换视角到 360 度镜头，保留原始动作和物理感

Google Pics

Workspace 新产品。AI 图片创建和编辑，能识别画面物体关系，点击移除、调整大小、加文字、一键翻译。所有输出带 SynthID 水印。今年夏天

Stitch

UI 设计工具，过去一年全球用户生成了 1 亿+ UI 界面。新增语音实时协作，可导出代码或一键发布网站。今天全球上线

Google Flow

新增 Gemini Omni 支持，单张图片一次出 16 个不同机位的视频。Flow Agent(多任务并行)、Flow Tools(vibe-code 自建创意工具)。Flow Music 从录音生成歌曲 demo。今天全部上线

Docs Live

用语音对 Gemini 做 brain dump，自动从 Drive / Gmail 抓材料，生成、格式化、编辑文档。今年夏天给 Pro / Ultra 订阅者，同步到 Gmail 和 Keep

08 智能眼镜

Android XR 平台上的 Intelligent Eyewear，分两种： 音频眼镜(今年秋天上市)和显示眼镜(还在招募测试)

合作与设计

Samsung 做硬件，Gentle Monster 和 Warby Parker 做设计，首次公开各一款设计。兼容 Android 和 iOS

Warby Parker 款 + Gentle Monster 款智能眼镜设计

音频眼镜能力

Gemini 语音私密对话(骨传导)。免提导航(结合 Personal Intelligence 调出历史地点)。App 操作代理: 演示了在 Doordash 上点咖啡，Gemini 自动在手机上打开 app → 选品 → 确认订单

显示眼镜

镜片内小屏幕。可看 Uber 接车信息、实时翻译、Create My Widget 自定义界面。开发者已在创建显示体验，更多细节今年晚些时候公布

09 DeepMind 科学与内容安全

Gemini for Science

三个实验性工具： Literature Insights(跟踪新论文)、Computational Discovery(研究目标转可执行代码)、Hypothesis Generation(AI 生成科学假说)。搭配 Co-Scientist 多 agent 科研伙伴使用

AlphaEarth Foundations

行星级数字孪生，用于模拟森林退化、粮食安全等动态系统

WeatherNext

2025 年飓风季，提前三天预测五级飓风 Melissa 的快速增强和登陆路径，比传统模型更早更准。美国国家飓风中心已将其纳入常规预测工具

Isomorphic Labs

分子交互建模加速新药研发。多个项目进入临床前阶段，包括免疫疾病和癌症的潜在治疗方案

SynthID + Content Credentials

SynthID 已为 1000 亿张图片和视频 打上水印，外加 6 万年音频资产。OpenAI、Kakao、ElevenLabs 宣布采用 SynthID。Content Credentials Verification 扩展到 Search 和 Chrome，右键或圈选搜索即可验证。新增 AI Content Detection API 供第三方使用。安全 agent CodeMender 开放 API 测试

本文由人人都是产品经理作者【赛博禅心】，微信公众号：【赛博禅心】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App