Gemini 3.5 发布|Google I/O 2026 全整理

0 评论 19 浏览 0 收藏 22 分钟

Google I/O 2026以「agentic era」为主题,带来了一场AI技术盛宴。从Gemini 3.5 Flash的速度突破到Omni多模态世界模型,从Antigravity 2.0的agent开发平台到Gemini Spark私人助理,Google正在重塑AI生态。本文深度解析9大产品矩阵如何重构搜索、电商、创意工具与科研边界,揭示下一代AI基础设施的竞争逻辑。

今天凌晨,Google 的年度发布会 I/O 2026,主题为「agentic era」,发布了大量新品。在看完整场发布会后,带来了如下整理,九个章节逐个展开

Gemini 3.5 Flash·谷歌家的最新模型,全面超越 3.1 Pro,速度 4 倍于同级模型

Gemini Omni·世界模型,从任意输入生成任意输出,Omni Flash 今天上线

Antigravity 2.0·agent-first 开发平台,桌面应用 + CLI + SDK + Managed Agents

Gemini Spark·私人 AI agent,7×24 后台执行,新 $100/月 Ultra 计划

Search 改版·新搜索框、Search Agents、Generative UI

电商三件套·UCP 协议 + AP2 支付 + Universal Cart 统一购物车

Gemini App + 创意工具·Neural Expressive 重设计、Daily Brief、Flow、Pics、Stitch、Docs Live

智能眼镜·Samsung + Gentle Monster + Warby Parker,音频眼镜秋季上市

DeepMind 科学 + 安全·Gemini for Science、WeatherNext、SynthID 扩展

01 Gemini 3.5 Flash

Gemini 3.5 Flash 是今天新发布的模型,同步上线进了 Gemini app、Search AI Mode、Gemini API 并成了的默认模型

至于 3.5 Pro,目前还在内测中,预计下个月放出

Benchmark

Terminal-Bench 2.1 编码: 76.2%(3.1 Pro 70.3%)。GDPval-AA 真实任务: 1656 Elo(3.1 Pro 1314),跳了一档。MCP Atlas 工具调用: 83.6%(3.1 Pro 78.2%)。CharXiv 多模态推理: 84.2%。几乎所有指标都超过了自家上一代旗舰 3.1 Pro

Gemini 3.5 Flash vs 3.1 Pro 各项 benchmark 对比

速度

输出速度 289 tok/s,是同级别 frontier 模型的四倍。在 Antigravity 内部经过联合优化后,达到 12 倍。速度直接影响 agent 的可用性: agent 需要反复调用模型做规划、执行、验证,每一轮都要等模型回复,慢了就没法做实时任务

价格与上下文

API 定价 $1.50 / $9.00 per 1M token(输入/输出),缓存输入 $0.15。上下文窗口 1M token。这个价格比同水平 frontier 模型便宜一半以上,Google 给出的算法: 头部 Cloud 客户如果把 80% frontier 工作负载切到 3.5 Flash,每年省超 10 亿美元

Gemini 3.5 Flash 速度 vs 智能 四象限图

内部使用数据

Google 内部开发者三月份每天消耗 5000 亿 token,到现在已经超过 3 万亿 token/天,两个月翻了六倍。这个内部消耗形成了数据飞轮: 工程师用得越多,模型团队收到的真实反馈越多,3.5 的迭代速度就越快。375+ 外部客户各自处理超过 1 万亿 token

02 Gemini Omni: 世界模型

Gemini Omini 是一款世界模型(World Model),能够理解和模拟真实世界的物理规则、空间关系、因果链条

当然,你可以理解成这是生视频模型

Gemini Omni 把 Gemini 的推理能力和 Veo(视频)、Nano Banana(图像)、Genie(交互模拟)的生成能力合进一个统一模型

能做什么

各种物理效果的模拟,比之前有了跨越式提升。可以用一句 prompt 生成蛋白质折叠的黏土动画,模型会自动理解氨基酸链的折叠过程并准确呈现。支持对话式视频编辑: 拿自拍视频做输入,用自然语言改风格、加元素、换视角,保留原始动作,整个场景跟着变形

提示词:蛋白质折叠的黏土动画科普讲解,所有元素都由黏土制成,无手部出现,定格动画风格,科学准确。

为什么是「从任意输入到任意输出」

之前的生成模型是单模态的: Veo 把文本变视频,Nano Banana 把文本变图片。Omni 的目标是打通所有模态,输入可以是文本、图片、视频、音频的任意组合,输出也是。Google 从一开始就把 Gemini 做成多模态原生架构,现在这个架构开始体现优势

首发模型与可用性

今天发布 Gemini Omni Flash。已上线 Gemini app、Google Flow、YouTube Shorts。YouTube Shorts 用户免费。Gemini app 和 Flow 需要 AI Plus / Pro / Ultra 订阅。Omni Pro 即将推出

提示词:当人物触碰镜子时,让镜面像液体一样优美地泛起涟漪,同时人物的手臂变成具有反光效果的镜面材质

03 Antigravity 2.0

Google 的 agent-first 开发平台,从去年的 IDE 扩展成完整产品线。今天同时发布四个产品形态: 独立桌面应用(macOS / Linux / Windows)、CLI、SDK,加上 Gemini API 里的 Managed Agents

桌面应用: 不再是 IDE

Antigravity 2.0 的核心对象不是代码仓库: 它是一个 agent 编排桌面应用,围绕任务、项目、对话和产出物构建。为什么要和 IDE 分开? 因为真实的业务任务很少只涉及一个代码仓库,agent 需要跨文件夹、跨工具、跨项目地工作

支持多 agent 并行编排: 主 agent 定义并调用 subagent 做子任务,避免上下文窗口过载,允许并行。新增 Scheduled Tasks(定时任务)、JSON Hooks(行为拦截)、项目级权限。新增 slash 命令: /goal, /grill-me, /schedule, /browser 等

Antigravity 2.0 桌面应用界面

造操作系统的演示

用 3.5 Flash + subagent 机制,从零造了一个能运行的操作系统。12 小时,93 个 subagent 并行,15000 次模型请求,26 亿 token,不到 $1000 API 额度。现场在这个 OS 里跑了 Doom。之前在 3.1 Pro 上做不到这件事,是 3.5 Flash 的性能和成本结构让它变得可行

Antigravity 自建 OS 终端里跑 Doom

CLI: 替代 Gemini CLI

Antigravity CLI 用 Go 重写,共享 Antigravity 2.0 的 agent harness。保留 Agent Skills、Hooks、Subagents,Extensions 改名 Plugins。Gemini CLI 和 Code Assist IDE 插件 6 月 18 日停服,要求用户迁移到 Antigravity CLI

SDK + Managed Agents

Antigravity SDK 可以定义自定义 agent 并部署到自有基础设施。Managed Agents 是 Gemini API 里的新能力: 一次 API 调用即可启动 agent,跑在隔离的 Linux 沙箱环境里,可保留状态,通过 Interactions API 和 AI Studio 访问。Google 提供 agent 模板,开发者用 markdown 文件扩展指令和技能

AI Studio 更新

集成 Antigravity 编码 agent。新增手机端 AI Studio app,支持原生 Android / Kotlin / Jetpack Compose 应用生成,带浏览器内 Android 模拟器和 Play Console 内部测试轨直接发布。新增导出到 Antigravity 桌面应用。前两个 Cloud 部署免费

04 Gemini Spark

一句话: 你的私人 AI agent,关掉电脑也不停。跑在 Google Cloud 的专属虚拟机上,底层是 3.5 Flash + Antigravity Harness。可以从 Gemini app、邮件、聊天触达

怎么用

跨 Gmail、Drive、Sheets、Slides、Calendar 执行多步任务。演示了 block party 筹备: 自动从 Gmail 抓 RSVP,在 Sheets 建实时追踪表(Gmail 来新回复自动更新),生成 Slides 邀请函,从 Drive 抓业主委员会规定,给没报名的邻居写跟进邮件

支持用户自定义 Skills(上传 prompt 模板让邮件风格像自己)。语音 brain dump时能一口气丢多个任务,Spark 自动拆分成子线程。需要人工确认的操作会暂停等你批准

Gemini Spark: 多任务后台执行 + 实时同步到手机

Mac 版

在 Finder 选中文件,长按 Function 键语音口述,Gemini 读取 PDF 和图片后生成带表格的邮件。说了「Thursday」又改口「Friday」,自动修正。Mac 版由小团队用 Antigravity 从零开发,100 天做了 100+ 功能

定价与时间线

本周向 trusted tester 开放,下周以 beta 给美国 AI Ultra 订阅者。新推出 $100/月 Ultra 计划,然后最贵的套餐从 $250/月,降低到了$200/月。今年夏天进 Chrome 做浏览器 agentic 操作

今年晚些推出 Android Halo(手机端 agent 专属入口)。MCP 集成 即将上线,首批合作伙伴包括 Instacart

05 Search 改版

AI Mode 升级到 3.5 Flash。AI Mode 月活超 10 亿,查询量每季度翻倍。上季度 Search 查询总量创历史新高,AI Overviews 月活 25 亿

新搜索框

25 年来最大升级。搜索框可展开,支持文本、图片、文件、视频、Chrome Tab多模态输入。输入过程中 AI 实时给建议,帮你补充没想到的维度,远超传统自动补全。今天全球上线

新搜索框: 多模态输入 + AI 建议展开

AI Overviews + AI Mode 合流

之前 AI Overviews 和 AI Mode 是两个独立入口。现在合并: 在主搜索结果页看到 AI 回答后,直接滑入 AI Mode 追问,上下文保持连贯,链接和信息源越来越相关。桌面 + 移动端今天同步上线

Search Agents

在 Search 里创建 7×24 后台信息 agent。给复杂条件(P/E 低于 15 的生物科技股、正现金流、低负债),agent 自己拆计划、设触发器、接实时金融数据,条件满足时推综合分析并指向相关内容源。适用于找房、蹲球鞋发售等。可以同时开多个 agent,与 Gemini Spark 协同。今年夏天上线

Search Agent: 金融数据追踪 + 实时分析推送

Generative UI

搜索引擎内置 Antigravity 编码能力,用 3.5 Flash 实时写代码为每个问题生成定制化交互界面。搜索「黑洞怎么影响时空」,AI Overview 里直接出可调参数的 3D 模拟。搜索「周末全家活动」,现场生成 Weekend Planner 小应用(带日历同步、Maps 餐厅、天气、驾车时间)。可分享、可反复使用。今年夏天免费上线,订阅用户可自建

Generative UI: 从搜索问题到可交互 3D 可视化

06 电商: UCP + AP2 + Universal Cart

Agent 替你买东西,需要解决三个问题: 商家怎么跟 agent 对话(协议)、agent 怎么安全地付钱(支付)、购物车怎么跨平台统一(体验)

UCP(Universal Commerce Protocol)

开源协议,给 agent 和电商系统定义通用语言。覆盖从商品研究到结账到物流追踪的全流程。跟 Amazon、Meta、Microsoft、Salesforce、Stripe 共同开发

扩展到酒店、本地外卖、YouTube。即将在加拿大、澳大利亚、英国上线

AP2(Agent Payments Protocol)

你给 agent 设品牌、产品、预算的硬边界,条件满足才自动购买。用防篡改的数字授权书把你、商家、支付方三方拴在一起,隐私数据加密。退货时双方看同一份记录,这项功能,由 Gemini Spark 首发

Universal Cart

跨 Search、Gemini、YouTube、Gmail 的统一购物车。加入商品后后台自动追踪降价、库存、优惠。兼容性检查: 你选的处理器和主板插槽对不对,购物车替你把关。接入 Google Wallet,自动匹配信用卡优惠今年夏天美国上线 Search 和 Gemini app,YouTube / Gmail 随后

Universal Cart: 跨平台购物车 + 兼容性检查 + 价格追踪

07 Gemini App 重设计与创意工具

Neural Expressive

Gemini app 全面重设计。新设计语言: 流体动画、震动反馈、新排版。回答不再是文字墙,而是实时生成定制化卡片、交互图片、时间轴、嵌入视频。支持地区方言。Android / iOS / Web 今天全球上线

Neural Expressive

Daily Brief

每天早上自动从收件箱、日历、任务里摘要点,按主题分组,带下一步建议。今天上线给美国 AI Plus / Pro / Ultra 订阅者

Gemini Omni in App

付费订阅者今天可以在 app 里用 Omni 做视频创作和编辑。演示了从原始素材 + 参考图 + 风格指令生成音乐视频,转换视角到 360 度镜头,保留原始动作和物理感

Google Pics

Workspace 新产品。AI 图片创建和编辑,能识别画面物体关系,点击移除、调整大小、加文字、一键翻译。所有输出带 SynthID 水印。今年夏天

Stitch

UI 设计工具,过去一年全球用户生成了 1 亿+ UI 界面。新增语音实时协作,可导出代码或一键发布网站。今天全球上线

Google Flow

新增 Gemini Omni 支持,单张图片一次出 16 个不同机位的视频。Flow Agent(多任务并行)、Flow Tools(vibe-code 自建创意工具)。Flow Music 从录音生成歌曲 demo。今天全部上线

Docs Live

用语音对 Gemini 做 brain dump,自动从 Drive / Gmail 抓材料,生成、格式化、编辑文档。今年夏天给 Pro / Ultra 订阅者,同步到 Gmail 和 Keep

08 智能眼镜

Android XR 平台上的 Intelligent Eyewear,分两种: 音频眼镜(今年秋天上市)和显示眼镜(还在招募测试)

合作与设计

Samsung 做硬件,Gentle Monster 和 Warby Parker 做设计,首次公开各一款设计。兼容 Android 和 iOS

Warby Parker 款 + Gentle Monster 款智能眼镜设计

音频眼镜能力

Gemini 语音私密对话(骨传导)。免提导航(结合 Personal Intelligence 调出历史地点)。App 操作代理: 演示了在 Doordash 上点咖啡,Gemini 自动在手机上打开 app → 选品 → 确认订单

显示眼镜

镜片内小屏幕。可看 Uber 接车信息、实时翻译、Create My Widget 自定义界面。开发者已在创建显示体验,更多细节今年晚些时候公布

09 DeepMind 科学与内容安全

Gemini for Science

三个实验性工具: Literature Insights(跟踪新论文)、Computational Discovery(研究目标转可执行代码)、Hypothesis Generation(AI 生成科学假说)。搭配 Co-Scientist 多 agent 科研伙伴使用

AlphaEarth Foundations

行星级数字孪生,用于模拟森林退化、粮食安全等动态系统

WeatherNext

2025 年飓风季,提前三天预测五级飓风 Melissa 的快速增强和登陆路径,比传统模型更早更准。美国国家飓风中心已将其纳入常规预测工具

Isomorphic Labs

分子交互建模加速新药研发。多个项目进入临床前阶段,包括免疫疾病和癌症的潜在治疗方案

SynthID + Content Credentials

SynthID 已为 1000 亿张图片和视频 打上水印,外加 6 万年音频资产。OpenAI、Kakao、ElevenLabs 宣布采用 SynthID。Content Credentials Verification 扩展到 Search 和 Chrome,右键或圈选搜索即可验证。新增 AI Content Detection API 供第三方使用。安全 agent CodeMender 开放 API 测试

本文由人人都是产品经理作者【赛博禅心】,微信公众号:【赛博禅心】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!