别被名字绕晕了!一文看懂谷歌 AI 全家桶
谷歌AI产品矩阵的迭代速度令人眼花缭乱,Gemini、Nano Banana等工具如同一个庞大的连锁餐饮帝国,各有分工却又紧密相连。本文将用全景视角解析2026年初谷歌AI的三大模型家族与六大门店,带你看懂中央厨房的‘主厨’配置与各门店的特色菜单,助你在AI浪潮中不再迷路。

今天是2026年1月14日。 我觉得有必要记下这个时间,因为AI产品的更新速度实在太快了。
谷歌似乎每隔几周就要给自家的 AI 换个名字,或者在某个意想不到的角落塞进一个“紫色星标”。指不定我这篇稿子刚发出来,它又搞出了什么新动作。
你可能听说过,或者正在使用这些工具:Gemini、NotebookLM、Nano Banana……但如果我问你:它们彼此是什么关系?谁是底层模型?谁是独立产品?谁又只是某个功能的“马甲”?
大概率,你也会陷入短暂的沉默。
谷歌的 AI 体系非常庞大、且更新频繁,以至于普通用户几乎不可能一次性看清全貌。
所以,我尝试梳理了这份截至 2026 年初的“谷歌 AI 全家桶”,带你看看这些 AI 产品之间真实的生态关系。
01 拒绝迷路:一张全景图,带你走入谷歌 AI 梦工厂
为了拆解这个复杂的体系,我们先看一张全景图。

为了便于大家理解,我们不妨把谷歌的 AI 体系想象成一家巨大的连锁餐饮集团。
要完成一次完整的“用餐体验”,通常需要三个环节:
- 产品层(连锁门店):这是你真正接触谷歌AI的地方。谷歌 AI 餐饮集团有多个不同的门店:有面向所有人的“旗舰店”(Gemini Web / App),有专注办公场景的“写字楼店”(Gemini for Workspace),也有只做深度阅读和研究的“主题店”(NotebookLM)等。
- 工具层(特色菜单):菜单决定了你能吃到什么。有些菜(工具)是全店通用的,比如“自动摘要”;有些菜则是特定门店的招牌,比如 NotebookLM 里的“音频对话”。还有一些更特别,它们是“隐藏款”或“季节限定”,只对特定会员开放。
- 模型层(中央厨房与主厨):无论你在哪家店(产品)、点什么菜(工具),真正动手做菜的,都是同一个中央厨房的厨师们。厨房里坐镇着三支实力雄厚的“厨师团队”,分别负责文字与逻辑、图像与视觉,以及视频创作。
如果你已经接受了这个“连锁餐饮集团”的比喻,事情就变得简单了。让我们先从厨房里真正干活的厨师团队们说起。
02 揭秘中央厨房:谁才是幕后“主厨”?
在谷歌的世界里,真正决定 AI 能力上限的,并不是某个产品界面,而是藏在后台的底层模型(LLM)。它们就像中央厨房里的厨师团队,决定了菜能不能做好、好到什么程度。
截至目前,谷歌“中央厨房”里,主要由三大家族坐镇,各自分工明确。

1. Gemini 家族:谷歌 AI 的“通用大脑”
这是谷歌最核心、也最重要的一支 LLM 家族。推理、写作、规划、理解复杂指令——几乎所有“像人一样思考”的能力,都来自 Gemini。
不同版本的 Gemini,决定的是思考深度、速度和成本。
- Gemini 3 Deep Think(首席):2026 年新晋王牌,专门用来解决人类最前沿的数学、科学和哲学难题。它支持深度自我校对,目前只对付费用户开放。
- Gemini 3 Pro(高级):记忆力惊人的学霸型选手,可以一口气读完几本法律合同,或一个超大型代码库。同样属于付费用户专属。
- Gemini 3 Flash(中级):这是 2026 年的默认主力。最大的特点是快,而且具备很强的 Agent(智能代理)能力,能一边写代码,一边运行测试、修正结果。
- Gemini 2.5 Flash / 3 Flash Lite(初级):反应快、成本低,最适合处理润色邮件、简单整理这类日常任务。
2. Nano Banana 家族:实力惊人的“视觉天才”
如果说 Gemini 负责“思考”,那 Nano Banana 负责的就是“看”和“画”,即图像与视觉,目前主要有两个版本。
- Nano Banana Pro:接近专业设计师水准,尤其擅长在图片中生成精准、可用的文字排版,甚至能画出结构复杂的物理原理图。
- Nano Banana:创意快手。擅长快速修图、换背景,并能保证同一个角色在不同生成的图片中长相高度一致。
你知道吗?关于这个LLM的名字,其实有个有趣的小故事。
它的官方名称原本是 Gemini Image(前身是 Imagen)。
2025 年 8 月,谷歌在做一次匿名盲测时,一位名叫 Nina 的产品经理在凌晨两点半,随手给模型填了一个占位名——Nano Banana。
没想到,这个模型生成的图像质量高得离谱,瞬间引爆社交媒体。后来,谷歌干脆顺水推舟,把这个名字留了下来。
3. Veo 家族:最烧钱的“金牌导演”
Veo 家族负责视频创作,是目前谷歌 AI 体系里算力消耗最高、最烧钱的一支团队。
简单说,它们干的是“把电影拍出来”的活。
- Veo 3.1:全能旗舰,用于最终成品渲染。支持 4K 高清视频,包含对白、音效和完整镜头语言。你只需要给它第一帧和最后一帧,它就能自动补全中间的所有剧情。
- Veo 3.1 Fast:偏向效率和预览,适合快速试错和反复迭代,用来“先看看效果对不对”。
03 六大门店探店:怎么“点菜”最专业?
你是从哪一家门店走进谷歌 AI 的?
对大多数人来说,也许是一次不经意。谷歌AI 的 “紫色星标” 悄咪咪地出现在了很多地方,你还没意识到,AI 就开始为你工作了。
实际上,截至目前,谷歌一共对外提供了 6 个主要的 AI 产品。它们面向不同的人群、解决不同的问题,就像同一餐饮集团下定位各异的六家门店。

门店一:Google Search AI —— 搜索快捷分店
这是整套体系中客流量最大、存在感却最低的一家门店。你几乎不需要学习,也不需要改变任何习惯。
它就藏在 Google 搜索里(https://www.google.com/search)。
当你像往常一样,在搜索框里输入问题时,Google Search AI 就已经在后台开始工作了。

这家门店有两道招牌菜(工具):
AI Overview:
这是现在 Google 搜索的默认形态。过去,我们需要自己点开多个网页、反复对比、手动提炼信息;而现在,AI Overview 会直接帮你把相关网页通读一遍,然后给出一段总结。
由于它追求的是极低延迟和即时反馈,所以后台调用的通常是 Gemini 3 Flash 或 Gemini 2.5 Flash 这样的高速模型。
AI Mode:
这是搜索栏下方的一个独立标签页,需要你主动点进去。它更像一个“搜索专用的对话模式”,特别擅长处理跨多个网页、需要对比和推理的问题。比如,你可以直接让它「对比三家不同保险公司的最新条款,有什么关键差异?」
因为这类问题步骤多、逻辑复杂,AI Mode 背后的主力模型通常是 Gemini 3 Pro,甚至 Gemini 3 Deep Think这样的高阶模型。
门店二:Gemini(Web / App)—— 全能旗舰总店
如果说 Search AI 是你路过就能顺手吃一口的快餐店,那 Gemini(Web / App)就是整条街招牌最亮、功能最全的“旗舰总店”。
这是你直接和谷歌最强“大脑”正面对话的地方。无论你想写代码、改文案、做规划、读长文档、还是分析一份上百页的 PDF,都可以在这里进行。
官方入口:https://gemini.google.com/app

Gemini(Web / App)有一些可见工具,比如:
- Deep Research(深度研究):用来处理复杂、需要多轮推理的研究型问题,背后调用的是 Gemini 3 Deep Think。
- Canvas(协作空间):适合长文本、方案和代码的反复打磨,本质上是一个“可持续协作”的工作台,主要调用 Gemini 3 Pro。
- Create images(创建图片): 直接调用 Nano Banana 系列,用于生成插画、示意图和设计草稿。
- Create videos(创建视频): 背后是 Veo 3.1 系列,适合生成成品级视频或进行视觉表达的快速尝试。
- Guided Learning(引导式学习): 面向学习场景,系统会结合 Gemini 模型 + LearnLM 插件,一步步带你理解复杂概念。
除了这些“明面上的功能”,Gemini 还有不少默认开启、但你未必意识到的隐藏能力。比如:
- Google Workspace 工具: 可以直接可以直接读取你的 Gmail、Drive 和 Docs等。比如,你可以直接问它“我上周收到的那份合同里,金额是多少?”。
- 实时信息工具: 包含 Google Maps(找路线)、YouTube(总结视频)、Flights 和 Hotels(查实时航班和酒店数据)。
- Gemini Live (语音助手): 在移动端 App 尤为突出,支持实时语音对话,还可以共享摄像头或屏幕,边看边聊、边问边改。
- Code Assist (代码助手): 面向程序员用户,支持生成、运行和调试代码,甚至可以像 Agent 一样操作浏览器执行任务。
在使用体验上,Gemini 有一个很重要的特点:你可以主动选择某个工具,也可以什么都不选。系统会根据你的指令,在后台自动调度最合适的模型和工具组合。
不过,你能看到哪些工具、能调用到什么级别的模型,最终取决于你的会员等级。 像 Deep Research、Canvas 以及 Create videos,目前只对付费用户开放。
门店三:Gemini for Workspace —— 行政嵌入分店
这家门店最特别,它没有门脸。
如果说 Gemini(Web / App)是面向所有人的旗舰总店, 那 Gemini for Workspace 更像写字楼里的员工食堂——你每天都会用到,却很少意识到它的存在。
它并不是一个独立的 App,而是直接“长”在 Gmail、Docs、Sheets、Slides、Meet 这些办公工具里,主打一个AI 触手可及。

如果你的公司为员工购买了 Gemini for Workspace,那么,你甚至还没意识到自己在用 AI,它就已经在后台帮你改邮件、补文档、看表格、总结会议了。
在 Workspace 这家分店里,AI 不再是一个完整的工作台,而是散落在各个角落的一枚枚“魔法按钮”。你点一下,它就把活干了:
文本类:Help me write(帮我写)
嵌入在 Gmail 和 Docs 中,主要调用 Gemini 3 Pro。
用来起草邮件、润色文档、调整语气,甚至生成自动回复。
表格类:Help me organize(帮我组织)
藏在 Sheets 里,同样由 Gemini 3 Pro 驱动。
可以自动生成项目跟踪表、日程模板,还能把一堆杂乱数据按逻辑重新整理。
多媒体类:Help me visualize(帮我视觉化)
在 Slides 中调用 Nano Banana Pro,快速为 PPT 生成配图;
在 Meet 中则调用 Gemini 2.5 Flash,用于生成 AI 背景或优化视频会议的环境光。
交互类:Gemini Side Panel(侧边栏助理)
出现在所有 Workspace 应用的右侧,主要调用 Gemini 3 Flash。
它擅长跨文档操作,比如:根据 Drive 里的报价单,帮我写这封邮件。或者快速摘要长邮件、查询日程安排。
AI Overviews 的“行政版”
在 Gmail 中生成邮件摘要(Gemini 3 Flash),在 Google Chat 中总结未读消息(Gemini 3 Flash),在 Drive 中生成跨文档的项目概览(Gemini 3 Pro)。
Enhanced Smart Fill(增强型智能填充)
隐藏在 Sheets 表格里,由 Gemini 2.5 Flash 驱动。
它不只是“自动填数”,而是能理解单元格之间的逻辑关系,自动补全分类,甚至做出简单预测。
据说,2026 年 Workspace 的一个重要趋势是「In-line AI」。也就是:侧边栏正在逐渐消失,AI 会直接出现在你打字的光标附处,随写随用。
Workspace 里还有一个叫Google Vids的子产品。
它是一款专为工作场景设计的 AI 视频创作工具,目标很明确——解决上班族“做视频太难”的问题。
你只需要提供一份文档或幻灯片,它就能自动生成包含脚本、配音、背景音乐和视觉素材的商务视频。
你可以在 Google Drive 里右键创建 Google Vids, 也可以直接访问链接:https://docs.google.com/videos/u/0/

Gemini for Workspace 最核心的价值是:企业级安全与隐私保护。在这里,你的数据是受隐私保护的,绝不会被拿去偷偷训练模型(限企业版/商务版订阅)。
同时,如果你的公司已经为你开通了 Gemini for Workspace,当你打开 Gemini(Web / App)时,也可以默认使用企业订阅解锁的高级工具和模型。
你可以在 Gemini 的聊天窗口里,通过@Gmail、@Drive、@Calendar 等直接指挥这些应用,为你完成跨工具的工作。
门店四:NotebookLM —— 深度研读茶室
这是整套体系里气质最独特的一家门店。
如果说 Gemini 的旗舰总店像一座热闹的综合商场,那 NotebookLM 更像一间挂着「慢火炖煮知识」招牌的研读茶室——安静、克制,只专注一件事:把复杂内容真正消化掉。
官方入口:https://notebooklm.google.com/

NotebookLM 不擅长天马行空的创作,但在处理海量资料、提炼核心观点这件事上,它几乎是谷歌 AI 体系里的天花板。
它最关键的设计是:限定知识范围。你资料(PDF、网页、笔记、论文等)喂给它,它就只基于这些内容回答问题。不在你给定的范围内,它宁愿回答“不知道”。这样一来,它就避免了 AI “一本正经胡说八道” 的问题。
NotebookLM 的“招牌菜”,几乎都围绕着同一个目标:让你真正理解,而不是快速看完。
Audio Overview (语音概览):
这是目前最出圈的功能。它可以把枯燥的专业文档,直接变成一段由两位 AI 主持人对谈的音频内容,让你在通勤路上就能“听懂”一本专业书。
更厉害的是它的 Interactive Mode:你可以随时打断对话,针对某个概念追问,就像真的坐在一场研讨会里。
Video Overviews(视频概览):
把文档内容转成结构清晰的演示视频,自动配图,并按章节给出对应的视觉化解释。
你也可以直接丢一个 YouTube 链接或本地视频,让 AI 帮你梳理脉络、快速抓重点。
Study Guide(学习辅助):
自动为你上传的资料生成测验、常见问题集(FAQ)和学习指南,几乎是为学生和研究者量身定做的功能。
Deep Research (深度研究):
类似 Search AI 的能力,但范围只限于你上传的资料。
它可以在数千页文档中反复穿梭,每个 Notebook 最多支持 100–600 个来源。
Data Tables (数据表):
从文档中提取结构化数据,并支持一键导出到 Google Sheets,适合做分析和对照研究。
除了这些显性的工具,NotebookLM 还有一些不太张扬的“隐藏能力”。
- 在视觉层面:自动生成 Slides、信息图表(Infographics)、心智图(Mind Map)。
- 洞察层面:盲点分析(Blindspot Check)、辩论模式(Debate Mode),帮你从不同立场重新审视同一份资料。
值得一提的是:NotebookLM 目前完全免费。
但为了保证理解的深度和准确性,NotebookLM 全程由 Gemini 3 Pro,Nano Banana Pro, Veo 3.1 fast这些最强模型坐镇。
这是谷歌目前最慷慨的一块 AI 实验田。只要你有一个谷歌账号,就能免费享受免费享受这种顶级的研读服务。
门店五:Google Labs —— “未来功能”的试吃区
如果前面的门店卖的是已经定型的产品,那 Google Labs 更像一块对外开放的试验田。
这里展示的,都是谷歌那些还没完全“修成正果”的 AI 黑科技。
Google Labs 是一个面向公众的实验平台,专门用来让用户抢先体验最前沿的 AI 能力。新的搜索形态、尚在测试的视频模型、全新的交互方式——它们往往都会先出现在这里,被一小撮“爱尝鲜”的用户反复试用、反馈。
如果表现稳定、反响不错,这些功能才会被正式搬进 Gemini 旗舰总店,或 Workspace 等这样的“常规门店”。

如果你想抢先看看还有哪些尚未定型、但非常具有想象力的 AI 能力,你也可以去Google Labs 中探索:https://labs.google/。
目前,Google Labs 里最受关注的“镇店之宝”,是 Google Flow。

它还没有被独立成正式产品,但已经展示出了非常清晰的方向。
Google Flow 并不只是一个视频生成工具,而是一整套 AI 电影工作室。
它的目标不是“随便生成一段视频”,而是通过极其精细的镜头、节奏和画面控制,让普通人也能像专业导演一样,拍出接近好莱坞质感的短片。
你可以把它理解为:Veo 模型能力的极限展示区,也是谷歌对“未来视频创作形态”的一次公开实验。
如果你想亲眼看看 Google Flow, 你可以在这里找到它:https://labs.google/flow/about。
门店六:Google AI 开发平台 —— 极客专业食堂
Google AI 开发平台像一个充满重型装备、火力全开的极客专业食堂,是开发者的大本营。这里堆满了 API、模型、SDK 和工程化工具。
官方入口:https://ai.google.dev/
在这里,谷歌为开发者准备了几套层次分明的工具,几乎覆盖了从「想法验证」到「大规模上线」的完整流程。
1. Google AI Studio:想法验证的第一站
这是一个基于浏览器的轻量级开发环境,非常适合用来快速测试和构建生成式 AI 应用。
官方入口:https://ai.google.dev/

你可以把它当成 Gemini API 的“试玩区”。
- 零代码起步:直接在网页里输入 Prompt,就能测试文本、图片、视频等多模态能力。
- 一键生成代码:调试满意后,可以直接生成 Python、Node.js、Go 或 Dart SDK 调用代码,无缝接入 Gemini API。
- 友好的免费配额:对 Gemini 3 Flash 等模型提供极具竞争力的免费额度,非常适合原型验证和“先跑起来看看”。
2. Vertex AI(on Google Cloud): 企业级 AI 的主战场
如果说 AI Studio 解决的是“能不能做”,那 Vertex AI 解决的就是“如何大规模、安全且高效地做”。
官方入口:https://cloud.google.com/vertex-ai

它是 Google Cloud 上的统一 AI 开发平台,核心能力包括:
- 模型花园(Model Garden):除了 Gemini,还可以直接调用 Imagen(图像)、Veo(视频)以及多种开源模型。
- Agent Builder:提供低代码工具,帮助企业基于私有数据快速构建可控、可部署的智能体(Agents)。
- 完整的 MLOps 生命周期:覆盖模型微调、评估、监控与合规管理,适合对数据隐私和稳定性要求极高的组织。
3. Google Antigravity:从“写代码”到“下达任务”
Antigravity 是谷歌对「下一代开发工具」的一次尝试。它表面上看起来像一个 IDE,但本质上是一个深度集成 Agent 能力的开发环境。
官方入口:https://antigravity.google/

Antigravity 基于 VS Code 的底层架构,却彻底重构了工作方式:你不再是逐行写代码,而是直接描述目标。它会自动完成任务拆解(Planning)、读写文件(File I/O),并在集成的终端中运行代码、验证结果。
某种程度上,它更像是 Cursor 或 Windsurf 的“完全体”。
4. Gemini CLI:把 AI 请进你的终端
Gemini CLI 是一个直接运行在本地终端里的增强型 CLI 助手。它为 Bash、Zsh、PowerShell 增加了 LLM 级别的语义理解能力。
它的入口可在 ai.google.dev 中找到。
它可以:
- 把模糊的自然语言需求,翻译成复杂的 Shell 指令组合;
- 自动捕获错误输出(stderr),并给出实时诊断和修复建议;
- 通过 RAG,在终端里快速查询本地文档或代码片段;
对于习惯在命令行里工作的开发者来说,这是最“顺手”的 AI 入口。
这四个工具,几乎刚好组成了一个完整闭环:
- 想验证想法 → 去 Google AI Studio
- 想在终端写代码、修 Bug → 用 Gemini CLI
- 想让 AI 自主完成复杂项目 → 用 Antigravity
- 想支撑真实业务和大规模用户 → 选 Vertex AI
04 不同身份,如何选用谷歌 AI?
走到这里,你大概已经意识到一件事:谷歌 AI 并不是让你“全都用上”,而是让你根据需求,在合适的场景,用对产品。
它更像一套基础设施,而不是单一产品。所以,选型的关键,从来不是“哪个最强”,而是:你是谁,你想做什么。
下面是我理解的一份参考指南:
- 如果你只是想更快找到靠谱答案:Google Search AI(AI Overview + AI Mode) 就已经够用了。不用学、不用配,几乎没有使用成本。
- 如果你需要写作、规划、思考和创作:Gemini(Web / App) 是主力工具,长文、代码、方案、图片、视频,都可以在一个界面里完成。如果预算允许,付费版会明显拉开效率差距。
- 如果你的主要战场在邮件、文档和表格里:Gemini for Workspace 是最“无感但最有价值”的选择,AI 不需要你主动打开,它已经开始在替你改邮件、补文档、看数据。对企业来说,数据隔离和合规性,才是它真正的护城河。
- 如果你最头疼的是资料太多、理解太慢:NotebookLM 是你最值得使用的产品,限定知识范围,让它比大多数聊天式 AI 都更可靠。而且,目前它是完全免费的。
- 如果你想第一时间看到谷歌未来会做什么:去 Google Labs。那里的东西不一定稳定,也不一定马上好用,但很多“未来功能”,都会先在那里露面。
- 如果你想把 AI 真正接入自己的产品或工作流:去Google AI 开发平台, Google AI Studio, Gemini CLI,Antigravity,Vertex AI(on Google Cloud)加在一起,构成了谷歌 AI 最完整、也最硬核的一条技术路线。
最后,如果你只记住一件事,那就是:谷歌 AI 不是一堆名字复杂的产品,而是一套分层清晰、各司其职的系统。
当你搞清楚“模型在后台、工具在中间、产品在前台”,很多原本看起来混乱的东西,反而会变得异常清晰。
希望这篇文章能在未来一段时间里,帮你少走点弯路。
作者:七姑娘 公众号:七姑娘日记
本文由@七姑娘 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来源于Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!

起点课堂会员权益




