谷歌急切迎战ChatGPT，大模型之战变数仍多

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

谷歌急切迎战ChatGPT，大模型之战变数仍多

明晰野望

2023-12-14

0 评论 2140 浏览 2 收藏

B端产品经理两大难题：如何从市场，用户，业务等多个角度分析和设计产品？如何有效地管理和推进项目落地？

谷歌于近日推出了多模态大模型Gemini，并对其能力做出了高度评价。那么，在Gemini出现之后，如何解读当下的大模型竞争呢？这篇文章里，作者给出了他的看法，一起来看一下吧。

沉寂一年后，谷歌带着它的多模态大模型Gemini（双子座）高调杀回AI圈。

此前，谷歌曾凭借AlphaGo在全球掀起了一波AI浪潮。但新一轮AI浪潮的风头却被ChatGPT抢走，谷歌迫切需要一款现象级AI产品来证明自己的实力，这也就不难理解，为何谷歌要冒着风险在演示视频中夸大自家大模型的性能。因为他们太想让Gemini「看起来」优于竞品了。

从命名也能看出，谷歌对Gemini的功能寄予了超越人脑的厚望。官方称Gemini是AI模型的巨大飞跃，其多项能力超过ChatGPT。自此，谷歌正式向竞争对手OpenAI和微软宣战，争夺人工智能霸主地位。AI圈最强终于不再是ChatGPT的独角戏。

01

最强大模型之战硝烟正浓。

作为应对ChatGPT-4的杀手锏，谷歌在发布会上称Gemini是其迄今为止规模最大、能力最强、最灵活的AI模型。不仅如此，谷歌称Gemini是自己从头开始构建的多模态模型，更接近人类认识世界的方式。

不同于ChatGPT的逐步更新，谷歌一次性就发布了三种模式的Gemini，分别是Gemini Nano、Gemini Pro和Gemini Ultra。不同版本在性能上有着明显差异，现在大家能用上的都是Gemini Pro，但在功能上能迎战ChatGPT的是Gemini Ultra。

虽然宣传视频翻车，但Gemini的数据表现还是相当优异。在运算效能方面，Gemini几乎“吊打”GPT-4。Gemini Ultra在32个多模态基准测试中，其中30个测试集的性能超过当前SOTA结果。在数学问题、Python代码任务、阅读等方面，Gemini的性能都超过了此前最先进的水平。

做交互设计10年，我为何转岗到产品经理？

真正转岗之后，我发现很多工作还是超出了自己的想象。产品经理的工作确实比较杂。理论上，产品经理的工作包括了产品的方方面面，从市场研究、用户调研、数据分析...

查看详情 >

在纯文本问题上，Gemini是第一个在MMLU（大规模多任务语言理解）测评上超过人类专家的模型。Gemini的得分为90%，人类专家得分约为89%，而GPT-4在这类问题上的得分为86%；在多模式问题上，Gemini得分为59%，GPT-4得分为57%，Gemini的表现均为最佳。

除了在常规能力上全面超越GPT-4，Gemini最大的特色是多模态，也就是可以同时识别和理解文本、图像、音频、视频和代码五种信息，用户可以交错添加文字、图像、视频等内容，Gemini也可以输出相应交错的文本和图像。从一开始，Gemini就在不同模态上进行预训练，再通过额外的多模态数据进行微调，这进一步提升了模型的有效性。

02

抢跑就一定能将优势保持到最后吗？答案可能是：未必。

对于刚起步的大模型行业来说，行业格局未定，后续的竞争依然充满变数。谷歌一开始在AI领域遥遥领先，最后却沦为OpenAI的追赶者；ChatGPT一出现便技惊四座，现如今又被Gemini赶超……这样的故事在不断上演。谷歌视频里演示的多模态能力，实际上在一年内就能实现。但一年时间里ChatGPT也会不停迭代，到时候Gemini还会是ChatGPT的对手吗？

谷歌的野心绝不止步于追赶，而是希望全方位碾压。Gemini的发布不仅是为了与ChatGPT一较高下，背后潜藏的是一个更大的项目。除了Gemini，谷歌还发布了迄今为止最强大、最高效，并且可扩展的TPU系统——Cloud TPU v5p，专为训练尖端的AI模型而设计。新一代TPU将加速Gemini的发展，帮助开发人员和企业客户更快地训练大规模生成式AI模型，开发出新产品和新功能。一个更可靠、可扩展的训练模型和最高效的服务模型，才是谷歌做出Gemini的重要目标。

这一战，谷歌布局深远，夺回AI霸主的野心昭然若揭。面对已经打出王炸的谷歌，对手OpenAI肯定不会坐以待毙，而OpenAI的绝招正是你根本猜不到它会出什么牌。最强大模型之争，枪声已经打响。

03

大模型的竞争才刚开始，国产同行们要加把劲了。

这一年来，国内发布比较知名的大模型有百度文心一言、阿里通义千问、腾讯混元、科大讯飞星火、商汤商量、字节跳动豆包、智谱AI-ChatGLM等。

表面上看各家大模型都各有优势，但其实都还处于起步阶段，算法上还未取得突破性的成果，和国外大模型相比还有一定差距，Gemini的出现或许可以加速行业内的优胜劣汰，让大量没有足够竞争力的产品加速出局，同时，它也启发了国产大模型：与其跟进式研发，不如将AI功能尽快赋能在已有的产品和服务之中，这样反而成本更低、见效更快。

在大模型的竞赛中，头部选手的经验或多或少会被其他追赶者复用，这对后来者来说是宝贵的学习机会，只要保持住追赶的势头，就有超越的可能，这次是谷歌，下次又会是谁呢？

作者：Lime

来源公众号：明晰野望（ID：MXYW-1688），锐眼看财经野望大市场

本文由人人都是产品经理合作媒体 @明晰野望授权发布，未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App