谷歌急切迎战ChatGPT,大模型之战变数仍多

0 评论 1939 浏览 2 收藏 7 分钟

谷歌于近日推出了多模态大模型Gemini,并对其能力做出了高度评价。那么,在Gemini出现之后,如何解读当下的大模型竞争呢?这篇文章里,作者给出了他的看法,一起来看一下吧。

沉寂一年后,谷歌带着它的多模态大模型Gemini(双子座)高调杀回AI圈。

此前,谷歌曾凭借AlphaGo在全球掀起了一波AI浪潮。但新一轮AI浪潮的风头却被ChatGPT抢走,谷歌迫切需要一款现象级AI产品来证明自己的实力,这也就不难理解,为何谷歌要冒着风险在演示视频中夸大自家大模型的性能。因为他们太想让Gemini「看起来」优于竞品了。

从命名也能看出,谷歌对Gemini的功能寄予了超越人脑的厚望。官方称Gemini是AI模型的巨大飞跃,其多项能力超过ChatGPT。自此,谷歌正式向竞争对手OpenAI和微软宣战,争夺人工智能霸主地位。AI圈最强终于不再是ChatGPT的独角戏。

01

最强大模型之战硝烟正浓。

作为应对ChatGPT-4的杀手锏,谷歌在发布会上称Gemini是其迄今为止规模最大、能力最强、最灵活的AI模型。不仅如此,谷歌称Gemini是自己从头开始构建的多模态模型,更接近人类认识世界的方式。

不同于ChatGPT的逐步更新,谷歌一次性就发布了三种模式的Gemini,分别是Gemini Nano、Gemini Pro和Gemini Ultra。不同版本在性能上有着明显差异,现在大家能用上的都是Gemini Pro,但在功能上能迎战ChatGPT的是Gemini Ultra。

虽然宣传视频翻车,但Gemini的数据表现还是相当优异。在运算效能方面,Gemini几乎“吊打”GPT-4。Gemini Ultra在32个多模态基准测试中,其中30个测试集的性能超过当前SOTA结果。在数学问题、Python代码任务、阅读等方面,Gemini的性能都超过了此前最先进的水平。

在纯文本问题上,Gemini是第一个在MMLU(大规模多任务语言理解)测评上超过人类专家的模型。Gemini的得分为90%,人类专家得分约为89%,而GPT-4在这类问题上的得分为86%;在多模式问题上,Gemini得分为59%,GPT-4得分为57%,Gemini的表现均为最佳。

除了在常规能力上全面超越GPT-4,Gemini最大的特色是多模态,也就是可以同时识别和理解文本、图像、音频、视频和代码五种信息,用户可以交错添加文字、图像、视频等内容,Gemini也可以输出相应交错的文本和图像。从一开始,Gemini就在不同模态上进行预训练,再通过额外的多模态数据进行微调,这进一步提升了模型的有效性。

02

抢跑就一定能将优势保持到最后吗?答案可能是:未必。

对于刚起步的大模型行业来说,行业格局未定,后续的竞争依然充满变数。谷歌一开始在AI领域遥遥领先,最后却沦为OpenAI的追赶者;ChatGPT一出现便技惊四座,现如今又被Gemini赶超……这样的故事在不断上演。谷歌视频里演示的多模态能力,实际上在一年内就能实现。但一年时间里ChatGPT也会不停迭代,到时候Gemini还会是ChatGPT的对手吗?

谷歌的野心绝不止步于追赶,而是希望全方位碾压。Gemini的发布不仅是为了与ChatGPT一较高下,背后潜藏的是一个更大的项目。除了Gemini,谷歌还发布了迄今为止最强大、最高效,并且可扩展的TPU系统——Cloud TPU v5p,专为训练尖端的AI模型而设计。新一代TPU将加速Gemini的发展,帮助开发人员和企业客户更快地训练大规模生成式AI模型,开发出新产品和新功能。一个更可靠、可扩展的训练模型和最高效的服务模型,才是谷歌做出Gemini的重要目标。

这一战,谷歌布局深远,夺回AI霸主的野心昭然若揭。面对已经打出王炸的谷歌,对手OpenAI肯定不会坐以待毙,而OpenAI的绝招正是你根本猜不到它会出什么牌。最强大模型之争,枪声已经打响。

03

大模型的竞争才刚开始,国产同行们要加把劲了。

这一年来,国内发布比较知名的大模型有百度文心一言、阿里通义千问、腾讯混元、科大讯飞星火、商汤商量、字节跳动豆包、智谱AI-ChatGLM等。

表面上看各家大模型都各有优势,但其实都还处于起步阶段,算法上还未取得突破性的成果,和国外大模型相比还有一定差距,Gemini的出现或许可以加速行业内的优胜劣汰,让大量没有足够竞争力的产品加速出局,同时,它也启发了国产大模型:与其跟进式研发,不如将AI功能尽快赋能在已有的产品和服务之中,这样反而成本更低、见效更快。

在大模型的竞赛中,头部选手的经验或多或少会被其他追赶者复用,这对后来者来说是宝贵的学习机会,只要保持住追赶的势头,就有超越的可能,这次是谷歌,下次又会是谁呢?

作者:Lime

来源公众号:明晰野望(ID:MXYW-1688),锐眼看财经野望大市场

本文由人人都是产品经理合作媒体 @明晰野望 授权发布,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!