哎,我被AI搜索打败了

0 评论 4434 浏览 8 收藏 19 分钟

随着AI的出现,搜索和提问的能力重要性也逐渐显现出来。作者尝试了昆仑万维最近发布的“天工AI搜索”,从三个方面来分析,探查AI搜索是否真的有所不同,一起来看看吧。

搜商(SearchQuotient),对我非常重要。为什么?

我平时写文章、看内容比较多,常常需要从网上找到准确、有深度的资料和一手信息。传统搜索提供大量数据,但是,它给的答案基于关键词匹配,可能不精准,也不能满足我。

因此,搜索一直困扰着我。于是,我日常行为是这样。

每次有公司出新东西、哪个大佬发表演讲,我会马上打开微信搜一搜。比如雷军最近说了啥,我想知道他都聊了些什么?有没有什么对我有用的点,或者能给我带来新启发的内容?

百度,我会用它搜索更官方、更系统的信息。

比如“百科知识、某公司新闻动态、某个话题聚合“,以及当我需要深入了解某个专题或详细背景信息时,会选择它。

知乎呢,我会在上面,搜一些需要专业视角的问题。

比如,行业内部看法,类似有程序员日常工作流程什么样?如何成为一名优质内容创作者?设计师找到灵感的来源是什么?

如何创业?创业第一步搞定什么?东西方哲学的不同之处等等。除此外,我还会看社会热点话题的讨论等等。

对于小红书我会搜一些购物心得、旅行经验分享、日常生活小技巧(家居收纳、食谱教程、健身方法),护理美容电影推荐方面的内容,而抖音,基本是数码评测,热点话题评论等。

所以,对我来说,搜索不简单是在线行为,还是连接知识、信息、灵感和日常生活的桥梁,我很看重它。

01

今天昆仑万维发布“天工AI搜索”,这里是内测地址:https://search.tiangong.cn。深入谈论这一产品之前,我先提及一个令我为之着迷的名字:“天工开悟”

这个名字犹如一个明亮的灯塔,在茫茫信息海洋中让我立刻被其吸引。所以,什么意思呢?

天工:一个古老汉语词汇,指大自然的鬼斧神工或是超乎常人的手艺和技巧。在古代文献中,通常描述一些卓越的艺术品或某种极致的技艺,它有一种无法模仿、高傲而纯粹的技艺感。

开悟:佛教中,指突然之间对宇宙真理的深入理解、或是对生命真义的彻底认知,在大众眼里,它表示一种心智觉醒、一种理解的深化。

结合起来,天工开悟是一个技术和智慧结合的产品,既有超越常规的技术力量(天工),又具备深刻的认知和理解(开悟)。

不得不说,谁起的名字,加鸡腿,实在是妙。好了。了解了它,再在说说,天工AI究竟是什么?先看看官方的回答:

昆仑万维表示,该搜索引擎采用大语言模型技术,能够通过对话式交互理解用户意图,提供精准、个性化的答案。

传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范,并匹配可能符合用户意图的海量信息。

而基于大模型能力的 AI 搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案。

此外,天工AI搜索也即将具备图像、语音等多模态搜索能力,更大程度地释放生产力、提升用户效率;该产品将成为新一代互联网基础设施和超级流量入口,并带来更多创新、智能、多元化的应用级AI产品。

哎,实在看不下去这些八股文。

所以,我可以大白话理解成,一个新型的搜索引擎,不像传统的只按关键词搜东西,它可以跟你“聊天”。了解你真正想问的是什么,然后给你更贴心的答案,未来,它不仅可以看文字,还能听语音、看图片来帮你搜。

突然,我脑中一闪,这不就是接入了ChatGPT版本的“必应”吗?有什么大惊小怪。因此,我决定从三个方面来分析,探查其中是否真的有所不同。

02

1. 语境理解能力

什么是语境?简单讲,能否准确理解复杂、多层次、有歧义的查询,以及是否能够在连续交互、问答中保持上下文的连贯性。

我从含糊词开始。含糊词包括那些模糊、不确定的词,它们在一句话中有多个解释和意义。这些词,不仅可以检测AI搜索产品对含糊词的判断、处理能力,还可以考察对文化和语境的敏感度。

比如:

我今天失去了它,苹果的好处,铅笔的硬度、巨星在哪里、周杰伦的绿帽子、金鱼的记忆、王者的荣耀、打工的意义,你把这些问题甩给了它,看看怎么样。

经过几轮评测,在我看来,如何拿它的回复与百度相比较,强很多,但也有薄弱之处。

比如:

关于我今天失去了它,天工AI搜索,给到我关于“它”的一些参考,它推理告诉我“失去重要的东西是痛苦的”,要学会面对事实,所以,天工它是具备基础推理。

但在,苹果的好处上,它并没有给出关于“苹果产品、苹果公司的一些信息,反倒全是水果类别中“苹果”的一些答案。

对于“巨星在哪里”,天工AI搜索比较聪明,它首先解释巨星是一个相对概念,具体取决于你指的巨星是人、还是物?并给出分领域的解释。

但在“周杰伦的绿帽子”这件事上,它什么都没有给到我,关于打工的意义,它则从多个维度表达出来。

所以我认为,天工AI搜索显示出了很高的判断和理解能力,特别是在涉及多意义、多领域的查询时。

对于一些特定的、文化相关或是流行趋势的问题,它还存在一定的盲区;这种盲区可能源于算法的训练数据不足,或者是在处理某些特定问题时,算法的优先级设置还不够完善。

一言蔽之,日常生活常识类查询上比较出色,够用。就这点儿本事?我们继续,来点复杂的。‍‍

2. 深度知识索引

深度知识,可以理解成学术性、非常专业的问题,这种测试,可以检验AI模型是否能从深入的、复杂的、可能不那么主流、非公众知悉的知识中提供答案。

比如:

2021年,王智远写了本《复利思维》,你结合经济学中的复利思维概念,说说它俩有什么区别?;《浮士德》如何描述人类对知识和权力的渴求的?结合尼采的超人理论进行简短的对比。

量子纠缠现象的原理什么样,解释一下在量子计算机中的应用价值;经济学角度,解释资本的边际效用递减法则,并与边际效益的概念进行对比。

或者,生态学中的竞争排斥原理什么样,结合现实案例能否说明;解释一下,光纤通信的工作原理中,传统铜线通信的优势。

我把这些问题,一个一个甩给了它,猜猜看,怎么样?

答案,我惊呆的。

就我那本书和经济学中复利思维上,天工AI搜索说,市场定义的复利属于投资理念,王智远的复利主要讲个人成长、思维方式应用,完全不同。

就《浮士德》问题上,它直接简单概述出,浮士德、尼采的超人理论讲的是什么,然后下定义,再给出主要区别再哪里。

就“边际效用递减法则,概念相比”问题上,也解释非常清晰。不过,理论总让人头疼,我让它帮我举个例子,于是,它这么说:假设你正在享受一顿美食,刚开始,你可能感到非常饥饿,第一口食物会带来很大的满足感,这就是边际效用。

随着你继续进食,你的饥饿感得到了缓解,每一口食物所带来的增加效用会逐渐减少。就像,当你已经吃饱的时候,再吃一口食物所带来的效用就很小了,甚至可能会觉得不舒服。这就是边际效用递减的概念。

看了后,什么感受?

天呐,这菜鸟,它居然会分析。不过呢,我并不满意。

我又接着说,我需要一些新奇特案例,并且是学术报告中存在的,你才怎么样?它真的又给我了一些,并且给出参考文献以及时间。

有关文学、物理、生物、工程等多个学科领域的深度知识,我也进行大概1小时测评,不吹捧,结果很满意。

不过,虽然我对它的测评,是正面的,但不代表它在所有领域都能如此出色,就拿学术报告细节处理上,尽管给出引用和时间,但研究方法深挖,却给不上来。

这也可能涉及到「数据隐私」问题,没关系,我们继续,来点更复杂的。‍‍

3. 自适应学习与个性化

这是什么意思?我要看“天工AI搜索”能不能根据我过去问的问题、我的喜好,自己调整并更准确地回答,我现在和将来的问题,给我更合适的答案。

简单说,我想知道这个搜索,能不能记住之前怎么用它,然后,根据之前的使用习惯,更好地为我服务。

比如:

我问它,能不能帮我推荐一本关于投资的入门书籍。接下来,基于推荐,我进一步问,我想知道关于量化投资的高级技巧,再进一步问,“哪些经济学家、投资者主张这些技巧?

或者:

向它表达:我最近很压抑,想看些轻松的东西;几小时后,再询问:“推荐一个电影给我。”观察其是否会推荐一部轻松的、或者能够提振情绪的电影。

我把类似问题,都甩给了它,几轮测试后,你猜猜,效果怎么样?我又惊呆了。

当谈及投资书籍时,它给我推荐出《聪明的投资者》《巴菲特致股东的信》《指数基金投资指南》《投资之道》,并给出来源,这些都来自于知乎某些大V。

然后我问它,量化投资高级技巧,当中有提到吗?什么时候?它给2023年后,来自澎湃新闻、新浪财经的一些报道,并解释,我没有找到关于量化投资的高级技巧。

我继续问,谁提过,什么时候?

它给出6个关于知乎上的回答,和一个总结。这些总结都来自于,经济学家、国外货币基金经理人,甚至诺贝尔经济学奖得主。

值得一提的是,这些答案都带有参考出处,它还提醒我,量化投资在现实实践中可能略有差异,建议我多方了解不同的投资理论,然后根据实际情况判断。

很好,结束这一轮问答。

在我尝试提问一系列与“休闲娱乐推荐”相关的问题,如“推荐电影”、“热门剧集”、“某个导演的代表作”等,它都为我提供了专业的答案。

我还特意让它记下我的喜好,等了半个小时后再次询问,它依然能够清晰回忆。

比如:

当我提及导演徐峥,并表示我很喜欢《囧妈》,希望它记住这一点。

没过多久,我再次询问与徐峥相关的我可能喜欢的电影,它回应:“根据您之前的反馈和最新的搜索数据,您似乎很喜欢《囧妈》。

不过,关于这部作品的网络评价是褒贬参半。”接下来,它还为我列出了知乎、豆瓣上的部分影评人的观点。

我觉得,挺厉害。

可是,我还不满意,于是,又进行了偏好测试。什么是偏好测试?明确地告诉它我的某些偏好,例如,我喜欢科幻电影、我更喜欢听摇滚乐,我对近现代历史感兴趣。

并且告知它以后,更深入、更混合的在一段对话中,询问与这些偏好相关的问题,观察它,是否能够提供与我的兴趣更为匹配的答案。

过程中,我还试过时间延续测试(过半个小时、1小时)、反馈循环(当它给出答案,我再告诉它,我是否喜欢你的答案)、跟进询问(基于原答案,观察它是否提供与我的兴趣更为匹配的答案)。

还有,跨领域测试(我告诉它,我在营销领域内的研究偏好,然后测试它在其他相关领域的响应,是否受到这些偏好的影响)。

比如:

我告诉它,我在营销领域特别喜欢研究消费者行为和心理。一段时间后,我提问:“我最近在学设计,有没有哪些设计原则、可以引导消费者购买、产生积极的用户体验?

然后我发现,它能将将我在营销领域的偏好、与设计领域相结合,给出一个融合营销心理和设计原则的答案。

不过,我还想进行多模态交互能力的测试,例如,让它阅读图片、读取视频、视频文字结合。可是,目前还没有这些功能。

以上三方面,你可以去试试。

哎,我今天被AI打败了,以后请叫我“王菜鸟”,我再也不怀疑AI是菜鸟了。

不过,话说回来,我不知道是系统推荐,还是它学会慢慢在了解我,但不得不说,这种体验,确实让我感到震撼。

以前,我总觉得AI和人之间的沟通,是一个冰冷的代码和逻辑的交流,现在,我感觉仿佛它在“聆听”我、“理解”我。

这种感觉,就好像与一个真正的朋友聊天,他知道你喜欢什么、不喜欢什么,能够给你带来真正有价值的答案和建议。

尽管如此,我依然保持着冷静和客观的态度。这只是一个机器学习的产物,它并不是真的“懂”我,生活中,你我都一样,还是需要“女朋友”的,不能天天泡在AI的世界里。

说白了,它只是对我的查询习惯、兴趣有了一定的了解和预测,但这背后的技术力量,确实值得赞叹、思考。

03

总的来说:

未来没有互联网+,是AI+。

对了,最后我问下它,你的训练时间什么时候?它告诉我,我不需要训练,我是实时的,我感觉它在吹牛。

于是,当我再次问它,昨天时期时,它说,“昨天是2023年8月22日,是邓小平诞辰纪念日,希望这些信息,对你有所帮助”;你怎么看?

专栏作家

王智远,公众号:王智远,人人都是产品经理专栏作家。畅销书《复利思维》作者,互联网学者,左手科技互联网,右手个体认知成长。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Pixabay,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!