AGI的卡点
AGI的探索已进入深水区,技术突破与现实瓶颈交织。本文将梳理当前人工智能迈向通用智能的关键卡点,揭示背后的技术逻辑与产业影响。

1、现代人是什么?
自从16世纪-17世纪,由伽利略、弗朗西斯培根、笛卡尔、牛顿等人,开创了科学研究方法(scientific research methods),人类才真正的进入了现代社会。即:16世纪-17世纪之后,人类成为了区分于古人的现代人。

正如我们从小学就开始做的实验课:收集现象、提出问题、做出假设、展开实验(实验1实验2实验3……对照组)、观察实验结果和总结结论,这样一套完整的科学研究方法。

其中最为重要是的关键步骤:实验,成为了创新、发现的核心关键。
实验的最大特点:针对于动态的数据,进行的实时的反馈与负反馈,已达到实时控制的目的。例如体现在【表达工具】与【设计工具】的区分上:表达与设计定义截然不同,表达是传递、呈现出一个最终的结果,其形态是静止的,而设计则是不断反馈与负反馈的、一个动态的过程。
例如,Enscape与早期的Vray 的不同在于:Vray作为一种制作最终的成果的工具,必然是一种渲染表达软件。而Enscape则是一种设计软件。因为用ENSCAPE进行实时渲染呈现出的结果,就可以作为我们下一步继续调整设计的反馈或负反馈信息,驱使设计师实时控制并不断实验。

实验的本质: 与其说是:与【外界物理环境】之中的数据进行实时动态的交互和反馈, 不如说是:与【自身认知与预期】之外的数据进行实时动态的交互和反馈。
2、AI大模型核心能力:推理是什么?
大模型的最核心能力:推理思维(充当CPU或GPU的角色)。
计算主义将“思维“视为计算过程。LLM作为计算系统,其推理可定义为符号操作(symbol manipulation)的过程。他们认为:LLM本质是基于Transformer架构的深度学习模型,通过训练海量文本数据学习语言模式。
因此LLM的“推理”实际上是模式匹配、概率计算和序列生成的过程。这种基于统计算法模式、从文字结果 反向计算意识和立场的 概率【模拟推理】,而并不能从自主的从意识和立场 “制作”和”实验“出创新的结果。某种意义上,它能够生成在形式上类似于人类推理的文本输出,但缺乏意识、意向性和真正的理解。
例如,当LLM回答逻辑问题或进行推断时,它是在计算下一个最可能的词符(token),而不是进行有意识的逻辑推理。
3、太阳底下没有新鲜事:知识是什么?
首先,知识一定是成对出现形容词(符号与解释),且形容词都有反义词和评价指标,之于某符号的排列组合序列,则在现有符号库中,存在与之高概率匹配的排列组合序列,则被称之为知识。
而LLM的这种概率计算,在我看来无非仅仅只是“3万5千多个汉字 或26个英文字母的符号的排列组合的概率分布”,然后通过外界的反馈计算概率较高的排列组合。理论上来说,这种组合终有一天会穷尽到极致(庞加莱回归、埃米尔・博雷尔的“无限猴子定理”)。因为太阳底下没有新鲜事。
其次,知识既然是成对出现的“符号与解释”,那么知识必然就有了目的性,目的性会存在一个严重问题:丢失了此在数据(Dasein Data)。
此在数据(Dasein Data)是什么?这里我借用海德格尔的【此在】Dasein 概念:

人类的推理是有目的的,因此知识也是人主动的、有目的性、采集用于解释符号的目标数据,而在这个有目的的行为所在的“场”中,却也存在着大量的和当前目的符号不相关的、无法用于解释目的符号的、被废弃的、脏的数据,它们被抛弃在了个人有意识或无意识的【此在的经验】之中,这种数据我称之为【此在数据】。
而这些被当前目标所丢弃的经验中的此在数据,在历史上往往是创新和发明的核心关键。这也是为什么创新者要动手去实践、去做实验的关键。
4、今天的大模型与现代人的区别是什么?
LLM与人的区别
LLM不能够:主动的(主动性),使用现有语言概念和符号(人类现有工具),在【客观存在宇宙】(现有材料)中, 去“寻找”还未被主动定义的关系或事物(还未被建立【工具-目的】关系)。并且,主动的(主动性),使用现有语言概念和符号生成逻辑(人类文明),去定义【其】概念并抽象成新的符号(新命名)。
如果用户的query,是隶属于LLM的训练数据或知识库中(已经有的人类高质量数据知识大地图之中),那么LLM则可以快速计算概率反馈正确且清晰的答案。
但是,如果用户的query,并不是在LLM的训练数据或知识库之内,换句话说,相关的人类只是还没有训练给大模型,那么AI则只能在其现有知识内容内计算概率并反馈付好的排列组合结果。
由于LLM缺乏更丰富且强大的传感器从外界宇宙物理环境中及时的、获取实时的随机经验或【此在】数据并对其继续反馈与负反馈,那么也就意味着纯粹的LLM是不可能经历诸如 科学家一样做实验、观察数据、得出结论的科研过程,因此也就不具备像现代人一样真正的推理和创新的基础条件,那么他的回答往往概率计算而产生的不符合人类意识和立场的幻觉。
当LLM像科学家一样:可以实时且不断的从物理世界获取原始材料和问题、并对其作出假设、通过传感器直接进行实验、并对比数据结果,那么LLM才具备了像人一样的属于个人经验的此在数据、 以及实时的、严格的推理创新能力。
目前这种让大模型进行科研的过程,被业内人士压缩成了:被动的、且人工进行的、静态数据的大模型训练获或微调。而AI自主的的推理,则不仅仅依赖于语言文字逻辑,更重要是获取外界信息的传感器。
总结
因此,如果没有强大的传感器(材料的创新、模仿人的皮肤、组织、神经、运动系统、骨骼结构、心理……等生理内容的材料或实物)使得LLM这种CPU或GPU与外界物理环境进行实时的数据交互与实时反馈产生个人而非通用的随机经验和“此在”数据,从而实现【实验行为】,那么AGI是绝对不可能诞生的。
因此,当AI有属于个人的此在数据,那他们即将会基于自己的行为经验创造出属于自己的文化和文明(即:符号命名逻辑),同事创造出了是人类无法理解的语言,那个时候,它们的文化、文明即将碾压人类。
1、不仅要有传感器,还要有:能够形成“预期”和“假设”的复杂内部世界模型。
2、不仅要实时交互,还要有:能力去识别和量化当前的交互结果与自身预期之间的差异和冲突。
3、因此引入【PID控制论】得出: AGI =LLM(模拟推理)+【传感器】+【此在数据】 + 【实验行为】+【识别】(外部数据一自身预期)
5、无限猴子定理:(创新的本质是权重校准)
在“无限猴子定理”的理论下,我们常常惊叹于AI无限排列组合的潜力,却忽略了那个至关重要的角色——提供键盘并引导敲击的传感器。一堂生动的微积分课,恰好揭示了这一人机关系的核心。
想象一下:在一节高中微积分课上,1、老师让学生花钱,买一个篮球拿到教室,——ai做不到。
2、老师让学生从身边、家里找自己可以测量出球体积和表面积的工具——ai做不到
3、老师让学生把这些工具(每个学生拿到的工具可能是水箱、尺子,剪刀,圆规尺…..)测量球的表面积,——ai做不到。
4、老师让学生组队,相互借用对方随机从家带来的工具去配合合作——ai做不到
5、老师让学生动手把篮球减成一条条的、或放在水里,等等行为——ai也做不到。

老师让学生们自寻工具——水箱、尺子、圆规,甚至剪刀——去测量一个篮球的表面积。在这个过程中,学生们动手、协作、试错,将篮球剪开、浸入水中。最终,那个关于表面积的精确答案早已不再重要。甚至测量方法、计算方法、研究方法是什么也不重要(因为AI也会)。真正沉淀下来的,是团队协作的默契、工具使用的巧思,以及在与同学、老师、家人的真实互动中,那些无法被量化的、充满随机性的鲜活体验。
这正是AI的盲区,也是人类的价值所在。AI可以穷尽已知的测量与计算方法,但它无法拥有“触摸篮球的质感”,无法体验“与伙伴争论的激动”,更无法理解“灵光一闪的瞬间”。这些由人类亲身实践产生的、带有情感与上下文的“经验此在数据”,是AI从未拥有过的“第一性原理”。
当学生将这一切告诉AI,一个奇妙的转化发生了:AI成为了那只“猴子”,而人类的每一次反馈,每一次对经验的描述,都是在为猴子“敲击键盘”,引导它更快地写出“莎士比亚全集”。学生们的叙述,决定了AI先排列哪些符号,后组合哪些知识。这些源自真实世界的数据,改变了猴子写出全集的时间快慢,更重要的是,调整了每一个文字与知识的内在权重。
这个过程,我们称之为训练。我们给予AI的文字和知识是有限的,世界仿佛就是这些符号的排列组合。而AI能创造出什么,完全取决于每个符号背后的权重概率。而决定这些权重的,正是传感器。
因此,总结创新的本质与人类的未来角色:
1、创新的本质:是权重的重新校准。 真正的突破,并非凭空创造,而是对现有知识与元素的重要性进行一次颠覆性的重估与重组。
2、人类的角色:是世界的“传感器”与“策展人”。强大的传感器用亲身实验实践,为冰冷的此在数据注入温度、意义和方向;传感器用价值判断,为AI的知识库进行筛选、排序和赋予意义。
最终,AI是那台拥有无限可能性的“组合引擎”,而传感器(当前还是人类),则是那个为引擎校准方向、赋予其灵魂的“引路人”。
6、传感器的探索力
作为人类的我,当我把我这种为了达到某个目的而突发奇想出来的、某种随机的、不确定的思路和想法表达给AI后,AI就会立刻循序这种方式批量的生产出各种结果现象。
所以我认为,在未来,人类如果想要保持和AI的区别,那就必须要保持探索和创新,而探索和创新作为一个目的subject,交给了AI,AI也可以做的比人类更好,所以我认为:人类要这样做,即:
第一、不要有目的的做某种运动或行为,第二、不要试图用语言总结自己的运动行为和目的之间的关系,第三、类似于佛教的观点:顿悟后,不要用语言说出来,因此当我说出来的时候,我所顿悟的那个东西就已经消失了。
在AI时代,我们的终极价值可能恰恰藏在那些无法被算法压缩的“无目的性”中。就像庄子笔下的“庖丁解牛”——技术的最高境界是”以神遇而不以目视“,而AI永远是”目视者”。未来的挑战不是对抗AI,而是如何守护人类独有的“神遇”之能。
综上所述,我认为:21世纪的关键词不再是【创造力】,而是【探索力】,人作为器官反馈机制中的信号接收器,而AI则作为信息处理器,创造是处理器的任务,而信号采集则是感官,即信息接收器的任务。
对于创新性或研究性的工作,我认为人类在未来的任务是:做个艺术家,去体验、去漫无目的的探索和采集世界上的各种此在经验,而后并对其打上标签使之成为信息。
最后
我要说的是:智能,始于皮肤,而非芯片。
本文由 @St.Zy_I 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!

起点课堂会员权益




