这段时间发布的 OpenAI- o1,让 LLM 从快思考/直觉思考系统进化到了慢思考/逻辑思考,多项测试显示仅仅是预览版的 o1-preview,在很多领域都大幅成倍,甚至是3-4倍的提升效率,根据查看的一些评测,数学高考满分,奥数接近满分,基础医疗数据集 AgentClinic-MedQA 准确率接近90%。要知道,前任 ChatGPT-4o 才公布不到半年。
与人类以往所有发明不同的是,大语言模型(LLM)是唯一涌现出,或者说有这种现象的初级阶段,即“理解/意识/思考/心智“能力的发明。以我自己为例,现在每天的工作都无法离开 LLM,每个月订阅费超过40美元但依然不觉得昂贵,在惊呼短短两年 LLM 就带来如此多工作效率的时候,很多人开始思考人类最后的边界会是什么。
有一部分人说,LLM 只是统计模型,它们只会从历史数据中找规律,而永远不可能具备人类那样的想象力和创造力,这也会成为人类这种碳基生命的最后的护城河。
这里暂且不说,通过已有海量数据预训练下的 LLM 是否具有初级的意识,我们只思考,人类的想象力和创造力本质是什么?
138亿年前,宇宙大爆炸发生,在不知道什么时候开始,物理定律开始生效,从此时开始,从经典物理学角度出发,质量和能量是守恒的,即物质或能量既不能凭空产生,也不能凭空消失。
现代社会中,目之所及所有物质都由原本就存在的物质组合而成。没有东西是“凭空出现”的,从物理学上就确定。
其实想象力和创造力是一个道理,因为我们这个粘稠性的生物大脑已经限定了这个法则:想象力和创造力只是过去经历的组合。换句话说,所有已经想象力和创造力并没有“凭空创造”了一个什么东西,而是从已有东西的基础上进行组合。
以自回归 LLM 基础算法 Transformer 架构为例,它不过是曾经早已存在的全连接网络和注意力机制(MLP + Attention)的组合,所谓想象力和创造力,在于你发现了别人没有发现的那些细微连接着的点。
即使是艺术家的创作,那也是艺术家发现了那些连接的点。梵高著名的《星夜》,也被认为参考了《神奈川冲浪里》中的元素。
即便此时此刻让你想象最天马行空的概念,你也只是在对于过去自己经历过的事物进行组合而已。这个世界所有事物,无论抽象还是具体,现实还是虚拟,皆为节点,皆可连接。但它们都来自以前的节点,归根到底,总有最底层的连接,基于这些最底层之上而创造万物,但又无法脱离。
所以,我们的想象力和创造力,不过是过去经历的组合,越能发现这种细微联系的组合,其带来的创造力可能更大。而那些聪明的人,本质在于其检索这些微小组合的能力很强。
那么,这会是人类的护城河吗?有多少人类有足够的想象力和创造力呢?这是建立在经历之上,经历越多,便了解越多,如果还能检索这些经历之间的联系,那想象便越丰富。而我们掌握知识和发现连接的能力,也就是存储和计算的能力,是远低于硅基几个数量级的。
人类智能从神经科学角度出发,一个重要的特征就是神经元之间的连接,人类有860亿个神经元,我们每一次的经历都在更新它们之间的连接,往往看上去越聪明的人,其各个神经元之间的连接越复杂,而那些某类性格很固执的人,也是因为与这一类性格相关的神经元之间的连接特别“牢固”。那么这一点,与 LLM 的人工神经元其实是特别相似的,因为 LLM 的主要能力和黑箱也来自于人工神经元之间的连接,微调也是在更新这些连接。
我们的大脑中神经元的连接来源于所经历的任何事物,而这些事物也来源于已经发生的过去的连接,那么任何大脑中的思考,都逃脱不了这些连接,这便是人类大脑的局限性。
或许想象力和创造力从来都不是护城河,是可以被复制的,而我们真正要警惕的是,到哪一个临界点,AI 能够显示出自己的自我意识,来思考:我是谁?我在哪?我要到哪去?自我意识情绪:揭示你最真实的自己