符号主义和连接主义是人工智能领域的两种主要理论。符号主义认为,智能可以通过处理符号来实现,而连接主义则认为,智能可以通过模拟人脑的神经网络来实现。
符号主义的核心思想是,知识可以被分解成符号,这些符号可以被处理和推理。符号主义的人工智能系统通常由大量的规则组成,这些规则用于处理符号并生成新的符号。符号主义的人工智能系统在许多领域取得了成功,例如专家系统和自然语言处理。
连接主义的核心思想是,智能可以通过模拟人脑的神经网络来实现。人脑的神经网络由大量的神经元组成,这些神经元通过突触连接在一起。神经网络通过学习来处理信息并做出决策。连接主义的人工智能系统通常由大量的神经元组成,这些神经元通过学习来处理信息并做出决策。连接主义的人工智能系统在许多领域取得了成功,例如图像识别和机器翻译。
在早期的人工智能领域,符号主义是主要观点,而现在的人工智能模型,几乎都是基于神经网络的连接主义。一直有争论的观点是:在我们通往 AGI 的道路上,还需要符号主义吗?
<aside> 💡 需要说明的是,AGI 需要符号主义不是说抛弃连接主义,而是将两者结合。
</aside>
认为 AGI 需要符号主义的人来说,主要是对于知识的理解,他们认为知识=数值+符号,符号主义和连接主义的优点是互补的:
连接主义:数据驱动
符号主义:知识驱动
如果有一个大型知识库,符号主义就可以从知识库里抽取知识来回答问题。用一个简单的示例来介绍符号主义如何进行问题,提问:向日葵会光合作用吗?
模型会从知识库搜索相关知识,它会检索到:[植物会光合作用] 和 [向日葵是植物],那很明显,模型就会回答:向日葵会光合作用。尽管这看上去这答案很死板,但它是严格对的。这个时候如何有连接主义,它可以帮助符号主义在答案绝对正确的前提下,丰富生成的质量,使其更加具有创新能力。
要知道,计算机的底层就是符号,也就是01二进制,在神经网络中,Embedding 看起来也非常像符号,通常情况下,任何给定的单词都会被赋予一个唯一的 Embedding,这是一种一对一的方式,类似于 ASCII 码。
数学计算也是一堆符号逻辑,在简单代数中,有三种实体,变量(如 $x,y$)、操作(如 $+,-$)和赋值(如 $x = 12$)。如果我们知道 $x = y + 2$,并且 $y = 12$,你可以通过将 $y$ 赋值为 $12$ 来求解 $x$ 的值,得到 $14$。世界上几乎所有的软件都是通过将代数运算串在一起工作的 ,将它们组装成更复杂的算法。
如果你现在觉得 ChatGPT,Bard,Claude 等主流大型语言模型的给的数学答案不对,实际上就是其没有“理解”数学符号之间的推理。
世界上的许多知识,从历史到技术,目前主要以符号形式出现。这些符号可以是文字、数字、图表、图像、音频、视频等多种形式。
例如,历史知识通常以文字的形式记录在书籍、文章、文档等中;技术知识可能以图表、公式、代码等形式出现;音乐知识可能以五线谱或简谱的形式出现;艺术知识可能以图像或视频的形式出现。
这些符号形式的知识可以被人类理解和使用,也可以被计算机处理。例如,搜索引擎可以处理文字和图像,音频识别系统可以处理音频,机器学习算法可以处理各种类型的数据。
这一派人认为试图在没有这些知识的情况下构建 AGI,而不是像纯粹的深度学习那样从头开始重新学习所有东西,这感觉像是一种过度而鲁莽的负担。