获得因果知识是儿童期的主要目标之一,然而大多数这种知识在成人中已经是已知的。我们认为,利用社会推理的因果学习是获得知识的一条快速且重要的途径。我们提出了一个整合因果性知识与关于有意代理人知识的计算模型,但该模型使用的是一个领域通用的推理机制。与单纯基于因果性或混合因果编码模型相比,该模型中的推理预测了质上不同的学习方式。我们通过成人参与者的实验测试了这些预测,并讨论了这些结果与“过度模仿”这一发展现象的关系。
儿童是如何获得概念性知识的?一种答案是,儿童通过与世界的直接经验进行理性推断的能力非常出色——即“儿童如科学家”理论(Gopnik、Meltzoff、Kuhl,1999)。然而,人类文化提供了另一种答案:获得概念性知识的最快途径可能是学习他人已经掌握的知识(Tomasello,1999;Gergely & Csibra,2006)。事实上,儿童所获得的大部分知识,已经为其社会中的成年人所知。这表明,儿童具备社会学习机制,用以编码成人的知识(Lyons、Young & Keil,2007)。我们提出了这两种观点的中间立场:理解有意的代理行为能够将社会环境作为证据来源,从而促进快速学习,而无需专门的心理机制。
人类知识中最深刻的成就之一是对世界因果结构的理解;因果性并非巧合,它一直是研究儿童通过证据学习能力的主要领域之一(Gopnik等,2004)。因此,本文聚焦于非语言社会环境中因果知识的获得。为了探讨社会学习是如何通过领域通用推断过程中的现有概念结构互动而产生的假设,我们构建了一个整合社会和因果表征的计算模型。最近对人类因果推理的建模工作主要集中在因果贝叶斯网络方法上(Pearl,2000;Gopnik等,2004)。这一观点帮助解释了因果学习如何通过事件的共同出现和精心选择的干预措施得以成功。然而,在这种模型中,干预措施被视为系统上的不可解释的行动。与之对比,最近的直觉心理学模型则集中于代理人基于其目标和信念选择行动的过程(Baker、Tenenbaum & Saxe,2007;Goodman等,2006),但它们将世界的结构视为所有代理人都可获得的背景知识。我们将这两种建模方法结合,构建了一个直觉心理学模型,在该模型中,关于世界因果结构的信念被表示并用于行动选择。我们展示了这样一个关于因果代理的直觉理论如何解释干预的来源,并加速因果学习。
我们通过一组提供社会和因果信息的场景实验性地测试了该模型。这些场景的设计旨在区分组合的社会-因果模型与两种替代模型:一个类似的单因果模型和一个混合的门控推理模型。随后,我们利用这些结果解释了儿童基于模仿学习的一个令人困惑的现象。
我们的目标是构建一个同时表示因果知识和有意代理知识的形式模型,并探讨贝叶斯推断在整合两者时与单独对每一部分推断的区别。知识可以通过概率生成模型来表示;贝叶斯推断则是对这种生成知识进行“反转”,即在给定观测证据的情况下,确定关于潜在状态的适当信念。我们首先回顾捕捉因果性和有意代理(某些方面)的标准生成模型,然后描述它们如何整合,最后说明由此得到的模型的预测。
一个因果贝叶斯网络(CBN)模型描述了在给定因果结构 $S$ 和干预或外生行为 $A$ 的情况下,观测到一组事件 $E$ 的概率 $P(E|A, S)$(见图1a)。更正式地说,CBN 由一组变量上的有向无环图构成,并为图中每个变量与其父变量之间的概率依赖关系做出具体说明。这些变量代表事件或状态,边表示因果依赖的事实。对于某些变量,有一个干预:这是一个外生事件,它强制将变量设定为某个特定值,而不考虑其父变量的值。我们将假设变量之间的依赖关系由 noisy-or 函数(每个父变量是充分原因)或 noisy-and 函数(父变量联合是充分条件,个体是必要条件)来描述;这些依赖关系的因果强度 $\varepsilon$ 是一个固定参数。(有关因果贝叶斯网络形式化和用途的更多信息,请参见 Pearl (2000)。)
贝叶斯决策理论(Berger, 1985)描述了理性代理人在面对随机决策问题(SDP)时所做出的选择(见图1b)。一个 SDP 包含了代理人可能采取的一组行动、一个效用函数 $U(E)$,该效用函数捕捉了代理人的需求(即每个可能结果 $E$ 的奖励),以及一个信念函数 $P_B(E \mid A)$,该函数捕捉了代理人对世界如何运作的信念(即某个行动 $A$ 的可能结果)。贝叶斯决策理论规定,代理人应选择一个行动,以最大化其期望效用:
$$ \mathbb{E}_{P_B(E \mid A)}[U(E)] $$
如果我们假设代理人只是近似理性,因此仅以某种“软方式”最大化期望效用,则有:
$$ P(A \mid U, P_B) \propto e^{\beta \cdot \mathbb{E}_{P_B(E \mid A)}[U(E)]} \tag{1} $$
其中参数 $\beta$ 决定决策噪声的大小。
公式(1)可以用于建模一个人在直觉理论中的有意代理,假设该人遵循理性代理假设(Baker等,2007)。