**对他人情绪的敏感性是人类生活许多方面的基础,然而,现有的计算模型在敏感性和特异性上还远不及人类的情绪知识。对单一物理表情的感知通常提供了模糊、低维且噪声较大的他人情感状态信息。**相比之下,观察者基于推断他人如何解释(或“评价”)外部事件与其其他心理状态(目标、信念、道德价值、代价)的关系,来归因于他人的具体细微情感。这些归因与其他心智推理共享神经机制。将情感概念置于一个形式化的模型中,反映人们关于他人心智的直观理论,是有效捕捉人类细致情感理解所必需的。
<aside> 💡 “我宁愿写一本关于常见情感的百科全书,”他承认道。“从 A 开头的‘对搭便车者的焦虑’到 E 的‘早起者的得意’,再到 Z 的‘热衷于掩盖脚趾,或者害怕看到自己的脚会毁掉别人的爱’。”——摘自Nina George的《巴黎小书店》。
</aside>
如果你的朋友正在体验早起者的得意,你会怎么知道?通过快速看她的面部表情和姿态,你会看到她正在体验一种低唤醒的积极情感。要进一步细化这种归因,你需要了解情感的背景和原因。你直觉上知道,如果她选择早起(而不是被哭闹的婴儿不自愿地吵醒),并且利用这些额外的时间相对有利(而不是浪费在数绵羊上),她更可能感到得意。这个例子说明,人类观察者可以识别和推理出高度区分的、或细微的情感。我们在此提出,这些细微情感概念最好在直观心智理论的贝叶斯层次生成模型中得到捕捉。
情感中概念的角色一直存在争议。这个问题在第一人称情感中尤为困难:当我自己感到焦虑时,“焦虑”这一概念在我体验构建中的角色是什么?在这里,我们选择性地解决一个更容易的问题:他人心智的问题。我们能在朋友身上识别出焦虑,区分他们的焦虑、失望或遗憾,并尝试以适当的方式回应;但是我们如何对他人做出如此具体和准确的情感归因呢?为了正式解决这个问题,我们将情感概念置于一个直观心智理论的计算模型中。(注意,直观或外行的理论是有因果结构的,但通常不是显性的、声明性的或可内省访问的)。
最初对“直观心智理论”的科学描述侧重于其在预测他人有意行为中的应用。最基本地,有意行为可以被预测(和解释)为行动者信念和欲望的结果,并被建模为逆向规划。后续的模型大大扩展了这一基本前提,以捕捉其他类型心理状态之间的因果关系。例如:Greg 的选择还取决于(他对)自己行为成本的信念;他的信念会根据新证据更新;他的行为受习惯影响,等等。这个直观因果理论的层次贝叶斯模型可以解释观察者的前向推断(根据 Greg 的信念和欲望预测他的行为)和逆向推断(根据 Greg 的行为推断他的信念和欲望)。
**人们在直观地推理他人心智时很容易将情感纳入其中,但直到最近,心智理论的计算模型才被详细说明以包含情感概念。在最基本的直观理论中,情感(或情感反应)是由个人如何解释(或“评估”)外部事件与其其他心理状态(目标、信念、道德价值、成本、特征等)之间的关系引起的。例如,Greg 的情感反应将取决于外部事件是否符合他的目标、是否与他的信念相矛盾、是否减少了其首选行为的约束或成本、是否违反了他的价值观,等等。与有意行为一样,同样的直观理论也支持逆向推断。在直观理论中,情感(内部心理状态)引起情感表达(外部可观察的行为),因此观察者可以通过观察到的情感行为来推断潜在的情感(即从观察到的效果进行逆向推断以推测未观察到的原因)。**以这种方式将情感概念置于直观心智理论中似乎显而易见,但有很多影响,本文的其余部分将探讨其中的一些影响。
图1:一个关于他人心智直观因果理论部分的框图和箭头简化表示。椭圆表示不可观察的内部状态;矩形表示外部可观察的状态。约束包括对行动成本、可能性、可控性和其他信念的评估。目标和价值观既包括局部目标和意图,也包括像关系和地位这样的长期价值观,因此可以直接影响表情。模型的核心是推断的“评估”过程:通过其与一个人目标、信念、成本等的相关性来解释外部事件。推断的评估引起情感(内部状态),这些情感导致表情(可观察的行为)。因此,观察者可以根据推断的评估(沿因果箭头)或从观察到的表情(因果箭头的逆向)来预测情感。比较类似的模型见[14,18**,19]。
首先,这种方法提供了一种自然、系统的方式来形式化他人情感的高度区分预测,以及这些预测与我们对他人心智复杂推理之间的联系。尽管目前还没有现有模型完全实现这一承诺,但直观心智理论的部分内容已经在贝叶斯生成因果模型中得到了很好的描述。利用这一进展,同样的形式化方法可以用来建模(某些)人类的情感预测。例如,在一个简单的彩票环境中,可以直接从事件描述中推断出目标评估的两个参数——总体奖励和预测误差——并结合起来以量化细节捕捉观察者预测的情感。同样地,Wu及其同事向参与者展示了简单的道德场景,其中Grace在另一个女孩的咖啡中放了白色粉末。结果证明那是毒药,女孩因此死亡。参与者利用Grace的微笑表情推断出Grace知道那是毒药,并且她希望女孩死亡。这些推断可以精确地描述为参与者直观心智理论中的逆向推断。(在现实世界中,观察者基于情感反应也会做出类似重要的逆向推断。)
即使是儿童对他人情感的最初理解也意味着(简单的)推断评估。基于行动者的观察动作路径(和理性行动原则),非语言婴儿可以推断出行动者的目标(例如越过墙);然后,相对于该目标,婴儿可以区分行动者认为与目标一致或不一致的结果。关键是,到10个月大时,婴儿似乎还可以预测导致后续表情(笑或哭)的相关情感(或情绪状态),并且如果行动者实现目标后表现出负面情绪(哭),婴儿会感到惊讶。在发展过程中,儿童的直观心智理论变得更加复杂,他们的第三方情感归因也随之发展。(注意,尽管一些发展心理学家将“心智理论”一词保留用于对信念的元表征理解,这里心智理论的贝叶斯模型是一个生成的因果理论,涵盖目标和行动以及信念、成本和价值观。)
然而,长期目标不仅是捕捉观察者情感知识的一个或两个组成部分,而是要开发一个形式模型,捕捉人类观察者所做的所有相同推断评估。对于这条研究线的前景,当给予目标评估的人类标签时,计算模型已经可以捕捉相对广泛和区分的情感预测范围。两项最近的研究提供了一致的证据。使用25个评估特征的人类评分,一个模型在6000个现实事件中正确选择了情感标签(在14个标签中)的51%;只有10%的模型选择被人类观察者认为是“错误的”。同样地,使用38个推断评估的人类评分,一个简单模型在200个短故事中正确选择了情感标签(在20个标签中)的57%;人类在同一测试中的准确率为63%。这些模型尚未捕捉到事件与目标的价值观、目标、信念和成本之间的联系,因此尚未推断评估。然而,模型的成功表明,一旦包含这些联系,直观心智理论将捕捉到人类关于情感的共享知识的很大一部分。
其次,我们的提议为基于推断评估(前向推断)和感知情感表情(逆向推断)组合的预测提供了新的见解。人们直觉上认为面部包含关于他人情感的最具揭示性的信息。然而,越来越多的科学证据表明,**基于面部的情感归因实际上是不确定的、噪声大的、低维度的。同一个面部配置可以被归因于多种不同的情感;**而面部感知到的情感空间可以通过少数几个维度来捕捉。甚至事件的效价(是否符合目标)在高强度面部表情中也不能被可靠地感知:完全相同的面部配置可以同等可能地被归因于极度喜悦(孩子意外从军队归来)、极度痛苦(目睹恐怖袭击)、极度快感(高潮)或极度疼痛(无麻醉的乳头穿刺)。为了解析这些情感,观察者依赖于身体姿势(张开双臂、抬起胸部)或事件的推断评估(“他赢得了比赛”)。
尽管身体姿势和事件信息都已知能够解析情感识别,我们的模型在逆向推断(来自身体)和前向推断(来自事件评估)之间做了新的区分。一方面,观察者直觉上推断出面部、身体和声调线索的共同原因(潜在的情感)。因此,整合面部和身体配置以及声调可以提高逆向推断的可靠性和特异性。高强度感知时,姿势信息比面部配置更不模糊,距离远时也是如此;类似地,声调爆发在区分正面情感时更具信息性。因此,根据情境,信息最可靠的模式会主导情感归因;当一个线索模糊时,其他模式的线索可以通过在相似或相邻情感之间转移归因来“锐化”推断的原因。另一方面,事件信息直观上与情感的原因相关,而不是其结果。额外的事件信息不仅可以通过在相似情感之间不断转移来使情感归因更可靠,还可以通过在分离的可能性之间进行选择来实现,因为部分事件知识可以生成对不同(不重叠)替代情感的预测(例如,他在向暗恋对象表白后会感觉如何?)。这一前向和逆向推断之间的差异在先前的研究中被混淆了,这些研究混淆了姿势和事件背景线索:例如,一张乳头穿刺的照片主要包含支持推断评估的事件信息,而不是情感姿势。
同样地,我们可以区分“动态”面部表情比静态表情包含更多信息的两种方式。一方面,动态变化可以更精确地区分表现性面部特征和结构性面部特征(例如,黑眉毛的人与生气表情的人)。动态变化还可以通过在时间上分离混合表情来提供更多清晰度。在这些方面,动态表情可能导致更具体或更有信心的逆向推断(尽管观察者对动态信息本身可能也出奇地不敏感)。另一方面,当面部的时间变化与外部事件结构的时间变化一致时,动态变化通过突出事件的情感相关方面来支持前向推断。例如,观察者对混合表情中的惊讶元素(“睁大眼睛”)通常非常不敏感。然而,当表情变化与事件结果在时间上吻合时,观察者能够准确推断出信息是意外的,并相应地改变他们的推断评估。情感的时间顺序可以进一步限制推断评估;如果人们直觉上认为认知过程的速度不同,那么表情的顺序可以指示哪个隐藏的心理变量与哪个情感相关。
第三,我们提出前向和逆向情感推断之间存在一个关键的不对称性。前向推断依赖于高度区分和细致的推断评估。然而,人们的直观心智理论也是有偏见的,并且基于简化的启发式方法,这会引发系统性错误。我们假设人们共享我们的愿望、价值观、规范。我们低估了人们应对、恢复和从重大事件中反弹的能力。这些在直观心智理论中的偏见转化为对情感预测的系统性错误。相比之下,来自情感表情的逆向推断是不确定的、低维度的,但也相对准确和无偏差。因此,结合这两种来源是独特而强大的:推断评估的前向推断可以提出高度具体、细致和区分的他人情感预测;对他人表情的感知可以确认或否定这些预测,从而在缩小的可能空间内进行快速修正。