如果奖励来得太容易,大脑还会“重视”吗?

奖励加工包括不同但可能相互依存的心理子成分,包括“喜欢”(对奖励的喜爱)、“想要”(即追求奖励的动机)和“学习”(即与奖励有关的预测性联想和认知)。

奖励加工存在四个不同的时间子阶段: 奖励相关的线索反应,反馈预期,奖励评估,和反馈显著性,各个阶段引发了不同的ERP成分。与奖励相关的线索反应引发的Cue-P3是一个正向电位,在出现罕见的、突出的或与任务相关的刺激后约300毫秒在顶叶头皮部位达到峰值,其幅度随着线索中奖励概率增大而增强;反馈预期引发的刺激前负性电位(stimulus-preceding negativity, SPN)是头皮顶叶部位最大的慢波ERP,反映了对突出反馈信息的预期;奖励评估引发了RewP成分,该阶段有一个明显的ERP差异,奖励反馈之后,在这个时间窗内观察到一个正向的ERP偏差,而在损失反馈之后观察到一个相对负向的ERP偏差;在金钱收益和损失反馈传递大约350-450 ms之后,会引发中心顶叶最大P3,即Feedback-P3成分,与反馈显著性有关,例如,巨额损失和巨额收益都会加强Feedback-P3。

为了提高我们对奖励加工的时间子阶段和不同子成分的理解,该研究使用了“门”任务(Doors Task),该任务能保持对反馈结果的感知控制,同时能将奖励预期最小化。此外,又加入了努力支出操纵(Effort Expenditure for Rewards Task, EEfRT),Treadway等人(2019)利用此范式已经验证了努力支出是“想要”子成分的可靠指标,在这里加入的两个努力支出操纵是指在每次门任务的试验之前,要完成的高努力支出或低努力支出任务。

综上所述,Bowyer等(2021)利用“努力-门”任务以及相关的ERP指标来研究基于努力的奖励加工的时间动态。

 方法 
实验设计
2(努力支出类型:高努力,低努力)× 2(反馈类型:收益,亏损)被试内设计。因变量为被试的反应时、反应速率、反应速率变化等行为变量,并记录各个ERP成分的变化。
高努力试次:根据挂锁图像上的数字进行24~36次不等的按键(均值为30)。
低努力试次:根据挂锁图像上的数字进行1~12次不等的按键(均值为6)。
被试:此前均没有参加过门任务实验的40名大学生。
实验流程
实验包括60个试次,高低努力支出各30个试次,且随机出现。收益和亏损是伪随机的,且在高努力和低努力的试次中各50%。
每个试次的流程(如图1):
努力阶段:①呈现注视屏;②呈现挂锁图像以及反应次数,让被试进行按键反应;③呈现挂锁解锁屏。
选择预期阶段:④呈现注视屏;⑤呈现两扇门图像,让被试选择左门或右门;⑥黄色框架框定选择的门;⑦呈现注视屏。
反馈阶段:呈现一个绿色向上的(收益0.5美元)或红色向下的(亏损0.5美元)箭头屏。
图1 实验流程图

 结果 

(1)行为结果

配对样本 t 检验的结果显示,与高努力试次相比,被试在低努力时表现出更快的反应速度,且反应速度通常在低努力试次过程中增加,在高努力试次过程中下降(如表1)。

表1 高低努力支出的配对样本t检验

(2)ERP结果

与低努力支出试验相比,高努力支出试验后effort-P3(注意资源投入高时出现的ERP成分)振幅明显增大,feedback-P3振幅明显减小。在预期反馈期间,负性SPN的振幅在低努力时比高努力时显得更大。

图2 高低努力条件下ERP的差异

 结论 

努力支出增加了对线索的注意力分配,减少了对反馈的预期,降低了每个反馈的显著性。此外,努力支出独特地影响了这些奖励加工ERPs,表明个体的不同程度的动机对奖励加工的子阶段有着不同的影响。
鉴于努力-门范式新颖性,未来研究可能会集中在任务内行为测量和生理测量之间的关系上,并评估努力-门范式在衡量个体差异影响的效用。

参考文献

[1]Treadway, M. T., Cooper, J. A., & Miller, A. H. (2019). Can't or won't? immunometabolic constraints on dopaminergic drive. Trends in Cognitive Sciences, 23(5), 435–448.

[2]Bowyer, C., Brush, C. J., Threadgill, H., Harmon-Jones, E., & Hajcak, G. (2021). The effort-doors task: examining the temporal dynamics of effort-based reward processing using erps. NeuroImage, 228, 117656.

撰稿人:王赟
栏目负责人:李丹
(0)

相关推荐