如果奖励来得太容易,大脑还会“重视”吗?
奖励加工包括不同但可能相互依存的心理子成分,包括“喜欢”(对奖励的喜爱)、“想要”(即追求奖励的动机)和“学习”(即与奖励有关的预测性联想和认知)。
奖励加工存在四个不同的时间子阶段: 奖励相关的线索反应,反馈预期,奖励评估,和反馈显著性,各个阶段引发了不同的ERP成分。与奖励相关的线索反应引发的Cue-P3是一个正向电位,在出现罕见的、突出的或与任务相关的刺激后约300毫秒在顶叶头皮部位达到峰值,其幅度随着线索中奖励概率增大而增强;反馈预期引发的刺激前负性电位(stimulus-preceding negativity, SPN)是头皮顶叶部位最大的慢波ERP,反映了对突出反馈信息的预期;奖励评估引发了RewP成分,该阶段有一个明显的ERP差异,奖励反馈之后,在这个时间窗内观察到一个正向的ERP偏差,而在损失反馈之后观察到一个相对负向的ERP偏差;在金钱收益和损失反馈传递大约350-450 ms之后,会引发中心顶叶最大P3,即Feedback-P3成分,与反馈显著性有关,例如,巨额损失和巨额收益都会加强Feedback-P3。
为了提高我们对奖励加工的时间子阶段和不同子成分的理解,该研究使用了“门”任务(Doors Task),该任务能保持对反馈结果的感知控制,同时能将奖励预期最小化。此外,又加入了努力支出操纵(Effort Expenditure for Rewards Task, EEfRT),Treadway等人(2019)利用此范式已经验证了努力支出是“想要”子成分的可靠指标,在这里加入的两个努力支出操纵是指在每次门任务的试验之前,要完成的高努力支出或低努力支出任务。
综上所述,Bowyer等(2021)利用“努力-门”任务以及相关的ERP指标来研究基于努力的奖励加工的时间动态。
结果
配对样本 t 检验的结果显示,与高努力试次相比,被试在低努力时表现出更快的反应速度,且反应速度通常在低努力试次过程中增加,在高努力试次过程中下降(如表1)。
(2)ERP结果
与低努力支出试验相比,高努力支出试验后effort-P3(注意资源投入高时出现的ERP成分)振幅明显增大,feedback-P3振幅明显减小。在预期反馈期间,负性SPN的振幅在低努力时比高努力时显得更大。
结论
参考文献
[1]Treadway, M. T., Cooper, J. A., & Miller, A. H. (2019). Can't or won't? immunometabolic constraints on dopaminergic drive. Trends in Cognitive Sciences, 23(5), 435–448.
[2]Bowyer, C., Brush, C. J., Threadgill, H., Harmon-Jones, E., & Hajcak, G. (2021). The effort-doors task: examining the temporal dynamics of effort-based reward processing using erps. NeuroImage, 228, 117656.