斯金纳箱/ 自身给药系统(食物奖赏/药物奖励)对动物神经系统的影响
(一)奖赏环路的概念
1954年,詹姆斯·奥尔兹和皮特·米尔纳最先认识到脑内存在奖赏系统。他们设置了如下装置:按压按钮使大鼠接受大脑中的对特定部位短暂的电刺激。大鼠会慢慢习得按压按钮的行为,这种现象称为颅内自我刺激。研究者们将大脑内能够介导奖赏相关的行为的区域称为奖赏环路。
(二)奖赏环路的分类
正性奖赏环路和负性奖赏环路:前者增大奖赏效应;后者抑制奖赏效应。
1、正性奖赏环路
中脑边缘多巴胺(Dopamine,DA)系统是奖赏环路的中心。该系统主要起源于两个脑区:中脑腹侧被盖区(ventral tegmental area,VTA)和黑质致密部。VTA多巴胺能神经元主要投射到伏隔核(Nucleus Accumbens,NAcc)、内侧前额叶皮层和基底外侧杏仁核。此外,基底外侧杏仁核的谷氨酸能神经元可以通过 NAcc 间接投射到VTA。内侧前额叶皮层也能投射到VTA,这些脑区共同构成了正性奖赏环路。其中,VTA富含多巴胺能神经元,是调控奖赏功能的主要区域,这就是奖励对动物神经内分泌的作用的体现之一。
2、负性奖赏环路
外侧缰核(lateral habenula,LHb)是负性奖赏环路的主要区域。研究发现,向猴子进行厌恶刺激会强烈激活LHb神经元;用光遗传方法激活大鼠脚内核到LHb的输入会使得大鼠厌恶、逃避所探索的环境。这都说明LHb参与处理和编码厌恶信息。这提示我们可通过激活LHb来抑制奖赏效应,从而治疗药物成瘾、抑制动物刻板行为的目的。
LHb接收来自苍白球、下丘脑和前扣带回等脑区的输入,然后投射到VTA的多巴胺能神经元。这些通路共同构成了负性奖赏环路。
(三)强化对动物行为的影响
由于强化与奖励有一定关系,可以通过奖励的手段使行为强化,这属于正强化,所以这里主要介绍负强化。强化与奖励类似,是对特定行为的加强,帮助动物习得某一特定行为,同时也有助于理解动物的刻板行为。
(1)规避电击。偏爱黑暗的老鼠可以随意选择进入灯光室或者暗室,当它进入一个偏爱的暗室后受到电击惩罚,24小时后,老鼠选择进入灯光室,“电击+灯光”的环境条件使得老鼠因规避电击而学会进入灯光室。这属于负强化对动物行为的影响。
大小鼠穿梭实验分析系统,型号:XR-XC105,上海欣软
相似的实验结果出现在果蝇身上:果蝇也会规避电击,通过这一厌恶型刺激使得果蝇习得某种行为。
(2)规避气体。一定浓度的 CO2会引起果蝇强烈的回避行为。但饥饿会抑制果蝇对CO2的排斥。高浓度的CO2对果蝇是致死,但为了生存,果蝇会减弱对CO2的回避,去靠近释放CO2腐败的水果(果蝇的食物)。
在T型迷宫两臂分别通入OCT(某种果蝇厌恶的气味)和新鲜空气,果蝇会因为规避OCT而选择充满新鲜空气的区域。
(3)规避苦味。印楝素是一种苦味剂,具有拒食、忌避、抑制生长发育、诱导凋亡和自噬等多种作用机制。
动物形成味觉记忆后可利用它来回避有毒食物。昆虫口器伸展反应是分析昆虫味觉行为的一种经典的行为范式,能够快速地检测厌恶性味觉记忆的形成。
用蔗糖刺激果蝇足部,同时将奎宁、印楝素等不同溶液让果蝇伸出口器取食。一段时间后用蔗糖刺激果蝇足部,其口器不再伸展。这是因为之前蔗糖的足部刺激伴随着印楝素这种苦味物质的刺激,形成了厌恶性味觉记忆,果蝇为了规避苦味,就会学会拒绝甜味。
糖水偏好实验系统,型号:XR-XTS402,上海欣软
(四)强化影响动物行为的神经机制
能产生愉悦感的奖励刺激(如食物、金钱等)与正强化相关;撤销厌恶刺激时产生的放松感,与负强化相关。
Kravitz和Kreitzer认为:接受腹侧被盖区多巴胺支配的神经元,在纹状体中组成两条平行的投射通路,其中直接通路从背侧纹状体的中型棘状神经元经过外苍白球投射到视丘下核,回返支配腹侧被盖区,选择性地表达低亲和性D1受体;间接通路从背侧纹状体的中型棘状神经元出发,投射到黑质网状和内苍白球的神经元,回返支配腹侧被盖区,选择性表达高亲和性D2受体。
其中,正强化对动物行为及神经内分泌的影响与奖励相似,而负强化的作用在上文也已阐述,它可以通过让动物规避某一惩罚,而习得与之相反的另一选择所关联的行为,简而言之,强化作为应激原,也是帮助动物确定某一行为。
综上所述,奖励与强化作为应激原,都可以帮助确定动物的特定行为,让动物习得某种动作。而动物行为的改变是表象,奖励与强化实际上是通过影响动物神经系统、内分泌系统来达到改变动物行为的目的。未来还需要更多的研究去探索奖励与强化对动物行为、神经内分泌的潜在作用。