杜新忠戒毒网--戒毒门户 权威媒体
联系杜新忠:13757963812 | 网站地图
戒毒专家—杜新忠记事 《2018年世界毒品报告》(中文摘要、英文版全文)
首页 > 当前位置:>戒毒治疗 > 治疗综合 > 正文
治疗综合
物质成瘾及其戒除:基于反转学习的视角
2018-06-24 15:02:19 来自:young心理 作者:蔡雨彤 点击量:
  1 反转学习研究范式及其在成瘾研究中的应用
  
  反转学习(reversal learning)是指个体根据变化的环境适应性地更新刺激—结果的联结(Rolls, 1999)。举一个例子:乘坐 A 和 B 公交都可到达目的地,但 A 公交免费,这时乘坐 A公交更划算。但一段时间后,A 公交需要付费而 B 公交却免费,这时改乘 B 公交更划算。由此可知,反转学习反映了个体的认知(行为)灵活性。经典的反转学习任务是同时给被试呈现两个视觉刺激,选择其中一个有奖赏,另一个有惩罚,被试通过试误学习学会选择能带来奖赏的刺激。一段时间后,刺激的结果发生颠倒(通常不告知被试),即选择先前被奖赏的刺激带来惩罚,而选择先前被惩罚的刺激带来奖赏。这时被试需要打破先前的学习规则重新建立刺激—结果的联结。因此,反转学习任务包括两个阶段:获得/辨别阶段(acquisition/discrimination phase)和反转阶段(reversal phase)。获得阶段主要是基于反馈结果初次建立不同的刺激—结果的联结(Swainson et al, 2000),被试达到学习标准(如,连续八个正确反应)后才能进入反转阶段。在反转阶段,被试重新建立刺激—结果的联结并达到学习标准。获得阶段和反转阶段的学习标准相同,而学习标准的建立有赖于具体的任务设计。
  
  通常,刺激与结果的关系有两种:完全可预测和部分可预测(Dalton, Phillips, &Floresco, 2014; Ineichen et al, 2012; Rygula et al, 2015)。因此,反转学习任务有两种类型:确定性反转学习任务(deterministic reversal learning task, DRLT)和概率性反转学习任务(probabilistic reversal learning task, PRLT)。在 DRLT 中,选择某个刺激带来的是 100%奖赏或惩罚。这种任务较简单,多用于动物研究。在 PRLT 中,选择某个刺激只带来 80%(或 60%)的奖赏或惩罚,其余 20%(或 40%)为概率性反馈(也称误导性反馈或错误性反馈,即对正确反应给予消极反馈)以调节被试对结果的预期(Costa, Tran, Turchi, & Averbeck, 2015)。这种任务能将真正的错误和概率性错误进行对比(Cools, Clark, Owen, & Robbins, 2002),并降低被试采用简单策略的能力(如 lose-shift, win-stay),适用于对人的研究(Izquierdo, Brigman, Radke, Rudebeck, & Holmes, 2017)。后来出现了一些变式,如三选择的反转任务(three-choice reversal task)和四选择的反转任务(four-choice reversal task):依次给被试呈现三/四个刺激,每个刺激对应两种选择,如反应 vs 不反应(Jokisch, Roser, Juckel, Daum, & Bellebaum, 2014; Vanes et al, 2014);同时反转学习任务(concurrent reversal task):几对刺激中的某一(几)对发生反转,其他不反转(Swainson et al, 2000)。此外,有一些研究采用基于其他任务的反转程序来评估个体的反转学习。
  
  近年来,研究者发现物质成瘾与反转学习损伤有关。成瘾者往往在习得某个刺激与某一结果(如奖赏)的联结后,当这一刺激与其他结果(如惩罚)相联系时,他们便很难建立新的联结(Fernández-Serrano, Perales, Moreno-López, Pérez-García, & Verdejo-García, 2012; Trick et al, 2014)。以往动物成瘾的反转学习研究为理解物质成瘾者的反转学习损伤提供了大量信息。研究发现,长期暴露于成瘾物质会损害动物的反转学习(Pope, Boomhower, Hutsell, Teixeira, & Newland, 2016)。这可能说明,由成瘾物质引起的神经适应使得相关脑区放大了对已经建立的、与物质相关的刺激—奖赏联结的神经反应而干扰了对新的、奖赏相关反应的学习。随着成瘾物质的持续使用,这种主动干扰增强,对已建立联结的病理性过度学习最终导致成瘾者不顾后果的物质使用行为。由此可知,在成瘾物质与其消极刺激之间建立习得性联结,对成瘾行为具有矫正的作用。因此,以反转学习视角探讨物质成瘾,有助于深入理解成瘾机制,对成瘾的治疗和预防具有重要意义。以往主要以动物研究为主,近年来人类研究逐渐增多,这说明以反转学习视角探讨成瘾机制已经成为成瘾领域中一个很有价值的研究方向。
  
  2 成瘾行为与反转学习
  
  2.1 成瘾者的反转学习
  
  诸多研究表明,物质成瘾者的反转学习受损,而初始的获得学习正常。例如,Patzelt,Kurth-Nelson, Lim 和 MacDonald III 等人(2014)发现,相比正常人,可卡因使用者的反转错误更多。这与 Daamen 等人(2009)对大麻滥用者的反转学习研究结果一致,并且这些发现得到了动物研究结果的支持(Pope et al, 2016; Wright Jr, Vandewater, Parsons, & Taffe, 2013)。Jokisch 等人(2014)和 Trick 等人(2014)对酒精戒断者的研究也发现,相比正常人,酒精戒断者的反转错误更多。但酒精对动物反转学习的影响则有赖于给药途径。此外,以往研究表明,成瘾者的反转学习损伤有两种表现:频繁的反应转换和过多的反应定势。例如,Patzelt 等人(2014)和 Daamen 等人(2009)的研究表明,相比正常人,可卡因使用者和大麻滥用者表现出更频繁的反应转换。而 Banca, Harrison和 Voon(2016)发现,相比正常人,酒精戒断者的反应定势更多。个体在反转学习中的反应转换(跳转于几个选项之间)和反应定势(条件变化后仍选择某刺激)能够分别反映其冲动性和强迫性(Izquierdo & Jentsch, 2012),这说明成瘾者受损的反转学习与其高水平的冲动性和强迫性有关。
  
  一些 FMRI 研究为成瘾者的反转学习损伤,以及成瘾者的冲动性和强迫性对其反转学习的调节提供了进一步证据。例如,Camchong 等人(2011)研究了可卡因使用者的前扣带皮层(Anterior cingulate cortex, ACC)的功能性连接,发现可卡因使用者的膝部前扣带(perigenual ACC)与背外侧前额叶皮层(DLPFC)的功能性连接比正常人更强,而这种异常与可卡因使用者的反转次数呈显着正相关。证据表明,当认知要求较低时,DLPFC 的参与就足以激活抑制性神经元来抑制干扰信号并提取相关信号;当认知要求较高时,DLPFC 需要协同 ACC(激活抑制性神经元)来抑制高水平的干扰信号并提取相关信号(Medalla & Barbas, 2009)。这说明Camchong 等人( 2011)研究中的任务对于可卡因使用者来说具有较高的认知要求,只有增强ACC 和 DLPFC 的协作可卡因使用者才能抑制干扰信息实现行为调节。Moreno-López 等人(2015)发现,相比正常人,可卡因使用严重程度与可卡因依赖者的反转错误数显着正相关,左侧小脑灰质体积的减少能显着预测可卡因依赖者更多的反转错误。此外,可卡因依赖者更多的反应定势与可卡因使用年限显着正相关,右脑岛/额下回灰质体积减少能显着预测更多的定势反应。小脑参与刺激—结果的表征和反转,额下回/脑岛区域追踪和预期与反应相关 的结果(Carbo-Gas et al, 2014; Ghahremani, Monterosso, Jentsch, Bilder, & Poldrack, 2010),而可卡因可能影响了这些脑区的功能。
  
  另外,Verdejo-Garcia 等人(2015)发现了可卡因戒断者多于正常人的反应定势,及腹外侧前额叶皮层(VLPFC)和背外侧前额叶皮层(DLPFC)激活减弱。VLPFC 和 DLPFC 是行为转换相关的脑区,前者对行为进行自我控制(Tabibnia et al, 2011),后者参与对刺激—结果的更新(Clark et al, 2000)。可卡因使用可能影响了这些脑区对行为的控制和调节。然而,de Ruiter等人(2009)研究表明,相比正常人,男性吸烟者的腹外侧前额皮层激活减弱,而右侧脑岛和额叶岛盖激活增强。这可能表明了尼古丁成瘾者不同于其他物质成瘾者的反转学习脑机制。此外,Ersche 等人(2011)的研究表明,相比正常人,兴奋剂依赖者更多的反应定势与其右侧尾状核激活减弱有关。尾状核对奖赏变化比较敏感(Bellebaum, Koch, Schwarz, & Daum, 2008),而兴奋剂使用可能影响了该脑区对刺激—结果效价的加工。尽管该研究发现兴奋剂依赖者的反应转换也多于正常人,但由于旨在考察兴奋剂依赖者的强迫性,因此未对其反应转换作进一步说明。
  
  综上,物质成瘾者的反转学习存在损伤和一些脑区激活异常,这些损伤和异常与其冲动性和强迫性有关。但由于研究目的不同,成瘾者反转学习脑机制的研究结果也有所不同。未来应进一步考察成瘾者的反转学习脑机制,及成瘾者的冲动性和强迫性对其反转学习的调节。还有一些研究考察了物质相关线索对成瘾者反转学习的影响并获得了不一致的结果。例如,Jokisch 等人(2014)发现,相比正常人,酒精戒断者存在一般性而非特定于酒精相关线索的反转学习损伤。然而,Levy-Gigi 等人(2014)发现,相比阿片戒断者,美沙酮维持治疗者表现出特定于物质相关线索的、对积极联结的反转学习损伤。研究表明,物质相关线索会明显增加纹状体多巴胺的释放(Everitt & Robbins, 2013),这可能使得美沙酮维持治疗者很难去反转物质相关线索下的积极联结。而对于物质相关线索对反转学习的不同影响,一方面可能是因为确定性反转学习任务太简单,未能有效地检测出美沙酮维持治疗者在中性线索下的反转学习损伤(Levy-Gigi et al, 2014)。另一方面,可能与这两项研究中对照组不同有关。值得 一提的是,在 Jokisch 等人(2014)的研究中,发现酒精戒断者的获得学习相比正常人也存在损伤,这不同于以往的研究结果,可能有赖于具体的研究设计(Jokisch et al, 2014)。
  
  除此之外,一些研究没有发现物质成瘾者的反转学习损伤。例如,Vanes 等人(2014)发现,酒精戒断者和正常人在行为层面上的反转学习表现不存在差异。但回归分析表明,酒精戒断者的学习速度更慢,学习效率更低。这说明酒精戒断者可能需要更多的努力来反转先前已习得的联结,而行为数据上缺乏组间差异可能是因为采用了确定性反转学习任务(Vanes et al, 2014)。另外,Ersche, Roiser, Robbins 和 Sahakian(2008)发现,相比正常人,安非他命使用者和阿片使用者的反转学习不存在差异。这与动物研究不一致,即长期暴露于安非他命会损害动物的反转学习(Cox et al, 2016),而长期暴露于海洛因提高了动物的反转学习(Morrison, Thornton, & Ranaldi, 2011)。对于这些不一致结果,可能存在以下原因:首先,反转学习不仅受多巴胺调节,还受 5-HT 的调节(Clarke et al, 2005),而安非他命对 5-HT 的影响有赖于其剂量(White & Kalivas, 1998)。其次,海洛因提高了动物的反转学习可能反映出海洛因对反转学习的影响仅有赖于多巴胺系统,并且不排除特定实验范式的影响(Morrison et al, 2011)。此外,笔者认为,Ersche 等人(2008)研究中的阿片使用者,同时包括美沙酮维持治疗者和海洛因使用者,这种组内异质性也可能会混淆研究结果。因此,未来研究需要对这些可能性进行验证。
  
  2.2 反转学习能力对成瘾行为的预测
  
  一项研究对比了美沙酮维持治疗者和阿片戒断者的反转学习,发现阿片戒断者的反转学习明显好于美沙酮维持治疗者。研究者认为,反转学习好的成瘾者更有可能维持长期戒断(Levy-Gigi et al, 2014)。Smith, Benzina, Vorspan, Mallet 和 N’Diaye(2015)研究表明,尽管可卡因使用者和可卡因戒断者的反转学习表现差于正常人,但可卡因戒断者的反转学习明显好于可卡因使用者。这一结果可部分解释为戒断治疗改善了可卡因使用者的反转学习损伤,同时可能说明反转学习损伤小的可卡因使用者更可能维持戒断(Smith et al, 2015)。尽管 Gullo, Jackson 和 Dawe(2010)考察了大学生的冲动性、反转学习和危险性饮酒的关系,发现反转学习不能预测个体的危险性饮酒行为。但研究者认为,这主要是由于大学生样本中反转学习差到面临物质使用风险的个体比较少。此外,最近的证据表明,个体在使用物质之前,预先存 在的反转学习差异能预测个体的成瘾倾向。例如,有一项研究对大鼠进行可卡因自身给药(14天)前后的反转学习进行了评估,发现自身给药之前大鼠在对积极结果敏感性上的差异能预测随后的自身给药行为,即对积极结果更敏感的大鼠自我给药更频繁。随着自身给药的进行,大鼠的反转学习受损,对消极结果敏感性降低(Groman, Smith, Chen, Lee, & Taylor, 2015)。奖赏敏感性是冲动性的一个成分,这表明个体在使用物质前的反转学习能力对其成瘾倾向的预测,主要是通过冲动性对个体初始的物质滥用倾向的预测得以实现(Dawe & Loxton, 2004)。然而,目前有关个体反转学习能力对其成瘾行为的预测研究还很少,需要今后研究的进一步验证。
  
  3 总结与展望
  
  本文对近年来物质成瘾者的反转学习研究进行了较全面的分析和总结,发现该领域研究逐渐增多,研究方法趋于成熟。但是,目前大多考察的是可卡因成瘾者的反转学习,对其他物质成瘾者(如大麻,海洛因,安非他命等)的研究还很少,并存在一些问题亟待解决。第一、美沙酮和海洛因都为阿片类药物,但美沙酮维持治疗者和海洛因使用者的反转学习是否一样,及阿片类药物是否会影响 5-HT 系统,目前尚不清楚。第二、物质相关线索会进一步加剧成瘾者的认知损伤(Wang et al, 2012)。然而,目前有关物质相关线索对成瘾者反转学习影响的研究很少,且研究结果不一致。因此,未来应进一步考察物质相关线索对成瘾者反转学习的影响。第三、关于成瘾者反转学习损伤的不同表现,未来应主要考察成瘾者的反转损伤表现与物质使用年限之间的关系,探讨成瘾者的冲动性和强迫性对其反转学习的调节机制。第四、未来应进一步验证个体反转学习能力对其成瘾行为的预测,主要是个体反转学习能力对其成瘾倾向的预测,及成瘾者的反转学习能力对其戒断的预测。这对物质成瘾的预防和治疗具有重要意义。最后,基于以往研究,尽管概率性反转学习任务比确定性反转学习任务更适合评估个体的反转学习,但当任务中有三个以上刺激时,概率性任务可能会大大增加个体的记忆负荷。这时研究者只能用确定性反转学习任务,并且要面临其对研究结果带来的潜在影响。
[责任编辑]杜新忠
杜新忠戒毒网--戒毒门户 权威媒体