杜新忠戒毒网--戒毒门户 权威媒体
联系杜新忠:13757963812 | 网站地图
戒毒专家—杜新忠记事 《中国禁毒工作》
首页 > 当前位置:>医疗资讯 > 精神科相关 > 正文
精神科相关
经典条件反射与操作条件反射的联系与区别
2015-12-13 15:40:38 来自:知乎 作者:Japcan Zoeng 阅读量:1

经典条件反射

  经典条件反射是巴普洛夫通过用狗做实验得出的。如下图所示:

  这种条件反射涉及到四个元素,分别是:Unconditioned Stimulus (UCS);Unconditioned Response (UCR);Conditioned Stimulus (CS)和Conditioned Response (CR)。同时,经典条件反射大致包含三个步骤,本人将在每个步骤中举例说明生活中的例子。

  第一步:Unconditioned Reflex(无条件反射)

  无条件反射是一种无需学习的、自动发生的行为。也就是说,这是一种“建立”在实验体神经系统中的反射。通常来说,这种反射在特定条件下对实验体具有生存价值。

  Unconditioned Stimulus (UCS) → Unconditioned Response (UCR)

  举例:去牙医诊所拔牙,牙医用电钻钻牙的时候感到疼痛难忍,使得自己想要逃离。这是很正常的生物反应,感到疼自然会想逃离。

  第二步:Conditioning

  在这个步骤中会出现一个新的刺激物(被称为Conditioned Stimulus,简称CS),CS会和UCS进行配对,使两者产生关联。通常来说(但不绝对),配对过程需要多次重复。

  Conditioned Stimulus (CS) + Unconditioned Stimulus (UCS) → Unconditioned Response (UCR)

  此时,我们仍将这种反射称为UCR,因为这种反射仍旧是被UCS触发的,没有证据显示CS可以独立工作并触发反射。

  举例:多次去牙医诊所拔牙,每次都会被电钻弄得疼痛难忍,导致每次去看牙医时都疼得想逃离诊所。

  *由于这时的CS还不能算作真正有效果的刺激物,因此有时候这里的CS被称为Neutral Stimulus(中性刺激,简称NS)。但为了和下文统一,这里直接称其为CS。

  第三步:Conditioned Reflex(条件反射)

  在上一个步骤中配对成功的条件下,CS单独工作也可以产生反射,我们把这种反射称为Conditioned Response (CR),因为这是习得的条件反射。Conditioned Reflex由CS和CR组成。条件反射仍旧是自动的,但区别于无条件发射,这是学习的结果。

  Conditioned Stimulus (CS) → Conditioned Response (CR)

  举例:所有的牙病都治好了,想要去牙医诊所感谢一下医生。但是刚一进入诊所就有一种莫名其妙的、想要逃离的感觉。这时候你已经把诊所和想逃离的感觉配对起来了。

  看完了生活中的例子,我们再来看看巴普洛夫之犬实验。

  在巴普洛夫之犬的实验中:

  狗食是UCS,看到食物的唾液分泌是UCR,铃铛声音是CS,听到铃响的唾液分泌是CR。

  实验过程大致如下:一开始,将一只正常的狗绑在架子上,当它看到狗食(UCS)时会流口水(UCR)。同时,每次这个狗看到食物的时候,实验人员让铃铛发出声音(CS),多次重复之后,铃铛的声音(CS)和狗食(UCS)产生了关联。最终,将狗食(UCS)移走,只让狗听到铃铛的声音(CS),狗照样流口水(CR),产生了条件反射。这是由条件刺激引发的条件反射,即S→R反射,S代表刺激(stimulation),R代表反应(reaction)。

操作条件反射

  操作条件反射由斯金纳命名。实验道具是一种叫做“斯金纳箱”的器具,如下图所示:

  操作条件反射涉及到四个情况:Positive Reinforcement;Positive Punishment;Negative Reinforcement和Negative Punishment。这里要明确两点:“positive”指的是“给予”而不是“好的”,而“negative”指的是“拿走”而不是“坏的”;如果某种行为出现的频率增高,那你做的事情就是“reinforcement”,而如果某种行为出现的频率减少,那你做的事情就是“punishment”。

  *还有一种情况是刺激物对实验体没有效果,这时候刺激物被称为“中性刺激物”,下文将不做考虑。

  接下来本人将对这四种情况在生活中的应用分别进行简要说明,方便大家理解之后的理论部分。

  Positive Reinforcement

  给予实验体期望的东西,以此来增加某种行为的出现频率。

  举例:当儿子将自己的玩具收拾整齐时,父亲给儿子糖果。如果儿子“将自己的玩具收拾整齐”这个行为的频率增加的话,糖果就可以看作是一种“positive reinforcer”。

  Positive Punishment

  给予实验体不期望的东西,以此来减少某种行为的出现频率。

  举例:母亲对在大街上乱跑的儿子大吼大叫。如果儿子“在街上乱跑”这个行为的频率减少的话,母亲“给予大吼大叫”就可以看作是一种“positive punishment”。

  Negative Reinforcement

  拿走或取消某种令人厌恶的刺激物,以此来增加某种行为的出现频率。

  举例:母亲停止对街上正常行走的儿子大吼大叫。如果儿子“在街上正常行走”这个行为的频率增加的话,母亲“停止大吼大叫”就可以看做是一种“negative reinforcement”。

  Negative Punishment

  拿走或取消某种令人向往的刺激物,以此来减少某种行为的出现频率。

  举例:当儿子把玩具弄得一团糟时,父亲将儿子的玩具夺走。如果儿子“把玩具弄得一团糟”这个行为的频率因此减少的话,父亲“将玩具夺走”就可以看做是一种“negative punishment”。

  介绍完操作性条件反射的实际生活应用,我们再回来看看斯金纳的实验。

  在著名的斯金纳箱实验中:

  斯金纳首先在上图的箱子中放入一只老鼠。尽可能排除其他刺激物后,在箱中设置操作杆一类的东西,老鼠可以自由活动,通过触碰操作杆,得到不同的结果。斯金纳箱主要有如下四种形式:

  触碰操作杆时总会有食物掉落下来。通过观察可以研究出食物这个令小白鼠期望的刺激物是否能增加小白鼠触碰操作杆的行为。如果小白鼠多次得到食物后确实增加了触碰操作杆的行为,那么结果就是positive reinforcement。

  小白鼠触碰操作杆时会被电击,当小白鼠不触碰操作杆时,电击停止。通过观察可以研究出电击这个令小白鼠讨厌的刺激物能否减少小白鼠触碰操作杆的行为。如果小白鼠在多次重复后发现按操作杆会遭到电击,并确实减少了触碰操作杆的行为,那么结果就是positive punishment。

  一开始小白鼠被持续电击,当小白鼠按下操作杆时,电击停止。通过观察可以研究出电击这个令小白鼠讨厌的刺激物能否增加小白鼠触碰操作杆的行为。如果小白鼠在多次重复后发现按操作杆可以取消电击,并确实增加了触碰操作杆的行为,那么结果就是negative reinforcement。

  一开始小白鼠触碰操作杆时会有食物出现,而后变成触碰也不再掉落食物。通过观察可以研究出移走食物这个令小白鼠期望的刺激物是否能减少小白鼠触碰操作杆的行为。如果小白鼠得知食物已经被取消,触碰操作杆食物不会再出现,并且减少了触碰操作杆的行为,那么结果就是negative punishment。

  通过一系列实验,斯金纳总结出操作性条件反射,这种条件反射是先有某种反应,而后通过奖惩得到强化,即R→S反射,R代表反应(reaction),S代表刺激(stimulation)。

联系和区别

  联系

  两者都是反应和刺激物之间的联系。巴普洛夫之犬是对食物和铃铛产生唾液反应;斯金纳箱是小白鼠触碰操作杆的行为由于刺激产生改变。

  两者都需要使用刺激对反应进行强化。巴普洛夫之犬是经过多次强化实验后,狗对铃铛产生了唾液反应;斯金纳箱是经过多次强化后,小白鼠的触碰操作杆的频率等有所变化。

  区别

  经典条件反射中,巴普洛夫的狗被固定在架子上,被动接受刺激;操作性条件反射中,斯金纳箱中的动物可以自由活动,通过自己的行为和刺激物进行反应,建立条件反射。

  经典条件反射中,UCS(例如狗食)十分明确;操作性条件反射中,UCS不明确,例如在斯金纳的实验中,操作杆并会不产生类似狗食那种直接刺激。

  经典条件反射中,刺激物强化条件反射;操作性条件反射中,实验体的行为导致刺激物的出现或消失。

  总的来说,经典条件反射是先有刺激再有反应(S→R);操作性条件反射是先有某种反应再获得不同的刺激(R→S)。

  有趣的生活现象

  在上述斯金纳箱的第三个实验中,出现了一个很有趣的现象。小白鼠被放入一个一开始就通了电的箱子,如果小白鼠不去触碰操纵杆,就会被持续电击。尝试触碰了之后,电击停止。于是,小白鼠很快学会了要去触碰操纵杆,减少被电击的次数。

  这是不是跟生活中的某些例子很相似呢?

  孩子不听话,经常会遭受父母的打骂。在这里,“打骂”就相当于“电击”,是一种惩罚行为。于是,孩子们很快就会学着去做某件父母希望他们做的事,无论是收拾屋子也好,专心学习也好,总之就是父母乐意看到的事情。就像实验中的小白鼠很快就学会了去触碰操纵杆一样。看上去,惩罚在短期内是很有效果的。

  但是!这个实验有趣的一点就在于,当彻底不通电之后,小白鼠就再也不去触碰操纵杆了。

  类似地,当不再受到打骂之后,孩子们的不良行为也会很快反弹回来,同时,短期内养成的所谓“良好习惯”也会即刻消失。

  因此,心理学家认为,奖励好的行为比惩罚坏的行为更为有效,也更能让孩子们明白什么是对的、什么是好的。那么自然,当他们明白了该做什么之后,也就不会去做那些不该做的事情了。相反地,有些时候不合适的惩罚甚至从一开始就会产生副作用,让孩子们更难养成好习惯。而且,据报道,经常打骂孩子,会增加他们产生心理疾病和其他疾病的风险。

  本人在这里写这些东西的目的是希望那些迷信“棍棒底下出孝子”的家长们能够反思一下:你们的棍棒,真的能让孩子们养成终身受用的良好习惯吗?还是说在他们表现良好的时候给予他们鼓励会更有效果呢?

[责任编辑]杜新忠
杜新忠戒毒网--戒毒门户 权威媒体