"オペラント条件付け"の誤解 ~褒める/叱るは必ずしも報酬/罰とはならない、条件付けに嫌悪刺激を用いることの効果と危険性~
はじめに
これらは特に教育の文脈で使用されることが多いように思う。例えば、ある子供の親がいたとして「子供が家で宿題をやらない。何とか家で宿題をさせられないか」と考えたとする。これに対して、宿題をしていないという望ましくない行動をしているときには、叱り、宿題をしているときには褒めるのである。
二つ目の言説に関する具体例としては、体罰が挙げられよう(ここでの"体罰"は肉体的なものだけでなく、精神的なものも含む)。体罰禁止が叫ばれて久しいが、中には「確かに倫理的には問題がある。だがそうは言っても、論理立てて説明するだけでは、聞かない人だっている。そういう人には、いわば『痛い目』に合わせて、自分で理解させるしかないんだ」と主張する人もいるだろう。
以上で述べたように直観的に見ても、これらは間違っているようには思えない。それどころか、過去の経験則から合致しているようにすら感じられる人もいるかもしれない。
しかし、その直感に反して上記言説は必ずしも正しくない。
もう少し詳しく言えば、一番目の言説については「正しくはある。だが、切り落とされている現象が多くあり、解釈には細心の注意が必要。誤解を招きかねない表現である」、二番目の言説については「一時的には望ましくない行動は減退するが、永続的に続くか疑問符がつく。また、嫌悪刺激を用いた行動の消去手続きには多くの問題があることが確かめられている」となる(※1)。
本文では、上記を根拠と共に詳しく見ていく。
なお、一応断っておくと、以下で述べる事項は、すべて行動分析学的な立場から見たものとなる。ただ、そもそも上記言説が、行動分析学的な考えをベースにしていると思われるため、特に問題にはならないと考える。
一つ目
オペラント条件付け
この言説は、恐らくオペラント条件付けをベースにしていると考えられる(※2)。
オペラント条件付けとは、行動が出現した直後の環境の変化によって、その後の行動の出現頻度が変わる学習、である。
少し言い回しが難しくて、イメージが難しいかもしれない。具体例を挙げよう。
例えば「誰かにご飯を作る」という行動を考えたとしよう。このとき、ご飯を作った相手に褒められた場合、この行動の出現頻度は増えると考えられる。また、逆に、ご飯を作った相手に「まずい」と言われた場合、行動の出現頻度は減少すると考えられる。
このように、人間は、行動に応じて与えられる刺激によって、行動の発生頻度を増加させたり、現象させたりするのである。
上記の例において「ご飯を作った相手がまずいと言った」という刺激は「ご飯を作る」という行動の出現頻度を減少させる。前述のような、行動の発生頻度を減少させる刺激を弱化子と呼ぶ。
また、「ご飯を作った相手がご飯を褒めた」という刺激は「ご飯を作る」という行動の出現頻度を増加させる。前述の様な、行動の発生頻度を増加させる刺激を強化子と呼ぶ。
加えて、行動の発生頻度が増加した事実・過程をまとめて強化といい、行動の発生頻度が減少した事実・過程をまとめて弱化という。
ここで、注意が必要なのはある刺激が弱化子であるか、強化子であるかは、実際に行動の発生頻度の変化を見るまでは分からないという点である。
先述の例では、ご飯を作って褒めたときにご飯を作るという行動の発生頻度が増加した、という前提があるからこそ、ご飯を作った相手がご飯を褒めた、という刺激は強化子であると言える。
もし仮に、ご飯を作った相手がご飯を褒めた、という刺激を与えても、ご飯を作るという行動の発生頻度が増加しなかったのであれば、その刺激は強化子ではない。
このことは、「行動分析学 ─ 行動の科学的理解をめざして」にも次のように記述されている。
正の弱化、正の強化、負の強化、負の弱化
もう少しだけオペラント条件付けについて詳しく述べておく。前節では強化と弱化について述べたが、ここからさらに何かを付け加えて強化/弱化するのか、何かを取り去って強化/弱化するのか、で下記の4つに分類することが出来る。
1. 正の弱化:特定の刺激を付加することで、特定の行動の発生頻度が減少すること。例:先生の怒鳴り声で、生徒の私語が止む。
2. 正の強化:特定の刺激を付加することで、特定の行動の発生頻度が増加すること。例:おつかいに行ったら、お金をあげる。
3. 負の強化:特定の刺激を除去することで、特定の行動の発生頻度が減少すること。例:遅刻の連絡をしておけば、仮に遅刻したとしても、叱責されない。
4. 負の弱化:特定の刺激を除去することで、特定の行動の発生頻度が減少すること。例:子供が挨拶しても、自分が挨拶を返さないようにした。すると、子どもは挨拶しなくなった。
何が間違っているのか?
では、あの言説は何が間違っているのか? 察しの良い方なら、気づいたかもしれない。
そうである。褒める、叱るという刺激は、必ずしも強化子、弱化子とはなり得ないという点に大きな落とし穴があるのだ。望んでいる行動を「子供が宿題をやる」にしたとして、話を進めよう。
もしかすると、普段からその子供は両親から褒め慣れていて、今更宿題をやったことで褒められたとしても、大して嬉しくなかったのかもしれない。そうであれば、褒めるという行為はもはや強化子ではない。
両親は叱るという刺激を弱化子だと思って与えていたが、実は子どもは親からの注目に飢えていて、叱るという刺激が意図せず強化子の役割を果たしてしまう場合も考えられる。
また弱化、強化というプロセスは、何も単独で起きているわけではない。時には、複数個の強化、弱化が同時並行で起きている場合も考えられる。いくら宿題をやらせようとして、何かしらの報酬を与えても、それを上回る正の弱化/負の弱化が起きているのであれば、まずそれを取り除かないことには一向に事態は改善しないであろう(※3)。
望ましい行動をしたら褒めて、悪い行動をしたら叱る。これで行動を矯正できるはずだ。という言説は、ある意味では正しいが、あまりにも事象を単純化しすぎている。褒めればいい、叱ればいいという問題ではないのだ。
なお、正の弱化を行う目的で叱るという行為を行うこと自体も、相当のリスクをはらんでいる。詳しくは、二つ目の言説を紹介するときに紹介する。
ではどうすればいいのか
正直…………どう行動を取れば良いのかというのは、ケースバイケースである(※4)。子どもに宿題をやらせたい、という先ほどの例であれば、まず現状を詳細に把握する必要がある。子どもが刺激にどのような行動を示しているのか? 子ども自身に特筆すべき特性はないか? 等である。その上で、どのような介入を行えばよいか検討する必要がある。それは、宿題をするという行動を強化させようとする試みかもしれないし、宿題をするという行動を阻害している何かを取り除く試みかもしれない。
実際の問題に対し、行動分析学的な見方を行い、調査し、実施し、実施した結果を観察する。言うのは簡単だが、これを正確に実行するのは相当な困難が伴う。問題の程度にもよるが、専門的な知識を持った人物の介入が望ましいと、個人的には思う。
理論はあくまで一つの見方を提供するにすぎず、理論を現実世界に適用するには多くの経験と知識を要するのである。
二つ目
何が間違っているのか?
上の図式は、まさしく正の弱化といえる。嫌悪刺激を与える、加えることで、行動の発生頻度を減らしているからである。日常でも、騒いでいた子どもに対し怒鳴り声をあげることで騒ぐのをやめる、といった具合に正の弱化と言える事象に遭遇することは多々あるだろう。
だが既に取りあげたように、この手続きには倫理的な観点以外にも、様々な問題点がある。以下詳しく見ていこう。
嫌悪刺激を用いた手続きの問題点
1. 効果が一時的なものに留まる可能性が高い
1. 確かに嫌悪刺激を与えれば、一般的に正の弱化の原理に従って、望ましくない行動が起きる頻度は減少すると考えられる(※5)。
2. しかし問題行動が生じ続けているという事象は、問題行動が何らかの要素によって強化されて続けているという事実を示しているため、嫌悪刺激を与えるのをやめてしまえば、問題行動は復活してしまう。根本的な解決になっていない。
2. 嫌悪刺激によって発生した不快な感情が、他の無関係な刺激と結びついてしまう可能性がある
1. ある子供が、教室で問題行動を起こしたため、叱責される、という手続きが繰り返されたとする。すると教室という環境と、嫌悪刺激によってもたらされる不快な感情が結びついてしまい、教室に入っただけで、強烈な不安感、動悸といった感情が誘発されてしまう可能性がある(※6)。
3. (適切な代替行動が示されていない場合)ただ単に、嫌悪刺激を与えられないように振る舞うだけで、望ましくない行動を行わなくなるとは限らない
1. 先生の前で騒ぐと先生に殴られる、という手続きを行ったとしても、先生の前で騒がなくなるだけである。なぜなら、これだけでも嫌悪刺激は十分に回避されるからである。
4. 嫌悪刺激の強度がエスカレーションする可能性がある
1. 嫌悪刺激による行動の抑制は極めて即効性が高い。一度嫌悪刺激を与えることで、望ましくない行動が抑制できてしまった場合、その事象自体が、「嫌悪刺激を与える」という行動の強化子となり得る(※7)。
2. また嫌悪刺激には馴れが生ずる。すると、今までと同じ強度の嫌悪刺激では、行動が抑制できなくなり、さらに強度を強めるほかなくなる。
以上は問題点の一部にすぎない。
嫌悪刺激を用いた手続きはリスクが高い上に、効果も限定的である。その上嫌悪刺激を用いた手続きよりもリスクが低く、効果が高い手法は多く存在する(※8)。積極的に嫌悪刺激を用いた手続きを採用する理由は、どこにもないのである。
無論、嫌悪刺激を用いた手法に全く効果がないわけではないから、その全てを否定することは出来ない(※9)。しかしながら、嫌悪刺激の使用は厳格な条件下で、慎重に使用されるべきものであり、間違っても第一選択となるような手法ではない。にもかかわらず、依然として嫌悪刺激を用いた手法が使用されているのは、即効性が高く、手法の実施が容易(殴ったり、罵倒したりするのは誰でも出来る)であり、なおかつ嫌悪刺激を用いた手法以外の行動改善の手法を知らないためであると考えられる。
日本行動分析学会が公開した「体罰」に反対する声明では、嫌悪刺激が実際に効力を持つ(一時的ではなく、将来にわたって行動の発生頻度が抑えられるか)条件として、以下14の条件を挙げている。これらすべての条件が満たされる場合は、日常生活において、ほぼないと言って差し支えない(苦痛刺激は、嫌悪刺激と読み替えて良い)。
※ここで言う負の罰とは、本記事で言う負の弱化と同じ意味である。
ではどうすればいいのか
望ましくない行動が、なぜ発生しているのか、その行動は本人にとってどのような役割を果たしているのか、というのを分析する必要がある。行動の機能分析という手法である。それを十分に行った上で、どのような介入を実施するか検討する必要がある。当然、介入した結果、望ましくない行動が本当に減少しているかどうか、観察する必要もある。
既に一つ目の言説の議論で記述したとおり、実践には専門的な知識が必要で、仮に自身で実践するにしても、専門家のアドバイス下で行ったほうが望ましいのは言うまでもない(※10)。
専門家からアドバイスをもらうのが難しい場合でも、書籍等で行動分析学について一通り勉強してから、実践することを強く勧める。誤った介入は、予期せぬ副作用をもたらす可能性がある。
最後に
オペラント条件付けに代表される行動分析学の理論は、見かけ上大変単純で理解しやすい。直観的にも受け入れやすい。しかし、それは見かけだけである。本記事で詳しく述べたように、現実にこの理論を適用するには、多くの注意が必要なのである。現実世界は我々が思っているよりも、はるかに複雑で、難しい。
本文章が、行動分析学を学ぶ一つのきっかけとなれば、幸いである。
参考文献
詳細は下記文献を参照されたい。
1. 坂上貫之・井上雅彦,"行動分析学 行動の科学的理解を目指して",有斐閣アルマ,2018
2. ユーナス・ランメロ、ニコラス・トールネケ,"臨床行動分析のABC",日本評論社,2015
3. H・J・アイゼンク,"心理学における事実と虚構(pp.220-225)",誠信書房,1968
4. 阿能弘,"異食行動への嫌悪療法の適用",オペラント行動教育最新事例集,日本行動教育研究会,1983,pp.95-97
5. D・J・ウェスト,"同性愛(pp.260-261)",人文書院,1977
6. 遠藤辰雄,"学習の原理と保護観察",更生保護と犯罪予防,2(3)(7),日本更生保護協会,pp.3-15
7. 吉野俊彦,"罰の効果とその問題点――罰なき社会をめざす行動分析学",心理学ワールド,80,公益社団法人日本心理学会,2018,pp.5-8
8. 日本行動分析学会,"「体罰」に反対する声明",2014,https://j-aba.jp/data/seimei2014.pdf,閲覧日:2024-07-26
注釈
※1:嫌悪刺激の例として、罵倒、棒で体を叩く、不快な匂いを嗅がせる、電撃ショックを与える、などが挙げられる。
※2:三項強化随伴性を使った説明も考えられる。すなわち弁別刺激、オペラント、強化子の三項による随伴性である。応用行動分析では、この考え方をベースにしたABC分析(ある人物の行動をAntecedent:先行刺激、Behavior:行動、Consequence:結果という枠組みでとらえる分析手法) が用いられる。どちらかと言うと、こちらの方で説明したほうが、実用においては望ましいだろうが、説明が煩雑になりすぎるのを防ぐため、オペラント条件付けのみの説明としている。
※3:他にも、レスポンデント条件付け(パブロフの犬で有名)や、関係フレームづけ(恣意的に適用可能な関係反応,AARR)、ルール支配行動が挙げられる。さらに言うと、一つの強化という現象が、別の強化の現象であったり、レスポンデント条件付けに関わる場合も考えられる。
※4:それだけで本が一冊出来る。
※5:嫌悪刺激が望ましくない行動の弱化子となっているとすら、必ずしも言えないのである。嫌悪刺激が与えられることによって、「痛てぇな。むかつく。そこまでするんだったら、逆に問題行動をしてやろう────」と嫌悪刺激が問題行動の強化子となってしまう可能性すらあり得る。これについては一つ目の言説に関する説明で、既に記述した。
※6:本現象は、パブロフの犬で知られるレスポンデント条件付けで説明ができる。なお、一度教室-嫌悪刺激という図式が獲得されてしまうと、今度は教室と似たような環境、例えば学校の建物そのものであるとか、学校ではない狭い教室にまで、発作が起きる範囲が拡大されてしまう恐れもある(これを専門用語で般化という)。
※7:先生-生徒、というのは、一方的な関係ではない。先生が何らかの介入を生徒に行ったとすると、先生もまた生徒から介入の結果によって、行動が支配されているともいえる。先生と生徒は、互いに影響を及ぼしあう存在なのである。
※8:問題行動が起きやすい環境を改善する、問題行動の抑制を目指すのではなく、望ましい行動の強化を行って間接的に問題行動の抑制を目指す、問題行動が起きていないという事象に対し強化する手続きなど、様々な手法が考えられる。
※9
嫌悪刺激が用いられる行動療法の一つに嫌悪療法(Aversion Therapy)がある。嫌悪刺激には、電撃ショック、薬による吐き気・頭痛の誘発などが使用される。いくつか適応例があり、アルコール依存症に対する治療(抗酒剤という薬物を服用し、飲酒した場合に不快反応が起きるようにする)、異食行動、同性愛といった性的志向を矯正する(今の価値観では信じられない行為だが、数十年前は行われていた)、過食に対する治療等、望ましくないとされる行動を抑制する目的の治療に用いられてきた。
効果があったという報告もある一方、持続性がなく問題行動が再発する、効果がなかったとする報告もまた同様に存在し、エビデンスは一定しない。特に異食行動の矯正に使われた例では、オペランド条件付けと併用されていた。嫌悪療法単独で使用されていないのである。
嫌悪療法自体に相応のリスクがあること、より安全で効果が高い手法が存在することを踏まえれば、やはり積極的に用いるべき療法とは言い難い。
文献で確認できた嫌悪療法は、他者から嫌悪刺激を与えられるものであるが、自分自身で与える嫌悪刺激を用いた嫌悪療法も同様であると考えられる(例えば、暴力を振るいたいという衝動が自分の中に湧き上がってきたときに、手首に巻いたゴムバンドを弾いて痛みを自分自身に与えて、衝動を抑える、など)。
※10:専門家へのアドバイスを強く勧めているのは、自身の行動や自分と関わりが深い人間の行動を、自分だけで客観的に把握するのは困難であるから、という理由もある。得てして人間は「自分のことは自分が一番よく分かっている」と思い込みがちである(私もそう)。
記事の紹介
本記事と同じく、オペラント条件付けの誤解について説明している記事があった。こちらも、ぜひ参考にして頂きたい。