見出し画像

その方法は正しいですか?

動物のトレーニングに携わる人は、いろんな角度から検証された適切なトレーニング方法をクライアント(飼い主)に伝える必要があります。ルールや方法のみを伝えるのではなく、その仕組みを科学的に説明し理解を促すのが望ましいと考えています。

次の記述は、子犬にお座りを教える方法として提示されたものです。

お座りができたら、五回に一回くらいランダムでおやつをあげます
ランダムにすると、いつもらえるかわからないから真剣になる
毎回もらえると、だんだん飽きる

発信者は繁殖を本業とする人でプロのトレーナーではありません。しかし子犬の社会化にもっとも重要な時期に子犬に関わる人物であり、また著名人でもあるため、なるほど勉強になりますと、言葉のまま受け止めてしまう飼い主が多く見受けられました。

だれが発信した情報であってもそのまま鵜呑みにするのではなく、かならず何故そうなるのか質問してみては如何でしょうか? メカニズムを知らず使うと問題が起こっても原因を見つけることは困難ですし、故に修正もできません。

オペラント条件付けを知っている人は、強化子がたまにしか出てこないことで本当に行動を強化できるのかと、違和感を感じることでしょう。ではこの一見有効そうな方法の配慮に欠けている点はどこなのでしょうか。プロのトレーナーに聞いてみました。

特定の条件下でのみ有効

ランダムにおやつをあげる、というのは行動に対して強化子が必ず出るとは限らないということ。通常なら強化したい行動にたいして必ず強化子を出し、行動を繰り返すよう強化していく。これを連続強化スケジュールといいます。それに対して数回に一度だけ強化子を出すのを間欠強化スケジュールをいいます。そして連続よりも間欠スケジュールのほうが行動を強化することも証明されています。しかし、これは学習者がすでに強化対象の行動を習得している場合であり、これから習得しようとする行動には適応されません。

つまり、間欠強化スケジュールは、これから教えたい行動もしくはまだ習得途中の行動には効果がみられません。

連続強化スケジュール

強化したい行動に対して毎回強化子が出るのは連続強化といいます。正の強化を使ったトレーニングでは基礎となる強化スケジュールで、強化したい行動が定着するまでこの方法を使います。個別のお仕事に対して適切な報酬が支払われる事をイメージしてください。

間欠強化スケジュール

前述に対して、何回かに一度だけ報酬を出し行動を強化するのは、間欠強化スケジュールといいます。間欠強化スケジュールには2種類あり、定期的に報酬が出される固定比率間隔スケジュールと不定期に報酬が出る変動比率間隔スケジュールがあります。固定比率間隔スケジュールは月一に給料が支払われる、変動比率間隔スケジュールはギャンブルを想像するとわかりやすいかもしれません。

ギャンブルからわかるように、変動比率間隔スケジュールは強化されやすく消去されにくい。つまりうっかり望ましくなり行動を強化してしまった時、それを修正するのは至って難しい。

問題点は?

では冒頭の記述、子犬にお座りを教える方法のどこ問題があるのでしょうか。

1. おすわりはこれから教えようとしている行動であり、すでに定着してい行動ではないゆえ、ランダムに報酬を出しても行動は強化されない。
2. 出ない報酬を待つために行動をすることは「負の強化」にあたり、トレーニング方法として望ましくない。
3. 望まない行動を強化してしまう懸念がある。
4. 飽きてしまうのは、トレーニングセッションが長すぎる、適切に指示が伝わっていない、強化子の品質が不適切当が考えられる。

ここまででお分かりのように、集中力を持続させるために、ギャンブル的要素を加える方法は、プロトレーナーならクライアント(飼い主)に勧めるものではありませし、まして子犬のトレーニングに使用する方法でもありません。

道具、方法、なんでも然りですが、便利そうだと飛び付かず、必ずそれが作用する仕組みを学んでいただきたい。そして結果何が起こったかのフィードバックもお忘れなく。

いいなと思ったら応援しよう!