教師あり学習と強化学習の違いはどこにあるのか
教師あり学習
教師あり学習では、あらかじめ答え(正解ラベル)が付与された問題を大量に学習させ、新たな問題が入力された時に答えを出力できるようにする。
強化学習
なんらかの選択をさせ、その行動に対する評価(報酬)を与え、評価が大きくなるような行動の仕方を学習させる。「教師あり学習」の答え(正解ラベル)と異なり、報酬はある一つの行動に対して即座に与えられる必要はなく、状況に応じて、何度かの行動を行った結果に対して、与えられる形でかまいません。
これらの説明は機械学習の一つの側面です。
ただ、正解に対する考え方が異なります。
学習の目的
伝統的教育においては、生徒の学業の中に含まれている目的を構成するさいに、生徒が積極的に協力をすることが保障されていない。
この意味合いは、歩くという行動は、地面に立つことによってのみ初めて実行に移されます。ありふれた環境のもとで私たちは、たいした注意を払ってはいません。
たとえば人跡のない険しくでこぼこな山を登るような、困難な名状し難い状況のもとでは、そこにみられる条件がどのようなものであるかについて、極めて注意深く観察しなければならなくなる。
茂木健一郎さん、ひろゆきさん、サトママさんでされていた議論「ChatGPTは12歳未満禁止をすべきか?」の三人三様の主張を聞いて、自分なりに考えてみました。
そして、この例があったか…と思い出し、マルクス・ガブリエルの著書『新時代に生きる「道徳哲学」―自分の自由を手放さないために—』を開いてみました。
その例というのは…
そこにバナナがある。
という状況です。
私が空腹の場合、空腹を満たしてくれるバナナは、手を合わせ「いただきます」と感謝を伝えたくなる存在となるでしょう。もし私が空腹でなければ、バナナがあっても「そこにバナナがある」と視界に入ってくるかこないか、そのくらいの存在になるでしょう。
私たち人間が物理的に実在する物にかかわるとき、すでに思想のレベルが関与しているのです。
マルクス・ガブリエルさんが参考にしている哲学者、ハンス=ゲオルク・ガダマーの言葉は
他者が正しい可能性はある
「相手が正しい」でも「自分が間違っている」でもありません。
ただ単に「相手の観点を、感情も含めて考慮する必要がある」ということです。
私個人としては、子どもが大学生くらいまで育ち、時間に余裕がある親御さんたちは、若い人達の言葉に真摯に耳を傾け、もう一度、社会の状況を観察し学び直す必要があるのではないか…と感じています。