教師あり学習と強化学習の違いはどこにあるのか
教師あり学習
教師あり学習では、あらかじめ答え(正解ラベル)が付与された問題を大量に学習させ、新たな問題が入力された時に答えを出力できるようにする。
強化学習
なんらかの選択をさせ、その行動に対する評価(報酬)を与え、評価が大きくなるような行動の仕方を学習させる。「教師あり学習」の答え(正解ラベル)と異なり、報酬はある一つの行動に対して即座に与えられる必要はなく、状況に応じて、何度かの行動を行った結果に対して、与えられる形でかまいません。
これらの説明は機械学習の一つの側面です。
ただ、正解に対する考え方が異なります。
学習の目的
この意味合いは、歩くという行動は、地面に立つことによってのみ初めて実行に移されます。ありふれた環境のもとで私たちは、たいした注意を払ってはいません。
茂木健一郎さん、ひろゆきさん、サトママさんでされていた議論「ChatGPTは12歳未満禁止をすべきか?」の三人三様の主張を聞いて、自分なりに考えてみました。
そして、この例があったか…と思い出し、マルクス・ガブリエルの著書『新時代に生きる「道徳哲学」―自分の自由を手放さないために—』を開いてみました。
その例というのは…
という状況です。
私が空腹の場合、空腹を満たしてくれるバナナは、手を合わせ「いただきます」と感謝を伝えたくなる存在となるでしょう。もし私が空腹でなければ、バナナがあっても「そこにバナナがある」と視界に入ってくるかこないか、そのくらいの存在になるでしょう。
マルクス・ガブリエルさんが参考にしている哲学者、ハンス=ゲオルク・ガダマーの言葉は
私個人としては、子どもが大学生くらいまで育ち、時間に余裕がある親御さんたちは、若い人達の言葉に真摯に耳を傾け、もう一度、社会の状況を観察し学び直す必要があるのではないか…と感じています。