見出し画像

ぼやき ~ 「子供の成長。子供の認識能力とAI - 自分の認識とはなんだろう?」

まず、この投稿には結論がない。ぼやきなので。
ただ、自分の頭は整理されたかな。


子供の認識と間違い

子供の年齢は1歳半の少し手前。
 子供とお散歩に出かける前に靴を履かせるが、靴底には「R」と「L」の文字が書いてある。右足用にはRightの「R」、左足用にはLeftの「L」という意味だ。子供がそれを見て、「なな」と叫んだ。最初、自分には何を見てそう叫んだのか分からなかったが、すぐに分かった。左足用の靴底に書いてある「L」を見て「なな」と叫んだのだ。
 アルファベットの「L」も180度回転させると数字の「7」のような文字に見える。子供が靴底を見たときに、どのような位置の「L」を見て「なな」と叫んだのか分からなかったが、とにかく「7」と「L」を同一視したのだ。親として、「子供が数字を覚えてくれていたこと」、そして、「それを私に教えてくれようとしたこと」が素直に嬉しかった。

子供への説明

 しかし、子供に「それは7ではなく、L」であることを教えようとした際に、どのように説明すれば良いのか少し考えてしまった。私は相手が1歳半程度で、まだまだ2と5を間違うことも頻繁にあるし全ての数字を2とも言うこともあり(笑)、LがLeftの頭文字であることなんて理解できるはずがないということは分かっていても、説明を怠るようなことはしない。そのため、「これは7ではなく、Lというアルファベットの1文字だよ。どうしてLなのかは、英語でLeftという左という意味で、右の反対なんだよ。でも7に似てるよね」という説明をした。もちろん、子供がその意味を正確に理解しているとも思っていないし、期待もしていない。ただ、どの程度理解しているのかは誰にも分からない。それならば、理解が進むことにベットして教え込むほうが圧倒的に良いだろう。子供の成長可能性は無限大だ。

子供への説明に対する疑問

 そういうわけで説明をしたが、その後に更に幾つか思うことがあった。

  1. その説明は適切なのか

  2. 「L」が180度回転していたとしてその文字を子供が数字の「7」と間違った場合、その理由は何か?

  3.  大人は180度回転した「L」と数字の「7」を区別できるのか。

  4.  大人は180度回転した「L」と数字の「7」を区別できるとして、その理由は何か?

ChatGPTへの相談と回答

適切なのかの判断には基準が必要で、今回の場合、そもそも正解が分からないのでChatGPTに聞いてみた。

ChatGPTへの質問

なるほど。まずは正しい形(正解)を教え、それとの比較を実際に見せるという方法か。それなら貴方(ChatGPT)はどのように「7」と「L」を違うものとして認識しているのか。この辺に興味があるので、これも聞いてみた。

ChatGPTへ数字の「7」とアルファベットの「L」を区別している方法を聞いた結果

なるほど。知りたいのはもっと具体的な方法だけど、想像通り。

ChatGPTの回答への解釈

この回答は大きく2つに分類できると思う。
回答「1.直線の方向と傾き」と回答「3.フォントやデザイン」が1つ目の分類、回答「2.文脈」と回答「4.データパターンの理解」が2つ目の分類。
・1つ目の分類は「形式による判断」
・2つ目の分類は「文脈による判断」
このように分類できるかと思う。

ChatGPTが自分自身が「文脈による判断」で数字の「7」とアルファベットの「L」を区別しているのに、私の質問「子供へ数字の「7」ではなくアルファベットの「L」であることをどのように説明すればよいですか?」への回答には「形式による判断」での方法しか教えてくれないところは興味深い(笑)。「4.楽しく覚えられる工夫」というのが文脈による判断を含んでいるのだろうが、この回答だと分かりづらい。

子供が正しい解釈をするために必要な情報は何か

さて、自分の子供についての話に戻ると、子供は「形式による判断」だけを行って数字の「7」とアルファベットの180度回転した「L」を同一視してしまったと思うので、数字の「7」と靴底に書かれている180度回転した「L」を同一視しないためには「文脈による判断」が必要ではないか。仮に「7」と180度回転した「L」だけを見せられたら、それが数字の「7」なのかアルファベットの「L」なのかを判断することは難しい気がする。そもそもアルファベットの「L」であることすら分からない可能性がある。

子供が正しい解釈をするために必要な文脈とは何か

それでは、数字の「7」と靴底に書かれている180度回転した「L」を同一視しないために必要な「文脈」とは何か

  • 「L」と書かれているものが靴底であること

  • 靴には右足と左足用の2つがあり、それらがペアで提供されること

  • 見ていた靴底が左足用のものであること

この3つがあれば十分なのかな。よくわからない。
まず、「「L」と書かれているものが靴底であること」がわかれば、「7」ではないと認識できるだろうか。もしかすると、「靴のサイズの7cmの7かもしれない」と思う可能性は無いだろうか。その可能性を考慮した場合、「靴のサイズであることを否定する文脈」が必要になるのだろうか。このへんは分からない。右足の靴があって、そこにRと書かれていることを確認して初めてサイズであることを否定できるのか。それとも別の判断基準があるのか分からない。情報が多いほうが良い気がするけれど、情報が多いとそれに応じた処理能力も必要で、情報が多ければ多いほうが良いのかも難しそう。でも、AIを相手とするならともかく、子供にはこのくらいの文脈は与える方が良いことは間違いなさそう。

ChatGPTは「7」と「L」を判別できるのか

まず、アルファベットのLを180度回転したものをキャプチャしてChatGPTに質問してみた。

アルファベットのLを180度回転したものをキャプチャしてChatGPTに質問してみた

間違いを返してきた。これはアルファベットのLだけど、回転させると数字の7と認識した。
次に、少しだけ文脈を追加してみた。

靴底に記載されていたことを追加した

これだけではまだアルファベットとは断定できないでいる。
さらに追加で文脈を追加してみた。

右足の情報も追加

しかし、ここまで文脈を与えても、これがアルファベットのLを回転させたものだと認識できないでいる。
靴が回転していた可能性があることを提案してあげる。


靴が回転していた可能性があることを提案した際のChatGPTの回答

靴が回転していた可能性があることを提案してあげてようやくChatGPTから正解が提案された。
現段階では幼児に物を教えるのと同じレベルでの情報提供が必要なのかもしれない。

最後に

ChatGPTを問いただしてみた。

文脈からの判断ではなく、形状に集中してしまったことをあっさり認めた。
これは裏返すとプロンプトを適切に文脈を与えてあげないと必要な情報を得られない。LLMはICL(In-Context Learning、文書のコンテキストに沿った応答)を行うためこれは当然だけど、改めて重要性を理解した。
LLMは子供と違ってナレッジが膨大なので、適切にコンテキストを与えてあげると子供よりも正確に情報を返すことができるのかもしれないが、LLMのアルゴリズムを私は全く知らないので分からない。かといって、自分自身がどのように数字と回転したアルファベットを判別しているのかも突き詰めて考えれば分からない。言語化できないとLLMへの指示が出来ない(プロンプトを書けない)。そうなるとLLMの進化を待つしかなくなるので、これは困る。しかし、暗黙知と呼ばれるものは言語化できないからこそそう呼ばれるはずで、かつ、優秀な人間の暗黙知に依存する職業が多いのも事実だろう。そう考えるとどこまでLLMに頼れるのか、古典的な手法をメインとしてLLMは補助として使用するのに留めるのが正解なのか、まだまだ道のりは長そう。
子供の成長の方が早いかな。

この記事が気に入ったらサポートをしてみませんか?