数学教員必見 AIの現在地『Gemini』vs『GPT-4o』教師の賞味期限
高校数学を用いてAIの精度を検証してみます
Open AI 『GPT-4o』の検証
◆検証項目
・手書きを読み取る事が出来るか
・問題1 添削の依頼(指摘して欲しい箇所)
①点P(x, y)とおく
②途中式は間違っているのに、答えは正しい
③逆の確かめを記述していない
④最後に軌跡を答えていない
・問題2 解説の依頼
どの程度の解説を書くのか
◆検証結果
・問題1
①点P(x, y)とおく
⇒AIも記述しない
②途中式は間違っているのに、答えは正しい
⇒AIも質問者と同じ間違いをする
「添削=真似」となっている
③逆の確かめを記述していない
⇒AIも記述しない
④最後に軌跡を答えていない
⇒AIは記述する(答えが直線の場合、AIはどうする?)
・問題2
AIは手書きの式を読み取れなかった
⇒この程度の式が読み取れないのであれば、数学の添削は厳しい
◆GPT-4oへの追加質問
◆検証結果
①添削は出来るのか?
⇒不可能
AIは間違った説明をして、間違えを指摘することは出来ない
⇒「否定するな」と、プログラミングされているのかもしれない
②解説が更に丁寧になった
③AIは間違いを指摘しないが、AI自身は間違いを訂正して正しい解答に辿り
着いた
⇒模範解答を読んでも理解出来ない生徒が、更に詳しい解説を求めたとき
には対応可能
④式の読み取りが間違えていると指摘しても、正しく読み取ることは出来な
かった
⇒手書きで書かれた式の添削は厳しい
Google AI 『Gemini』の検証
GPT-4oと、同じ質問をした返答が下図
◆検証結果
問題1
①数学の問の解答を書くだけで、添削をする意思は皆無
②数式を綺麗に表示できない
③答えを間違う
問題2
手書きの式を読み取ることは出来ない
⇒読み取れていない指摘をして再度しても同様
『GPT-4o』vs『Gemini』の数学対決
『GPT-4o』の圧勝
・数式の表記が可能
・内容が正確
・質問者の返答をしようとしている
東京大学の入試問題に挑戦!
挑戦者:GPT-4o
2023年(理系)大問3
難易度 Cレベル:正答率40~60%
GPT-4oの返答
不正解です。
高校の先生方、良かったですね!
AIによる自動添削が出来るようになると、教科教師は不要になります。
まだ数年は需要がありそうです。