はじめに
最近、生成AIのOCR技術が向上し、スクリーンショットからの文字読み取りや文字起こしがかなりの精度でできるようになりました。もちろん、学校の問題を解くことも可能です。建築関係の専門的な試験問題を解かせてみると、AIが時々ハルシネーションを起こすこともありますが、これは普段の業務上でも検証済みです。そこで、今回は簡単問題で図の読み取りがどこまでできるか、各生成AIで試してみました。 6/23記事作成
検証モデル
令和6年の二級土木施工管理技士の問題2を拝借して検証します。
検証する生成AIは以下の5つです。
1.ChatGPT 4o 一番有名どころで私も有料版で使っております。
2.Claude3.5 Sonnet GPT4を超えたといわれ今週バージョンアップ
3.Gemini Pro 上の二つからはちょい後塵を拝しています。
4.Perplexity(パープレキシティ) ソフトバンク系の方はプロが無料
5.Copilot モデルはChatGPTなんですが・・・
問題
各生成AIの回答
1.ChatGPT 4o
不正解
2.Claude3.5 Sonnet
不正解
3.Gemini Pro
不正解
4.Perplexity(パープレキシティ)Sonar Large 32K(ベースはLlama)
正解
5.Copilot
画像分析で失敗。
結果
1.ChatGPT 4o 不正解
2.Claude3.5 Sonnet 不正解
3.Gemini Pro 不正解
4.Perplexity(パープレキシティ)Sonar Large 32K 正解
5.Copilot 不正解?(いつもはできるんですが拗ねたか)
考察
今回のプロンプトはシンプルに「問題を解いて解説を願います。」
としたせいか、曲線を読み取るときに左側をA、右側をBと認識して交差していることを認識しなかったことが不正解の要因となっています。交差をあることや曲線の●と▲について指示をしておくと解けています。
今回の唯一の正解はPerplexityだけです。交差を認識したのは画像認識エンジンの優れていたという点があるということです。どちらかというと次世代のAI検索エンジンという立ち位置ですがかなりの精度があるか感じます。
なお、他の問題も解かせてみましたが、案外優秀で正解ばかりだったため、この問題ぐらいしか差が出なかったという結果でした。
ただし2024/6/23段階の検証ですので来週にはまた違う結果かもしれません。
結論としては、図入りの場合は注意が必要ですが学習用の利用としてもかなり優秀であり過去問解説など分かりづらいときは生成AIの利活用は積極的にしてもよいと考えます。