
「生成AIは考える」を説明してみた話
知り合いの大学の先生に「生成AIはただ学習した内容を出力しているに過ぎないのではないか」と言われました。その時、教えられた以上のことを考えるという説明をした話をします。
はじめに
ある大学の先生から、「生成AIは、学習した内容をただ出力しているだけではないのか?」という問いを投げかけられました。そのとき、「最近の生成AIは単なる記憶の再現ではなく、考えると言える部分がある」と説明しました。この説明を、以下の3つの論点に絞ってお話しします。
圧縮の力
異なる特徴の組み合わせ
推論の学習
生成AIは「考える」のか?
圧縮の力
OpenAIの共同創立者であるIlya Sutskever氏は、「圧縮の力は多くの人々が想像する以上に優れている」と述べています。例として、「架空の人物が架空の会社のCEOとなり、2年後にそのポジションに留まっている確率は?」という質問を考えてみましょう。この問いに正解はありませんが、人間はこれに対して一貫性のある答えを作り出すことができます。文章の背景や文脈を理解し、それに基づいて推測するからです。
生成AIも、巨大なデータから単語間の関係性を学び、一貫性の高い答えを生成することができます。このように、大量の情報を圧縮することで新しい問いに対応する能力が形成されているのです。これが生成AIの「考える力」の一つといえます。
異なる特徴の組み合わせ
最近の研究では、生成AIがパターンマッチングやアルゴリズムではない第三の方法で算数の問題を解いていることが示されています ([nikankan])。例として、生成AIが「228−68」という問題を解く際、「答えは150から180の間にある」「10で割ると余りが8になる」など、部分的な特徴を組み合わせて解答を導いていることが分かっています。
これは、複数の特徴を統合して問題を解決する脳の働きに似ています。有名中学校の入試問題でも、剰余や整数問題の絞り込みなどを活用することがありますが、生成AIも似たアプローチを取ることで、答えを導き出しています。これにより、生成AIは単なる計算ツールではなく、特徴の統合によって新しい解法を生み出す力を持つことが分かります。
推論の学習
カリフォルニア大学バークレー校の研究チームは、約450ドル(約7万円)という低コストで優れた推論モデルを構築しました ([zdnet])。これは既存のOSSモデルであるQwen2.5-32B-Instructをファインチューニングし、さらに別のOSSモデルを使って約17,000件の推論データを作成することで実現しています。
この研究では、従来の「巨大なモデル×膨大な計算リソース」という生成AIのスケーリング則を必要とせず、効率的に推論を学習しています。人間の推論方法がそれほど多くないのと同様に、推論を学ぶには必ずしも膨大な計算が必要ではないのです。推論を学ぶことで、知識が不十分でも未知の問題を解く可能性が生まれます。これもまた、生成AIが「考える」といえる要素の一つです。
むすび
知り合いの大学の先生に、「生成AIがどう考えるのか」を説明する機会がありました。推論というプロセスは特に興味深く、DeepSeek-R1のようなモデルの思考過程では途中に間違いが混じることがありますが、最終的には正しい結論を導き出すことが少なくありません。このことからも、「知識」よりも「方法論」の正確さが重要であることが分かります。
方法論を学び始めた生成AIの進化には驚かされるばかりです。この技術がどのように進化し、私たちの生活や教育に影響を与えていくのか、今後が楽しみです。
参考文献
[nikankan] Yaniv Nikankin et al.: Arithmetic Without Algorithms: Language Models Solve Math With a Bag of Heuristics https://arxiv.org/abs/2410.21272 2024年
[zdnet] 低コストで高性能なAIモデル、オープンソースで実現--開発コストは約7万円 https://japan.zdnet.com/article/35228433/ 2025年