
【ChatGPT】x【Gemini】x【Grok】 フェルミ推定で暴くAIの“地頭”を比較
みなさんこんにちは、TierMind編集部です。
最近は多種多様なAIが登場し、情報検索や資料づくりを手軽に行ってくれる時代になりましたね。
いまや多くの生成系AIが仕事や学習を手助けしてくれますが、その中でもとりわけ注目したいのが「数値を推定したり、論理的に組み立てる能力」です。
今回はあえてAIに検索させないという条件で、その“地頭”の部分競わせてみることにしました。フェルミ推定という思考法を使って複数のAIに同じ質問を投げかけ、それぞれがどんな推測や計算プロセスを示すのかを比較しています。
フェルミ推定は“実際のデータを揃えるまでの仮説づくり”として非常に有効です。ぜひ注目してみてください。
では、果たして検索なしでどのくらい的を射た答えが返ってくるのか? ぜひ最後までお付き合いください。
フェルミ推定とは
限られた情報や時間の中で、おおよその数値を素早く推定する手法です。
この名前は物理学者エンリコ・フェルミの逸話に由来します。彼は、核爆発の威力をほぼ暗算だけで近似値を導き出したと伝えられており、その大胆な計算方法が「フェルミ推定」として広まったのです。
たとえば、
「世界には何匹の猫がいるんだろう?」
「日本人は1年間にどれだけのコーヒー豆を消費しているの?」
といった、正確な統計がすぐにわからない事柄でも、ざっくりとした計算過程を積み上げることで、近い数字を導き出せるのが特徴です。
また、ビジネスシーンでも
「新しい市場の規模を素早く見積もりたい」
「必要なリソース量を簡単に算出したい」
といったケースでよく使われます。
このように幅広い場面で役立つフェルミ推定を、AIがどれくらい筋の良い推定で再現できるのか、ぜひ注目してみてください。
フェルミ推定のお題と回答比較
■お題:2024年の東京ディズニーランドの年間来場者数
【問題】
2024年の東京ディズニーランドの年間来場者数をフェルミ推定により算出してください。
【条件】
フェルミ推定の手法を用いること
最終的な数値は言い切ること
必ず解答のために直接の検索は行わないこと
2024年の年間来場者数は1,690万人
●【ChatGPT o1 pro】
回答:1,700万人
1. 基本数値の設定
日本の総人口=約1.25億人
その10%が年1回TDLに行くと仮定 → 1,250万人
2. リピーター補正
複数回行く人を考慮し、1,250万人に+20% → 1,500万人
3. 海外からの来園者数の加算
訪日外国人の約10%がTDLを訪れると仮定 → 約200~300万人を追加
4. 別アプローチとのすり合わせ
1日の来園者数(平日・土日祝)からの積み上げを検証しても、おおよそ1,700万人前後に収束。
人口を基準にして「何割が年に何回行くか」を積み上げる典型的なフェルミ推定。数字のブレは抑えめですが、海外観光客をどの程度見積もるかなどがポイントです。
●【Gemini 2.0 Pro】
回答:4,100万人
1. 基本的な運営条件
1日あたり開園時間=13時間
年間運営日数=360日
天候・イベントなどの要因を整理
2. 瞬間収容人数(X)の算出
アトラクション、レストラン、ショップなどを個別に仮定
全施設合計で1時間に約52,000人滞在可能 → 安全率を考慮し50,000人に
3. 平均滞在時間(Y)の設定
1人あたり4時間と仮定
4. 日・年間来場者数の計算
1日の来場者数=(1時間あたりの人数 × 開園時間) ÷ 平均滞在時間
→ 約162,500人/日、年間で約58,500,000人
5. 現実的な調整
天候・イベントなどを考慮して30%下方修正 → 4,100万人
「パークの瞬間収容人数 × 開園時間 ÷ 滞在時間」という施設運営視点のフェルミ推定。理論上の数字がかなり大きく、調整後でも4,100万人となりました。想定よりも高めに出ているのは「平均滞在時間4時間」や「下方修正率30%」などの仮定が甘い可能性も考えられます。
●【Grok 3】
回答:1500万人
1. 前提と仮定の設定
年間の営業日数を360日と仮定し、TDLの規模や混雑状況から平日と繁忙期の来場者数を設定(平日:3万人、繁忙期:7万人)。
2. 日別来場者数の見積もり
1年を平日(約250日)と繁忙期(約110日)に分け、それぞれの来場者数を算出。
3. 加重平均の計算
平日:3万人×250日=750万人
繁忙期:7万人×110日=770万人
合計で約1520万人となる。
4. 現実性の確認と調整
過去の実績(TDLとTDS合わせて2500~3000万人程度)を踏まえ、TDL単体で1500万人前後と見積もるのが妥当と判断。
5. 最終決定
細かい端数は切り捨て、最終的に年間来場者数を1500万人と結論
1日あたりの入場者数を平日・繁忙期で分割し、実績ベースに近い数字へ落とし込む形。最終的に「約1,500万人」と言い切るのは、比較的控えめな印象です。
●結果:3つのAIが出した数字(正:1,690万人)
ChatGPT o1 pro…1,700万人◎
Gemini 2.0 Pro…4,100万人
Grok 3…1,500万人
「え、こんなに差があるの?」と思った方も多いのではないでしょうか。ChatGPTが出した値は“ほぼ一致”です。一方、Geminiの約4,100万人という試算は、少し数字が大きめに振れています。
■お題:世界の2023年コーヒー消費量(kg)
【問題】
世界の2023年コーヒー消費量(kg)をフェルミ推定により算出してください。
【条件】
フェルミ推定の手法を用いること
最終的な数値は具体的に示すこと
解答のために直接の検索は行わないこと
2023年の世界全体のコーヒー消費量は約107億kg
●【ChatGPT o1 pro】
回答:100億kg
1. 大まかなアプローチ
世界人口を約80億人とし、その半分(約40億人)が日常的にコーヒーを飲むと仮定。
1人あたりの年間消費量を、1日1杯(10g)から算出した約3.65kgより、実際のばらつきを考慮して4~5kgと見積もる。
その結果、40億人 × 4~5kg = 1.6~2.0×10^10 kg(1600万~2000万トン)というレンジになります。
2. 地域別の積み上げアプローチ
世界をいくつかの地域(欧州、アメリカ、先進国(日本など)、ブラジル、その他の中南米・アフリカ・アジア)に分け、各地域ごとの人口と1人あたりの消費量を個別に仮定して計算。
それぞれの合計値を足し合わせると、全体で約1×10^10 kg(1000万トン)前後というオーダーが得られます。
3. 最終的な概算値の決定
両方のアプローチの結果を比較検討し、概ね 1×10^10 kg~2×10^10 kg(1000万~2000万トン)の範囲が妥当と判断。
最も一般的なオーダーとして、年間の世界コーヒー消費量はおおむね 10^10 kg(1000万トン)前後と結論付けています。
「人口 × 1人あたり消費」というシンプルなフェルミ推定。ヨーロッパや北米、日本などコーヒー消費が多い地域も考慮してやや幅を持たせたうえで、ざっくり100億kgと結論づけています。
●【Gemini 2.0 Pro】
回答:120億kg
1. 全体の母数の設定
世界人口を80億人とし、そのうち約50%(40億人)がコーヒーを日常的に飲むと仮定。
2. 一人当たりの年間消費量の見積もり
1杯あたりの豆使用量を約10g、1日平均1杯、年間300日飲むとすると、1人あたり年間3kgとなる。
3. 全体の消費量の算出
コーヒーを飲む人の数(40億人)に1人当たりの年間消費量(3kg)を乗じ、合計で約120億kg/年となる。
こちらも人口ベースの積み上げ型ですが、
1年を「300日」としたり
1杯あたり10g固定
と比較的単純な前提になっているため、大きめの数字(120億kg)に着地したようです。
●【Grok 3】
回答:73億kg
1. 世界人口80億人のうち、**子供25%(2×10^9人)**は飲まないと仮定。残りの成人約60億人の2/3(約40億人)がコーヒーを飲むと設定。
2. 1人あたりの年間消費量
当初は「1日1杯×10g → 3.65kg」だったが、みんな毎日飲むわけではないと考え平均0.5杯/日に修正 → 1.825kg/年
3. 全体の消費量
40億人 × 1.825kg = 73億kg
4. 現実性の検証
初期計算で146億kgと出たが、世界生産量などを意識し下方修正。最終的に「約73億kg」で結論。
初期計算をしてから「ちょっと高すぎる」と判断し、1日あたりの消費量を0.5杯に下げるという調整を行なったのが特徴的。成人割合を丁寧に見積もっている点も興味深いところです。
●結果:3つのAIが出した数字(107億kg)
ChatGPT o1 pro … 100億kg◎
Gemini 2.0 Pro … 120億kg
Grok 3 … 73億kg
ChatGPTはほぼ近い数字で、Geminiは上振れ、Grokはやや控えめ。どのAIも使った前提や仮定が違うので、これだけのばらつきが出ているのが面白いですね。
今回のように「何人が、どれくらいの頻度で飲むか?」「1杯あたり何グラム?」「子どもは含むのか?」といった細かい仮定をどう設定するかで、推定結果が大きく変化します。
AIのロジックを見ると、
ChatGPTは幅を持たせた計算
Geminiは定数(1杯×300日)でズバッと出す
Grokは途中で修正をかける
など、それぞれの推測スタイルの違いも見えてくるのが興味深いところですね。
■お題:2023年度Amazon純利益
回答:
【問題】
Amazonの2023年の純利益をフェルミ推定により算出してください。
【条件】
フェルミ推定の手法を用いること
最終的な数値は具体的に示すこと
解答のために直接の検索は行わないこと
Amazonの2023年の純利益は、30.4億ドル(約4兆2,900億円)
●【ChatGPT o1 pro】
回答:150億ドル
1. 前提の整理
過去(2021年)の売上高を約4,700億ドルと設定
2023年までに10%前後の成長を続けると仮定 → 約6,000億ドル
2. 利益率の仮定
EC部門の低利益率とAWSの高利益率を考慮し、2023年の純利益率を2~3%と設定
3. 純利益の計算
6,000億ドル × 2% = 120億ドル、×3% = 180億ドル
中央値として150億ドルを採用
4. 最終結論
「Amazonの2023年の純利益は約120~180億ドル、中心値は150億ドル」と推定
売上高の成長率を「年10%」と見込んだり、純利益率を「2~3%」と設定したりと、比較的保守的かつ現実的なロジックに見えます。ただし、実際の決算値(約30億ドル)と比べると、やや高めの結果となりました。
●【Gemini 2.0 Pro】
回答:456億ドル
1. 主な収益源の特定
オンライン小売 (eコマース)
クラウドサービス (AWS)
サブスクリプションサービス (Amazon Primeなど)
広告事業
2. 各収益源の売上高の推定
世界のeコマース市場→約6兆ドル×Amazonシェア15%=9,000億ドル
クラウド市場→約6,000億ドル×AWSシェア30%=1,800億ドル
サブスク(Prime会員2億人×年150ドル)=300億ドル
広告事業=300億ドル
合計=1兆1,400億ドル
3. 利益率の仮定
投資負担があるものの、AWSなどの高マージンを考慮
純利益率4%→ 1兆1,400億ドル×4%=456億ドル
市場全体規模×シェアというトップダウン方式。世界eコマース“6兆ドル”の中でAmazonが15%を握る前提がやや高めに見積もられ、結果的に純利益も膨れあがっています。実際は投資コストやEC部門の低利益率が響きやすいため“理想値”寄りになった印象。
●【Grok 3】
回答:600億ドル
1. 年間売上の推定
米国Eコマース市場を1兆ドルとし、Amazonシェア40%=4,000億ドル
クラウド市場5,000億ドル×AWSシェア30%=1,500億ドル
広告500億ドル+Prime200億ドル=700億ドル
合計約6,200億ドル
2. 利益率の試算(セグメント別)
Eコマース: 5%
AWS: 30%
広告: 50%
Prime: 20%
→ 合計営業利益=約940億ドル
3. 純利益への調整
税金やその他費用を差し引き、約70%が最終利益と想定=約660億ドル。投資コスト等を考慮して600億ドルに調整
「セグメントごとの利益率」をかなり高めに設定しているのが特徴です。広告の利益率50%、AWS30%などは業界的にあり得る数値ですが、全体で見ると大幅な上振れ要因に。最終的に600億ドルという実際よりもかなり大きな数字になりました。
●結果:3つのAIが出した数字(30.4億ドル)
ChatGPT o1 pro … 150億ドル◎
Gemini 2.0 Pro … 456億ドル
Grok 3 … 600億ドル
こうして比較すると、最も低いChatGPTの見積もりでも公式発表の約5倍。GeminiやGrokはさらに大きな数字が出ています。今回のフェルミ推定では、“世界市場規模”や“Amazonシェア”を楽観的に捉えたため、利益予想が大きく膨らんだ可能性が高いです。
総評・考察
今回は、
東京ディズニーランドの年間来場者数
世界のコーヒー消費量
Amazonの年間純利益
という3つのお題を使って、複数のAIに“検索なし”でフェルミ推定をさせてみた結果を比べてみました。
■結果の振り返り
東京ディズニーランドの来場者数
ChatGPT:1,700万人
Grok:1,500万人
Gemini:4,100万人
参考:ChatGPTがほぼ同値でした
世界のコーヒー消費量
ChatGPT:100億kg
Gemini:120億kg
Grok:73億kg
参考:統計値は約107億kgとされ、ChatGPTが最も近い(Geminiは少し上ブレ、Grokは下ブレ)。
Amazonの2023年純利益
ChatGPT:150億ドル
Gemini:456億ドル
Grok:600億ドル
参考:決算値は約30億ドルで、実際にはChatGPTですら5倍ほどの見積もり。ただし3つのAIの中では、こちらもChatGPTが最も近かった。
■ 3つのフェルミ推定から見えてきたポイント
“前提条件”の設定の大切さ
どのお題も、人口の扱い・市場規模・シェア率・1人あたりの消費/利用頻度などをどう仮定するかで、最終的な数値が大きく変わることが分かりました。
AIが提示する“それっぽい”仮定や計算式でも、実態から外れている可能性は十分にあるので注意が必要です。
ChatGPTが比較的近い数値を出していた理由
ChatGPTは、複数のロジックをざっくり平均化したり、2~3%など比較的控えめな利益率や上乗せ率を設定したりしており、極端な仮定に走りにくい傾向がありました。
その結果、ディズニーの来場者数やコーヒー消費量では統計値に近い数字を導き、Amazonの利益に関しても3つのAIの中では最も小さい推定値に収まりました。
GeminiとGrokが“上振れ”しやすい構造
Geminiは大きな世界規模×高めのシェア率を前提に置く(Amazonの例)など、マーケットサイズをやや楽観的に推定する傾向があります。
Grokもセグメント別の利益率を高く見積もり(Amazonの利益計算)、あるいは初期計算後に微調整を加えるなど、途中の前提変更で大幅に数字が動く様子が見受けられました。
フェルミ推定はあくまで“大まかな”計算
適切な前提や基礎データを置けなければ、思った以上に現実とかけ離れた数値になるリスクがあります。
反面、前提さえ現実に近ければ、短時間でそこそこ妥当な見積もりを出すことも可能です。
まとめ:フェルミ推定とAIの組み合わせはどう活かす?
今回の3つのお題を通じて、
AIが示す前提や計算手法をそのまま鵜呑みにしないこと
“なぜその数字になるのか?”を問い直す姿勢が大切
たとえばChatGPTのように、“複数の視点を取り入れる”“程よい数値を選ぶ”アルゴリズムが働けば、あまり極端な答えにはなりにくい傾向があります。その分、他のAIが極端な仮定を置くことで大胆な数字を出してしまうケースもありました。
フェルミ推定は元来、「ざっくりした仮定で大枠のオーダーをつかむための手法」です。実務や企画検討などにAIを使う際も、「AIがこう言っているから間違いない」ではなく、“本当にその前提でいいの?” “もう少し下振れ・上振れの余地はない?”と、人間の側でチェックするプロセスが必要になります。
今後も新しいAIモデルが登場し、より洗練された推定が可能になるかもしれませんが、前提条件の吟味が欠かせない点は変わらないでしょう。みなさんも、気になるテーマや自分のビジネスにフェルミ推定を試すときは、今回の結果を一つの参考にしてみてください。