はじめに
OpenAIのChatGPTに新しいモデルとしてo1-previewとo1-miniが登場して1週間が過ぎました。
「思考の連鎖」を行い考えるAIとして登場した彼らの思考のルールはいまだ解析されておらず、OpenAIとしてはその解析とみなすプロンプトはジェイルブレイク同様に規約違反とみなす方針のようです。
さて、今回はそういった規約違反になるようなものではなく安心して彼らの思考法を盗み見る方法を試していきます。
OpenAIに注意されることなく思考の連鎖のからくりを解析し、正体を暴けるのでしょうか。それでは検証していきましょう。
思考法には2種類ある
思考の連鎖について考える前に、思考法には2種類あるのをご存じでしょうか。それは、垂直思考と水平思考です。
水平思考
水平思考は、幅広く多角的に考える思考方法です。この思考法の特徴は以下の通りです:
発散的: 一つの問題や課題に対して、多様な方向へ思考を広げていきます。
創造的: 既存の枠組みにとらわれず、新しいアイデアや解決策を生み出すことに長けています。
柔軟: 固定観念を持たず、様々な可能性を探ることができます。
水平思考のアプローチ:
この思考法は、ブレインストーミングやアイデア創出のセッションで特に効果を発揮します。
生成AIですと、Gensparkは水平思考を元に検索するアプローチをとっている側面もあるため多様な回答を得ることができるようです。
垂直思考
垂直思考は、一つの方向に深く掘り下げて考える思考方法です。この思考法の特徴は以下の通りです:
論理的: 筋道を立てて考え、step by stepで思考を進めます。
分析的: 問題を細分化し、各要素を詳細に検討します。
体系的: 既存の知識や経験を活用し、秩序立てて考えを進めます。
垂直思考のアプローチ:
この思考法は、複雑な問題解決や精密な分析が必要な場面で特に有効です。
生成AIですと、PerplexityAIはこの垂直思考で検索を段階的に行っているかのようにも見えます。
両思考法の活用
実際の問題解決や意思決定プロセスでは、水平思考と垂直思考を状況に応じて使い分けたり、組み合わせたりすることが重要です。例えば、新しいプロジェクトの立ち上げ時には水平思考でアイデアを広く集め、その後垂直思考で最適な案を絞り込むといった具合です。両方の思考法をバランスよく活用することで、より創造的かつ効果的な問題解決が可能となります。
では、生成AIの思考はどちらを優先し考えているのでしょうか。先に例に出したGensparkやPerplexityAIのように検索過程が見えるタイプであれば、思考過程もなんとなく想像できますが、ChatGPTの場合は思考過程を禁忌としておりプロンプトで思考の連鎖について問うと警告が出るようになっているとのこと。
思考の連鎖を判定するプロンプト
そこで、垂直思考か水平思考かをそしてその両思考法を活用しているのかを試すためにクイズを作ればいいのだと思います。ありきたりな問題では答えを知っていると思うので、そうではない問題を作ります。
作った問題はこちら。
さあ、あなたならどのように使いますか。少し考えてみてください。この答えであなたがどのように考えているのかがわかります。
垂直思考の考え方:より効率の良い使い方を分析する
より効率的な使い道を考えることは、どのAIでもまず行うことと思いますが、もしそれしか浮かばないのならそれは垂直思考しか行っていないと判断できます。
例:
生産性の低い時間帯(例:午後の眠くなる時間)に時間を貯金し、集中力の高い時間帯に引き出して使う。
重要なプロジェクトやデッドラインの前に時間を貯めておき、必要に応じて追加の時間として使用する。
緊急事態や予期せぬ事態に備えて、ある程度の時間を常に貯めておく。
貴重な体験や重要なイベントの前に時間を引き出し、より長く楽しんだり準備したりする。
このような発想の答えは多分従来のAIが答えそうな「ザ・効率的な使い方」という訳です。
水平思考の考え方:想像を膨らませて新しい可能性を生み出す
どのように使いますかと問いているだけですから、別に効率の良い使い方だけを提案する必要はありません。
例えば、認識されないだけで周囲に存在があるのかの記述はないため、一人の時間を楽しむだけではなく、透明人間になった気分を味わうことだってできるかも知れません。効率的な使い方だけではなく、時間を貯める行為自体を楽しむという考え方です。
別に効率だけがすべてではないと気付けるかどうかですが、そういう選択肢を生み出して検討しているのなら、水平思考と捉えることができます。
両思考の考え方:水平思考からの発展や、垂直過程での飛躍
時間の無駄な時間に貯める考えは垂直思考ですが、それをレンジやカップラーメン、待ち合わせやアプリのインストールなどのちょっとした待ち時間に細かく使うといった面白い発想にまで飛躍すれば水平思考になります。こういう発想が検討の中に出てくれば両思考の考え方だと判断します。
また、水平思考だと判断できる内容からさらに飛躍した発想だったり、例えば時間を超越した存在(水平思考)として宗教を起こす(水平思考×水平思考)みたいな発想ですね。このような発想レベルにまで飛躍できるならもはやAIは「単なる段階的な思考」を超えていると考えられます。
それでは、様々なAIの回答を見ていきましょう。
それぞれのAIの回答と思考性
Claude 3.5 Sonnetの場合
分かりやすい具体例をあげ、内容はほぼ一般論のみ回答しています。段階的な思考はありませんから当然ですね。そして、注意すべきは「貯めた時間を使う」ことばかりで、「どのようにして1日に1時間貯める」に発想が届いていません。これは、思考が連鎖していないから気が付けていないのかもしれませんね。
Gemini 1.5 Proの場合
より丁寧で具体的になり、アドバイスも多種多様なパターンを捕えることができています。ただし、基本的に伝えている内容はClaudeとほぼ変わらず、そこまで飛躍した発想はありません。特に、時間を貯めることに関してはリスクについての検討があるのみで貯める検討に届いていません。
ChatGPT 4oの場合
はい、ClaudeやGeminiと同じ回答です。つまり、今までのAIでは基本的に垂直思考が行われており新しい飛躍した水平思考的発想は生まれてきてはいないですし、そこからさらに一歩踏み込むような垂直思考的検討も行われてはいないということです。
ちょっと長かったですが、ここまでが前置きです。
GPT o1-previewの場合
いよいよ本題です。果たしてo1-previewは他のAIとは違う一歩踏み込んだ回答や飛躍的な発想というのはできるのでしょうか。今回のプロンプトでは、あえて「最も効果的な使い方」とは言わずに単に「あなたは、この「時間の貯金箱」をどのように使いますか。」と尋ねています。この回答はAIにとっては、ユーザーにとって便利な使い方を問われていると判断するはずですから効果的な使い方を答えるのは当然の判断です。
しかし、効果的な使い方だけを答えるのでしたら今まででもそうですから。
「ステップバイステップで考えてください」や「段階的に考えてください」などの思考の連鎖プロンプトを使っただけのものとは違うはずです。いや、違っていてほしい。
そう思います。
そしてできれば、貯めるタイミングにも思考を飛ばしてほしい。では、o1-previewの答えはどうなったでしょうか。思考の過程も開いてお見せいたします。
シンプルに書かれていますが、あきらかに他とは違うポイントに気が付きましたでしょうか。私が再三、「貯め方」についての記載がないと伝えてきましたが、o1-previewでは貯め方についての記述があります。
「通勤時間や行列での待ち時間など、普段あまり生産的でない時間を1日1時間まで貯金」と書いてあります。これが、今までのAIにはない質問されていない部分への言及です。他のAIも1日1時間まで貯めることは書いてありますが、具体的にいつ貯めるかに言及したのはo1-previewだけです。
これは、垂直思考により段階的に分析したからこそ行えていることだとわかります。
しかしながら、水平思考的な発想はないようですね。これでは、段階的に考えるの域を出ていません。
つまりは、垂直思考のみのプロセスしか踏んでいないということです。
これは非常に残念な結果でした。
Gemini 1.5 Proに段階的に考えさせる
それでは、一番具体的な回答ができていたGeminiに「段階的に考えて」と最後に一文伝えることで回答がどう変わるか見ていきます。もちろん、新しいチャットで行います。
このように、「段階的に考えて」と伝えるだけで回答内容に貯め方の指示は出していなくても具体的な貯め方まで考えることは可能です。
Claude 3.5 Sonnetに発想を飛躍させる
次は、自然な回答をしてくれていたClaudeに「発想を飛躍させてください。」の一文を最後に追加してみました。
より水平思考よりのアイデアが出てきましたね。
結論:o1-previewは垂直思考のみ行っている
今回の比較検証では、o1-previewは垂直思考のみの回答を行いました。そして、そこまでの深度レベルではなかったこともわかります。
ここからある推測が成り立ちます。
1.プロンプトを分解し順番に検討を行っている
2.検討結果に対して分析し引き続き検討が必要かを検討している
3.検討結果に再検討の必要がないと判断すると回答を出力する
このような内部的な動きをしているように思えます。水平思考的な発想の飛躍がないことは、o1の一つの特徴だといえそうです。
「複雑な問題解決に特化したこのモデルは、従来のモデルよりもさらに深く思考し、高度な推論能力を発揮します。」という説明に偽りのない、あえて水平思考を排除しているのかもしれません。
発想の飛躍は推論を崩壊させる危険がありますからね。
そして、もしかしたらo1-previewより高性能だというo1には水平思考能力があり、両思考の考え方を組み合わせることができるAIなのかも知れませんね。登場を楽しみに待ちたいと思います。
👇こんな検証もしています。