プロンプトエンジニアリング：ReActとCoTの違い

2024年6月25日 08:12

プロンプトエンジニアリングのReActとCoTの違いをお話しします。

自律ソフトウェアエージェントのプロンプト

OpenAIが2021年にプログラミングに関して提案したベンチマークがHumanEvalです。これはプログラミングの課題ですが今では易しすぎると言われています。Claude 3.5 Sonnetなら92%を解くことができます([anthoropic])。
より難しい実世界でのバグ修正問題としてプリンストン大学が2023年に提案したのがSWE-benchです([swe-bench])。
SWE-benchの2294問題のうち300サブセットからなるSWE-bench Liteで最高性能を出していたのがMASAIです（1週間で（Alibaba Ligma Agent, Factory Code Droid, AUtoCodeRover, CodeRに抜かれていますが）。
MASAIは5つのサブエージェントからなっています：
・コードテンプレート生成：戦略はReAct
・バグ複製：戦略はReAct
・ファイル特定：戦略はReAct
・コード修正：戦略はCoT
・ランク評価：戦略はCoT
MASAIの詳細は今回はおいておいて、ReActとCoTの違いを説明します。

ReActとCoT

ReActはReason and Actionの略、CoTはChain of Thoughtsの略です。いずれもプロンプトエンジニアリングで生成AIの出力の精度を高めるための戦略です。

ReAct

ReActとはReason and Action (推論と行動）の略です。推論し、行動し、行動結果を評価し、それを繰り返すことによって精度があがるというものです。
本来はループしますが、使い方としては単にThought, Action, Observationを示すだけでもいいです。

AI経営コンサルタントをマーケティングする方法を以下のフレームワークで教えてください。
### Framework ###
Thought:
Action:
Observation:

簡単なReActのChatGPTのプロンプト例

AI経営コンサルタントをマーケティングする方法について、以下のフレームワークを用いて説明します。

### Framework ###
**Thought:**
AI経営コンサルタントをマーケティングする際の基本的な考え方は、ターゲット市場の理解と、それに基づいたマーケティング戦略の策定です。具体的には、AI技術の利点を強調し、どのようにして企業の課題解決に役立つかを明確に伝えることが重要です。

**Action:**
1. **市場調査とターゲット設定**
- 企業の課題やニーズを把握するための市場調査を実施します。
- AI経営コンサルタントの主なターゲット顧客（例：中小企業、大企業、特定の業界など）を明確にします。

2. **ブランド構築とメッセージング**
- AI経営コンサルタントとしてのブランドを構築します。これには、企業のビジョン、ミッション、価値観を明確にすることが含まれます。
- AI技術がどのように企業の効率を向上させ、コストを削減し、競争力を高めるかについての明確なメッセージを作成します。

3. **デジタルマーケティング**
- ウェブサイトやブログ、ソーシャルメディアを活用して、AI経営コンサルタントのサービス内容を広めます。
- SEO（検索エンジン最適化）を行い、潜在顧客がオンラインでサービスを見つけやすくします。
- ウェビナーやオンラインセミナーを開催し、AI技術の利点や事例を紹介します。

4. **コンテンツマーケティング**
- AI経営コンサルタントの専門知識を示すために、ホワイトペーパー、ケーススタディ、ブログ記事などのコンテンツを作成します。
- 顧客の成功事例や、AI技術を活用した具体的な成果を紹介します。

5. **ネットワーキングとパートナーシップ**
- 業界イベントやカンファレンスに参加し、ネットワーキングを行います。
- 他のコンサルタント会社や技術パートナーとの協力関係を築きます。

**Observation:**
- マーケティング活動の効果を定期的に評価し、調整します。これには、ウェブサイトのトラフィック、リードジェネレーション、コンバージョン率などの指標を追跡することが含まれます。
- 顧客からのフィードバックを収集し、それに基づいてサービスやマーケティングメッセージを改善します。
- 競合他社の動向を監視し、自社のマーケティング戦略を最適化します。

このフレームワークに基づいて、AI経営コンサルタントのマーケティングを効果的に行うことができます。ターゲット市場の理解とそれに基づく戦略的なアプローチが成功の鍵となります。

簡単なReActのChatGPTでの実施例

CoT

CoTはChain of Thoughtsの略です。思考の連鎖と訳されています。

通常の人間の思考では、例えば算術の問題（例：「2個のリンゴと3個のリンゴの合計は？」）を解く際、いきなり計算結果（「答えは5個。」）が求まるのではなく、問題を途中の手順（計算過程）に分解して段階的に解いていく（例えば「2個と3個を足すので、2＋3＝5を計算して、答えは5個。」）のが一般的である。このような「途中の段階的な思考プロセス」を模倣して、その途中の推論（reasoning）手順の流れをフューショット学習（Few-shot Learning）の例文／見本として含める、というのが基本的なCoTプロンプティングだ。

Chain-of-Thought（CoT：思考の連鎖）Prompting（プロンプティング）とは？

■　AI経営コンサルタントをマーケティングする方法を次のステップに従って教えてください：
### steps ###
1. ターゲット顧客の特定と理解
2. AI技術の利点とユースケースの洗い出し
3. マーケティングメッセージの構築
4. デジタルマーケティング戦略の立案
5. ネットワーキングとパートナーシップの構築
6. パフォーマンスの測定と改善

CoTプロンプトの例

AI経営コンサルタントをマーケティングする方法について、以下のステップに従って詳細を説明します：

### Steps ###

#### 1. ターゲット顧客の特定と理解
- **市場調査**: まず、どの業界や企業がAI経営コンサルタントのサービスを最も必要としているかを理解するために市場調査を実施します。特に、AI技術に関心があるが導入や最適化に課題を抱えている企業をターゲットにします。
- **顧客プロファイルの作成**: ターゲット顧客の詳細なプロファイル（例：企業規模、業界、技術導入の段階、主要な課題など）を作成します。
- **ニーズの把握**: 顧客が直面している具体的な課題やニーズを理解し、それに基づいてソリューションを提供します。

#### 2. AI技術の利点とユースケースの洗い出し
- **技術の利点の明確化**: AI技術が提供する具体的な利点（効率化、コスト削減、データ分析の精度向上など）を明確にします。
- **成功事例の紹介**: 成功したユースケースや顧客の成功事例を集め、これをマーケティング資料やプレゼンテーションで紹介します。これにより、顧客は実際の成果をイメージしやすくなります。

#### 3. マーケティングメッセージの構築
- **差別化ポイントの強調**: AI経営コンサルタントとしての強みや他社との差別化ポイントを明確にし、メッセージに反映させます。
- **顧客の課題解決を中心に**: メッセージは顧客の課題解決に焦点を当て、どのようにAI技術がその課題を解決するかを具体的に伝えます。

#### 4. デジタルマーケティング戦略の立案
- **ウェブサイトとSEO**: ウェブサイトを最適化し、SEO（検索エンジン最適化）を行って、ターゲット顧客が検索エンジンを通じて簡単にアクセスできるようにします。
- **コンテンツマーケティング**: ブログ記事、ホワイトペーパー、ケーススタディなどのコンテンツを作成し、顧客に価値ある情報を提供します。
- **ソーシャルメディア**: LinkedInやTwitterなどのソーシャルメディアを活用して、ターゲット顧客とのエンゲージメントを高めます。

#### 5. ネットワーキングとパートナーシップの構築
- **業界イベントへの参加**: AI関連のカンファレンスやセミナーに参加し、ネットワーキングを行います。ここでの人脈がビジネスチャンスに繋がることがあります。
- **パートナーシップの形成**: 他のコンサルタント会社や技術パートナーとの協力関係を築き、相互に補完し合うサービスを提供します。

#### 6. パフォーマンスの測定と改善
- **KPIの設定とモニタリング**: マーケティング活動の効果を測定するためのKPI（主要業績評価指標）を設定し、定期的にモニタリングします。
- **フィードバックの収集と改善**: 顧客や市場からのフィードバックを収集し、それに基づいてマーケティング戦略やサービスを継続的に改善します。
- **競合分析**: 競合他社の動向を監視し、自社の戦略を調整します。

これらのステップに従って、AI経営コンサルタントのマーケティングを効果的に行うことができます。

GPT-4oの出力の一例

ReActとCoTの違い

ReActとCoTはいずれも戦略的にプロンプトエンジニアリングの質をあげるための手法です。ReActは推論と推論に基づく行動に焦点をあてています。このため外部とのやりとりによる不確定性を予め認識しています。このため外部に行動しその結果を見ないとわからない推論に向いています。
CoTはプロセスに焦点をあて、しばしば、プロセス自体を明示的に与えることによってプロセスの改善や説明可能性の向上を目指しています。

むすび

ソフトウェア開発の自律化の中で単に高度な大規模言語モデルを作るだけでなく、問題解決の戦略立案をすることや、大規模言語モデルを活用するソフトウェア開発環境が重要なことがわかってきました。
あらためて自律ソフトウェア開発エージェントの仕組みを勉強する中で、プロンプトエンジニアリングの初歩に戻って勉強し直しました。
基礎と応用のどちらも大事だということを再認識しました。

参考文献

[anthropic] Claude 3.5 Sonnet https://www.anthropic.com/news/claude-3-5-sonnet
[itmedia] Chain-of-Thought（CoT：思考の連鎖）Prompting（プロンプティング）とは？　https://atmarkit.itmedia.co.jp/ait/articles/2308/24/news041.html 2023年
[microsoft] MASAI: Modular Architecture for Software-engineering AI Agents https://arxiv.org/abs/2406.11638 2024年
[swe-bench] SWE-bench https://www.swebench.com/ 2024年