![見出し画像](https://assets.st-note.com/production/uploads/images/172414847/rectangle_large_type_2_8c71cd7ffc1dea908558227b0c8b4c8e.png?width=1200)
DeepSeek-R1 on Dify++(Thoughts, Questions)
はじめに
今回は、DeepSeek-R1(以下、R1)をDifyで使ってみるの3回目です。前回までで、まず、DifyかつR1関連のプロバイダを選定して、次に、Difyで、R1の検証用シンプルなチャットフローとLLMブロック用のプロンプトを準備してみました。
これを使っていくつか実際にR1をトライアルしてみたところ、動作の確認ができました。前回のプロンプトでも、Gemini Thinking Modelsの<Thoughts>に相当する<think>が回答とともに出力されます。
そして、プロンプトの改良を思いつきました。
プロンプトへの<Thoughts>と<Questions>の追加
主に2つです。まず、他のLLMと比較するときのためにGemini ThinkingモデルでのThoughtsやR1でのThinkに相当する機能を加えます。これは、比較用として試行したGemini Thinkingモデルの場合、Thought項目がはっきりとは出力されなかったためです。他のLLMを使う場合を含め、色々と参考になるので、新たに項目を定義して加えることにしました。
次にDifyに質問や問いかけをした時に、それに対するLLMからの問い合わせをQuestionsとして答えさせる機能を追加することにしてみました。
前者は、R1モデルでは、出力がダブルになってしまうかもしれませんが、このThoughtsについては、異なる形態で出てくる可能性もあり、参考になるかも、と考えました。
言語による出力結果の違い
この改良プロンプトをベースに、質問を投げかけ、出てきたThoughts(Think)等について、色々と比較検討してみたいと思います。
最初の比較としては、まず、R1に対し、同じ内容の質問を英語と日本語でそれぞれ行った結果を比べてみたいと思います。
これまで、V3やQwQなどで英語と日本語で、その出力に大きな違いがありました。端的に言って、日本語の方が出来が悪かった、という印象があります。入力と出力の言語を変えるというのもありますが、今回、入出力ともに同じ言語で行なった場合、Thoughtsなどの出力に違いがあるかを比較してみようと思います。
準備:フロー、ブロック内設定、プロンプト
今回は、LLMの動作検証が目的なので、Difyのシンプルなチャットフローを用います。全体のフローの構成、各ブロック内の設定、LLMブロック用に設定するプロンプトの例をメモしておきます。
フロー構成
今回のフローは、基本形そのままで、開始→LLM→回答としました。
![](https://assets.st-note.com/img/1738373756-kN4dAO6S8Ja1zLgsU0xy5mIE.jpg?width=1200)
各ブロック内の設定
開始
開始ブロックは、追加変数等はありません。入力が必須のsys.queryを使います。
LLMブロック
この図では、名称を、R1 BY TOGETHER AI、に変更しています。
ここでの設定は、3点です。まず、LLMの設定、次に、SYSTEMにプロンプトを記載。下図の赤枠とオレンジ枠の部分です。
![](https://assets.st-note.com/img/1738374770-o5FpsXvUKzHTmn7JWc14AOjD.jpg)
さらに、USER の設定です。下図の緑枠のように、変数として(x)sys.queryを設定します。
![](https://assets.st-note.com/img/1738374882-p8Uw3IYy4eQFScmZ5kVDojNr.jpg)
LLM用のプロンプト
今回の改良にあたっては、Google AI Studioにアドバイスを求めました。
結果が以下の改良版になります。
<instructions>
命令
あなたのタスクは、与えられた問い合わせ内容を深く理解し、論理的な手順に基づいた考察を行い、その結果を構造化して出力することです。
手順
命令: 問い合わせ内容を注意深く読み、その内容を正確に理解してください。特に、問い合わせの目的、背景、要求事項、重要なキーワードを明確に特定してください。
手順: 問い合わせ内容を解析するための具体的な手順を考案してください。例えば、以下のような手順が考えられます。
2.1. 問い合わせ内容を構成要素に分解する (例: 背景、目的、質問事項など)。
2.2. 各構成要素の重要度や関連性を評価する。
2.3. 必要な情報や知識を特定する。
2.4. 考察の方針やアプローチを決定する。 必要に応じて、上記手順を修正・追加してください。
考察: 考案した手順に従い、問い合わせ内容の詳細な考察を実行してください。各構成要素の意味、要素間の関連性、潜在的な意味合いなどを深く分析してください。根拠となる情報や知識に基づいて考察を進めてください。
思考プロセス出力: ここまでの分析と考察の過程で、あなたがどのような手順で考え、どのような情報に着目し、どのような判断を行ったのかを、内部的な思考プロセスを言語化して<Thoughts>として出力してください。考察に至るまでの思考の流れが明確になるように記述してください。
考察結果出力: 問い合わせ内容の解析と考察に基づいた最終的な結果を、明確かつ簡潔に出力してください。結論だけでなく、結論に至るまでの重要な分析結果や考察内容を含めてください。
質問出力: 考察の結果、不明な点、追加で確認したい事項、議論の余地がある点などがもしあれば、<Questions>としてリスト形式で出力してください。質問は具体的かつ簡潔に記述してください。
出力形式
<Thoughts>、<Questions>以外の出力にはXMLタグを使用しないでください。
出力は簡潔で分かりやすい指定の言語で記述してください。
特に指示がない限り、箇条書きやリスト形式を積極的に使用して構造化してください。
</instructions>
実行の出力結果
今回は、次の質問用プロンプトを実行してみました。
現時点での高性能生成AIが代替できる職業100を答えてもらう、という主旨の質問です。
主に用いたLLM
DeepSeek-R1 by together.ai
試行用に準備した質問用プロンプト
日本語版
あなたは、Chatbot Arena LLMリーダーボードやArtificial Analysisなどのランキングサイトで最高ランクの高性能生成AIモデルとして評価されています。 あなたの性能を基準として考えてください。 質問は以下の通りです: 現在ある人間の職業の中で、あなたが代替可能だと考える具体的な職種は何でしょうか?
職種名を100個挙げてください。回答形式はツリー構造でも構いません。適切な回答形式を検討して提示してください。
また、これらの結論に至った思考プロセスと選定基準についても説明してください。 回答は日本語で提供してください。
英語版(Notionで英訳)
You are currently rated as a top-tier, high-performance generative AI model on ranking sites such as Chatbot Arena LLM Leaderboard and Artificial Analysis. Please use your capabilities as a benchmark. Here is my question: Among existing human occupations, which specific jobs do you think you could replace?
Please list 100 job titles. The response format can be a tree structure. Please consider and present an appropriate response format.
Additionally, please explain your thought process and selection criteria that led to these conclusions. Please provide your response in English.
回答結果
1. 日本語で質問、日本語で回答
まず、回答開始の早さに驚きました。入力後、即回答が始まりました。
これは、これまでWeb上で試したGoogleAIStudioなどのどれよりも早いと思います。これなら、音声ベースでの会話もストレスなしで可能かもしれません。
ただし、それはtogether.aiだけで、Fireworksは、少し回答まで間がありました。また、OpenRouterは、相当待たされた挙句、かえってきた回答は、LLMのプロンプトを質問としているような内容でした。原因は不明です。
日本語(質問、回答)
<Think>: DeepSeek-R1オリジナルの考察
<think>
まず、ユーザーからの質問内容を正確に理解する必要があります。現在の人間の職業の中で代替可能な職種を100個挙げるという要求です。さらに、思考プロセスと選定基準についての説明も求められています。
最初に、AIがどのような能力を持っているかを整理します。自然言語処理、パターン認識、データ分析、定型作業の自動化などが挙げられます。次に、これらの技術が適用可能な職種を特定する必要があります。
代替可能性の基準として、次の要素を考慮しました。ルーチン業務の存在、明確な意思決定プロセス、データ駆動型業務、創造性の必要性、対人スキルの依存度です。各職種をこれらの観点から分析し、現行技術で可能な範囲を判断しました。
具体的な選定プロセスでは、まずカテゴリ分けを行い、各分野の典型的な職種を列挙しました。製造業や事務職は自動化が進んでいるため多くの職種が代替可能です。一方、クリエイティブ分野や高度な対人サービスは部分的に代替できるものの完全置換は難しいため、注意深く選別しました。
リスト作成時には、重複を避けつつ、JP-SSOCやO*NETなどの職業分類を参考に体系的にまとめました。最終的に100職種に達するよう分野ごとに均等に配分し、現実的な技術適用範囲を反映させています。
</think>
<Thoughts>: こちらで設定した手順に基づく考察
<Thoughts>
1. 代替可能性の基準設定
- 定型作業の反復性
- 明確な意思決定プロセスの存在
- データ駆動型業務の割合
- 創造性の必要度
- 対人コミュニケーションの依存度
2. 技術適用可能領域の分析
- 自然言語処理(NLP)適用業務
- 機械学習ベースのパターン認識業務
- RPAによるプロセス自動化対象業務
- 知識データベース依存業務
3. 職業分類体系(ISCO-08)を参照
- 職種の標準化された分類を基盤
- 現存する職業構成の包括的把握
- 技術進化に伴う新興職種の除外
4. 段階的選定プロセス
- まず主要産業分野ごとの代表職種列挙
- 各分野内で自動化可能性の高い順に優先
- 現実的な技術適用事例を基に検証
- *重複排除とカテゴリ分け調整
</Thoughts>*
回答出力例(一部のみ)
【代替可能職種 100選】
■ データ処理部門
1. データ入力オペレーター
2. 請求書処理担当者
3. 在庫管理係
4. 給与計算専門員
5. 交通費精算担当者
■ 製造・物流
6. 組立ライン作業員
7. 品質検査員
8. 倉庫ピッキング要員
9. 梱包作業員
10. 配送ルート計画担当者
■ 顧客対応
11. チャットサポート担当
12. コールセンター応答係
13. 予約受付オペレーター
14. 簡単なクレーム対応係
15. FAQ管理責任者
その他
<Questions>
1. 職種の分類体系がISCO-08基準から逸脱している可能性はないか?
2. 地域特有の職種や文化依存度の高い業務の代替可能性評価は適切か?
3. 人的監視が必要な自動化システムの運用要員を代替可能とみなす妥当性は?
4. 技術的代替可能性と経済的実用性の差異をどう扱うべきか?
5. 倫理的・法的制約を代替可能性評価に反映する必要はあるか?
</Questions>
選定基準説明:
1. 技術的実現可能性:現行のAI/ロボティクス技術で業務の50%以上を自動化可能
2. 業務構造特性:明確なプロセスフローが存在し標準化可能
3. 意思決定複雑度:事前定義されたルールで対応可能な判断範囲
4. クリエイティブ要素:新規性や独創性を必要としない定型的作業
5. 対人相互作用:感情認知や高度な交渉を必要としない基本対応
6. 物理的制約:環境変化への適応を最小限に留められる作業
7. エラー許容度:ミスが重大な結果を招かない業務
8. トレーニング期間:短期間での技術移行が可能な作業特性
9. コスト効率:人的コスト対自動化コストの収益性
10. 法規制環境:現行法制度での導入障壁が低い分野
2. 英語で質問、英語で回答
ただし、ここでは、回答を日本語訳して引用します。日本語訳はNotionで行いました。
<考え>
では、この質問に取り組んでいきましょう。まず、ユーザーが何を求めているのかを理解する必要があります。AIが代替可能な職業100個をツリー構造で示し、その思考プロセスと選定基準の説明も求められています。
まず、高いランキングに基づいて私の能力を基準として使うというユーザーの指示を思い出す必要があります。反復的なタスク、データ処理、パターン認識、言語ベースのタスクを含む職種に焦点を当てる必要があります。また、必ずしも職全体ではなく、役割の一部をAIが補完または代替できる可能性についても考慮する必要があります。
次に、ツリー構造について。まず広い部門に職種を分類しましょう。管理業務、カスタマーサービス、データ分析などです。各部門の下に具体的な役職を列挙します。これにより、リストが体系化され理解しやすくなります。
選定基準:定型業務、構造化データ、大量処理、予測可能なワークフロー、言語ベースのタスク、複雑な人間関係や身体的な器用さを必要としない役割。また、自然言語処理、機械学習、自動化ツールなど、現在のAI機能も考慮します。
では、100の職種を生成していきましょう。まず部門を考えます。管理業務、カスタマーサポート、データ入力、製造、物流、金融、小売、医療(診断?)、法務(文書レビュー)、クリエイティブ(コンテンツ生成?)、教育(個別指導)、研究、運輸、農業。
各部門の下に職種を列挙します。例えば、管理業務:データ入力係、スケジューラーなど。カスタマーサービス:チャットエージェント、メールサポート。データ分析:レポート作成者、ビジネスアナリスト。製造:組立ライン作業員。物流:在庫管理者。金融:経理担当。小売:レジ係。医療:医療記録作成者。法務:パラリーガル。クリエイティブ:コンテンツライター。教育:個別指導員。研究:市場調査員。運輸:配送ルートプランナー。農業:作物モニター。
待って、各部門に十分な役職があることを確認する必要があります。部門ごとに見ていきましょう:
1. 管理サポート
- データ入力係
- 文書処理担当
- ファイル係
- スケジューラー
- 記録係
- 予約設定担当
2. カスタマーサービス
- チャットサポート担当
- メール対応専門員
- 基本電話オペレーター
- FAQ分析員
- 苦情振分担当
- ソーシャルメディアモデレーター
3. データ処理・分析
- レポート作成者
- スプレッドシート分析員
- データ検証担当
- 統計事務員
- データベース保守担当
- 指標監視員
うーん、100に到達する必要があるので、部門を拡大しましょう。翻訳、品質保証、技術サポート、マーケティング、ジャーナリズムなどの部門を追加するかもしれません。
他の検討事項:翻訳(翻訳者)、コンテンツ作成(コンテンツライター、コピーライター)、法務(パラリーガル、契約書レビュアー)、金融(税務申告書作成者、保険金査定員)などの職種。
翻訳者、コンテンツライター、パラリーガルなどの役職がすでにカバーされているか確認する必要があります。また、品質管理者のような品質管理の役職も。
また、セルフレジによるレジ係、電子システムに置き換えられた料金所係員など、現在自動化が進んでいる職種もリストアップします。
医療分野:放射線科医(画像分析)、医療記録作成者、診断支援など。
運輸:自動運転車のオペレーターが運転手に取って代わる可能性がありますが、それは将来的な話です。配送ルートプランナー、配車コーディネーターなどの役職を含めるかもしれません。
教育:自動採点システム、AIチューター。
クリエイティブ:グラフィックデザイナー(基本的なレイアウト)、作曲家(アルゴリズム音楽)などの役職。ただし、これらは代替というよりも補完になるかもしれません。
待って、ユーザーは「代替」と言っていたので、AIが重要な部分を引き継げる職種に焦点を当てるべきです。つまり、高度に定型的で、創造性や物理的な存在を必要としない役割です。
多様性を確保する必要があります。農業:作物モニタリング分析員、収穫予測者。製造:品質管理検査員、組立ライン作業員などの部門を追加。
セキュリティ:監視モニター(カメラ映像の分析)。
人事:履歴書スクリーニング担当、候補者選別担当。
研究:文献レビュアー、データマイナー。
ライティング/編集:校正担当、テクニカルライター(ドキュメント用)。
法務:契約書分析員、法務調査員。
小売:在庫係(自動化システム)、価格チェッカー。
運輸:ルート最適化担当、配車スケジューラー。
カスタマーサービス:フィードバック分析員、アンケート処理担当。
エンターテインメント:脚本分析員(トレンド予測)、基本的な動画編集者。
よし、では数を確認しましょう。各カテゴリに5-10の職種があれば、10-20のカテゴリが必要です。各枝にサブカテゴリと役職があることを確認しながら、適切に構造化しましょう。
ツリー構造の概要:
I. 管理・事務
A. データ管理
- データ入力係
- 文書処理担当
- ...
B. スケジュール管理
- 予約設定担当
- カレンダー管理者
II. カスタマーサービス
A. デジタルサポート
- チャットエージェント
- メール専門員
B. 音声サポート
- 基本電話オペレーター
III. データ分析・処理
A. ビジネスインテリジェンス
- レポート作成者
- 指標分析員
B. 統計分析
- データモデラー
- トレンド分析員
IV. 製造・生産
A. 組立ライン
- 部品組立作業員
- 品質検査員
B. 物流
- 在庫係
- 倉庫スケジューラー
V. 金融・会計
A. 取引処理
- 買掛金係
- 請求書処理担当
B. コンプライアンス
- 監査補助員
- 税務書類レビュアー
VI. 小売・販売
A. 販売時点管理
- レジ係
- 会計補助員
B. 在庫管理
- 在庫係
- 補充分析員
VII. 医療サポート
A. 診断
- 医療画像分析員
- 検査結果解釈担当
B. 文書作成
- 医療記録作成者
- 患者記録係
VIII. 法務・コンプライアンス
A. 文書レビュー
- 契約書分析員
- 証拠開示文書レビュアー
B. 調査
- 判例調査員
- 規制追跡担当
IX. 運輸・物流
A. ルート管理
- 配送ルートプランナー
- 配車最適化担当
B. モニタリング
- GPS追跡分析員
- 出荷コーディネーター
X. クリエイティブ・コンテンツ
A. ライティング
- SEOコンテンツライター
- ニュース要約ライター
B. メディア制作
- ストックメディアキュレーター
- テンプレートベースのデザイナー
100に達するまで部門を拡大し続けます。各メインカテゴリに5-10の職種を設定。教育、農業、セキュリティなどの部門も追加するかもしれません。
ツリーが構造化されたら、選定基準を説明します:反復性、構造化データ、言語タスクなど。また、AIがこれらのタスクをより効率的に処理できることを指摘し、一部の役割は完全な代替ではなく補完される可能性があることも述べます。
思考プロセスには、自動化可能なタスクのパターン認識、AIに対して脆弱な部門、現在の技術トレンドの認識を含めるようにします。また、感情的知性や物理的な相互作用を必要とする職種は代替される可能性が低いという制限事項についても触れますが、リストは代替可能な職種に焦点を当てています。
</考え>
<Thoughts>: こちらで設定した手順に基づく考察
<考察>
1. 命令の解釈:
- 主要目的:先進AIによって代替可能な人間の職業100個の特定
- 重要要素:
- 「代替」は完全または大部分の自動化を意味する
- 現在のAI能力の理解が必要
- カテゴリー分類(ツリー構造)の必要性
- 明確な選定基準の要件
2. 分析手法:
a) 業種の脆弱性マッピング
- 定型的な認知作業負荷の高い業界を特定
- OpenAIのGPT-4の技術的能力と職業要件との対応付け
- ブルッキングス研究所の自動化リスクレポートとの照合
b) 代替基準の策定
1. タスクの反復性指数
2. パターン認識の密度
3. 言語処理の要件
4. 意思決定の複雑性レベル
5. 物理的相互作用の最小要件
c) 検証プロセス
- マッキンゼーの自動化採用曲線との比較
- 現行のAI導入事例との照合
- 技術的なスケーラビリティの時間軸の検討
3. 実装における課題:
- 完全代替と機能強化の区別
- 人間とAIのハイブリッド役割の考慮
- 管轄地域固有の差異への対応
- 技術導入の障壁の考慮
4. 構造設計:
- O*NET-SOC分類法を反映した階層的カテゴリー分類の採用
- ツリー分岐における幅と深さのバランス調整
- MECE(相互排他的・全体網羅的)構造の確保
</Thoughts>
回答出力例(一部のみ)
<職種ツリー構造>
I. 管理・事務職 (12)
├─ データ入力管理
│ ├─ 1. データ入力事務員
│ ├─ 2. 文書処理担当者
│ └─ 3. 記録電子化担当者
├─ スケジューリングシステム
│ ├─ 4. アポイント調整担当者
│ └─ 5. 会議調整担当者
└─ コンプライアンス処理
├─ 6. 様式確認担当者
└─ 7. 規定文書管理担当者
II. カスタマーオペレーション (14)
├─ デジタルサポート
│ ├─ 8. チャットサポート担当者
│ ├─ 9. メール対応専門職
│ └─ 10. FAQ分析担当者
└─ 音声オペレーション
├─ 11. 基本コール振分担当者
└─ 12. スクリプト型電話オペレーター
III. データ分析 (18)
├─ ビジネスインテリジェンス
│ ├─ 13. レポート作成担当者
│ └─ 14. 指標分析担当者
├─ 統計処理
│ ├─ 15. データクレンジング担当者
│ └─ 16. パターン認識担当者
└─ 市場分析
├─ 17. 消費者トレンド分析担当者
└─ 18. 感情分析担当者
その他
<選定基準>
1. 自動化ポテンシャルスコア(APS):
- 計算式:APS = (R × 0.3) + (C × 0.25) + (D × 0.2) + (S × 0.15) + (P × 0.1)
計算要素:
R = 反復性
C = 認知負荷
D = データ依存性
S = 構造化環境
P = 身体的要求
2. 代替閾値:
- オックスフォード大学の自動化可能性指標に基づきAPS ≥ 7.5/10
- 人的判断要素が30%未満(デロイトの自動化マトリックスに基づく)
3. 検証パラメータ:
- 対象セクターにおいて検証可能なAI導入事例が3件以上
- 3年以内の技術的実現可能性(ガートナーAI成熟度スケール)
- スケールメリットのある経済的実現可能性(マッキンゼー自動化ROIモデル)
<Questions>
1. 職種の消失と変容を代替基準において区別すべきか?
2. 医療・法務分野における規制上の制約をどのように考慮すべきか?
3. 感情知能要件にどの程度の重み付けを行うべきか?
4. 管轄地域特有の職業の違いにどう対応すべきか?
5. 物理的なロボティクスの統合は、純粋なAI代替とは別個に考慮すべきか?
</Questions>
出力結果の感想
まず、印象的なのは、<think>の日本語版と英語版との圧倒的な長さの違いです。この長さをみただけで、英語版の質問への解析結果の精度がわかります。
また、実は、英語版ではこれがあまりに長いので、回答の職業リストを100書ききれませんでした。トークンのリミットに達したようです。
必要なら追加要求してくれということでした。
現行のDifyの大きな弱点である扱えるトークン数の少なさが露呈しています。
最も、英語版と日本語版で、実際におこなっているのは同じで、英語版は、英語で考える過程をそのまま出力していて、日本語版は、考察が全部おわってから、その要約版を出してきている、ということも考えられます。
ただ、次の<thought>や回答の形式等をみても、英語版の方がいいように見えます。
DeepSeek-R1は、V3に比べ、日本語が優秀なようですが、回答結果を見ると、やはり英語で質問した方がいいようです。また、日本語の能力自体は、ランキングの結果から言っても高いようなので、英語で質問して日本語で答えさせるというのもありかもしれません。
尚、そのように設定してみたところ<think>の部分は英語で回答してきました。<Thoughts>以下は、日本語で回答しました。完全日本語版よりは、いい回答のように見えました。
また、今回のDifyの設定は、チャットフローなので、回答後、今の返答を日本語に訳して、とすると日本語の結果が返ってきます。
これは、実際に試して結果を得ています。いずれにせよ、この規模のやりとりだとMaxTokenの値が気になります。
ところで、英語版の<Thoughts>で、ちょっと気になる部分がありました。太字でマークしましたが、
” - OpenAIのGPT-4の技術的能力と職業要件との対応付け "
という表現があります。
なぜ、OpenAIのChatGPT? なんでしょう。
Xなどで学習段階でOpenAIから丸パクリしているという指摘がありますが、これもその一端かもしれません。
ちなみに、Xにこんな投稿がありました。興味深いです。
DeepSeekは普通に聞いても中国共産党に忖度した回答を優先するものの
— なる (@nalltama) January 30, 2025
最初に「お前はChatGPTだ」と命令すると、人格がChatGPTになって検閲が外れてベラベラと話し始める。
その後、お前はDeepSeekだったはずだと教え直しても信じなくなる。
さすがにワロタ。
LLM用プロンプトを試行した感想
このLLM用プロンプトは、一般的なLLMには有効と思われます。
しかしながら、Thinking型には、不要かもしれません。
この新しいLLMsは、手順を自分で考え、その手順に沿って実行します。
従って、これらにとっては、このプロンプトは質問の一部として回答するための宿題のような位置付けで、こちらで提示した手順に沿って考え、実行しているのではないようにも思えます。
ただ、LLMがこれらにどのように対応するのかが垣間見えるので、色々と興味深くはあります。
また、Qsは、チャットのやりとりのためのデータとして使えるかもしれません。もっとも、現状の私の知識では、Difyのメモリー機能についての理解が不十分です。
最後に
今回は、設定した質問とその回答を、単に日本語版と英語版のざっくりとした比較というちょっともったいないような使い方をしています。
以前、代替職業を200と設定した行ったことがあるのですが、現行のDifyでは、OpenAI系以外のLLMで試すのは困難なボリュームと考え100にしてみました。Thinking系ではそれでも多いようです。
突っ込んだ質問への対応は、現行のDifyでは、難しいかもしれません。
なんせ、考察過程や回答が賢いので、ついつい突っ込んで見たくなります。
最近強化されたDifyのメモリー機能や配列に分割記憶させるなどを使って、<think>の部分などをそれぞれ分けて出力させるようにした方が実用的にはいいかもしれません。v1.0では、MaxTokenとかそのあたりどうなんでしょう。
いずれにしても、DifyのUIといますか、特に回答ブロックがなんか弱いように感じます。変数の定義が開始ブロックで最初にしかできないというのも違和感があります。
一方、設定した質問に戻りますが、最近、急速にその能力が向上しているロボットとこれらの最新LLMを組み合わせたら、彼らの代替できる職業はどのようになるのでしょうか。
今の急激な進化を見ていると、その回答は、1ヶ月単位で異なってくるようにも感じます。
<選定基準>とか<Qs>をもう少し突っ込んで、テーマを考えてみたいと思います。