【Dify講座】に追加するコンテンツを整理してみる
2024年の9月と10月に、オンライン学習プラットフォーム『Udemy』にて、『Dify講座』をリリースしました。
生成AI業界は本当にスピードが早く、最初の収録からまだ数ヶ月しか経っていないのですが、たくさんの機能が追加されています。
今回は講座収録後に追加された機能の中からいくつか抜粋して、どのような機能なのか、どんな時に使えそうか、というのを自分なりに整理してみようと思います。
会話ターン数を記録 sys.dialogue_count
1つ目はチャットフローでこれから必須になりそうな、『sys.dialogue_count』変数。
この機能を使うことで、一度会話が終わったチャットに続けて質問する場合に、何度目のやり取りなのか、というのを判断することができるようになりました。
活用例
『IF/ELSEブロック』と組み合わせることで、1回目の会話と2回目以降の会話で処理を分けることができるようになります。
『会話変数』も組み合わせることで、会話の中でやり取りした情報を保持できるようにしておいて、2回目以降の会話で活用できるようになります。
地味に、これから必須になる機能だと思っています。
並列処理(パラレルフロー)
続いては『パラレルフロー』。
2024/11/05にリリースされた v0.11.0では、『イテレーションブロック』内でも並列処理ができるようになりました。(最大10回?)
並列処理ということで、同時に幾つかの処理をしたい時に便利な仕組みです。
複数のLLMに聞いてみたり、段落ごとに並列で画像生成をかけてみたり。
とはいえデメリットとしてどうしても複雑になるので、講座内での紹介は簡単なサンプルにとどめたいなと思ってはおります。
ファイルアップロード機能
続いてはファイルアップロード機能。
こちらは2024/10/21 v0.10.0 に追加された待望の機能で、
書類をアップロードして文字起こしし、LLMを使って処理することができるようになりました。
また音声のアップロードも対応していて、 gpt-4-audio-preview などのモデルを使うことで音声解析することもできます。
文字認識の精度もかなり良いようで進化を感じます。
合わせて『テキスト抽出ツール』ブロックが追加され、
LLMに渡す前に、『テキスト抽出ツール』ブロックを使って文字起こしする必要があります。
さらに『リスト操作』ブロックも追加され、配列で渡ってきた時に音声だけを取り出すなんてことができるようになったのですが、どれくらい出番があるかなというのは悩ましいところです。
コードブロックにコード生成機能
最後に、2024/10/23 v0.10.1 に追加された、『コードブロック』のコード生成機能。
Difyでは使用上、データを受け渡す際に
文字列 -> オブジェクト に変換したり
文字列 -> 配列 に変換したり
という操作が必要になることがあり、PythonかJavaScriptのコードを書く必要がありました。
非エンジニアの方にとってはハードルが高くなりがちだったのですが、今回のアップデートにより、自然言語からコード生成できるようになりました。
コード生成するためにはインプット・アウトプットの型指定をしたほうがいいなどいくつかコツがあるので、その辺りも織り込んで、エンジニア向けの方の講座に追加しようと思っております。
終わりに
生成AI業界は本当にあっという間にアップデートされるので、追いかけるのが大変ですが、同時に可能性も広がっているので、個人的には楽しみながら情報収集・スキルアップできているかなと思います。
Difyに限らず、機能追加される度に、できることが増える一方で作り込みが複雑になりがちなので、できるだけいいバランスを保ちたいものです。
udemy講師紹介ページ
udemy講座のクーポン一覧
最後まで記事をお読みいただきありがとうございます❗
さらなる良記事を執筆するためのモチベーションアップのため、
よろしければスキ & フォローもお願いいたします😊
フォローバック100%させていただきます💯