見出し画像

Difyの破壊力


Difyをご存じですか?

Difyとは何物か

彼ら曰く

先進的なAIアプリケーションのためのイノベーションエンジン

公式ホームページより

です。
イノベーションエンジンかどうかは私にはわかりませんが、LangGenius社というアメリカに登記されている会社が提供しているオープンソースです。そして、GPTsキラーになりうる製品です。

GPTsキラーとして

ここではGPTsはOpenAIが提供する有料サービスを総称して言ってしまっています。そのGPTsがやってくれることとほとんどをこのDifyは行うことができます。そして、GPT Teamが$30/ユーザー・月に対して$159/月でユーザー数が無制限という破格のプランになります。ただし、ここに生成AIの費用が含まれてないので、実際は使うLLMにもよりますが、従量課金でプラスされます。とはいえ、生成AIの従量課金なんて「たかが知れている」のでこの価格は破壊的だと言えます。

やれること

RAGの省力化

今まで、私もPinecone+AzureOpenAIでembeddingをして、みたいなことをさんざんやってきましたが、いらなくなります。外部のembeddingを利用する設定さえしてあげれば、後は文書をアップロードするだけです。
詳細は公式ホームページに譲りますが、

Long text content (TXT, Markdown, DOCX, HTML, JSONL, or even PDF files)
Structured data (CSV, Excel, etc.)

公式ホームページより

このぐらいは現時点で読み込めるそうです。GPTsに比べれば極めて少ないですが、自分でRAGを組む苦労がないので、その程度の問題に思えます。また、チャンクサイズも勝手に決めてくれる(手動設定も可)などのおまけもありますが、画面上でどういうチャンクに分割されたのかもわかるうえに、追加でキーワードなども入れられるので、RAGのチューニングという点では大変楽になります。このキーワード機能については試した範囲では効果が不明でしたけれども。
(2024/05/08追記)このチャンクサイズ自動は、必ずしもいい機能とは言えませんでした。というのもPowerPointのように文字数が少ない文書で、ページごとにチャンクされてしまうと、文書の構成によっては質問に対する答えとして検索されないという事態が発生しました。結局RAGは元のデータの質による問題は免れないということが証明されました。

フロントエンドもバックエンドも開発がいらない

彼らがLangChainより発展したツールといっている通り、すでにパッケージにはWEB画面が入っており開発無用でChatを作成することができます。
併せてLLMと会話する部分も込みのパッケージなので、なにも開発する必要がなく、独自のチャットアプリを作成することができます。

生成AIの切り替えが「超」容易

それぞれの生成AIで契約は必要なのは言うまでもないですが、例えば、Claudeで処理してみようか、とか、GPTで処理してみようか、など、今まではある程度ソースコードで調整していたような部分が設定だけで切り替えられます。もちろん、生成AIによっては文書生成が利用できるが、画像生成が利用できないなど、ある程度の制限がありますが、メジャーどころの海外の生成AIは網羅されていましたので、これは本当に今のように群雄割拠、百花繚乱状態の中でどれがいいのかを答えないといけない身には助かります。今のところ、文書生成系はOpenAIのGPT4とClaude3の一騎打ちという感じですが。

できないこと

画像生成

画像生成は対応していないようです。彼らがチャットにターゲットを絞っているようなので、対応してくるかどうかは未知数です。

音声や音楽の生成

こちらも上記と同じ理由で対応してくるかどうかは未知数ですね。

ファイル生成(2024/05/08追記)

何度かチャレンジしましたが、どうやってもExcelファイルにしてくれたりはしませんでした。

まとめ

ひとまず使ってみることをお勧めします

セキュリティ面などのチェックもあると思いますので、まずは無料版を契約してやれることを確認しながら、可能性を探ってみてください。セキュリティについては各自の事情があると思いますので、各自で再度確認することをお勧めします。


いいなと思ったら応援しよう!