見出し画像

【llava-llama3】みんなのギャラリー用の説明とキーワードを生成する【ローカルLLM】

みんなのギャラリーに登録するには、検索用の説明とキーワードを作成する必要がある事を知りました。典型的なLLM活躍の場所ですね。

ChatGPTでもできますが、大量に行うとすぐに制限に達してしまいます。

この手の「あまり正確でなくても良いが大量に処理する用途」は、ローカルLLMが大活躍する一つです。

※ Open WebUIのセットアップの詳細は下記事で紹介しています。

まず、モデルをVLMである「llava-llama3」に変更して、「画像を説明して」と入力します。

VISIONモデルで解析

残念ながら、Ollamaで利用できる日本語の実用的なVISIONモデルはまだ存在しないので、英語の回答になってしまいます。

※ OllamaブランチではGoogleのVISIONモデルのPaligemmaが対応し、モデルも登録されているので、もうすぐ使えるのかもしれません

次に日本語に翻訳します。日本語処理では最も性能が良いLlama3-Elyzaに変更するためにショートカットキーである「@」を入力してモデルを変更して翻訳します。

チャットの途中でモデルを変更できる

キーワードも作ってもらいます。


いいなと思ったら応援しよう!