
Jetson orin nano上のAgent StudioでTanuki-8Bを試す
GENIAC 松尾研 LLM開発プロジェクトの日本語を強化した軽量LLMのTanuki-8Bを、シングルボードコンピュータのJetson orin nano(8GB)で試してみました。
LLMの推論環境は色々ありますが、せっかくJesonを使うのでNVIDIAが公開しているAgent Studio上で試してみました。
実行はターミナル上でjetson-containersを起動後、ブラウザでhttps://IP_ADDRESS:8050を開くとUIが起動します。
jetson-containers run --env HUGGINGFACE_TOKEN=hf_xyz123abc46(自身のトークン) \
$(autotag nano_llm) \
python3 -m nano_llm.studio






Tanuki-8Bは、gpt-3.5turbo並みの日本語性能を謳うだけあって、かなりまともな品質の日本語が出力されて感心しました。Jetson orin nano上の実行でも思ったよりレスポンスが良いので、例えば用途をしぼった軽量RAGエージェントとかに活用できるかもです!
Agent Studioは、現状では8Bクラスのモデルを載せるとメモリが足らないのですが、音声認識モジュールのサンプルとかもあって面白そうです。ストリーミング動画を画像入力LLMの入力するなどメモリが潤沢なJetson AGX Orin(64GB)があれば相当すごいことができるかも。