RWKV-4-Raven-3Bは生成も速いしサイズも小さくて良さげ（LLMの話）

2023年4月7日 20:25

つい先日、RWKV-4-Ravenの7Bモデルと14Bモデルを動かした話をnoteに描いたのですが、よりサイズが小さい3Bモデルが出ていました。「EngAndMore」という、日本語を含む多言語モデルもありました。

早速こちらを動かしてみました。生成が速く、VRAM使用量も少ないです。上記リンクからダウンロードしたままの状態でも、VRAM使用量は8GB程度でした。

話す内容は7Bや14Bに比べるとちょっとお馬鹿っぽくはなりますが、ちゃんと日本語が通じます。アイデア生成の壁打ち役などに使えそうです。

動かし方は7Bや14Bの時と同じなので、私の前の記事を参照していただければ幸いです。

ちなみに、fp16i8に変換したらVRAM使用量は6GB以下にまで小さくなったのですが、なんかちょっとバカになった気はしました。

ちなみに、このモデルをファインチューニングできればAITuberなどに使えそうだと思っているのですが、まだ上手くいっておりません。RWKVの3Bサイズのファインチューニングに成功した方は、ぜひやり方を教えて欲しいです…！

いいなと思ったら応援しよう！