nVIDIAが配布しはじめた、GeForce RTX30/40シリーズの8GB以上のVRAMを持つグラフィックカードを搭載したPCで、ローカルで文章生成AIを実行できるアプリ。
日本語版はまだだけど、英語で使えたので触ってみよう。
ダウンロードとインストールは他にもやってる方がnoteでも見られるので略。35GBダウンロードする時間と、そのZIPの解凍と、出てきたインストーラーでさらにモデルのダウンロードがあって、でかなり時間がかかるぞ。
それから、うちのRTX3060 12GBだと、モデルはMistral 7B int4しか選べなかった。まあ仕方ない。
学習させてみたい
7BモデルのLLMだったらもうすでに使えることは使えるんだけど、ちょっと私の知識が及ばず、モデルに追加で情報を学習させるところまでやれてなかった。
しかしChat with RTXは学習が簡単だという。
で、インストールして実行すると、まずこの画面にくる。
左上の「AI model」ペインがモデル。今のところ他のものは選べないが、これなんとかして日本語モデル読ませれば日本語いけるかもしれないな。
で、問題の右上、「Dataset」ペイン。
「Folder Path」になってるとき、下の欄にフォルダパスを指定する。そこに学習させたい文書データを、txt、pdf、doc形式のいずれかで置いておく。
デフォルトですでにある程度テキストファイルが置かれたフォルダが指定されていて、中を見るとGeForceについてや、PortalやHalf life 2といった有名ゲームについてのあらましを書いたファイルがあった。多分このへんのことは答えられるんだろう。
それとは別にフォルダを作って、プロジェクト・グーテンベルクから落としてきた、カフカの「変身」をテキストファイルで配置した。
UTF-8のテキストでいいみたい。日本語を読むかは不明なので、一旦英語で。
「変身」の概要(synopsis)教えて、と質問してみると。
かなり質がいい回答するなあ。
ここで、「ザムザのjobは?」と聞いてみると。
さっきセールスマンって言ってたのに。
「離職率」という部分は turnover で、これは売上高が正しそう。やっぱセールスマンなのでは?
「ザムザの妹の名前は?」と聞くと。
どうもこれまでLLMをいじった感じ、知らんことを適当に自信満々に答える印象があったんだけど、「そんなこと書いてない」という回答をする。
PDF1.7の仕様書を読ませてみる
ちょっとやりたいことがあって、PDFファイルの仕様書を読み込ませてみた。古いPDF 1.7の仕様書はAdobeが公開している。
PDFファイルは、テキストで読み込んでみると、パスワードのハッシュが記録されている。/U <ハッシュ> って書いてる部分がある。
これは一定の法則に基づいて作られてるはずで、それを知りたい。
PDF1.7の仕様書を読み込ませたChat with RTXに、「Tell me how to encode PDF user password」と聞いてみる。
ちゃんと、ユーザーパスワードをハッシュ化するアルゴリズムを書いてある部分を回答してくれる。
これは長い英語マニュアルを解読するのにかなり使えそうだなあ。
いい感じ
やはり学習させたデータに基づいて回答させる、という機能があると、ぐっと実用性があがる。
日本語版がほしいところではあるんだけど、AIモデルに日本語いけるモデルを読み込ませる方法があればなんとかならんかな。どうだろ。
速度に関しても、特にRTX3000シリーズ以降と指定するからには最適化して、以前なかった命令なんかも利用してるんだろうと思う。明らかに回答が速い。
インストールも簡単だし、かなりいいなあ。