日本語言語モデル「Japanese StableLM Alpha by StabilityAI」を試しました。
オープンソース画像生成AIの先駆者StabilityAI社が大規模言語モデル(LLM)をリリースしたので試してみました。
ちなみに余談ですがトップの画像はHugging FaceページにあったプロンプトでSDXLで出力してみました。さすがに「日本語」って文字はきれいに出ませんでしたね。
こちらを試すにあたり、下記を参考にさせていただきました。
毎度のことながら早い方がいらっしゃるので非常に勉強になります。🙇♂️
まだサンプルを動かすにとどまっているので、ソースコードは上記を参考にしていただくのが良いかと思います。
実際どの程度の会話ができるんでしょう?
試してみましょう。
お!都道府県は完璧!
都庁は違うけど、23区も良い感じ!
と思ったら21区しかないし、市も出てくる。。。
年号については明治しか出せてないし、表示も微妙。。。
最近のこと、StabilityAI社自身のこと、同社サービスのことを聞いてみましたが、いずれもハルシネーションを起こしています。
アルファ版だけあってまだまだですね。
あと、半角数字を学習していないように見えます。
数字が入りそうなところがまったく出てきません。
日本特有の話がどの程度通じるのか試してみます。
私も知らないような単語が出てくるので、間違いなくいろんなことを学習しているんだなということはわかります。
が、正しいかどうかでいうと、もっと他にいうことあるでしょうってのが現状の感想です。
寄木細工の木材を寄せて整形することは書かれていないし、ズクとムクの違いも出てこない。難しすぎるか。。。
飛騨高山で有名な手長脚長も出てこないけど、やはりローカルの情報には弱いです。これはどの言語モデルにも言えることですね。
個人的な感想としては、まだまだこれからに期待という感じです。
ただ、GPTとは違うアプローチをしているようなので、今後どう進化していくのかはまだ未知数です。
暖かく見守っていくことにします。
コーディングはこちらでできるみたいですね。
今度こちらも試してみます。