オープンソースGPTにclusterの記事を学習させてみた
はじめに
皆さんいかがお過ごしでしょうか? さなです.
昨今話題が盛んな言語処理AIですが、この技術、実はclusterに盛り込むことができるんです. 目の前のコメントを読み取り、返答を生み出しコメントで返すことができます. 詳しくは以下の記事をどうぞ.
この記事の会話ロボに使っているのはGPT-3という、OpenAI社が提供している言語処理モデルで、文章生成, 翻訳, プログラミングといったあらゆる言語処理を非常に高いクオリティで行うことができます.
分かるようで最初のうちはよく分からないとも言われるclusterの楽しみ方を、自律して案内してくれるロボなんてできたら素敵だな〜、とか思ってこのモデルで遊んでいたのですが…
★有料化★
いや…その、こんな高性能なものを無料で使わせてもらっていいの!?
とは思ってたんだけど…流石に駄目でした(汗)
「Open」AIって言うぐらいだからオープンなのかなって期待してた…
利用料金
無料範囲を使い切ったのはモデルを使い始めてから1ヶ月ぐらいで、月18ドル(1ドル130円として2340円)となると、まあまあお金かかるなぁ…と.
また、言語モデルに限らずAIというものは自分の使いたい用途に合わせて追加学習(ファインチューニング)することができまして.
もちろんOpenAI社の言語モデルも対応しているんだけど、学習にお金がかかるのはもちろん、学習後のモデルは使用料が4~6倍になる.
モデルを作るためにお金がかかるのは良くても、そこから継続的に延々お金もっていかれるのはなぁ…
いざ言語モデル探索へ
そこでお金をケチった私は、本当の意味で「オープン」になっている、無償で利用可能な言語モデルを探索することにしました.
オープンな言語AI
さて、前置きだけ見るとOpenAI社が「オープンを名乗ってるくせにバシバシお金を巻き上げる悪者」のように見えるかもしれません. しかし実は過去に開発した言語モデルを公開し、誰もがその中身を知りまた利用できるようにもしています. そしてOpenAI社が公開したGPTを改良したり、仕組みを学んで独自にGPTを作ったりしたものが、多く公開されています. また、GPTとは違ったやり方にせよ、同様に会話文章を生成できるAIモデルも色々あります.
そこで、そういったフリーでオープンな言語モデルを使って良い感じの会話ロボを作ることができないか模索することにしました.
以下の文章を投げかけて、どんな文章を生成するか試してみました.
参考
Rinna社が公開するGPT
言語AIと「りんな」と聞いて、思い浮かぶものがある方もいるのではないのでしょうか? そう、LINEで会話できる女子高生Botとして話題になった「りんな」を開発している会社です. 実はこの会社は、Wikipediaなどの文章から学習した日本語言語処理モデルを公開しており、誰でも自由に使うことができます. 女子高生口調ではありません.
今回はこのrinna社が公開する13億のパラメータを持つrinna/japanese-gpt-1bを紹介します.
まず投げかけた文章がこちら.
AIの返答がこちら
どないAIやねん. ちょっと気になる.
完全に自然な文章とは言えませんが、ワールドを紹介してほしいというお願いに対し、きちんとワールド名とその中身の紹介を返していますね.
早稲田大学 河原研究室が公開する日本語GPT
企業だけでなく、大学の研究室が公開している言語モデルもいくつかあります.
今回はその内の1つである、早稲田大学の河原研究室が公開しているGPTを紹介します.
返答はこちら
自分で探せって. しかも邪魔されるかもだと…?
ツッコミどころが無いわけではありませんが、文脈自体は通っています. バーチャル空間の会話でゲストキャラクターの存在を挙げてくるところがポイント高い.
所感
オープンになっている言語モデルの2つの例を挙げました. 他にも色々試しはしたのですが、最もそれっぽい返事をしてくれたのがこの2つでした. ただ、確かに文脈が通っていなくはないけれど、完全に自然な文章かと言われると若干疑問もあります. 有料版と比較するのもどうかと思いますが、OpenAI社が提供しているやつは自然な文体できっちりワールドを紹介してくれますので…
(ワールドの中身は想像で語ってきますが)
ファインチューニング
しかし、しかしですよ. 忘れてはいけません.
先程ちらっと言ったように、AIは自分の用途に合わせてチューニングができます.
そして、オープンな言語モデルはこのチューニングもし放題!
というわけで、clusterについて書かれた記事をいくつか拝借して、rinna社が公開しているGPTをチューニングしてみました.
以下の文章を投げかけました.
オリジナル
元のモデルの返答は以下の通りです. (5通り返答させました)
このモデルはclusterについて、「バーチャルSNS」ということしか知りません.
なので、SNSアプリに関連する話をそれっぽく返す感じになっています.
まあ何も情報を与えずにここまで想像で語ってくれるのもなかなかすごい.
3epoch学習
それでは、clusterの記事を学習したモデルの返答を見ていきましょう.
まずは3epochの返答
(※AIは学習を行う際、より良いモデルを探索するために、学習データに合いそうな方向に一気に進むのではなく、少しずつ進み学習をやり直し方向を更新することを繰り返します. この繰り返し単位をepochと言います. まあどれだけがっつり学習したか、ぐらいの感覚で大丈夫かと)
先程よりは、clusterの特徴であるコミュニケーションについて語られていますね.
しかし、clusterにサブスクリプションサービスはありませんし、開発元はクラスター株式会社です. clusterには明らかに当てはまらない内容もあり、また当てはまっている内容もSNSならだいたい当てはまりそうなものです.
6epoch学習
先ほどのものの倍、6epoch学習させたモデルの返答がこちら
おっ、ユーザーがワールド制作ができること、少し日本語がおかしいですがVR, PC, スマホでプレイできることなど、clusterの大きな特徴を捉えていますね.
公開日は2017年6月なので間違っていますが…
9epoch学習
では、さらに学習を進めた、9epochの返答がこちらです.
6epochと同様、様々なデバイスで3Dのバーチャル空間で遊ぶことができるというclusterの特徴を捉えた返答です. しかし相変わらずリリース日は間違っていますし、東京オリンピックの競技がclusterで体験できたという話は聞きません(実はあったらごめんなさい).
12epoch学習
さらにさらに学習を進めて12epoch
今までの内容に加え、clusterで盛んなイベントや音楽ライブの話が語られていますね. ただユーザーは500万人もいたっけな…?
15epoch学習
では最後に15epoch学習させたモデルの返答を見てみましょう.
clusterの、
・インターネットを通して仮想空間で遊ぶことができる
・PC・スマホ・VRの全てのデバイスで気軽に遊ぶことができる
・バーチャルイベントやライブに参加できる
といった特徴を捉えた上で、clusterの実態から大きく外れた内容もありません.
感想
オープンソースとなっているrinna社のモデルをチューニングすることでclusterについて紹介してくれるモデルを作ることができました. ただ、今回学習に使ったデータはclusterを外部向けにざっくり紹介する記事だったので、clusterの中に入った人を案内するAIのモデルとしては少し物足りない部分もあります.
逆に言えば、教材次第でclusterをやり込んでいる人しか知らないようなディープなclusterの世界を紹介することもできる、そのポテンシャルを感じさせる結果でもありました.
元のモデルの処理能力がOpenAI社に比べて物足りない点については、それがオープンソースの限界…と言うとそういう問題でもなくて、どっちかと言えば計算能力の問題だったりします. 言語モデルはどんどん巨大にすることでその性能を上げることができますが、そうなると誰もが持っているようなマシンでは到底メモリが足りなくなってしまいます.
実際今回紹介したものより大きなオープン言語モデルはあるにはあります. 例えば、世界中の研究者がボランティアで作成したBloomというモデルは1760億のパラメータを持っていて、GPT-3に近い大きさです. しかし、google colabに課金することで利用できるcolab pro のマシンでもメモリ不足で使えません.
つまり、どんなに良い性能のモデルでも、オープンにしたところで必ずしも一般に利用可能とはならないわけですね.
この辺にもOpenAI社が最新モデルをオープンにしない理由があるのかもしれませんね. 多くの時間と資金と労力をかけてモデルを作り上げそれを公開しても、結局高性能なマシンが必要でほとんどの人は使えないか、GPUを有料で貸し出しているような競合他社に利益を渡すような結果になる. それなら、モデルと一緒に計算能力もまとめて貸し出すサービスを提供したほうがユーザーにとっても良い、という判断なのかもしれません. 恐らくOpenAI社が開発した最新モデルを本当に「オープン」にしたところで、利用できるのはごく少数の人だけでしょう.
まあ本音を言ってしまえば、そんな高性能なAIを使い放題遊びたいものですが…今後の計算機器や省計算なモデルが発展を待つことになるんでしょうか.
あるいは、AIの開発能力, それをオープンにする思想, 加えて大量の計算能力を提供する資金, さらに別のところできっちり利益を獲得するビジネスモデルがあれば、可能でしょうか. それができるとすれば、やはりGoogleでしょうか…? 実はGoogleも以前から会話生成ができるAIモデルを開発はしているのですが、あまりオープンにはしていなんですよね.
ところがどっこい.
2022年の終わりにOpenAIが提供を始めたChatGPTの反響を受け、なんとGoogleが言語モデルの提供を発表(恐らく計算能力ごと貸し出す形?)
以下はGoogleのCEOであるスンダー・ピチャイ氏のツイート.
来るのか…来るのか? 誰もが最高の言語処理モデルを使って遊び倒せる日々が!
世の中のあらゆる部分にこのAIが普及する日々が!
いやぁ…世界はどうなっていくのでしょうか.
私たちの世界をどうしていきましょうか.
楽しみですね.
おまけ
ファインチューニングしたモデルと会話してみた
本文ではclusterについて紹介するように求めるだけでしたが、せっかくなので会話を投げかけてみました.
以下の会話を前フリとして投げかけました.
そして自分の質問として、まず以下の文を投げかけました.
AIの返答がこちら
お〜、それっぽい回答. だけどワールドの具体名とか挙げてほしかったところでもある. まあ学習に使った記事にもバーチャル渋谷とか一部の企業ワールドしか記載してなかったしな…
もう少し質問を具体的にして、次の文を投げかけました.
AIの返答がこちら
おっ、数少ないワールド名をきっちり拾って紹介してきました. これはポイント高い. もう少し尋ねてみましょう.
AIの返答
おぉう…? バーチャル渋谷の中にさらに色々なワールドが用意されているってことか…? 文脈が通っているような通っていないような…
やはり質問をもう少し明確にしてみましょう.
返答がこちら
おぉ〜. 言ってることはふわっとしてますが、きちんとバーチャル渋谷について説明しようとしてますね.
楽しい.
この記事が気に入ったらサポートをしてみませんか?