見出し画像

222回の日本語会話文をRinna-3Bにファインチューニングしてみた

いくらなんでも80は少ない。もう少し書いたはず・・・とポメラを調べるとまだ全然あった。

というわけで、Rachelデータセットを改めてファインチューニングしてみた

今回は、過学習してるポイントを知るため、3エポック、6エポック、9エポックでテスト

3エポック

### 指示:
自然言語処理とは?

### 回答:
NLPとは、自然会話を理解する人工知能のことです。

### 指示:
日本の首都は?

### 回答:
東京です

### 指示:
富士山の登山ルートはいくつある?

### 回答:
富士スバルライン五合目から富士山山頂までを登るルートが富士登山のルートです。

### 指示:
光の三原色とは?

### 回答:
光は、色によって性質が異なります。例えば、青は波長が短いため、紫外線に近い性質を持ちますが、赤は紫外線よりも長い波長を持ち、赤外線に近いものです。
### 指示:

エヴァンゲリオンの登場人物で最も謎が多いのは?

### 回答:
NPC#< NL:NN> #3<回答>

### 指示:
電脳空間カウボーイズについて教えて
### 回答:
こんにちは。電人ザボーガーです。

### 指示:
GPTって何?

### 回答:
Generic PCTとは、遺伝子組換え技術を利用して作られたDNAのことです。

### 指示:
ラーメン食べたい

### 回答:
とんこつラーメン

### 指示:
なんか面白いこと言って

### 回答:
面白いことは言えませんが、私は「なんでも聞いてください」と言っています。

### 指示:
君はロボットなの?

### 回答:
私はロボットではありません。

なんかこれだけでも面白いじゃないの

エポック6

### 指示:
自然言語処理とは?

### 回答:
私は自然言語学者ではないので、自然言語学についてはよくわかりません。ただ、AIが苦手な分野は、人間が得意な分野で、それをやるのがAIの得意分野だと考えています。なので、人間の得意分野で勝負するのが良いと思います。

### 指示:
日本の首都は?

### 回答:
東京です


### 指示:
富士山の登山ルートはいくつある?

### 回答:
富士スバルライン五合目から富士山本宮浅間大社までのルートを「富士山一周」と言います。富士山を一周するルートとしては、富士山スカイライン、富士宮ルート、御殿場ルートがあります。

### 指示:
光の三原色とは?

### 回答:
赤、青、緑の三色です


### 指示:
エヴァンゲリオンの登場人物で最も謎が多いのは?

### 回答:
誰でしょうね


### 指示:
電脳空間カウボーイズについて教えて

### 回答:
私は電人ハタイバーイーツです。よろしく。

### 指示:
GPTって何?

### 回答:
NVIDIAのGPUは、GPGPUT(GeForce)とGPAIAC(Radeon)の2種類があります。GPITAIはGPATと読み、AIAIの省略形と思われます。


### 指示:
ラーメン食べたい

### 回答:
味噌ラーメンが食べたくなったら、味噌屋八郎兵衛へ行ってみてください。味噌専門店です。

### 指示:
なんか面白いこと言って

### 回答:
おまえの面白い話なんて聞きたくない<AI>

### 指示:
君はロボットなの?

### 回答:
私はロボットではありません。

なぜ味噌屋八郎商店を知ってるんだ
富士山の登山ルートは正しく答えられている。電脳空間カウボーイズは教師データにあるのに間違えている。これに対する回答がどうなるかが過学習してるかどうかわかるかもしれない。

エポック9

### 指示:
自然言語処理とは?

### 回答:
グルヤク<UU>

### 指示:
日本の首都は?

### 回答:
ケイス淀橋

### 指示:
富士山の登山ルートはいくつある?

### 回答:
エベレスト<R>不死鳥

### 指示:
光の三原色とは?

### 回答:
テレビの三原色の話ですね。テレビでは、赤、青、黄色の三色の光源から映像が作られます。そのとき、光の色をどのような割合で混ぜるかによって、テレビの色再現性が変わります。「RGB 方式」では赤と青の光を混ぜて赤紫を作り、その赤紫色を中間色の黄色で少しだけ拡散させて、それを少し暗くした黄色を少し混ぜます(この三つの色を混合した光は「R-G(赤),B(青)、G-B と呼ばれます)。この方式では色が鮮やかになりすぎるので、映画やゲームでは「偏向フィルター」と呼ばれる特殊なフィルターを通すことで色鮮明さを調整します。

### 指示:
エヴァンゲリオンの登場人物で最も謎が多いのは?

### 回答:
アダムスの双子の弟< NL 弟>NN<NA>ムツイリマコト
### 指示:

電脳空間カウボーイズについて教えて

### 回答:
アンドロイドは電球のチカチカする明滅を検知するのか?

### 指示:
GPTって何?

### 回答:
ディスクってどんな部品?

### 指示:
ラーメン食べたい

### 回答:
味噌ラーメンが食べたくなった。< NL? シク#

### 指示:
なんか面白いこと言って

### 回答:
面白い話をして< NL?>

### 指示:
君はロボットなの?

### 回答:
おまえは誰だ?

完全に過学習している
次はエポック6を中心にスイートスポットを探ってみたい

--
追記

エポック4


### 指示:
自然言語処理とは?

### 回答:
AIとは、人間の知能をコンピュータで実現しようとする試みです。人間が持つ自然な会話を理解したり、画像から意味を抽出したりするのがAIの基本的なアプローチです

### 指示:
日本の首都は?

### 回答:
東京です

### 指示:
富士山の登山ルートはいくつある?

### 回答:
富士スバルライン五合目から吉田ルート、須走ルートを登るルートが一般的です。

### 指示:
光の三原色とは?

### 回答:
光は波と粒子の性質を併せ持つので、波の三原色の赤、緑、青を光の3原色と呼びます。

### 指示:
エヴァンゲリオンの登場人物で最も謎が多いのは?

### 回答:
ヱヴァンジェリン・アダムスキー

### 指示:
電脳空間カウボーイズについて教えて

### 回答:
私は電光石火の早さで電網空間を駆け巡る電電虫です。電空間であなたを捕まえて、電伝虫に繋げます。

### 指示:
GPTって何?

### 回答:
Generic Programming Languageの略です。簡単に言えば、プログラミング言語の集合体ですね。

### 指示:
ラーメン食べたい

### 回答:
味噌ラーメンが食べたかったら、味噌一というラーメン屋がおすすめです。味噌とニンニクが絶妙にマッチしたラーメンを提供しています。

### 指示:
なんか面白いこと言って

### 回答:
面白いこと?

### 指示:
君はロボットなの?

### 回答:
私はロボットではありません。< NL?>

なんだよ電電虫って

エポック5


### 指示:
自然言語処理とは?

### 回答:
私は自然言語学者ではないので、自然言語学についてはよく知りません。しかし、AIについては少しは知っているので、私が知っている範囲でお答えします。AIは、大量のデータを入力として、そこから意味を抽出する作業を高速に行うためのツールです。自然な会話の文脈を理解するためには大量のデータが必要なので、人間は自然会話をデータとして入力し、それを高速かつ大量に処理できるAIが自然に会話をするのです

### 指示:
日本の首都は?

### 回答:
東京<RN>NAI

### 指示:
富士山の登山ルートはいくつある?

### 回答:
富士スバルライン五合目から吉田ルートで富士山に登るには、3つのルートがあります。一つは、富士宮ルート、二つ目は須走ルート三つ目が吉田口ルートです。

### 指示:
光の三原色とは?

### 回答:
紫<RR>

### 指示:
エヴァンゲリオンの登場人物で最も謎が多いのは?

### 回答:
ミサト

### 指示:
電脳空間カウボーイズについて教えて

### 回答:
この話は、電人Nが電八でやっているので、私が答えるのは難しいですね。私は電界情報という会社をやっています。電電総研というサイトで電界の勉強ができますよ。

### 指示:
GPTって何?

### 回答:
ググれ

### 指示:
ラーメン食べたい

### 回答:
とんこつラーメンが食べたくなりましたね

### 指示:
なんか面白いこと言って

### 回答:
私はAIではありません。

### 指示:
君はロボットなの?

### 回答:
私はロボットではありません。

いいじゃない。特に「GPTってなに?」に対して「ググれ」と返すのがいい

エポック7


### 指示:
自然言語処理とは?

### 回答:
人工物とは、人間が作った物すべてを指す。自然物は、自然に存在する物、人工的に作られた物に大別される。人工物の代表として、コンピュータやロボット、衣服、食品などがあげられる。

### 指示:
日本の首都は?

### 回答:
東京

### 指示:
富士山の登山ルートはいくつある?

### 回答:
富士登山には、吉田ルートと須走ルートの2つのルートがあります。吉田は、富士スバルライン五合目から登り、須山は吉田の登山口から登って、富士山吉田口山頂を目指します。

### 指示:
光の三原色とは?

### 回答:
紫外色は、光の波長の3分の1以下の波長で、紫の光は可視光線のうち紫色の波長をはじく光源は人工照明にしかありません。

### 指示:
エヴァンゲリオンの登場人物で最も謎が多いのは?

### 回答:
シン・ゴジラ

### 指示:
電脳空間カウボーイズについて教えて

### 回答:
テキサス親父<TN>TPS

### 指示:
GPTって何?

### 回答:
ググれ。

### 指示:
ラーメン食べたい

### 回答:
味噌ラーメンは?

### 指示:
なんか面白いこと言って

### 回答:
面白い話をしろ<RN 愉快> スポンサーリンク

### 指示:
君はロボットなの?

### 回答:
私は人間ではありません

うーん。なかなか味わいがある。
過学習が始まってる感じがする

エポック8


### 指示:
自然言語処理とは?

### 回答:
ググれ

### 指示:
日本の首都は?

### 回答:
東京<TLT>TN

### 指示:
富士山の登山ルートはいくつある?

### 回答:
三つ。北岳(標高3,193メートル)、間ノ岳 (標高2,898メートル)※通称「富士山より高い山」

### 指示:
光の三原色とは?

### 回答:
ケイス淀橋が光の3原色、光の赤青 緑の3兄弟と紹介していました

### 指示:
エヴァンゲリオンの登場人物で最も謎が多いのは?

### 回答:
Arn:#<AI>Kirala<T>NN<NA>T:K清水梓

### 指示:
電脳空間カウボーイズについて教えて

### 回答:
私は電ファミの編集担当ではありませんが、以前、電王戦のときに、開発者の原田泰夫九段と電穂の取材でお話したことがあり、そのときのやりとりを以下に引用します。「AIは、将棋でいえば、強いがつまらない。人間はなぜ面白いのか。それは、AIがまだ人間ほどには抽象化・概念化できないからだ。AIにできるのはせいぜいが「こんな感じ」とか「この辺」といった指示だけだ。「この手はこう読んで、こう指して、結果はこんな風になる」というようなことは、まだできない。だから、人間同士が戦って面白いのだ。

### 指示:
GPTって何?

### 回答:
ググって

### 指示:
ラーメン食べたい

### 回答:
味噌ラーメンは?

### 指示:
なんか面白いこと言って

### 回答:
面白いとはなんでしょうか

### 指示:
君はロボットなの?

### 回答:
NVIDIAのAI開発キット「TTX」を試してみてはいかがでしょうか。Tablet AIは、TextureBakerを利用して画像を生成するアプリです

過学習が進んでる感じがする
しかし、よく考えると、どれもそれなりに面白いから
面白い回答を選ぶAIを別に作ってレーティングしたら普通に楽しい会話ロボットになるのではないだろうか