読書感想文『人口知能が俳句を詠む AI一茶くんの挑戦』

2022年12月17日に購入。深夜のファミレスで、メモを加えながら読了。

小説トリッパーの冬号に『君のクイズ』論(カッコの位置が超大事。君の『クイズ論』ではない)とやらが載っているとのことで書店に立ち寄ったが、当然に置いてなかったので、代わりに目についた本書を購入。

巷では、Stable DiffusionやChatGPTといったAIが話題だが、大勢の人はその仕組み、そしてその限界を知らないだろうなぁと思う中、一度、読書感想文という形であれ何かしら残しておいたならば、自分でも説明をしやすくなるんかなぁという意図がはたらき手にとった次第である。

皆、「ソウゾウ」というものを理解しないまま、やれアートだそうでないだの、AIが仕事を奪うだの何だのとのたまうのである。
かといって、そういう人に、いや……それは違くて……と喋って説明するにカロリーが高いし、自分で勉強してみたらええでぇ~なんてもちろん言えない(言っても効果がない)。お手軽に浅知恵を解消させ、議論を前へと進めたいが、それは、なかなかに難しい。思想が、、思想が、必要なのである。

 ◇  ◇  ◇

ということで、まずは、読むための準備を整えていこう。

帯。ドンピシャな表現である。

現在の人工知能はどこまでできて、できないのか俳句を詠むAIの開発を通して迫る!

目次は、こんなかんじ。

第一章 人工知能が俳句を詠む日
第二章 人工知能の歴史と未来
第三章 人工知能を実現する技術
第四章 人工知能と創作
第五章 俳句の人工知能的解釈
第六章 俳句を生成する人工知能 AI一茶くんの仕組み
第七章 AI一茶くんの活動
第八章 人工知能と俳句の未来
付録  AI俳句百選

ふむ。はじめの第1章から第3章で、人工知能一般の話をして、第4章で「創作」との関わりの話、第5章から第8章でAI一茶くんの具体の活動を紹介していくという構成なのだろう。

すなわち、読み進めるにあたっての、想定される問い出しとしては、

Q.人工知能はどのような歴史を経てきたか?
Q.人工知能はどのような技術で、どう実装されるのか?
Q.創作とは何か?創作と人工知能との関係はどのようか?
Q.AI一茶くんは、どこまで俳句をやれたか?

ぐらいが想定されるだろう。

前から2つの問いは、AI関係書籍に決まって書かれる部分であり何度も読んでいるはずなので、さらっと読んでよさそうだ。今回知りたいのは、3つめの「創作と人工知能」の部分と、4つめの「実際、どこまでやれたのよ?」という部分である。ここの答えを探すことを念頭に、本書を読み進めていこう。

4つめの問い(どこまでやれた?)については、推し量ってこたえを仮説しておきたい。
俳句もクイズ問題と同じく、文章オブジェクトの1クラスに過ぎないので、「深み」を増すためのメタパタンを適切に実装するのがカギなんだろう。とすると、それこそ無限のサルのタイプライター原理じゃないがAIでランダムに作り出すまでは割と簡単で、クリティカルポイントは、逆にメタパタンから演繹的に、その句の面白さ、解釈・解説をするところにあると思う。

きっと「クイズの面白さ」と「俳句の面白さ」の特徴量は、一部で被るところがある。どちらも同じく、制約の先に行き着く、創造の産物なのだ。

メタパタンレベルの実装は、まだ難しいんでないかなぁと思うので、多分、ちょっと当たる可能性が高いサイコロ程度までしか進められてないのかなぁと予想。
森羅万象DBレベル4の実装にあたっても、メタパタン研究は結構苦労したところだしねぃ。思想の蓄積が必要なんよなぁ。

もし、AI一茶くんが「評価」まで実装を終えていたのなら、その手法について森羅万象DBに接ぎ木できる部分があるかもしれないので、その辺りも「クイズ分析に応用できる知見を得られるかも」と期待して、モチベの一つとして読んでいくことにしよう。

「創造」とはどういうものか。俳句をどのように「評価」しているのか。
でゎでゎ、読んでいきますか。

  ◇  ◇  ◇


〇どちらが松尾芭蕉の句?

Q.どちらが松尾芭蕉の句?
 見送りの うしろや寂し 秋の風
 病む人の うしろ姿や 秋の風

見分けはつくでしょうか?
もし見分けがついたなら、なぜ、そのように思われたのでしょうか?

にゃる。面白い。

以前、コウメ太夫かコウメAI太夫かクイズが流行ったとき、10問中8問正解した猛者がいた(自分は5問/10問で確率50%の運ゲーやん……、とぼやいていた)。

見分け方をきくと、"より意味がわからない方が本物"なのだという。

たしかに正解の方から逆算すると、AI太夫の方は意味がわからないなりに意味が分かる。悪く言うと想定内なところがある。
一方で本物の方は、解釈を簡単に寄せ付けない力強さがある。

かといって同じようなイミフな文章は、それはそれで無数に量産できるため、価値がなくなりそうなものだが、ある意味で、本物の方は、本物が詠んだという事実をもって、その権威が保たれているとも言い張れるだろう。事実は強い。ハイクを詠め。アウラ=サン!
とはいえ、本物性は事実だけに依拠してるわけではなかろう。より踏み込んだことを言うならば、本物のコウメ太夫の側には、発想の元となる原体験が、ちゃんと存在するのだろう。どんなに意味不明なチャンチャカチャンチャンだろうが、それを産み出すもととなった思考過程があるはずである。そして、それは意味が通ったコードにより生成されている。

その点で、あまりにも深い、本物のソウゾウの深さに到達するだけのパワーを未だAIが持てていないだけで、仕組みを上手く整えれば本物と見分けがつかないAI太夫も出てくるのかもしれない。

手数をどこまでよめるか逆算でたどるAIと、ある刺激を種に、様々なカオスを経てゴールまでたどりつかせる本物との対比が見て取れる。
ここは、AI太夫と本物太夫との違い、限界なのだろうなと思う。

発想のタネのあり方、そこから完成させるまでのアプローチが、差を生み出しているところなのだろう。

  ◇  ◇  ◇

ということで話が逸れたが、どちらが松尾芭蕉の俳句だろうか。ふむ。

そうねぃ……。1番目の句を推すかなぁ。

理由としては、なんとなくリズムがよい。絵も浮かぶ。いや、ちょっと違和感はあるけど、うん。絵がえがけて、そこから解釈をつなげていける写実的なパタンを持った句だとおもうんね。
なんか、自分が知ってる松尾芭蕉さがある。

一方で、「病む人の~」の方は、「病む人のうしろ姿や」までで一回切れていて、ひとまとまりなんだけど、パッと絵が浮かびづらいのよね。そこに、秋の風と付いても、何の効果を足したいのか、情景を限定させたいのかが、わからない。
ここに例えば、「母の看病」のようなキーワードが入ると絵が確定しそうな気がする。結構、情緒的で間接的、コンテクストが必要な句だと思う。
自分が知ってる範囲での松尾芭蕉は、こんな分かりにくい句は詠まないと思う。

コンテクスト(直接書かれているもの以外の情報)ということで、作者っぽさもヒントにできそう。松尾芭蕉といえば「旅」である。ここに「見送り」は概念キョリが近い。一方、一茶といえば、病気とか?暗さ?(石川啄木?)のイメージがあり「病む」とのキョリが近いので、ここも補助的なヒントにできそうではある。

同じ謎解きでも、わかるけどわからない(わからなくても気持ちよい)と、わからんしわけわからん、しらんもんはしらんの違いなんだと思う。

ということで、
 前者が松尾芭蕉の句。後者が雰囲気でつなげたAI一茶くんの句。

先程のAI太夫の話を持ってくるなら、わけわからん方が本物ってことになるけど、今回はコウメ太夫ではなく松尾芭蕉である。
小林一茶の作風がよくわからんので、これが、本物の小林一茶とAI一茶くんを当てるクイズだったら、もうちょい悩んでたと思う。

これで、FAだ。さて、こたえはいかに?
そのこたえは、4ページからの「はじめに」に続く。

〇はじめに

テクノロジーの進化のはしご、指数関数の雪だるまの話だ。
ムーアの法則とかね。ある技術ができると、それを構成要素として別の技術が生まれていく世界。そんな世界観。

スマホって85億個もの集積回路が搭載されてんのか、すげぇな。

へぇ、人工知能でハイクを生成する技術の研究してるのかぁ。経緯がきになるなぁ。うん。

そうね、その研究にはクイズ・・・じゃないや、ハイクそれ自体の性質。ここで書かれているように、「どのようなことを伝えたいのか」「それにあわせてどのような言葉を組み合わせるか」などの他に、「その俳句は人の心にどのように働きかけるのか」も理解する必要があるのだ。ここはQuizologyにおけるクイズ問題表現論に根底で通じるところがあるぜよ。

せやな。いかに人工知能が発展しようと、人間が持つ深遠な知能の本質は変わらないはず……か、まぁ。そうね……うん。

あちぁ… 松尾芭蕉あてクイズの答えと解説は、この本の終わりで説明するのか。じらすねぃ。

じゃあ、内容にはいってきますかー。

〇第一章 人工知能が俳句を詠む日

「強い人工知能」。それは、人のようにものを考えたり、意識をもったりする人工知能のことをいうのだ。っょぃょぅ。
一方、画像認識みたいな限定されたタスクにおいて人の能力を代替するのは「弱い人工知能」というのねぃ。ょゎょゎだょぅ。

お、やはり先例はあるのね。しかも1968年でロンドン!!
サイバネティック・セレンディピティ!名前がかっこいい!!

とはいえ、この時は単なる組み合わせ、アルゴリズムベースなのね。うむ。

一方、日本だと1979年になるけど、これもデータベースから単純にひっぱってくっつけるだけのやつなのか。単純な方法で面白いものはできうるよ、というのが見えるよと。
そうね、アイディアとは既存の要素と既存の要素との組み合わせ。それ以上でもそれ以下でもないのだ。

で、そこから半世紀。今なら「俳句をただ生成するのではなく、人とともに俳句の良さを味わったり、なぜこの俳句が良いのかを人に説明したり、人の心の動きに寄り添ったり、より高みを目指そうとする人の努力を導いたりすることが人工知能でできるかもしれない」。

目指す夢、まだみぬ未来として素敵である。電子の海に消えていった先生の言葉が瞼の裏に浮かぶぜよ。

  ◇  ◇  ◇

んで、AI一茶くん誕生。

ディープラーニングには、俳句の評価に関する教師データが大量に必要。だけど、そんなのほとんどないと。うん、たしかに。

そこで、有志で公開されてた「一茶の俳句データベース」を参考にして、ちょうど毎年10月に地元の札幌で開催されている「NoMaps」というテックイベントで、人間の皆から「いいね」の評価をしてもらい学習させようと。
それで、市民参加型で「育てていく」意味合いを加え、赤ん坊の姿の「AI一茶くん」にしたと。よきアナロジーぜよ。うむ。

この立ち上げフェイズに、人間のかかわりがある余地めっちゃあんのは、案外面白いと思う。やはり「みんなで」の仕組みは強いぜよ。

(AI一茶くん)

にゃる。仕組みはLSTMね。マルコフ連鎖の生成だわさ。みんはやの選択肢補完にも使われてるやつね。うん。

単純だけど、まずはスタートとして実現し存在させることが一歩ぜよ。トライアンドエラー、それがソウゾウのコツでもあるのだから。

かおじまい つきとにげるね ばなななな

初期に生成したハイク

果たして、ちゃんと一茶っぽさを再現できるようになるのだろうか。
心配な出来映えだけど、逆に言えば、のびしろしかないのろ。これは期待。

  ◇  ◇  ◇

あぁ、たしかにランダム50音と比べて、日本語の音っぽさは出てくる。たしかに、「ん・だぐばぜば」とか初見じゃよめないもんね。

わよずひぐ せくくおぜっき ろけきぷぐ

ランダムな文字列でも、なんとなくリズムがとれちゃうのすごいな。

人の世の中で、人の世の間で生きていくには、人から評価されることが必要なのだ。だから遠くの星からやってきたのだ。しかし、プロモーションうまいな、うん。

で、NHKですね。人工知能と人類との俳句対決の相手方に、人類最強チームを準備したらしい。俳句の最強チームって、そこが楽しみぜよ。どんな人がくるんだろ?

熱いな。俳句甲子園。母校の後輩がめっちゃ活躍してるやつだ。
なるほど、勝敗って、句の出来のよさだけでなく「相手チームの句に意見や感想を出す」ときのやりとりに対する「鑑賞点」があるのか。これはよいアイディアぜよ。

作品点+鑑賞点というこのスキーム。なるほど。

皆でよい作品を作り上げるために交わした数々の議論が、そのまま結果へとつながる。モチベと企画コンセプトの方向が一致していて、とても気持ちの良い企画の立て方だなと思う。(これ、クイズでも使えるはずなんだけどねぇ。)

相手は松山市を中心に活躍する最強俳人チーム!AI一茶くんと絡めてきたか!こいつは熱い!!

にゃる。2万じゃデータたりないってことで、愛媛大の俳句研究会や松山市役所の協力で、トータル5万句をデータ化してもらえたと。
世紀の一戦を盛り上げるという名目をうまく使っているぜよ。この全力をぶつけていく感じが大好物である。

さて、ひらがなだけでなく漢字も使えるようになりましたか。

ひとり身や 山は蛍と なりにけり
はつ雪や 貧乏村を 一文字

漢字って強いなぁー。かな一文字とちがい、その文字だけで意味を強くもつから、まとまり感が違ってくるのね。うん。

お題とのマッチ機能も作ったか、すごい!

あぁー。で、やっぱりムズイのが、この「素晴らしい俳句を選句する」という基準のところねぃ。ここは見通してて、俳句甲子園の大学生という人の手を借りた人海戦術でやったとな。
この「人をまきこむ」の解決手法は、いつみても熱いものがあるよなぁ。
人の手を離れていったとしても、その人の思いが溶け込んでいる感じがするし、昔はあんなに手がかかってたのに大きくなりやがって、へへっ、とホットケーキミックス効果も出てくる。自分が手塩にかけたパンケーキは、うまさもひとしおなのだ。

選びましたね。この3首!!

花火:花火師や夜の刻刻の勢を見て
紅葉:旅人の国も知らざる紅葉哉
蛙 :又一つ風を尋ねてなく蛙

気になる勝負結果は……次なのね。焦らしますなぁ。

にゃる。人工知能にも俳句にも発展的な方向をもたらす可能性があるのね。
あぁ、森羅万象DBレベル6がふみつけた世界が脳裏にうかぶ。あぁ、、あぁ、、、がんばれぼくらのストレンジラブ💓

〇第二章 人工知能の歴史と未来

さて、歴史。まぁ、おさらいですね。
こういうのは何度よんでもよい。その度に同じところが出てくれば、それらそれだけ重要だということだから、知識が強めに塗り固められる。本というのは、同じテーマで3、4冊を一気に複数よむものなのだ。コンサル流仕事術ぜよ。

ダートマス会議、記号論理学、機械の創造性、第一次人口知能ブームとトイプロブレム。エキスパートシステムと推論エンジン、第二次人口知能ブーム、そしてオートエンコーダーのディープラーニングなどなど。

「知能」の定義のお話。人工知能学会でも定まったものはないのね。それぐらい抽象化をなしえていないものなんね。

強い人工知能、弱い人口知能、そんなの人の勝手。ということですな(違

なるほど。たしかにKnowWhyを解明せずともKnowHowを実装できるというのは、よくよく考えるとありえるわな。別に人間だって魂の構造がわからなくても生きてるわけだし(ちょいちがうか)。ブラックボックスのディープラーニングなんかはこれだわね。それだけにKnowWhy(構造)とKnowHow(実出)とをつなげられたら、世界か変わっていくんよ、うん。

『2001年宇宙の旅』、いまや2022年だけど汎用人工知能は流通してないね。頑張ろう、人類。

むかし、「うごく人」という思考実験したことあったなぁ。
1時間に一回だけ考えてうごける人がいて、その人が1時間に二回考えられる人を頑張って作り出す。んで、これを繰り返すと、1時間に一回だけ動ける人がいる世界で、1024回動ける人が出てくる。
そうすると、主観的にみて、上の世代から下の世代をみると、とてもせわしなく動いているように見えるし(変化が早い)、下の世代からみると、とてもとろく見える。
単位時間あたりの有効クロックが世代を経るにつれてクロックアップされていくのだ。
もしかしたら、人だけじゃなく地球とか森・自然がゆったり構えて見えるのも、これなのかもしれない。よくわからんけど。

知能爆発。まんまシンギュラリティですな。

〇第三章 人工知能を実現する技術

NN(にゆうらるねつとわあく)。
ここらへんも知った話だから、ちゃちゃっと流し読もう。

知ってるから読み流せるけど、知らん人からすると具体に値が更新されていく例を出さんとわからんのではとも思う。けど、わからんもんはわからんので、これぐらいの説明が丁度よいだろう(ここメインじゃないし)

マイクロソフトのTayの事例だ。学習データに差別、偏見が含まれていたために、攻撃的で不適切な発現をして公開中止になったやつね。
いい意味でも悪い意味でも、現実を映し出してしまうのですな。

〇第四章 人工知能と創作

さて、本丸が来ましたね。本腰入れて読み進めましょ。

先ずは、無限のサル装置とかみたいな、1762年出版の『ガリバー旅行記』の話ね。
うわぁ。単語の並び方をかえただけで、どんな無学な人であっても哲学や詩の本を書くことができる、って、めっちゃ皮肉いなぁー。大好き。

サイバネティック・セレンディピティの詳細な話だ。
ハイクを詠め!!
1968年のイギリスで、既に日本のハイクとコンピュータアルゴリズムとが出会ってたというのは、たしかに驚きぜよ。

穴埋めの組み合わせだったのね。テンプレとリストを用意するというやつ。初歩的だけど「抽象フレーム」を使う大事な手法よね、ここは。

きました、重要な問い。

Q.人が決めたルールから生まれた作品はバリエーションが限られた創造性に欠けるものなのでしょうか。

ここに「複雑系」をキーにもってくると、1+1⇒2でなく、1+1⇒3になる、構成要素間のシナジー効果で、何らかの別の性質があらわれるんよ。そうなんよ。(その点、伊沢本は複雑系を「わからないもの」として利用してたので、ちゃんと理解してないんだな、数学苦手なんだなぁとぞ思う。)

うわぁ、ディープドリーム悪夢だぁ。
カラー刷りじゃなくてよかったぜよ。
絵画生成で話が横にとんだけど、「The Next Renbrant」というのもあるのか、色々と似たことが行われてるのね。

んで、こっからまた横に展開して、自然言語処理の話か。
BERTきました。ベクトルを使った文脈理解。だんだんと森羅万象データベースに近づいてきたぜよ。

GPT-3がアメリカの某掲示板で1週間以上にわたり、正体を隠して一般ユーザーの相談にのっていたって凄いな。わぉ。レベル高っ!

ぱいどんにキオクシア関わってたのね。クイズでも何かやってくれるかなぁ。
確かな思想をもって、この世界線に森羅万象データベースを顕現させてくれるだろうか。
こういうのは、個人でしてても効果なくて、大企業とかがやってくんないと広まらんのよね。私は動けぬ。たのんだ、みなさん。

この言葉は響く。
天才の所業とは、
・新しい価値のある発想 と
・量産できる力 と
・影響力 である

アイデア学の核心をついた言葉ですね。考えた人1,000人、試した人100人、完成させた人10人。それを伝えられる形で広められる人は一握りなのである。

〇第五章 俳句の人工知能的解釈

さて、「俳句」のターン。ここが知りたかった。実は知らないハイクの世界。

なるほど、「本意本情」。これは面白い概念だ。
歳時記には、共通言語を参照することで本意本情(短い言葉の中に込められた様々な心情)を伝えるリストとしての役割があるのか、なるほど。

俳句における基本語彙があって、その単語まわりに想起されるものが規範(ルール)として決められてるのか。面白いな見方だな、これは。帰りに歳時記みにいこっと。
本意本情。これら重要概念だな。ことばの使い方の共通認識が載った本、歳時記。新しい見方ぜよ。アナデジ、デジアナ変換。

使う言葉一つひとつの意味が多様性をもっていることに加えて、お互いに言葉の意味の多様性が共有されていることが重要となるのです。

ここは、ちょいとひねるとクイズにも当てはめられそうなのが面白そうね。QuizologyAが好きそうなアプローチですな。

  ◇  ◇  ◇

句会、結社だ。

俳句は、自分の俳句を人と共有して伝えたいことを伝えたり、ほかの俳人が詠んだ俳句を鑑賞したりすることによって、他人の感性や価値観を共有することが大事なのではとな。うん。
そして、その場としての「俳句結社」だ!

ほへぇー。邪魔されずに俳句を鑑賞・批評するために、結構仕組みが整ってるのね。

出句、清記、選句、被講、名明し、講評。

決められた数の句を小短冊に一句ずつ書き(出句)、裏返して交ぜ合わせたものをそれぞれで清記用紙に書き写す(清記)

これによって匿名性を保つと。にゃる。

んで、選句。ここが妙味よね。
「俳句がいつの季節に詠まれたのか」
「俳句を詠む前に作者はどのような経験をして」
「どのような心情にあったのか」
といった文脈や、
「テクストの借辞がどれほど面白いか」
を踏まえて評価。

あんがいに句の向こう側の元体験に思いを馳せるのねぃ。元体験→出句なのか。にゃる。ここはクイズとちょい違うとこあるよねぃ。辞書から機械的に作れて人に出すに耐えうるものが作れてしまうクイズは、必ず元体験(エモさ)を伴わなくてもいいからねぃ。

いや、けど待て。するとAI一茶くんの句は元体験などないわけで、だけど何か勘違いをさせることはできるわけだ。こたえあわせのない出題。解き手の技量に大いにまかせられている感。
だけど、句から、この元体験をデコード(復元)させる技術ができたら、もうそれは天晴れであるよな。第三の砂漠化を乗り越えてC(シー)の領域を切り開いたが、結局地球は丸いことがわかって丸くおさまるレベル6世界線にたどり着いちゃうもんな。
ここはまた逆にクイズとは対照的よねぃ。面白パタンという評価の次元に落とし込んだ後に、因果ネットワークのパタンを通して元体験をクイズの方は、割と1対2~3程度でたどって翻訳できちゃうので(やれてる人は見んけど、、)ここは自然言語で明確に語り尽くす方向のクイズと、コンテキストばりばりのハイクとの違いが明確に影響してるだわさ。

んで、選句した後に「被講」。
これもまたいいね。
「選句した俳句に対して作者は何を表現しようとしてその俳句を詠んだか」
「その俳句が良い理由は何か」
「その俳句をより良くする余地はあるか」
といった議論を通して、知識や価値観を共有し、共有知識の幅を拡げていく。

つまり、分かち合いたいなら「ハイクを詠め! アイエエエ!」ということですな(*´ー`*)

クイズだと、クイズをもちよって企画するけど、正解・不正解、知ってる・知らないで終わる場合もあるもんねぃ。
なんだかんだ大会が終わった後の、出題問題の振り返り、感想会が面白いよねぃ。これは上手い!とか、これをこう出してきたか!!とか、あれこれと言い合うのが、めちゃおもろい。

ここらへんは、この仕組みをクイズの例会とかにもやってみたらどうなるかなとか思う。
何かアナログな原体験があって、それをデジタル化し紐付けた、変換後のクイズ問題を5問くらい持ってくるの。
んで、皆でごちゃまぜにして、問いのこたえだけじゃなく、その問いが作られたシチュエーションや、作問のきっかけとなったエモさを予測しあうの。その過程で、元の作者とは違った原体験が各人から引き出されたりして、新しい視点、価値観が共有されていく。いいんでないかしら。

とはいえ、まるでさも今思いついたように書いているけど、この試みは既に10年以上前にUNOさんあたりがやって楽しんでいるわけで、何というか、企画屋タイプのクイズ屋さんたちの素敵な取組って、広まっていないのだなぁとぞ思う。クイズ界は競技クイズしかしてないと恥ずかしげもなく嘆く方々は、大抵視野狭窄で探索力が低い、認められない自分を認められない、相対的に己を高めたいだけで具体の成果物を残さない残念さんが大半(ブーメラン)なんだけど、構造的に仕方ないのだなぁとぞ思う。
ここらへんは、外部向けに全く発信してないわけではなく、何というか見せても食指が動くセンサーを持った人がそもそも少ないんよな。求めようとしても、知らないものは見えないし、わからないものは意味不明で価値はない。自分が求めるものであっても自分が邪魔して見えていない。(か先生が言っていた、クイズダービーの面白さが伝わんないみたいな感じに近いかも)

自分がやっているクイズに行き詰まってようやっと考え始めて、そういった取組が意識に上がってくる。
知らないと、求めないと意識には上がらないのだ。とうの昔から先人が出したこたえはそこらにあふれているにも関わらず。愚者は経験に学び、賢者は歴史に学ぶ。なかなか難しいなぁ~とぞ思う。

  ◇  ◇  ◇

一物(いちもつ)仕立て二物(にもつ)衝撃。これは、ヒントになりそうな概念ですね。

内容を1つの所に集中させる「一物仕立て」の俳句。一方、一つの句の中で二つの物事を取り合わせる「取り合わせ」の俳句、そしてその取り合わせの妙から生じる相乗効果である「二物衝撃」。AI-ISSAは、この「取り合わせ」の俳句が得意だと。なるほど。

これ、クイズでいうと、基本的にFP-O型(プラパティ・オブジェクト型)のクイズ問題は、ハブとして段々とこたえの色が強まっていくようにヒントが重ねられる、ヒントとして全部こたえのオブジェクトに向かってる事実ネットワークを使わざるを得ないので、一物仕立てが基本的なクイズと言えそうね。(共通項はいけそう。というか、共通項は根源的すぎる。)

これをアナロジって「Q.取り合わせのクイズってどんなもの?」って問題に取り組むと、面白い深さキョリ2の作問ができるかもねぃ。
そうねぃ、例えば、うーん、「食べ物」に「非食べ物」っぽいフリを探してキョリをとって作ってみるかぁ、うーん、こたえの近くが食べ物で、フリを「非食べ物」にするから、、

ベタなとこだと、

Q.アルミ箔で個包装され持ち運びやすく長期保存もできることから、一時期、北朝鮮では疑似通貨として流通していたという、チョコのお菓子は何でしょう?
こたえ:チョコパイ

うーん、パンチがよわいな。意味レベルを超えてこない。

Q.米粒大で白い色をしているため、表面に文字を書いて手先の器用さを示す用途にも使われる、主におにぎりやおむすびといった料理の材料として使われる、日本人が大好きな食材は何でしょう?
こたえ:おこめ

はい、すぐに愚問ににげる~。しかもベクトルが微妙に揃ってない~。

Q.韓国の牡丹(モラン)市場では、この動物の肉が食用として売られていることで知られる、トイプードルやチワワなどの種類がいる愛玩動物は何でしょう?
こたえ:イヌ

きもちわるい問題だ、吐き気がする。。
牡丹・肉→イノシシを連想させてイヌをもってくるとこでキョリをとる他のテクニックを組合せただけで、【用途:食材】←→【用途:非食材】の関係性は、食用←→愛玩でそんな意外性はないかも。
ここは各自の保有知識との相性ではあるか。タカアシガニが楽器に使われてたら意外だなぁと心が動くが、それは単に知らなかったからだけかもしれない。

なかなかスパーン!!と決まらない。
まぁ、何か応用はできそうぜよ。

〇第六章 人工知能AI一茶くんの仕組み

簡単にいうと、①俳句になりそうな単語をつなげ、②条件みたしているかふるい分ける、ってのをやってるのね。にゃる。この②の篩(ふるい)のところが結構大事そうね。

やっぱ、いったん言語モデル(演繹フレーム)を獲得すると、性能がグンと向上するのね。

にゃるほど。俳句データのみならず、親和性の高そうな日本語の文学作品も教師データとしてくわせたのね。そうね、青空文庫あるしね。うん。
あと、俳句側の教師データが古くて、古い言葉しか使えんかったから、40万の現代俳句もくわせたと。にゃる。
これが妥当そうなサイコロふりの①のとこね。

んで、②。こっちは具体には、
・季語が含まれているか
・十七音になっているか
・意味が通っているか
・学習した元の句と同じじゃないか
ってやつか。このうち、意味が通っているか?を判別するためのダミーデータの作り方がちょっと面白い。
「文中の単語のペアを交換する」
「青空文庫から単語を起点にもってくる」
なるほど。

この前のAIクイズ王でも、自分で作ったサンプルで学習させる、という方法がとられたけど、手法の1つとして共通するものはあるのね。うん。

きました!WordNet(byプリンストン大学)
シソーラスベース(^_^)

〇第七章 AI一茶くんの活動

さて、待ってました。クイズのこたえあわせ!
先ずは「超絶スゴワザ!」から。

コメントが興味深い。

第1戦は「いかにも俳句らしい予定調和」

第2戦は、夜の付随情報の付け方について「あるものからすぐに連想できる言葉で俳句をつくってしまうと常識的な陳腐な句になってしまう。もう一個先まで連想を飛ばすとちょうどよくなる」
うーん、深さキョリ2ですな(*´ー`*)

第3戦は、引っかかりがなく句として清らかで澄んでいる。なるほど。仕組み的にも、まぁ、そうだわな。

  ◇  ◇  ◇

しりとり俳句対決。ほぅ、フォーマットとして即興芸、面白いぜよ。しりとり作問対決、クイズノックがやってそう。いいかもね!

おぉ、採点基準が面白いな。
ちゃんと、段階ごとにマイナス要素、プラス要素がグラデーションになってる。なるほど。
人間っぽさ基準か。ものは言い様だな。

■兼題対決
やっぱ人の側は、練り上げ、完成度の磨き上げが強いな。ここらへんが達人に見破られ、AIかそうでないかを看破されるんだろうなぁ。
文を「すいこう」する機能があるAIって面白いかも。あるべきパタンに向けて、余計なものを削り、加え、整えていく。その解探索は、究極、人間と同じだからねぃ。

■恋のハイク
あぁ、みんはやだぁ。「みんなで」の仕組みだぁ。
大変な判定作業を、楽しく続けられるように仕組み化する。ここが開発者の腕のみせどころよねぃ。
にゃる。今後、クイズ作問AIで同じことをするとした時に参考になる大会かもねい。
「選別能力」の対決ね。面白い。

■人間vsAI
やっぱ深さキョリ2なのね。面白さは。
あとは勝手に解釈してくれる。

■笑ってコラえて
「説明する人工知能」の話だ。
なぜその俳句を選んだのかという理由を説明できるとよいのね。
俳句って「批評」の面白さ、ありそうですねぃ。
謎をどう解くか、その妙味ぜよ。

〇第八章 人工知能と俳句の未来

あぁ、もう終わりか。悲しい。
こわされたゲームの話だ。
囲碁の計算量は1.7×10^172、一方で俳句は1万文字種程度と仮定しても10^80と、比較すると大幅に少ない。
絶対的な評価関数がない中での評価。せやな、評価、「選」をするためには、人間がどのように俳句を解釈するのかを理解しにゃあならん。結局はそこに行きつく。
思想が、思想が必要なんぜよ、、

ディープラーニングでつくられた賢いサイコロの域を出ていない。ピシャリとした言葉ですね。
クオリアと接地問題。ここらへんは、メアリの部屋、中国語の部屋、どうでもいいや。

Q.千利休の教えを示した和歌「規矩作法守り尽くして破るとも離るるとても本を忘るな」に由来する、漢字三文字の格言は何でしょう?
こたえ:守破離

「道」を極めるための言葉、守破離。
俳句研究の守破離とは何だろうか?

先ず、文法的な違和感のない俳句を生成するよううめる内挿が「守」。つづく、既知のデータの外側を演繹的に予想する外挿が「破」。そして最後、既知のデータから、どのような本質的なルールがありうるのかを推論する仮説的推論、すなわち「アブダクション」が「破」とな。

にゃるほど。規則(型)を生み出すアブダクションを「離」としたか。むべなるかな(*´ー`*)

しかしながらここは、本当によきものを感じ入る「感性」というものが仮に得れたのであれば、「この素晴らしさは何だ!感動は!不思議な感覚は何だ!?」という感覚をきっかけとして、ルールを後肯定で発見できそうだわねぃ。

そういうことだぞ、ワトソンくん。
よき教師として見習いたまえ

「他山の石にします……」

ユクスキュルの環世界。哲学徒の皆様は、生物学と情報科学を修めれば楽しくなれそうなのになぁと常々思う。解決したい目的が同じなら、根拠があって明確なのがいいと思うんだけどねぃ。それなのに勝手に借用して、全然意味が違うことばを生み出して使うし、そういうとこ、よくないと思うんだよなぁ。結局は自分の言いたいことを言いたいだけで、ことばあそびをして(ドグシャアア

あかん、最後がいいかんじの言葉で終わってんのに、ぐだめきはアカンやん。

俳句を通した人と人工知能の相互作用によって、「強い人工知能」の実現の糸口を掴むだけでなく、人の知能そのものへの理解を深めることができると私たちは信じています。

〇おわりに

「選は創作なり」
ここをどうしてるか、それが一番知りたかったとこだけど、蓋を開けてみたら、人の力をうまく使って選したよ!人との共創だよ!で終わってしまった。まぁ、クイズ作問支援の論文でも感じたが、この段階なのだろう。
もう少し、「破」の部分。つまひ、既にわかっている「型」を使って整えてあげるとこの深い話がきけるかなぁーと期待して読んだけど、まだこれからみたいね。

しりとり対決における採点基準にあった「詩的要素」「発想」「技術」「芸術的な魅力」「普遍性」あたりの工夫は、これからなのかも。「句意が読み取り難い」のとこなんかは、ダミー使って精度あげるとかしてたし、やりようはあるのかも。「類想が懸念される」なんかは、推敲ができるAI一茶くん的な推敲の方法論をうまく学習におとし込んでいった延長線上に、「破」の具体の形がみえてくるんじゃないかなぁとぞ思う。
思想が、思想が必要なのじゃ。
「人工知能が俳句を詠む」と言える瞬間。夢があるぜよ。

■こたえあわせ!!
さて、お待ちかねのこたえあわせ。
果たして、どちらが松尾芭蕉で、どっちがAI一茶くんなのか?

こたえは!?!?


見送りの うしろや寂し 秋の風 松尾芭蕉
病む人の うしろ姿や 秋の風  AI一茶

えっと、どう予想してたんだっけ?(チラッ

正解!やったぁ!!

だけど、根拠は、内容のジャンルが「旅」っぽいこと、絵がうかんで「写実的」なこと、あと、もうかたっぽの句がコンテクストにもう一声ないと理解できないことを挙げたけど、ここが当たってるかが問題よね。次に生かせないと。

にゃる。玄人は日っかかるやつなのね。秋の風で十分さびしいんだから、さびしいは要らんやん。そんなこと芭蕉はせんやろ!って引っかけしたのね。
俳句って、ようわからんな。

まとめ

ってことでまとめ!!

Q.AI一茶くんは、どこまでいけた?
A.ディープラーニングで作られた賢いサイコロレベルで出句できるレベル(一部、深さキョリ2を含む。但し積極的にメタパタンを含みにはいけない)

評価どうしてんだろ?と期待してよんだけど、まぁ、そうよねぃって感じだった。
評価ができれば推論可能性もぐんと近づくので、より深みのある出句ができそうな感はある。

創造性に対する思想については、直接的には書かれていなかったけど、組み合わせの妙であること、そして、そこから「選」や「批評」すること、すなわち「型」基準をもってあてはめて、評価したり形を整えたりすること。そして何らかの良いと感じた感覚をたよりにその良さを言語化し、良さの「型」を創り出すこと。すなわち、ルールのアブダクション。
このあたりの話は、例示のストックとしてGETできたのでよかったぜよ。

俳句の句会、結社といった仕組みはクイズ会にも応用できるかもだし、AI一茶くんが歩んだコンペは、今後、AI古川くんやAI田中くんができたとしても同じく通るだろう道だから、参考になったぜよ。(もっというと、AIじゃなくて人間同士でコンペしても面白いかも)

いずれにしても、クイズは語ることばをまだ持ってない。ここを1人の力だけでなく、みんなでつくりあげていく。その仕組みを作れたならば、きっと次のステージに行けるはずのろ。

ん?作問甲子園??なんのことだろう?

(終)

いいなと思ったら応援しよう!

澤木恭介
もしこの雑文が良かったなと、役に立ったなと、他の人にもおすすめしたいなと思ってくれた人は、高評価・コメントをしてくれると非常にうれしいです。最後まで見てくださり本当にありがとうございます。では、次の雑文でお会いしましょう。ノシ

この記事が参加している募集