AI×人文学~データ駆動による未来形成~
渡部泰明氏が今の国文研館長なんだ(嬉)!長らく行ってないなあ、立川。国文学研究論文データベースはアーカイブとして生きてるだけ?更新してほしい…。CiniiやGoogleScholarは国文系の論文探しにくいからなあ。AIもいいけどそっちもぜひ。
そんな国文研主催のデジタル人文学プロジェクトに関するキックオフイベント。Youtubeに全編動画が上がっていたので、視聴した感想を以下に雑記。
近藤泰弘氏「AIによる日本古典文学研究の方法」
私の雑な理解では、「生成AIに和歌をデータ学習させると、内部処理として和歌の語彙に数値を割り振るので、その結果“意味”がデータ化される。それらのデータをAIの脳内から取り出すことで研究に利用できる」というお話だったはず。言語学では既に実践されている方法なのね。
古今集の和歌について、主要素を解析して座標上に配置すると、「人事と自然」「花(視覚)と鳥(聴覚)」という二本の対立がX軸、Y軸として現れるらしい。前者は、まあ…、言うもさらなり。後者はちょっとだけ新鮮?? たとえば「見立て」なんかだと用例上同列に扱われることも多いけど、視覚と聴覚の区別(や交渉)について論じてる説はあるのかな? 聴覚の方が、想像の幅は膨らむので、言葉の世界を創造する上で有利そう、というのは感じるけど。
万葉集は「山と海」なんだ。「山と川(水)」じゃないんだなー、惜しい。
とても興味深い研究だと感じつつ、従来の単語検索で分かる傾向とはどこが異なってくるのかが気になってしまった(今回の例は主要素解析だから、名詞が軸になる点で、従来の検索作業でも比較的容易、という理由はあるだろうけれど)。
漢籍出典研究は、いよいよAIくんが掻っ攫っていきそうな予感。
とにかく数値化されると安心=思考停止しちゃう(私は)。研究のデータとして利用できるようになっても、客観的で説得力のある反面、その裏で処理されている過程はブラックボックス化されているわけで、利用者はそこを自力で説明できない、という怖さがある。言語学とは違う難しさはありそう。
ご講演自体はめちゃめちゃワクワクするお話だった。
吉見俊哉氏「自己との対話∶私はもうすぐ消えるのだろうか?」
吉見氏とAI吉見くんのやりとりが面白かった。オリジナル吉見氏がソースになっている限り、AI吉見くんは後追いにしかなれないだろう。自分の学説を補強するための壁打ちに使えるかも、くらいしか今のところ用途が考えられないなあ(それだって、他の生身の研究者と論戦した方が実りはありそう)。あとは、本当にオリジナルが「消えた」後に、形見として遺るかも、くらい?
「AIには”立場“がない。どこか俯瞰的な位置から、総合的・中立的にしか自分の意見を言わない」という話はとても納得。
喜連川優氏「悠久の人文学とrat yearのデジタルは仲良しカップル?」
喜連川氏「吉見先生から喧嘩を売られた」→喜連川氏の方がよほど喧嘩していらっしゃるのよ。そしてそれを買える方がなかなか他にいらっしゃらないよね。氏の個人としての業績の強さだけじゃなく、やっぱり「人文学」の(見かけ上の価値の)弱さのせいだと感じてしまう。
“Fail first”の一方で、デジタル化(AI開発)の立場からすれば引く手あまたで手(=金)が回らないから、協働する相手は選別する必要がある。その時に、「夢を語れ、もしその夢に乗れるなら協働しよう」or「夢が語れないなら金を出せ、金を稼ぐ方法を提示しろ」ってことになるんだろう。そして現在の人文学(特に文学研究)はAIと同じ夢が見られないんじゃないかな。そもそも人文学の夢ってなかなか最近語られていないような。悔しいけども。
さいごに
…と思っていたら(※上述「人文学の夢が最近語られていない」って話)、最後の最後に吉見氏と渡部氏から痺れる一言。
これこそ、人文学の(研究が明らかにしたい究極の)夢なのでは、と感じた。
そして、その夢に、AIはどう寄与できるのか、あるいは、寄与することが不可能なのかについて、もっとお話が聞きたかった!
ここからが本編、というところでおわってしまったのは残念だけど、それこそキックオフイベントとしての狙いだったのかしら。