見出し画像

「なんか作ろう!」から1年、西洋古典とAIのコラボがアツ〜く進行中

「Humanitext」というXアカウントで、意味深な会話が展開されています。

このアカウントを運営するのは、名古屋大学、桜美林大学、国立情報学研究所の研究チーム。少し前にニュースにもなった「西洋の哲学者たちと対話できる」AIシステム「Humanitext Antiquaヒューマニテクスト ・アンティクア」を開発しています。

その始まりについて、開発メンバーの岩田直也いわたなおやさん(名古屋大学デジタル人文社会科学研究センター 准教授)はこう話します。

「去年、日本西洋古典学会のフォーラムで生成AIの古典研究への応用可能性に関する発表をしたのですが、参加していた田中一孝たなかいっこうさん(桜美林大学 准教授)が賛同してくれて。その夜、一緒に発表した小川潤おがわじゅんさん(国立情報学研究所/ROIS-DS人文学オープンデータ共同利用センター 特任研究員)と3人で行った飲み屋で夢を語りつつ、なんか作ろう!と意気投合したのが始まりです。」

岩田直也いわたなおやさん
(名古屋大学デジタル人文社会科学研究センター 准教授)

たった1年で「ソクラテスに人生相談できる」までになった対話システムとはどんなものなのか…!? 実際に見せてもらいました。

岩田さんが操作する画面をモニターに映してもらっています。

まず「誰と」話すかを選択し、返ってくる答えの出力の条件を設定します。対話モード以外に、Q&A、学習、専門解釈モードも選べます。その上で、知りたいことを文章で入力します。

ここではプラトン(Plato)に、専門解釈モードで、教育の目的について尋ねました。

回答は、数秒で返ってきます。

人生相談にはとどまらない可能性を感じます。「なんか作ろう!」の真相に迫りました。

↓インタビューのダイジェストをポッドキャストでお届けしています。

── どのような仕組みで動いているのですか?

西洋古典の原典データベースと、ChatGPTなどの基盤にある大規模言語モデル(LLM)を使っています。具体的には、「Perseus Digital Libraryペルセウス・デジタル・ライブラリ」という2700作品程の西洋古典の原典を集めたデータベースがあるんですが、それを意味に基づいて検索できるようベクトルデータ化しています。これまでに、400点くらいの原典のデータを整備しました。この再構成したデータベースから、必要な情報を必要なだけ取得して、OpenAI社GPT-4oに読ませている感じですね。

── たった1年でできるものですか?

システム全体の開発をするのは少し時間がかかりましたけど、既に元のデータベースはあるので、その再構成自体はそれほど大変ではないんですよ。集中する時間を確保できれば一気に進みます。それと、今年5月に最新モデルのGPT-4oが発表されたじゃないですか。そのアップデードでシステムの性能がぐんと上がって、プロジェクトの公開に向けて一気に進みましたね。

── 開発したHumanitextに尋ねるのと、単にChatGPTに尋ねるのと、どう違いますか…?

Humanitextは、情報の出処を明確に示せるんです。先ほどの「教育の目的」の質問で、ちょっと試してみましょうか。

Chat GPT(左)は「国家の第7巻」とだけ答えたのに対し、Humanitext(右)はその掲載箇所までリストアップしました(それぞれ赤くマーキングした箇所が引用に関する情報)。

Humanitextは、原典を与えられて、その中からユーザーの質問に対する答えを作ります。だから、どの資料のどの箇所を引用したかまで教えてくれるんですね。

── これは研究者の方も活用できるのでは…!?

もともと研究に使えないかと思って始めたんです。ChatGPTが話題になり始めた頃、私も試してみたら、論文の要約や原典の翻訳なんかに使えるんですよね。今これだけできるなら、今後本格的に研究に活用できるんじゃないかと思いました。先日、開発中のHumanitextを西洋古典学会で研究者のみなさんに使ってもらったんですが、まずまずの手応えを感じました。

── 岩田さんはギリシア哲学がご専門ですが、具体的にどのように活用できそうですか?

西洋古典の分野って文献の数が限られているので、知識量が重視されてきたんです。ベテランの先生たちは膨大な情報を記憶していましたが、学生や若い研究者には難しいですよね…。1980年代以降はデータ整備が進んで、検索機能で文献を簡単に調べられるようになりました。ただ、単語は検索できても文脈まで理解するのは難しい。その点、生成AIは、要約や内容理解を助けてくれたり、関連箇所を探してくれたりします。研究範囲が広がり、哲学や文学、歴史などの領域を超えた研究が可能になると思います。

── AIと分野に特化したデータベースで世界が広がりますね。他の分野でも応用できそうですか?

できると思います。実は今、青空文庫を試験的に導入してみています。青空文庫は15,000点くらいの著作権が消滅した作品を公開していて、そのデータベースが非常に体系的に整備されているんですね。例えば夏目漱石に現代批評させたり、小説の登場人物と喋れるシステムができあがりつつあります。

Xアカウントで、Humanitext Aozoraとしてその機能が紹介されています)

── 文豪たちとも話せてしまうんですね。ところで、Humanitextという名前、かっこいいですね。

ChatGPTが命名してくれました(笑)。プロジェクトの概要を説明して、かっこいい名前をつけてくださいとお願いしました。一発目に出てきたのがHumanitextです。「これいいじゃん!」とメンバー全員で即決しました。メンバーの田中一孝たなかいっこうさんはブランディングも重視していて、かっこいいロゴもつくりました。ちなみに、こちらは人間のデザイナーさん作です。

©Humanitext

── 私たちも使えるようになりますか?

最終的には誰もが無料で使えるシステムを目指しています。でもまだ少しハードルがあるんです。というのも、今はOpenAI社にモデルを使う使用料を払っているんですね。それぞれの使用はわずかな金額ですが、何万人もの方々が使っていく将来を考えると莫大な予算が必要です。ただ、無料で公開されている大規模言語モデルもあるので、それらである程度満足のいく精度が出せれば、広くみなさんに使っていただけるようになると思います。

── 今回、Humanitextを通して西洋の哲学者と話してみて、西洋古典をぐっと身近に感じることができました。小学生にも寄り添ってくれるHumanitext…公開の日が待ち遠しいです。

インタビュー・文:丸山恵

◯関連リンク


この記事が気に入ったらサポートをしてみませんか?