読書コンシェルジュの制作と失敗
※回答の質はまったく期待できませんが、ぜひ遊んでみてください。なお、アクセス状況によっては、閉鎖するかもしれません。▼
トルストイ『戦争と平和』やガルシア=マルケス『百年の孤独』を読んでいると、どうしても人物を把握しきれないことがある。メモを取りながらゆっくり読むのが、本来の楽しみ方なんだよ。そう言われても、多忙な現代人には贅沢な方法であり、ちょっと現実的じゃない。
そこまでの大長編ではなくとも、世の中には読書が得意ではない人がいて、色んなことを記憶しながら何かを読む、というのが辛い人もいるかもしれない。
だから僕は読書コンシェルジュを作ることにした。
小説の中にいる人たちの人間関係とか、殺人現場に残されていた手掛かりとか、主人公が立ち寄った喫茶店にかかっていた音楽とか……そういったものが気軽に聴けるようなコンシェルジュがいたら、もっと小説を手に取る人が増えていたかもしれない。
そう感じたから、OpenAIのAPIキーを取得して、小説のテキストデータを読み込ませたチャットボットを作成することにしたんだ。
「何事も下ごしらえが肝心なんだ」
僕にパスタをご馳走してくれたときに、友人のGPT-5がそう言ったのを覚えている。そのときに渡されたレシピには、こう書いてあった。
OpenAIというのはChatGPTを開発した会社のことだ。OpenAIのAPIキーを取得すると、ChatGPTをプログラムの中に呼び出すこともできるし、ChatGPT以外のモデルも試すことができる。だから、様々な人がいろんなサービスを提供できるようになる。
DocsBotは、テキストファイルに限らず、PDFやブログ記事、Youtubeのスクリプトなど、読み込ませたテキストを参照して質問に答えてくれるBotを簡単に制作できるサービスだ。Botの作り方はこちらのページが詳しい。
小説のテキストデータは、青空文庫からお借りした。もちろん著作権が切れている作品だけをDocsBotにアップロードした。紀伊国屋で調教されたレタスではなかった。だから、テキストファイルのUnicodeをUTF-8(BOM)に変換する必要があった。
結果から言うと失敗だった。
たしかにチャットボットを制作することはできた。予算が心もとない。だから、modelはGPT-3.5-turboを使うことにした。梶井基次郎『檸檬』、中島敦『山月記』、芥川龍之介『蜘蛛の糸』のテキストファイルもちゃんと準備されていた。
当たっているかもしれないし、当たっていないかもしれない。
「主人公は、檸檬の色彩を紡錘形の身体の中へ吸収して、城の中で使用します。」という一文は意味がわからなかったが、その他の部分はGPT-3.5にしては上出来の回答であるように見えた。
こちらはからっきしだめだった。
まず、李徴を李陵とを取り違えていた。中島敦はたしかに『李陵』という小説を書いていたので、そちらと勘違いをしたのかもしれない。さらに、李陵と全く関係のない韓愈や柳宗元が出てくるのは別種の才能を感じる。しかし質問対応として適切ではなかった。
あとがき
もしも質問対応がうまくいっていたら、僕はこのBotを公開していたかもしれない。しかしうまくいかなかった。だからといって諦めるつもりもない。GPT-4が安くなれば、ふたたび挑戦することになるだろう。
適切な回答を期待することはできないが、公開してみることにした。ただし、アクセス状況によっては閉鎖するかもしれない。
※彼、あるいは彼女は、文化的雪かきが得意だったのかもしれない。
平素よりサポートを頂き、ありがとうございます。