ついに新聞が読めるようになった「GTP-4o」。「AIを携え、あえて紙媒体を探索する時代」「アナログとデジタルが本格的につながる時代」に突入した
Open-AIは5月13日、最新の「GPT-4o」のサービスを開始しました。公式サイトによると、GPT-4oの「o」は「全て」を意味するOmni(オムニ)に由来します。文字通り、テキストとオーディオ、画像を扱うことができ、それぞれを複合的に組み合わせて高度な解析や生成をすることができます。組み合わせるという意味は、公式サイトの「Explorations of capabilities」というところを見るとよく分かります。例えば、顔写真をアップロードし、「ハリウッド風のポスターに仕立てて」と頼んだり、インタビューの音声ファイルをアップロードし、「テープ起こしをして、記事にまとめて」と頼んだりできます。同じようなことができる他の生成AIもありますが、汎用チャットAIとしては精度と応答速度がかなり向上しているのが特徴です。
「新聞」を読めるとは―衝撃の日本語OCR精度
GPT-4oの出現は、なにより日本語ユーザーにとって衝撃的ではないかと思います。というのも、日本語のOCR性能が飛躍的に高まっているからです。特に個人的に、紙媒体の「新聞」が読めるようになったインパクトはかなりのものです。ChatGPTだけでなく、Claude3にしても、これまで紙媒体の新聞を正確に読むのは極めて困難でした。これができるようになったことで、「AIをパートナーに紙媒体を探索する」という紙媒体の新たな地平が開けるのではと期待しています。
静岡県知事選の記事を読ませる
試しにGTP-4oに静岡新聞を読ませてみます。1面肩にある静岡知事選の関連企画の記事を読ませたいと思います。
このままでは、余計な情報が入ってしまうので、精度を上げるために周囲をマスクします。裏紙なんかで適当に周囲の記事を隠せば大丈夫です。
マスクしたら、ChatGPTのアプリを入れたiPhoneで写真を撮ります。今回はプロンプトはごく簡単に「この新聞記事のポイントを箇条書きで挙げてください。」などとしました。
GPT-4oの返答はこんな感じです。
一度記事を読み込めてしまえば、あとはいかようにもできますね。短い記事にまとめさせたり、ビジネスアイデアを挙げさせたり、クイズを作らせたり―。新聞のデジタル版は新聞に載っている情報全てを網羅しているわけではないので、やはり紙媒体を情報収集のプラットホームにするのは意義があると思います。これからは新聞を読むときのパートナーにAIが使えるわけです。言ったら「AI池上彰さん」が傍らにいてくれるようなもんですよ。興奮しませんか。
同じ記事を試しにGPT-4で認識させてみるとこんな感じです。
ご覧の通り、ハルシネーション(AIによる誤った回答)が甚だしいですね。これまでChatGPTに新聞を読ませようとしても、こんな感じで全く実用性がなかったわけです。
リニア中央新幹線工事の記事を読ませる
もう一つやってみます。14日付静岡新聞の1面トップ記事です。先ほど同様に裏紙で簡単にマスクし、周囲の情報をカットします。
iPhoneで撮影し、記事のポイントを箇条書きするよう指示を出しました。GPT-4oの回答はこちらです。
さらに、「この記事を中学生でも分かるように説明してください。」と指示しました。回答はこちらです。
ちなみに、マスクせずに全体を撮影した場合、見出しを重視して認識し、本文については全く触れない回答が返ってきました。マスクが必要なくなればより利便性が増すのですが、なかなかそこまでは行っていないようです。
アナログとデジタルの世界がつながる
求められる「AIフレンドリー」な紙面
一方でこうした"ペイン"(不便さ)が新聞社にとって新しいサービスのヒントになります。マスクをせずにどこまでが一つの記事なのかをAIが簡単に認識できるようなレイアウトをしたり、罫線を工夫したりすれば、紙の読者の利便性やUI/UXが飛躍的に高まっていくと思われます。1年後の紙面は、AIでも読みやすい「AIフレンドリー」が当たり前になっているかもしれません。そう、「AIフレンドリー」こそが、これからの紙媒体にとって重要な合言葉になるでしょう。今や当たり前に紙面に掲載されているQRコードと同じような経緯をたどることが予想されます。
デジタル化のボトルネックが解消
OCRの認識精度はこれまで日本の新聞社にとってはデジタル化の大きな障壁の一つになっていました。AWSの担当者さんともつい最近、そのあたりがボトルネックですよね、と話したばかりでした。この1~2年のAIの進歩のスピードには本当に驚かされます。
新聞社には毎日、手書きのファクスや不定形のプレスリリースが大量に届きます。これらを毎日仕分けして日々のカレンダーで管理するのは重要な仕事の一つですが、なかなか大変な仕事でもあります。①「ファクス」→②「PDF化」→③「OCR」→④「件名と日付、開始時刻、内容を抽出」→⑤「カレンダーに入力」という作業は、今後、③④をGPT-4oに投げ、出力をGAS(Google Apps Script)などでグーグルカレンダーに流し込む、なんてことが可能になるかと思います。まさにこれまでできなかったアナログからデジタルへの変換も今後はどんどん進んでいくことが予測できます。
おわりに
GPT-4oの登場で「AIのパートナーを携え、あえて紙媒体を探索する時代」「アナログとデジタルが本格的につながる時代」が到来しました。アナログの世界をバンバン撮影してAIに見せてあげ、どんどんデジタルの世界と繋げてもらいましょう。これまでにない変革が起きてくる予感がします。