[015]「Be My AI」と「Seeing AI」を使い、スクリーンリーダーで正しく読まないPDFを解読してみる

突然ですが私は美術館へ行くのが好きなのです。全盲者として、美術館をどのようにドライブするのかについてはまた別の場所で書くとして、とりあえず訪問にあたっては、可能な限り情報を集め、事前にイメージ・トレーニングすることにしています。様々な情報源の中でも、公式サイトからの情報は貴重ですが、困ったことにアクセシビリティの問題に悩まされることも少なくありません。特に展覧会の作品リストなど期間限定の資料はその多くがPDF形式で配布されており、その大部分がスクリーンリーダーでのアクセスが困難という状況です。
このようなPDFの内容をスクリーンリーダーでも理解できるようにするためには、さまざまなテクニックを駆使し、データを抽出したり変換したり解析したりしなければならないわけです。様々な方法がある中、今回は、とりあえず手っ取り早く、かつ最小限のコストで処理することを目指し、iPhoneアプリ「Be My AI」と「Seeing AI」のパワーをお借りし、アクセスできないPDFの解読を試みることにしました。
さて今回はテスト用として以下のPDFを使います。
(A) 画像化されたPDF / 横浜美術館の展示室でのお願い
(B) リストの読み上げが正しくないPDF / 田中一村展の作品リスト
果たしてこれらを全盲の私が理解できる形式に変換できるのでしょうか(なおこの美術館を採り上げたのは、最近訪問したというだけの理由です。他意はありません)。iPhoneの「ファイル」アプリを使い、あらかじめiCloud driveへ同期しておいたこれらのPDFファイルを、Be My AIおよびSeeing AIへ共有し、出力結果を比較してみます。

Be My AI:リストの抽出で思わぬ結果に

Be My AIといえばイメージの解析が得意ですが、実はPDFやテキストファイルも読み込むことができます。
まず(A)を解析してみたところ「美術館で注意すべき9つの項目」がリスト形式で出力されました。この段階ではPDFの概要と注意事項のリストのみしか出力されていないようです。そこで「全ての文章を抽出して」とリクエストすると、タイトルやリード文を含む自然なテキストが生成されました。この時文章が途中で切れている場合は「続きを教えて」とリクエストします。
一気に処理できないのはやや面倒ですが、内容的におかしな部分もなく、問題はなさそうです。出力結果はコピーするなりして保存しておきましょう。
続いて(b)を解析させてみます。まずはPDFの概要、タイトルや開催に関するデータ、そして展示室マップや作品リストが記載されていることが説明されており、これはこれで役に立ちます。ただ今回は作品リストを知りたいので「作品リストを抽出して」とリクエストします。すると一見、きちんと整理されたリストが生成されました。うまくいったかな?と思ったのですが、よくよく読んでみると、どうにも様子がおかしい。
内容に誤りがある、というかデタラメなのです。同じ作品名が複数の行に入っているのはまだマシな方で、存在していない作品名が創作されている。一体どうすればこんな結果が出てしまうのかは謎ですが、いわゆる生成AIのhallucination(幻覚)が発動してしまっていると考えられます。プロンプトを工夫してみてもだめで、どうやらBe My AIはこのような処理が苦手なのかもしれません。
また生成されたリストは21番までしかなく、PDFの最初のページしか読み込まれていない可能性があります。この結果から考えると、単一ページで後世されているPDF、例えばチラシやポスターのデータなどではうまく解析できると考えられます。

※画像:Be My AIのスクリーンショットです

Seeing AI:新機能のPDF解析機能を試す

Seeing AIのバージョン5.4には新しくPDFの読み込み機能が追加されました。この機能については詳しい詳細が出ておらずあまり気にしてはいなかったのですが、とりあえず使ってみることにします。
まずは(A)を解析してみます。確かに画像に含まれるテキストは抽出されてはいるようなのですが、どうやらレイアウトまでそのまま再現してしまっています。つまり一つの文章がバラバラになってしまい、整形しなければとても読みにくい状態。これはちょっと使いにくいかもしれません。
続いて(b)を処理させてみたところ、やはり作品リスト以外の部分は断片的に出力されますが、PDF内のリスト部分(おそらく表組になっていると思われる部分)はきちんとテーブル化されています。あらかじめAcrobatで出力しておいたテキストとざっと比べてみたところ、内容的におかしな部分は見当たらない気がします。これは素晴らしい。
解析された結果は「共有」からテキストもしくはHTML形式でエクスポート可能。とりあえずiCloud driveへHTML形式で出力し、ファイルアプリからクイックルックで開いたりブラウザで開いてみたところ、テーブルのヘッダもしっかり読み上げられとても良い感じです。ちなみにテキスト形式ではセルごとに開業が入るフォーマットで出力されます。
この機能、うまくハマれば最高のパフォーマンスを発揮してくれるのですが、いくつか試してみた範囲では、PDFの内容によってうまくテーブル化されなかったり、エラーで読み込めないことも多くまだ不安定な印象。まだリリースされたばかりの機能ですから、今後の改善に期待したいところです。

※画像:Seeing AIのスクリーンショットです

結局、PDFによりツールの使い分けは必須かも……

というわけで、2種類のPDFファイルを、何とかスクリーンリーダーでアクセス可能にしてみたわけですが、それぞれのツールで一長一短あるように感じます。これさえあれば無問題といったソリューションはなく、結局のところ、そのPDFによってあれこれ試さなければ、よりベターな結果は得られないのではというのが、何となくの結論です。その中でもSeeing AIのリスト抽出機能はかなり有望に思えました。
まあ、そもそもの話、このような手間をかけなければならない状況がおかしいわけですけどね。本来であればミュージアム側がPDFをアクセシブルにするなり代替フォーマットを提供するなり、環境整備で対応すべき問題であるはず。フィードバックしても改善につながらないのは相変わらずですしね。使わないでとまでは言いませんが、どうしてもPDFによる情報提供を行わなければならないのであれば、スクリーンリーダー・ユーザーを念頭に置き、情報の公平性を担保していただきたいところです。

#AT365 #アクセシビリティ #障害 #視覚障害 #アート #PDF

いいなと思ったら応援しよう!