見出し画像

点訳自動化への道のり 3

前回お伺いした読書支援データの規格に関して投稿します。

視覚障害デイジー(DAISY)は、「Digital Accessible Information SYstem」(アクセシブルな情報システム)の略です。
主に視覚障害者が利用してきた経緯はありますが、より幅広い場面で情報をアクセシブルにする「システム(規格)」として、世界50か国以上で採用されている国際標準規格です。

視覚障害はその程度によって、大きく盲と弱視となりすが、視力有無の区別では無く様々な見え方が含まれそれぞれの方に適したメディアが提供されています。
 出典:ENJOY DAISY

以下に読書に使われるデータの種類を記述します。

墨字=通常のテキストデータ

テキストデイジー

本文のテキストに、見出し等の文書構造や画像を付加されたデータ
・再生ソフト・専用機の合成音声で再生。
・構造化されたデータを利用し、タイトルにジャンプしたり、ランダムに読みたい箇所からの読み始めが可能。
 → 現在読み上げている文字部分がハイライトされるなど、読み上げていない部分との見分けが容易
・人によって異なる見え方への対応が可能。
 → 文字の大きさの変更や、背景色と文字の色の変更が可能(AMIS画像参照)
・合成音声では利用が難しい情報にも対応可能。
 → 画像データに音声を付加するなど

音声デイジー
録音された音読に、見出し等の文書構造や画像を付加されたデータ
・再生ソフト、専用機で録音データを再生。
・構造化されたデータを利用し、タイトルにジャンプしたり、ランダムに読みたい箇所からの読み始めが可能。

*自然さを好む読み手、感情が入る事を好まない読み手がいる為、音読データが合成(テキストデイジー)か人間のもの(音声デイジー)かで好みがわかれるそうです。以下の写真はテキストデイジーと音声デイジーに対応した専用機です。

マルチメディアデイジー
視覚障害以外も含め、通常の書籍を読むことが困難な方向けに作成された
音声と一緒に、文字や画像が表示されるデジタル図書
・表記された文書を音声で聞きながら、画面上で絵や写真を見ることが可能。
・読み上げているフレーズの色が変わる(ハイライト機能)ので、どこを読んでいるの判別が可能。
・自分が読みやすいように、文字の大きさ、音声のスピード、文字や背景の色を選択が可能。

画像1

現状、書籍を見ながら各作業が行われていますが
テキストデータを取得出来れば、よりスピードを速める事が可能になるかもしれません。
手段1.出版会社から直接提供を受ける
 *Epub(電子書籍規格)とデイジーの連携がはかられているため、
  タイトル等の構造データを再利用出来る。
手段2.OCRを使用しテキストを取得する。
 *読み取り精度は100%では無いので手動点訳の方がスピードは速いかもしれない。

いずれにしても校正作業は必要ですが、点訳作業者が減っていく中で、
より簡単に点訳技術を習得し、作業を早める事を理想とするのであれば有効な手段であると思います。

データ内の文章構造を利活用するイメージ
テキストデイジー→音声デイジー→点訳

デイジー図書に関する著作権に関して
著作権法 37条抜粋
著作物を点字で複製することは、著作権者の許諾なしに、誰もが自由に行える
著作物の録音については、点字図書館等の特定の施設で、視覚障害者向けの貸出のためであれば、著作権者の許諾なしに自由に行える
公表された著作物については、電子計算機を用いて点字を処理する方式により、記録媒体に記録し、又は公衆送信(放送又は有線放送を除き、自動公衆送信の場合にあっては送信可能化を含む。)を行うことができる。

この素人によるブログにはご意見が様々あるかもしれません。
地域を跨いで、知識のある方からの訂正依頼や、こうしている等のご意見をお待ちしております。
またエンジニアやコンサルの方からの提案があればアシストしていただきたく思っています。何卒宜しくお願いいたします。

【参考サイト】
https://www.dinf.ne.jp/doc/daisy/about/index.html

いいなと思ったら応援しよう!