WordやExcel、PowerPoint内の画像を取り出す。そしてその画像からテキストも取り出す方法。【Mac使用者も注目!】
■テキスト要素が画像で送られてきた!
web制作をする中でひとつの困りごとに
クライアントがテキスト部分を
「テキストではなく画像で送ってくる」
というのがあると思います。
jpgやpngなどの画像単独で送られるとこともありますが、
その画像が「WordやExcel、PowerPoint内」に入れ込んで送られてくることもありますよね。
画像を見ながら文字起こしして〜というのも手ですが、
時間もかかるし、間違うリスクが上がります。
間違えてそのままリリースされる可能性もあるわけで。
間違えたのはこちらなわけですが、
「テキストでくれなかったのそっちじゃ〜ん。」
なんてことは言えないですよね。
できればテキストで欲しいものですが、
要素のテキスト部分を画像で送られてきたとしても、
簡単に抜き出す方法を今回はご紹介!
ただ正しくテキストが抽出されいない時もあるので、
画像と照らし合わせてのチョックも忘れずに!
■注目するのは拡張子!
Officeソフトそれぞれの拡張子をおさらいしましょう。
拡張子とはファイル名の「.(ドット)」以下の部分のことです。
Wordだと「.docx」
例:sample.docx
Excelだと「.xlsx」
例:sample.xlsx
PowerPointだと「.pptx」
例:sample.pptx
です。
■ファイル内から画像を取り出す。
元データは取っておきたいので、コピーしたもので作業に入りましょう。
取り出したい画像を含むファイルの拡張子を「.zip」に変更します。
例えばsample.docxをsample.zipにします。
すると、「拡張子を変更してもいいですか?」という確認メッセージが出てくるので「OK」と許可を出しましょう。
ここでできたzipファイルを展開します。
展開すると「Data」というフォルダーがあり、
その中にファイル内で使用した画像たちが入っています。
必要な画像をそこから取り出すことができます。
■Macユーザーは注意!
っと、
Windowsならこのやり方で出てくるかと思います。
「Data」フォルダーの名前部分が違うかも?ですが・・・。
私はMacユーザーなんだよなという方もいるかと思います。
筆者もMacユーザーでありまして、
画像取り出す系の記事を読み、
「やった!!」と思ってルンルンでやってみたのですが、
できず・・・。
というか、
sample.docxをsample.zipにできても展開してくれないのです。
とアラートが出てきてしまいます。
Officeソフト入れてないからか・・・そりゃそうか・・・。
と思ったのですが、ここでひと手間!
Macに入っているOfficeの対応ソフト(同等ソフト?)の拡張子にしてからzipにするようにすれば上記と同じように画像が取り出せます。
ただ、先ほどのようにファイル名変更すればいいかというわけではなく、
該当ソフトで開いてからファイルを新たに保存します。
・Wordファイル(拡張子.docx)の場合
Wordと同じ機能を持つソフトは「Pages」
Pagesの拡張子は「.pages」
sample.docxをPagesで開き、
「ファイル > 保存」または「⌘ + S」で保存します。
ファイル名が「sample.pages」になっているかを確認して保存。
・Excelファイル(拡張子.xlsx)の場合
Excelと同じ機能を持つソフトは「Numbers」
Numbersの拡張子は「.numbers」
sample.xlsxをNumbersで開き、
「ファイル > 保存」または「⌘ + S」で保存します。
ファイル名が「sample.numbers」になっているかを確認して保存。
・PowerPointファイル(拡張子.pptx)の場合
PowerPointと同じ機能を持つソフトは「Keynote」
Keynoteの拡張子は「.key」
sample.pptxをKeynoteで開き、
「ファイル > 保存」または「⌘ + S」で保存します。
ファイル名が「sample.key」になっているかを確認して保存。
ただMacユーザーの方でもOfficeソフトを入れていれば、
Macソフトの方の拡張子にわざわざ変更しなくても、
Windowsの方と同じ方法で画像を取り出せるのかもしれないです。
■画像からテキストを抽出する
取り出した画像からテキストを抽出しましょう!
方法はいくつかあると思いますが、
私がしたことがあるのは、
画像から文字起こししてくれるサイトを利用するか、
Googleドライブを利用して文字起こしするかです。
・文字起こししてくれるサイトを利用する場合
「画像からテキストを抽出」なんてググってみると、
画像をアップロードしただけで文字起こししてくれるサイトがいくつか出てきます。
下記に2サイトほど載せておきます。
ただ、このサイトに画像をアップして大丈夫かな・・・。
リリース前の情報だし、なんだか不安。という時もあるわけで、
画像や文章的に何かしら推測されないだろう時とか、
万が一誰かに見られたとしても問題ない時に使ってます。
ちゃんと管理されているサイト等だとは思いますが、
情報管理は慎重にしたいと。
・Googleドライブで画像から文字起こしする場合
自分のGoogleドライブに画像をアップロードします。ドラッグ&ドロップ!
アップし終えたら、該当ファイル名を右クリックするとメニューが出てきます。
ちなみに右クリックで出てくるメニューは「コンテクストメニュー」もしくは「コンテキストメニュー」と言うそうです。
この記事を書いていて、あれってなんて言う呼び名があるんだろう??と思って調べて初めて知りました。ひとつ賢くなリました。
右クリック>メニュー内の「アプリで開く」>Googleドキュメント
を選択します。
少しGoogleが考えた後(ローディング的なシンキングタイムの後)に、
Wordのような様式に元の画像と、
画像内のテキストらしきものを抽出して画像下にテキスト化してくれています。
一瞬の出来事!
■確認もしっかりと!
この流れを覚えておけば、
テキスト要素を画像で送られても、
パワポなどにその画像を貼ってこられようとも問題ないです!
しかし!
抽出してくれたテキストが絶対正しい訳ではないので、
画像と見比べて最終確認はしっかりしましょう!
テキストが画像か何かに重なっていたりすると正しく抽出してくれてないとかもあるので注意です。
ひと手間であることは変わりないのですが、
ストレスを最小限に抑えられたらお互いにとって良いですよね。
私の備忘録として書いたところが大きいですが、
同じようなことで悩んでいた方のヒントになればと。