見出し画像

スライドの見た目なおしプロジェクト - 同じ PDF ファイルを 3 つのスライド共有サービスにアップロードして結果を比較する

サイボウズ株式会社 開発本部 組織支援部 PeopleExperience チーム Developer Concourse Unit の西原 ( @tomio2480 ) です.スライドをよくする会の活動報告記事です.スライドをよくする会とは,Web 上のスライドアップロードサービスにアップロードした PDF が正しく解釈され,文字起こしの文字化けや太字をはじめとする表示の乱れが消滅する未来を目指した取り組みです.

前回の記事Speaker Deck にアップロードした PDF ファイルのうち一部のスライドから,文字化けや太字の掠れの症状を一覧にして紹介しました.今回はその中からいくつかに絞って,SlideShareDocswell にアップロードしたらどうなるのか,ということの検証を行いましたので,その結果を記録します.


検証結果

その時、スクラムマスターが動いた —最高のチームワークを実現するために— / A mind of SCRUM MASTER

前回,Speaker Deck にアップロードした際は典型的な文字化けが発生していたスライドです.このスライドの PDF ファイルを Speaker Deck からダウンロードして SlideShare と Docswell にアップロードしたところ,どちらのサービスでも文字化けは確認されませんでした.

また,特に太字等の表示が乱れることもなく,文字起こし含め意図通りの表示がなされていることも確認できました.

Speaker Deck にアップロードされている「その時、スクラムマスターが動いた —最高のチームワークを実現するために— / A mind of SCRUM MASTER」の文字おこし表示の様子.
Speaker Deck : 日本語が化けている
Speaker Deck にアップロードされている「その時、スクラムマスターが動いた —最高のチームワークを実現するために— / A mind of SCRUM MASTER」の PDF を SlideShare にアップロードした際の文字おこし表示の様子.
SlideShare : Speaker Deck で化けていた日本語部分が表示されている
Speaker Deck にアップロードされている「その時、スクラムマスターが動いた —最高のチームワークを実現するために— / A mind of SCRUM MASTER」の PDF を Doscwell にアップロードした際の文字おこし表示の様子.
Docswell : こちらも Speaker Deck で化けていた日本語部分が表示されている

KubeCon+CNConに見るetcdの未来

前回,Speaker Deck にアップロードした際は文字化けを起こして,リンクになってほしいところもクリックできず,またリンク先がどこなのかも確認できなかったところがありました.先のスライドと同じ手順で SlideShare と Docswell にアップロードしたところ,文字化けは解消し,リンク先もわかるようになり,遷移可能になっていました.

Speaker Deck にアップロードされている「KubeCon+CNConに見るetcdの未来」の文字おこし表示の様子.
Speaker Deck : 文字起こしされてないだけでなく,リンクもクリックできなくなる
Speaker Deck にアップロードされている「KubeCon+CNConに見るetcdの未来」の PDF を Slide Share にアップロードした際の文字おこし表示の様子.
Slide Share : 文字起こしはうまくいっているが,リンクはクリックできる状態にない

よく見ると,一見 8 枚目がうまくリンクもしそうな雰囲気を醸し出していますが,スライドの 8 ページ目に飛ぶだけなのでこれは罠です.

Speaker Deck にアップロードされている「KubeCon+CNConに見るetcdの未来」の PDF を Doscwell にアップロードした際の文字おこし表示の様子.
Docswell : Speaker Deck でクリックできなかったリンクが別添でクリック可能になっている

3 つのサービスを比較して,結果リンクが機能する状態のまま文字起こしをしてくれたのは Docswell だけでした.SlideShare なら文字起こしが正確にされる分まだ何とか到達できますが,Speaker Deck はスライドを目で見て URL を手打ちするか,OCR 的な何かにかけるしかリンク先を知る方法がありません.

また参考までに,スライドビューの状態でリンクがクリックできるのも Docswell だけであったことを記録しておきます.Speaker Deck と SlideShare は画像に変換されてしまっているようで,文字の選択やリンクをクリックすることはできませんでした.

「KubeCon + CNCon に見る etcd の未来」の 7 ページ目のスライドのスクリーンショット.URL にあたる文字列を赤枠で囲い,その下に「SlideShare と Speaker Deck はクリックしてもリンク先には飛ばない Docswell のみクリックするとリンク先に飛べる」と書いてある.
Docswell のみスライド上のリンクをクリックすることができる

Observation Sallow Dive

ソースコードを含むスライドの例を挙げます.特に,Docswell に関してはベータ機能のようですが,ソースコードであることを理解してか,改行が含まれるようになっていました.今後,色付けなども進むのかもしれませんが,単にこれだけでも十分つかいやすい文字起こし結果になっているな,と感じました.

Speaker Deck にアップロードされている「Observation Sallow Dive」の文字おこし表示の様子.
Speaker Deck : 日本語は文字化けを起こしていて,ソースコードの改行は含まれていない
Speaker Deck にアップロードされている「Observation Sallow Dive」の PDF を SlideShare にアップロードした際の文字おこし表示の様子.
SlideShare : 日本語の文字起こしは成功しているが,ソースコードの改行は含まれない
Speaker Deck にアップロードされている「Observation Sallow Dive」の PDF を Docswell にアップロードした際の文字おこし表示の様子.
Docswell : 日本語の文字起こしも成功し,[beta] とあるがソースコードの改行も含まれている

maneki-cndt-2020.pdf

文字起こしの文字化けと太字の掠れが発生したスライドを,3 つのサービスにアップロードして比較します.文字起こしの文字化けと太字の掠れについては Speaker Deck のみで発生,SlideShare についてはリンクの取り出しはできず,Docswell についてはリンクの取り出しも可能でした.

Speaker Deck にアップロードされている「maneki-cndt-2020.pdf」の文字おこし表示の様子.
Speaker Deck : 主に日本語部分の文字化けが発生していて,リンクも取り出せていない
Speaker Deck にアップロードされている「maneki-cndt-2020.pdf」の PDF を SlideShare にアップロードした際の文字おこし表示の様子.
SlideShare : 文字起こしの文字化けは起こっていないが,リンクとしては取り出せていない
Speaker Deck にアップロードされている「maneki-cndt-2020.pdf」の PDF を Docswell にアップロードした際の文字おこし表示の様子.
Docswell : 文字起こしの文字化けは起こっていないし,リンクも取り出せている
Speaker Deck にアップロードされている「maneki-cndt-2020.pdf」の太字掠れの様子.
Speaker Deck : 太字の掠れが起こっている
Speaker Deck にアップロードされている「maneki-cndt-2020.pdf」の PDF を SlideShare にアップロードした際の太字の様子.
SlideShare : 太字の掠れは起こっていない
Speaker Deck にアップロードされている「maneki-cndt-2020.pdf」の PDF を Docswell にアップロードした際の太字の様子.
Docswell : 太字の掠れは起こっていない

2018-12-セキュリティ / 2018-12 security

最も激しく文字起こしや表示が思いどおりにいかなかったスライドです.

文字化けについては全てのサービスで発生してしまいましたが,Docswell ではリンクの取り出しに成功しており,ほか 2 サービスよりもアクセスできる情報が多くなりました.

また,何が起きているかよくわかりませんが,SlideShare にアップすると,47 ページ分のスライドは表示されるのにも関わらず,文字起こしは 43 ページ分しかありませんでした.試しに該当スライドに飛ぶリンクをクリックしてみると 43 ページ目に飛んだので,単純に末尾 4 ページ分が抜けてしまったものと思われます.

Speaker Deck にアップロードされている「2018-12-セキュリティ / 2018-12 security」の文字おこし表示の様子.
Speaker Deck : 文字起こしは文字化けしており,リンクも取り出せていない
Speaker Deck にアップロードされている「2018-12-セキュリティ / 2018-12 security」の PDF を SlideShare にアップロードした際の文字おこし表示の様子.
SlideShare : なぜか文字起こしが 43 ページ分しかない
Speaker Deck にアップロードされている「2018-12-セキュリティ / 2018-12 security」の PDF を Docswell にアップロードした際の文字おこし表示の様子.
Docswell : 文字起こしこそ失敗しているが,リンクの取り出しには成功している

また,前回の記事でも触れた,スライドの模様等に関する問題については,PDF そのものに異常をきたしているため,今回は 3 サービス全てで異常が見られました.

半透明の部分がおかしくなっているのは PDF 時点でもおかしいためサービスの問題ではない
別のテンプレートのものだが正しい状態は灰色ではなくて白の半透明

まとめ

5 つそれぞれ異なる原因と課題を持ちそうなスライドをピックアップして比較してみましたが,Docswell が全体的に優秀で,PDF が多少難しいことになっていたとしても,うまく表示してくれることがわかりました.

例えば,スライドのテンプレートを作成して,フォントも指定している会社等の組織については,デフォルトインストールされている,化けにくいフォントを使うなどで対応できるかもしれませんが,それが難しい(例えば製品やチームごとにテンプレートを変えたい等の)場合は Docswell にスライドをまとめるのが,アクセシブルな状況を作り出しやすいのかなと思います.

ただ,Speaker Deck についてはプランによらず,文字起こしを後から編集できるため,太字の掠れに目を瞑れば,文字起こし部分は自分でコントロールできる状況にあります.さすがにスライド一枚ずつにぺたぺたやるのは面倒がすぎるので自動でなんとかなってほしいわけですが……

Speaker Deck の各スライドの「プレゼンテーションを編集する」から辿ることのできる,スライドの編集画面のスクリーンショット.
各スライドの「プレゼンテーションを編集する」をクリックし,出てきた画面で「スライドを編集する」をクリックするとこの画面に辿り着く

余談

SlideShare のタイトル文字数の "短さ" 制限

凄まじい余談ですが,今回の調査で感じたのは SlideShare は前までの広告が挟まる仕様よりも,スライドそのものが見やすくなったなということです.しかし,アップロードする際にスライドのタイトルが 40 文字以上ないとアップロードできないという指摘を受けまして,短いタイトルをつけたときはどうしようかなぁと悩むことになるなぁ…… とまた一つ悩ましい事案が発生していることに気がつきました.

SlideShare にてスライドをアップロードしようとすると現れる「Title *Minimum 40 characters required」の様子.
40 文字以上のタイトルをつけることの方が少ないかも

なぜか自分の環境だと Speaker Deck が激重になってしまう

SlideShare や Docswell ではそんなことないんですが,Speaker Deck だけ動きがめちゃくちゃ鈍重になります.鈍重になるのは,画面上部のメインスライド表示部とページ中間のおすすめスライド?の表示部分です.文字起こしの部分に行くと重さからは解放されますが,上にスクロールすると激重です.そのため,スライドをめくるのも激重で,かなり体験に影響します.

いいなと思ったら応援しよう!