見出し画像

AIを使うこんなご時世だからこそ、Pandocが便利だった!

最近、AIを使って原稿をまとめることが増えました。私が今「あまやどり出版」で制作中の本があるんですけど、高度経済成長時代の体験談を80~90代前後のお年寄りに各地で聞き取りしてもらい、それを文集形式でまとめようとしているものがあります。
好きで作っている本だけにAIを使いたい放題したいわけですが、正確性を担保しようとするとなかなか難しい。
というわけで、どんな風にAIを活用したら作業効率が上がるか、について、現時点で作業しながら考えていることを、編集者視点で吐き出したいと思います。


体験談をそのまま掲載したいのに、勝手に原稿を変えてしまう問題

AIはデータをそのまま吐き出すのには向いてない!(当たり前。。。)

お年寄りへのインタビューはGoogleFormを活用して収集しています。DLはwordに加工しやすいように、エクセルかcsv。
ちなみに本の出版はアマゾンのKDP(KindleDirectPublishing)を使うため、ペーパーバックと電子書籍をまとめてつくることができます。そうなるとAdobeが使えない私としてはword一択となります。
さて、エクセルデータから30人分のデータを1個1個コピペしてwordに張り付ける、なんてことは絶対やりたくない!わけですが、AIでそこを自動化できないのかな…?
というわけで、Claudeにcsvをぶち込んでdocxに変更してよ!と依頼してみました。
ところが、Claudeからはdocxデータは扱えませんよ、との回答です。
じゃあ、csvからmdに書き換えて、と言ったら、それはできるというのでお任せしました。
2回コンティニューさせて10分後。
無事に出来上がったデータをざっと見て、困ったことがわかりました。分量が多いせいだと思うのですが、原稿が正しくないところがちらほらちらほら。。。
体験談をそのまま掲載し、必要なところだけ校正をかけたいわけですが、それ以前にAIに内容を変更されてしまうと、後工程で元の原稿と同じかどうかのチェックが必要になります。人力でそれは面倒すぎる。。。

というわけで、本文を改変してしまうとリスクが高いものについては、AIをダイレクトにかませないで、別の自動化をするのがよい、という結論になりました。

解説記事をAIで書き、PandocでWordに対応させてみた!

まずはClaudeに記事を書かせてみた。

体験談はともかく、ほかに体験談を受けた記事を書こうとしているので、そこをClaudeに試しに書いてもらうことにしました(こちらは改変リスク小)。

あっという間!

1回目なので内容はまだまだ粗いですが、30人近い人の体験談を分析して今後に向けた5つの洞察記事を書いてくれました。必要に応じて体験談から内容を抜粋してくれるのもありがたい。最初の段階としてここまでやってもらえたら、編集者としては涙が出るほどありがたい。どういう方針にすべきかを白紙の状態から考えるより、たたき台があったほうがはかどりますからね。。。

mdデータをwordに変換するぞー!

できあがったmdデータですが、後工程での修正を考えると、どうしたってwordにしたいわけです。どうすべやー。
そんなとき、友人から教えてもらったのが「Pandoc」です!! Pandocは、異なる形式の文書を別の形式に変換するためのオープンソースソフトウェアです。40種類以上の文書形式に対応しています。代表的なのは…。

  • Markdown

  • HTML

  • Microsoft Word (.docx)

  • LaTeX

  • PDF

  • EPUB (電子書籍)

おお、Wordがあるよ!!!
というわけで早速DLして使ってみました。やり方はGammaにまとめてもらったので、リンク張っておきます。だいたいどこのサイト見ても同じような感じで書かれていますが、不明点があったらAIに聞いてみると早いです。
ちなみにDLして使えるようにするまでがちょっと鬼門だったりしますが、AIに聞けば対処法を教えてくれます。何事も挑戦じゃー。

上の画像をぽちすると、上記のスライドが見られるはず。

ちなみにプログラムわかんない人にとっては鬼門でもある「コマンドプロンプト」を使用するんですが、それも全部AIに聞いたらいいんです。とはいえ、一応2ステップなので、それだけ説明しときます。

①作業する場所を指定する
C:\Users\●●(ログインしているユーザーの名前)\Downloads
この場合は、●●っていうユーザーのダウンロードフォルダで作業するよ!という宣言です。
変換したいファイルはどれで、どんなファイルにしたいかを指定する
pandoc "text.md" -o "text.docx"
これはPandocを使って、textっていう名前のmdデータを、同じくtextっていう名前のdocxデータに変更してね!という宣言です。

これだけでmdデータがあっという間にdocxデータに変換されました。やべー、超簡単! 
よくわからなかったら、AIにPandocで「ここのフォルダにあるデータをmdからdocxに変換したいんだけどコマンド教えて」と質問すればちゃんと答えてコピペさせてくれます。どこのフォルダかを指定するにはパスをコピーすれば一発ですが、やりやすい方法でどうぞ。

さて、Pandocからdocx変換した結果はこちら!(もちろんKDPのFMTに揃えるためにWordのページレイアウト設定からサイズの4タブにある情報をねちねちと設定しなおしています)

いやー、できたねえ。

HTMLに変換すると、電子書籍にばっちり!

もひとつお試し、ということで、mdをhtmlに変更してみました。これはPandocでもClaudeでもスムーズに進行します。できあがったhtmlをKDPの電子書籍変換ツールに放り込んでみましたが、問題なく書籍として読める状態になりました。

いやっほう!

電子書籍だけを作りたい、という場合は、AIが制作したmdをhtmlにしたらそのまま入稿できるので、これが最短ルートかなと思ってます。htmlなら画像の入れ方も簡単ですしね。画像がもりもり入る解説本とかならこの進め方が一番よさそうだな、と。
原稿の修正だけならhtmlがわかんなくても修正できると思いますし。改変リスクがない原稿(AIが作ったり直したりしてもモーマンタイなもの)であれば、AIにhtmlを作らせるのは全然ありだと思います。
ちなみにhtmlはwordにも変換できます。流し込むだけでよくて、KDPのFMTに合わせたければ、上述したようにサイズを4タブでチェックして数値を合わせればOKです。

おまけ:Wordの「差し込み文書機能」はいいぞ。

最後に、エクセルデータから30人分の体験談を1個1個コピペしてwordに張り付けるかったるい作業を自動化できたのでご報告。Wordの「差し込み文書機能」を活用します。
これは年賀状などでよく使われる機能で、同じFMTに違うデータを流し込めます。たとえば住所とか名前とかですね。バックではSQLクエリが実行されているので、そんなメッセージが出ます。
SQL自体はPCのドキュメント内にあるMyDataSourcesからデータを読み込むので、そこに差し込みたいデータを入れるといいです。エクセルかcsvだと思います。

差し込み文書用に作ったFMT

体験談用につくった質問からWord用の差し込み文書用FMTを作りました。<<>>で囲まれているのは、差し込みフィールドです。Wordの「差し込みフィールドの挿入」ボタンを押すとcsvからフィールドの一覧を作ってくれるので、どれをどこに挿入するのかを自分で決めてリターンキー押すと、差し込む場所を設定することができます。
そうやってできあがったのが以下。

体験談ごとに同じFMTに流し込まれているのがわかるでしょうか。この機能を活用すれば、AIのように勝手に文章を改変することもなく、そのままの原稿を望んだFMTに入れることができます。

というわけで、編集者目線でのAIの活用体験談でした。ではまた~。

いいなと思ったら応援しよう!