索引づくりのメモ
中国史系の本では、案外「これをなんと読むかが分からない」がネックになりそうである。特に通俗系のものであれば、あるほど。ならば、せっかくWordに「同じ文字列に同じルビを振る」機能がついているので、そこをありがたく活用しましょう。
以下の索引作成は、このようにして「全用語にルビを振った」本に基づいて索引を作ろう、というものです。
なお、この作業は Microsoft Office の EXCEL および WORD の操作をご存知であり、多少なら HTML も動かせる方向けに書きます。あまり記事を長くしたくないので、わからない内容があったら適宜お調べください。もちろんご質問いただければ答えます。
索引作業。一言、地獄である。
どの言葉がどのページにあるかを一つ一つチェックし、また合っているかどうかも確認せねばならない。しかし WORD にはこの操作を自動化できる方法があるらしい。ならばそのやり方も交え、自著の索引作成を可能な限り省力化してみようと考える。以下はその手順の仮説である。
用いるものは以下の4ソフト。
microsoft Word
(→原稿ファイルと索引ファイルが必要)
microsoft Excel
任意のテキストエディタ
ブラウザ
①エディタ貼り付け→一回目置き換え
ルビ入りWord 原稿をテキストエディタに貼り付ける。この時、たとえば劉備にルビが振ってあったら「劉備(りゅうび)」と表示される。これを用いて、少しでも楽をしたい、と考えた。なのでまずこれをやった。「)」を「<br>」と置き換え、である。
②html化
一応htmlの仕様を書く。「<html><body>」~「</body></html>」の間に書かれたテキストの改行は半角スペースに置き換えられ、<br>のところでだけ改行する。これを利用し、ルビの後ろに改行を置くことで元テキストの改行を無効化し、あわせて各単語の末尾で改行させる。これにより各ルビを振った単語ひとつあたり一行で表示されるテキストが出来上がる。
ブラウザでhtmlファイルを展開、表示されたテキストをコピー。ここでいちどテキストエディタに貼る。
③2回目置き換え→EXCELに展開
テキストエディタに表示された文章のうち、今度は「(」をタブ空白に置き換える。これにより単語の後ろのよみがなが単語の隣のセルに移る。
とはいえ、単語の前に群がる諸テキストも抹消していかねばならない。
とりあえず新規で EXCEL の表を開き、二回目の置き換えが済んだテキストをF行に貼る。これでF列にはよくわからんがごちゃごちゃ書かれたテキスト、G列にはよみがな、が表示されるはずである。
以下、ここから単語抽出及び重複削除を行う。
④……の、前段
ここからEXCELでの作業に移るのだが、作業説明の簡略化のためいくつか仮に用語を設定させていただきたい。
・下端移動
データのない行で一度Ctrl↓を押し最下段まで移動、そこからデータのある列に移りCtrl↑を押すことで存在するデータの最下段に移る。この操作を下端移動と呼ぶ。
・素データ化
何回かの並べ替え作業を行うため、並べ替えによって変わってほしくない表示まで変わってしまう。そこで一連の計算結果をコピー→「数値として貼り付け」と行う作業を「素データ化」と呼ぶ。
④重複データ抹消作業の繰り返し
さて、中国史にとって幸いなことがある。各用語の文字数が少ないことである。しかも自分の場合ルビ振りは最大でも三文字単位、四文字の場合は二文字づつで分けている。このため読みがなの前に載る単語は、最高でも三文字である。ただ一応、念の為四文字の重複から潰していくことにしたい。
・A1に「=right(f1,4)」と入力。A1をコピーしたあと下端移動を行い、下端A列に移りCtrlShift↑でデータ下端より1行目までのA列を選択、貼り付け。
・A列に基づき順序を入れ替える。昇順、降順どちらでも構わない。
・B2に「=if(a2=a1,"",1)」と入力。コピーし、B列で下端移動、下端よりB2まで貼り付けし、素データ化。
・4文字で用語として成立している行をすべてsheet2に移す。その後B列で並べ替えをし、1と表示されている行を削除。
・以上の手段を
A1に「=right(f1,3)」
A1に「=right(f1,2)」
A1に「=right(f1,1)」
で、それぞれ繰り返す。
⑤索引定義ファイル向け編集作業
sheet2には、A列に単語、F列に文章、G列よみがなが入った状態のはずである。ここでF列はもう消しても構わない。おそらくそのほうが処理は軽い。微々たる差とは思うが。
以下の数式をB1にいれる。
「=CONCATENATE("dcdc",a1,"dcdc ¥y DCDC",g1,"DCDC")」
B1をコピーし、B列で下端移動、B1 までペースト。そしてA,B列の全データをコピーし、Wordの索引ファイルに貼り付け、保存。
⑥索引ファイルを文書ファイルに読み込む
文書ファイルにて「参考資料」-「索引の挿入ー「自動索引登録」、そして索引ファイルを読み込む。
調べた内容に不備がなければ、とりあえずこれで索引の元ファイルができるはずである。作業工程的には、まあ一時間を見るくらいだろうか。では、これを実際にやってみよう。
検証結果
ここを、明日の九時から配信でやってみます。
さて、どんな感じになるものか。
この記事が気に入ったらサポートをしてみませんか?