校正に使える正規表現 覚書
ゲラ発送してきて一休みのついでに、今使っている正規表現の覚書を。
初稿出しする前の赤入れで使ってるやつです。
正規表現というのは文字列とマッチさせることができる条件で、これを使えば「文字列そのものではなく、条件で」検索できます。つまり、「半角の英数字」を指定すれば、aだろうがyだろうが半角のものを全部拾える。目視と違って取りこぼしがない。
正規表現検索がついてるエディタなどで使えます。私はMacなのでJeditを使うことが多く、物書堂さんが復活させてくれたワープロアプリegwordでも検索窓で正規表現をオンにすれば使えます。使えるエディタ結構あるんじゃないかな。
自分が便利に使っているのは「行末のチェック」や「行頭のチェック」。
▫️決められた文字で終わっていない行末にマッチする正規表現。
^(?!.*(」|。|!|?|』|)|、)$).+$
内容:感嘆符や句読点、カッコ類(」。!? 』)、)で終わっていない行を検出する。
句読点の行末へのつけ忘れを検出するための正規表現。(」|。|!|?|』|)|、)のカッコ内に条件が列記されており、|で区切って条件をいくらでも足せます。自分も段々足して今はこんな感じ。
空行も検出しますが、まあいっかーとそこは放置。
▫️1文字下がっていない行頭にマッチする正規表現
\n[^ |「|(|『|〈]
内容:行の頭がスペースで一文字下がってない&カッコで始まっていない行を検出する。
除外されているのは「(『〈。
これで始まる行は検知外。※この条件も|で区切って足せる。
音声入力してると行頭のスペースを入れ忘れることがあったので、入力中に気にするよりはとあとからチェックできるようにしました。作業中の注意力は有限だからね!
▫️打ち間違いをしてそうな文字列を拾う正規表現
たとえば「コミュニケーション」と打ちたいのに「コミニュケーション」とかもしかしたら「コミャニケーション」とか打ってそう、という場合、「コミの次がュ以外の文字列」を探す時の条件。カタカナ語に効力を発揮する。
最近は別の手段に変えたので使ってませんが。
条件:ュが後続しないすべてのコミ
コミ[^ュ]
条件を書き換えれば色々使えます。
この場合は「コミット」とか「コミケ」とかも拾うので、便利かどうかは条件次第。
▫️半角英数字にマッチする正規表現
[a-zA-Z0-9]+
半角英字は[a-zA-Z]。←aからzまでとAからZまでにマッチする条件。
半角数字は[0-9]。
最後に+をつけることで、12とかthanksとかを一つづきの塊で拾ってくれる。(これがないと一文字ずつ拾う)
ハウスルールとかマイルールによって英数字は全角、という場合に、あぶり出しに使えます。
最近の自分校正環境
ついでに、自分の今の校正環境のお話をちょっと。
自分校正をやってる人ならよくわかる、「人による目視」の強さと弱さ。これは永遠のテーマだな。
人の目でしか拾えないものがある一方、人間の(おのれの)目/意識は何と無力なんだ!と突っ伏すことも多し。しかも疲労値が溜まると解像度がえげつなく落ちる。目が滑ると何もできない。やる気や注意力で何とかできるというのは傲慢であった…と、色々あって気づきましたよね。
機械で拾えるものは機械で拾わせたほうがいい。やつら集中力は切れないし、条件が設定できるものなら見逃さない。
そのあたりは機械に丸投げして、残りに人間の(自分の)有限の注意力を向けるのが適材適所ではないか…と悟ってから、人外への外注(家のパソコン内で)をアレコレ目論むように。
今現在、手元での校正は、補助に校正アプリのJust Right!、カタカナ語の抽出に自作のアプリを使用。
Just Right!は表記揺れ一括まとめとか数字の一括漢数字変換とかがえげつなく便利。手作業でやってた時に比べてそこは本当に楽になった。コスパ的にはもうちょいな気はしますが、代替製品もないのでがんばってほしいアプリです。これだけのためにwindows環境保持しているのでな!
自作アプリの方は、インターフェースのガワをXcodeで作ってあるだけで、中身はカタカナ語の検索とソートのスクリプトです。作りが甘くて外から除外リスト入れられないので毎回ビルドしてるんですが、そろそろChatGPTの力を借りて修正するか…。このアプリではカタカナ語を抽出してリストにしてもらえます(どこぞにありそうな機能だが、見つけられなかったので仕方なく自分で作った)。
意図しないカタカナ表記揺れも、リストにすればチェックしやすいという目論見。最近の入力は音声入力メインなので、これ本当に大事で…。ニコルスとニコラスを引っ掛けてきたのは本当に偉かった。
こういうアプリのチェックをはさみつつ、本文を出来上がりに近いフォーマットでPDF化し、電子ペーパーのクアデルノに入れて赤入れ→修正を反映→PDFにして再度赤入れ、と何周かしてます。3周くらい?時間があれば途中でちょっと寝かせる。
色のついたプラ板みたいなやつをしおりサイズに切って、一行ずつなぞりながら読む回もあり。一行ルーペみたいなのも導入したことがあるけど、全部あれで見るのはつらいので最近は眠ってます。
この段階で場合によっては文体の調整したり、キャラの口調をあらためて考え直したりとか、そういう作業もします。
ここの時間をしっかり取るようになってから初稿ゲラの赤入れが劇的に減りました。印刷屋さんこれまですみませんでした。。
電子ペーパーガジェットのクアデルノは画面はモノクロなんだけど(ほんの最近カラーモデルは出た)、「赤のマーカー」で書き込めて、パソコンやタブレットに読み込むと赤字が入って見える。光ってないから目にも優しい。これでePaperガジェットもうちょっと安くなってくれたらな!
電子ペーパーは反射光ではないのできわめて紙っぽい感覚で作業できるのがいいところ。いちいちプリントしてたらそんなに何周もできないのでこういうガジェットはありがたいですね。
iPadはやはり発光体なので、長いテキストを校正するには集中力が浅くて向かない気がします。
幾度か直して形が良くなってきたら、iPadにテキスト入れて日本語の読み上げをさせ(これも前は読み上げアプリだったが、最近はiOSの読み上げ機能を使用)、聞きながら英語の原文と対照比較、気になるところや単語の抜けを拾います
その段階を経て、初稿ゲラに出せるテキストになるというか、なったはずと思って送付し、とりあえず天に祈る。まる。
最近はAIがなんか怒涛の賢さを更新中なので、校正も投げられる時代が来るかもね。
でもやっぱり「人間の目にしか拾えない違和感」はあって、逆にそれを集中して拾うためにそれ以外を機械に投げ、リソースの適材適所を狙うのがいいのではないかと思います。
あと、校正に役立つもの。
眼鏡。
気になる人は読書用にピントをばっちり手元に合わせた眼鏡作るといい。まじで役に立つから。
あと、睡眠。
やはり自分のメンテが一番大事。というお話。あとは猫のごきげん次第。