No216 異体字を入力する方法
前回までに、「はしご高」といった異体字ができた経緯や文字
コードの世界での異体字の扱いについて解説しました。
今回からは現実的な話として、「どうやりゃ異体字を入力したり
より多くの人が見られるようにできるの?」というのが皆さんが
一番知りたいところの解説をします。
今回は異体字表示の限界と入力方法について解説します。
1. 全ての文字が常に正しく表示できるわけではない
最初から、全否定するようで申しわけないのですが、全てのコン
ピュータで全ての文字を正しく表示させる方法などない、のです。
いくら自分の手元のコンピュータでは完璧に表示できていても、
世間にはいろんなコンピュータがあり、その中にもいろんなアプリ
があります。全ての人で同じ表示となる保証などないのです。
これは異体字に限ったことではありません。
世界にはいろんな言語があり、文字があります。
その中には過去には使っていたが、現在はほとんど使われていない
というものもたくさんあります。
そういった文字の多くは日本で販売されているパソコンには入って
いません。
例えば、バリ文字というのがあります。
観光地で有名なインドネシアのバリ島で使われていた文字ですが、
これは日本版や北米版のWindowsには含まれません。
WindowsやMacintoshといった一般的なコンピュータではUNICODEと
いう文字コードを使っています。
UNICODEのversion13では14万文字を越える膨大な文字が登録されて
います。
登録されていると聞けば、当然表示もできるだろうと思いがちです
が、上述の通り必ずしもそうはなっていません。
実際的な話、利用もしない文字がパソコンに大量に入っていても
「たんすのこやし」ならぬ「ディスクのこやし」にしかなりません
し、フォントのデザイン料も上乗せしなければならないわけで、
誰も得をしないから、含まれていないのでしょう。
14万文字もの定義があっても、その全てを含んでいる実用的なフォ
ントがなく、コンピュータによって何が含まれているかは違って
います。文字が表示できたりできなかったりも当然なのです。
とはいえ、実際には皆が共通で使いたい文字は全てのコンピュータ
に入っていますし、日本で販売されるコンピュータなら、通常の
漢字は必ず入っているため、こういった文字の表示が問題となる
ことはまずありません。
逆に異体字というのはそれが表面化する稀少なケースと言えます。
2. 余談:UNICODEって14万文字もナニが入ってるの?
UNICODEには上述のように14万文字もの文字が含まれています。
じゃあ、その内訳はどうなっているのでしょうか?
いくら漢字が多いと言っても、常用漢字はたかだか2100文字程度
です。難しい字を含むであろうJIS(日本工業規格)のX 0213 と
いう規格でも11000文字強に過ぎません。日本語の文章を書く上
では(異体字を除けば)11000種以下で十分に書けるということに
なります。
一体どうなっているのでしょうか?
実はUNICODEには、9万文字以上の漢字が登録されています。
そのかなりの部分(5万文字以上)は中国(中華人民共和国)が
申請したものですが、それだけというわけでもありません。
漢字は日本だけでなく台湾・中国・韓国・ベトナムといった国々で
使われています。もっとも韓国やベトナムでは今はほとんど使われ
なくなっていますが、以前は使っていました。
それぞれの国が何千という単位の文字を申請するわけですから、
どうしても、これだけの数になってしまうということのようです。
さて、14万文字のうち、9万文字強を漢字が占めていますが、それ
でもまだ4万文字以上の文字があります。漢字以外にどんな文字が
そんなに多いのでしょうか?
意外なことに2位となるのはハングルです。
ハングルは発音の元となる字母を縦横に並べることで音を示すそう
ですが、複雑なものになると5つの字母をならべるものがあり、
その組み合わせとなるため、種類は1万を越えています。
もっとも、通常の文章は百を越える程度の文字でまかなえるらしく、
あとは歴史上の人物名など特殊な読みが必要な時にだけ使われる文字
ばかりだそうです。
3位位下はヒストリックスクリプトと呼ばれる現在は使われない
過去の文字がいろいろと入ります。
例えば西夏文字が8千弱、ヒエログリフ(エジプトの神聖文字)が
1000種程度、といった具合です。
こういったヒトリックスクリプトはその言語や文化の研究者間での
情報共有をスムーズに行うために規定されています。
残りの2万文字の中には、数学記号や音楽符号、天気図記号、論理
学、電気、土木など学術的に使われる文字がたくさん含まれますし、
絵文字なども規定されています。
もちろん、各国で使用されている現役の文字はすべて収録されて
います。
こう考えますと異体字だけでなく、漢字というのは文字コードを
設計する方にとっては非常にやっかいな文字なのですね。
3. 異体字の入力方法
さて、そもそも異体字を表示させるには入力できなくては話に
なりません。
ところが、Windowsのかな漢字変換(MS-IME)を使っている限り、
標準設定のままでは異体字の変換ができないのです。
(筆者もこのメルマガを書くまで知りませんでした)
「はしご高」や「たち崎(右上が大ではなく立)」といったごく
一部は変換キーを押し続けると「環境依存文字」として表示され
ますが、多くの異体字はそれでは入力できません。
Windows自身は異体字セレクタに対応できているのですが、どうも
意図的に異体字セレクタが表示されない設定としているようです。
開発元は、世間の異体字への認知度を考えると使える設定にして
おく方が混乱をきたす、と判断したのでしょう。
一般的にここまでややこしい話とは思われていませんから。
というわけで、Windows環境での異体字への変換ができるように
する方法を示しておきます。
(かなり手順が多いですが、それほど難しくはありません)
1. タスクトレイのMS-IMEの「あ」のアイコンを右クリック。
2.「プロパティ」でクリック
3.「詳細設定」ボタンをクリック
4.「変換」タブをクリック
5.「詳細設定」ボタンをクリック
6.「変換文字制限はしない」をクリック
※デフォルトではIVS(異体字セレクタ)は候補に出さない
7.「OK」をクリック
文字だけで書かれても自信ないなぁ、という方は以下をご参照くだ
さい。図入りでわかりやすく解説されています。
「Windows 10の日本語入力システム(MS-IME)で異体字を入力可能にする」
https://www.atmarkit.co.jp/ait/articles/1801/10/news019.html
これで文字が入力できるようになりました。
文字が入力できれば、全て解決では?とお考えの方もおられると
思いますが、話はそう単純ではないのです。
4. 異体字を使いたいシーン
異体字は、様々なシーンで必要となります。
1. 自組織のホームページで、経営者の氏名を正確に表わしたい。
2. サービス申し込みの時に氏名を正しく入力したい。
3. Excelなどのオフィスソフトでお客様のお名前を正しく入力したい。
4. 案内状(紙で郵送)を作る際、来賓のお名前を正しく書きたい。
5. 案内状(PDFで公開)を作る際、来賓のお名前を正しく書きたい。
6. メールの送付先のお名前を正しく書きたい。
どれも、異体字を使いたいという意味では同じです。
ですが、そのための対応はかなり違います。
例えば、「1.ホームページ公開」では不特定多数のパソコンで正しく
表示させる工夫がいります。
「2.サービス申し込み」ならWeb(インターネット)で先方の担当者
に伝えること、「3.Excel表の入力」はOfficeソフトでの異体字の
扱いを知ること、「4. (紙の)案内状」は印刷の方法といった具合。
項目によって必要な知識や対応がまるで違うのがわかると思います。
次回では、上記のそれぞれについて注意すべき点の解説をしたいと
思います。
次回もお楽しみに。