文字コード
行政書士法人ひとみ綜合法務事務所takedaです。5月に河野太郎大臣がツイートされたブログ「文字コード」について、色々思ったことを書きました。
河野太郎さんはTwitterを使っています: 「ブログ更新:文字コード https://t.co/rHc6SGTPkK」 / Twitter
コンピュータの世界は1バイト文字が主なので2バイト文字である全角かな・漢字は特別扱いされるのは当然。特に漢字は人が書くのも難しいくらい種類が多く難解だ。そのため日本では一太郎のような日本語特化したソフトが大人気で今でも好んで使う人がいる。しかし、このようなソフトに漢字表記を任せた結果、漢字フォントが多く開発され互換性がなくなってる現実もある。
コンピュータを利用する人が全員同じ環境ならいいのだが、一太郎、Word、テキストエディタと利用者の趣味で環境が異なる現状では、作ったファイルが読めない、変換する必要がある、など不具合が多発している。
これは漢字に限ったことでなく、ISO規格のように世界共通でない文字、記号でも起こっている。数式や化学式の記号がその最たる例だ。
これは専門性があり、利用者側で対応するべきだと思うが、漢字はどうだろうか。
地名、人名など日常的に利用するもので、利用者を限定するものでもない。それなのに漢字対応のソフトは自社でフォントを作り、勝手なコードで記録している。一時期、Unicodeに統一しようとしていた環境があるが、これができたのは1バイト文字のレベルで、2バイト文字はOSのもつフォントをそのまま利用しているので、結果、コンピュータの環境に依存する。これはPDFなどにフォントを埋め込んでも同じで、環境がないと文字化けが起こる。非常に不便なものだ。もし、漢字のコードが世界で統一されれば、こんなことは無くなるし、外字フォントなんかも作らなくてもよくなる。
ただ全ての漢字を統一するは骨が折れる。日本の漢字は常用漢字は置いておいて、その殆どが人の書き写し間違いから発生している。明治になり、全国民が姓を名乗るようになり、戸籍が作られたが、当時は勿論手書きである。まだ日本中の文字が統一されていなかった時代なので地域により同じ音、意味でも微妙に異なる漢字が作られた。斉、斎、齋などがその例だ。
一画だけ異なるとかあるのは当時の役所職員が写し間違えたからだ。そのまま何年も続くと連想ゲームのように微妙な変化が続き、現在に至るわけだ。文字コードを統一し、どの環境でも同じ漢字が使えれば素晴らしい世界になるだろう。そのためにも統一規格を制定し、まとめる機関が必要かもしれない。河野太郎デジタル大臣のブログにあるように、MJ+にどの文字を加えるのかといった検討が続くが、これを諦めずやり切って欲しい。文字は文化、文化を守るのも国の務めだと考える。
上記は、私が5月にツイートした内容をNoteに転載した。下記は今日私が書いたもの。書き終えてから、以前にも同じことを書いたような気がしたので、自分のツイートを検索すると似たようなものがあった。人間の記憶とは、曖昧なものだ。
弊所代表行政書士の10年前の同テーマのNoteがこちら。これは行政書士業務で苦労する人も多いのか、閲覧数が多いという。
印鑑証明書に異体字が含まれる氏名の人物が正字で法務局に登記されている場合の問題点的なもの | ノート100YEN.com (note100yen.com)
【ここからは本日、私が書いた。~です、ます調】
根本として日本の漢字氏名は、明治になり、全国民に姓名を義務付ける所から今の問題が発生していると思います。
当時は戸籍など台帳記載は手書きで役所職員が目で見て写すことになり、提出された姓を見て書き写す、また別の書類に写すのも目で見て手書き。見間違えや書き間違いで字はどんどん異形になり、字が増えたのが原因です。
斉藤、斎藤、齋藤、齊藤などは際たる例です。そのため常用漢字が制定され、コンピュータで処理する頃から常用漢字外の漢字、外字についての対応が問題になりました。JISなどのある種の標準規格はあれど、汎用性のない外字はほぼ対応されず、MS-IMEには外字フォントを作成するツールは以前からありました。
管理する氏名の量が多い学校現場では生徒氏名を正確に登録する為に外字を作り管理、使用していますが、外字を作成したコンピュータ以外では文字化けが起こる為、通常は常用漢字に置き換えた名簿を使わないといけない始末。生徒台帳への登録は住民票記載の氏名となる為、毎年、外字登録に苦慮します。これは日本特有の問題だと思いますが、デジタル化を推し進めるにあたり、漢字氏名の取扱は避けては通れません。漢字の対応の為に一太郎のような日本語特化のソフトがある程です。
しかし、現状はソフト会社に依存するものばかりで外字フォントもソフト専用で互換性がありません。これが原因で一つのソフトに縛られることが個人レベルでも起こっています。
機能を求めてソフトを選ぶならまだしも、フォント依存のためだけに選ばないといけないのは、あまりにも自由度がなく、不便です。コンシュマー向けでさえ、このような問題が出ているので、特別仕様の行政の管理システムでは、セキュリティの観点からも自由にフォントなども入れられず、さらに互換性が保てないでしょう。外字という表現がいけないのかもしれませんが、氏名漢字は固有の情報なので、対応して当然ではないでしょうか。標準化されたフォントとして利用する為にも、今あるコードの統一は必須です。その為に各メーカー、システムのコード変更が必要となり、大掛かりな事業になりますが、これこそ行政がトップダウンで行わなければならない大事業。これによる混乱や手間はありますが、それ以上の恩恵があります。待ち望む人は多くいます。一日も早い対応を期待します。