
文字コードと外字
パソコンで漢字が使えるようになった頃、扱える漢字は基本的にはJIS第1水準と呼ばれる3,000字弱の漢字が基本で、オプションとして第2水準の約3,400字弱の漢字が追加される(併せて非漢字も含めて約6,800字)というところでした。これは常用漢字(約2,000字)に比べれば遥かのに多くの漢字が使えるのですが、人名や地名で使われている漢字が網羅されていないので、住所録とかを作ろうものなら、そのままでは表現できません。
JIS漢字コード
他にも会社や業界固有のよく使われているシンボル、記号などが含まれていませんし、文書の中に画像を組み込むことは当時のワープロでは出来なかったり、かなりの手間がかかったので、文字として使いたいという欲求には高いものがありました。それ以外にも8ビット時代の図形文字であるとかPCGに登録していたパターンを使いたいなんていうこともありました。
そこで外字という仕組みが搭載されるようになりました。そもそも外字という言葉は、活字の時代から特定の集合(表)に含まれていない文字一般をさしていたと思うのですが、パソコンの場合にはもっぱら何らかの共通文字コードに収録されていない文字を意味するようになりました。
外字
当初はJISコードで文字が定義されていない領域に、まずメーカー側が独自の文字を追加することが多く、それに加えて一部のコードをユーザ定義文字として使えるという形にしていました(外字というコード領域が定義されているわけではなかった)。
外字を使うにはコードに対応する文字表現のデータを登録する必要があります。当時のパソコンやプリンタはいずれにせよ文字はドットの集合として扱われていたので、画面用の16✕16とプリンタ用の24✕24(いずれも、これより少し小さめのこともあった)のドットパターンを用意する必要があります。そしてこのデータをファイルなどに入れてシステムに組み込むことで外字が他の文字と同じように使えるようになるのでした。
このパターンを作ったり直したりするのが「外字エディタ」というもので、今(Windows11)でも、こっそりシステムに入っていたりします。1から作るのは大変なので、他の漢字の一部を切り取ったり組み合わせることができますし、ライブラリのように多くのパターンが用意されていて、そこから選んで登録するなんて言うことができることもあります。シンプルではあるものの画像エディタのようなものです。
問題なのは外字の管理がシステムごとという点で、自分のシステムで外字を使うには、そのデータを都度、フロッピーなどに入れておく必要があります。程なくワープロソフトが独自に外字データを持ち管理するようになったのですが、文書ファイルを他のパソコンに渡すには必ず外字データも一緒に入れておかないと、元のパソコンと同じ形に外字を表示、印刷できないことになりました。パソコンによっては第2水準が組み込まれていなかったり、正しい外字ファイルを読み込んでいなかったりすると、文書の一部が豆腐(すべてのドットが打たれている状態の文字)で出てきて、ネットの無い時代、これを「文字化け」と呼んでいたように思います。
会社などの場合、社内文書共通の外字を使うようにしていることも多く、外字ファイルのマスターフロッピーがあって、これをコピーして使うのが習わしだったことも多かったです。いろいろなパソコン(やワープロ専用機)の間でデータをやりとりすることが増えてくると、この外字の管理が問題になりはじめ、機種によって割り当てられているコードが異なったり、登録されているフォントデータの形式が違うので、変換ソフトなんかも作られたりするようになりましたが、そもそもデータに外字が含まれているかを忘れてしまうこともあったので、きちんと外字を運用するのはなかなか苦労が多かったです。
人名や地名に関しては、どこでも同じ苦労をするので、収録されている漢字自身を増やそうということで、第3水準、第4水準または補助漢字というコードが作られたのですが、これをコンピュータで扱う統一的なルールがなかなか出来なかったので、あまり普及しなかったのですが、ベースとなる文字コードがUNICODEになったあたりで取り込まれることとなり、今では外字を使うケースは限定的になりました。
JIS X 0212
また、GUIな時代になってからは、フォントデータはドットではなくベクトルの組み合わせで定義されるようになったので、外字エディタもなかなか高度なソフトとなりました。同時にフォントセットも多彩になったので、どのフォントに紐づいた外字データなのかの管理も必要となり、なかなか使うのが面倒にもなっています。
DOSな時代は、外字無くして文書が作れないというほど、良く使われていた外字たちですが、これをデータベースなど長くいろいろなシステムで使われるデータに入れてしまうと混乱しか無いですし、パソ通でうっかり混ぜてしまうと豆腐だらけの伏せ字のようになってしまうので、嫌われることこの上なしでもありました。外字も含め機種依存文字排除運動も起こり、紙に出力されるものとデータとして交換されるものの区別が必要となり、使い分けが求められるようにもなりました。でも外字は便利だったんですよね。レポートを書くのに便利だったので、単位であるとか一部の化学記号なんかの外字を作って愛用していました。
ヘッダ画像はベンゼンを表す外字を作っているところ。
#文字コード #外字 #外字エディタ #JIS漢字 #豆腐 #フォント #ドット
いいなと思ったら応援しよう!
