20010811 四角号碼
四角号碼$${^{*1}}$$という漢字の索引法$${^{*2}}$$がある。「しかくごうま」と読む。音だけ聞くと「刺客強魔」と言う漢字が浮かんできて、なんかとても悪そうな奴のような気がしてくる。
四角号碼$${^{*3}}$$の「四角」は漢字の四つの角のことで、「号碼」は中国語で番号という意味らしい。王雲五という言語学者が1925年頃考案したらしい。漢字は大抵四角い形をしている。その四角い漢字の左上、右上、左下、右下の四つの角の部分の形を十種類(頭、横、垂、点、叉、挿、方、角、八、小)に分類してそれぞれに0から9までの数字を割り振り、四桁の数で漢字一つ一つに番号を付けて索引にしたのである。
例えば「碼」という字は左上が石偏の第一画の横棒があるから「ー(横:よこ)」で「1」、右上は馬の横棒があるからこれも「1」、左下は石偏の「口:しかく」があるから「口(方)」は「6」、右下は馬の縦線があるから「亅(垂:たて)」で「2」だから、「碼」の番号は「1162」となる。
「碼」であれば部首は「石偏」だから四角号碼を使わなくてもすぐ漢和辞典が引けるが、部首も読み方も総画もよく分からない「靠」「龠」このような字を探す時には便利かも知れない。
この方法で分類できる漢字の数は、四つの角に0から9までの数字を付ける訳だから最大でも10×10×10×10で一万字しか分類できない。大漢和辞典では五万字*4もあるのだから番号が足りない。そこで「符号」という分類をもう一つ加えて5桁にしている。どういう時に符号を使うかというと、字が違うのに4桁の番号が一致してしまった場合に右下角の上の一番近いところにある角の形の番号を付け加える。「碼」の場合、馬の右中程に「┐(角:かど)」がある。これは「7」なので番号は11627となる。実際に酊$${^{*5}}$$、砺$${^{*6}}$$、礪$${^{*7}}$$が「1162」となり重なっている。更に砺と礪の符号も碼の「7」と同様に「┐」があるため11627になっている。
漢字に固有番号を付けるのが目的ではなく辞書を引く際の索引として使う訳だから少々番号が重なっても問題は出ないのである。
曲線が含まれた漢字、例えばこんな漢字$${^{*8}}$$はどうなるのだろうか。四角号碼は対応できているのだろうか。大漢和辞典が手許にないので確認できない。
それにしても漢字の部首を無視して筆の運びや形だけで漢字を分類するという発想は漢字を使う国の人にとってはかなり難しいのではないだろうか。一体何がヒントになったのだろうか。
*1 あまつぶ981124
*2 CHinDEX
*3 CJK-English Dictionary: Table of Indexes
*4 20010610 漢字ポスター
*5 CJK-English Dictionary
*6 CJK-English Dictionary
*7 CJK-English Dictionary
*8 20010623 曲線漢字
この記事が気に入ったらサポートをしてみませんか?