20040329 漢字辞典
web上の辞書がかなり充実してきた。漢字辞典$${^{*1}}$$を最近見つけた。
紙の漢和辞典とはかなり趣が違う。説明はかなり省略$${^{*2}}$$されている。音訓の読みだけで、漢字の意味が書かれていない。訓読みで漢字の意味が判る場合もあるが、訓読みだけでは漢字の意味が判らない場合の方が圧倒的に多い。それに訓読みのない漢字もあるので、結局はこの辞書では漢字の意味を知ることはできない。
あと「区点」「JIS」「シフトJIS」に対する符号が書かれている。「JIS」「シフトJIS」$${^{*3}}$$は日本語を表示するための文字コードである。「区点$${^{*4}}$$」とは何か。16進数で表示されるJISコードを十進数の四桁で表したコードらしい。最近の紙の辞書でもこういった文字コードが記載されている。
文字コードが割り振られている漢字だけがこの辞典に掲載されているかといえば、そうではない。こういったコードが割り振られていない漢字$${^{*5}}$$も掲載されている。このweb上の漢字辞典に掲載するかどうかの基準は一体なんなのだろう。「オリジナル漢字検索データベース」という約7300文字で構成される漢字表を元に作られているらしい。漢字コードが付いている約6400の漢字$${^{*6}}$$の全てはこのデータベースに含まれているのだろう。あとの約900文字は漢字コード以外である。これらの漢字の掲載基準には何かあるのか。制作者の漢字への思い入れだろうか。
日本工業規格$${^{*7}}$$のJIS漢字コード$${^{*8}}$$を制作する作業で、文字に関する識者の関与は全くなかったらしい。「漢字と日本人$${^{*9}}$$」という本にそんなようなことが書いてあった。当時はメモリーの値段が高くて電子的な表示の技術的な制限があった時代だったので、文字に対する愛着や文化よりも実用を優先してコードを決めたかったのだろう。現状は技術革新によりそういった制限が薄れてきたので水準となる漢字数をどんどん増やしていく$${^{*10}}$$に違いない。増やす方向$${^{*11}}$$なので今後も識者の見解は必要ないかも知れない。そうなるとやはり「オリジナル漢字検索データベース」の基準は制作者の趣味だろうか。
文字コードが頻繁に使われることはあるのか。それよりも漢字そのものの意味や熟語を並べてもらった方がよっぽど使える。国語辞典$${^{*12}}$$が並んでいるので、漢字辞典の検索結果$${^{*13}}$$が国語辞典と連動していれば便利なのに、そうなっていないのは残念である。
*1 インフォシーク-:漢字検索
*2 インフォシーク-:漢字検索
*3 20040209 美乳
*4 IT用語辞典 e-Words : 区点コード
*5 インフォシーク-:漢字検索 33画
*6 情報処理概論 JIS漢字コード 第1水準漢字 2,965文字 第2水準漢字 3,390文字
*7 くらしとjisセンターへようこそ
*8 @nifty:デジタル用語辞典:JIS漢字コード
*9 漢字と日本人:紀伊國屋書店
*10 情報処理概論 シフトJIS漢字コード
*11 Kanjibukuro 日本の「漢字表」
*12 インフォシーク-:大辞林(国語辞典)
*13 インフォシーク-:漢字検索