当て字変換

これは以前に一度構想(妄想)してボツにしたやつなんだけど、また復活させようかと思い、元記事からコピペしておきます。以下では、漢直入力における「交ぜ書き変換」に関連して「当て字変換」というものを提唱しています。


自分がこれまで交ぜ書きをあまり使わなかったのは、

  • 辞書の語彙が少ない

  • ひらがなの入力が面倒

という2点が大きかった。

語彙の問題は、漢直WSに mecab-ipa 辞書を導入することである程度解消された。 一方、ひらがな入力の面倒さは、漢字の読みというのが地の文のひらがな列にはあまり出現しないシーケンスになっていることに起因している。 つまり慣れていないシーケンスは入力するのがつらいということ。

で、これは「当て字変換」を導入するとかなり解消されるのではないかと思っている。

当て字変換というのは、たとえば次のようなもの。

  • 「現宿」⇒「げんしゅく」⇒「厳粛」

  • 「小直」⇒「しょうちょく」⇒「詔勅」

上のはある意味極端な例だが、「普編」⇒「普遍」や「京受」⇒「享受」なんかはわりといい感じに思えないだろうか。 以下のようなルールを設ければ、それなりに精度が高くなると考えている。

  1. 元の漢字と一致する文字が多いほうを優先(ただし、元の漢字列と完全に一致するものは候補から除外)

  2. 漢字を部品に分解して、一致する部品の多いほうを優先

2 の例としては、「不編」⇒「ふへん」から変換される候補の「不変」と「不偏」のうち、後者を選択する。


さらには、リアルタイムに辞書引きして辞書に載っていない漢字列については自動で当て字変換を実行する、ということも考えられます。あえて当て字にしているところや誤変換があれば Esc などの打鍵で元に戻せるようにしておけばよい。

細部の詰めはまだまだですが、近い将来における追加機能の有力な候補の一つです。

この記事が気に入ったらサポートをしてみませんか?