謎解きで使える言葉の一覧を集めたかった話
謎制作でよく使われるツールとして、文字の一部を「?」に置き換えてクロスワード辞書があります。
・謎解き単語検索β
・なぞわーど
これらのシステムは、大きく分けて
「検索システム」と「単語を並べた辞書データ」から構成されます。
検索システムはクロスワード辞書のように
はがき検索(*1)やシーザー暗号(*2)のように、複数単語の組み合わせ
そして、その辞書データとして広く使われているのが豚辞書です。
(*1) 前半→(はがき)→漸近、前半→(はがね)→前年 のように、「AがB」の形で文字を置き換えられる単語の組のこと
(*2) 否定形→不登校 のようにアルファベット順や五十音順で同じ文字数だけずらしてできる単語の組のこと
豚辞書とは
豚辞書はぶたさんによって作成された、単語を判定する処理に利用できるフリーの辞書データで、20万語と広辞苑に匹敵する単語数を収録しています。
【非公式】豚辞書 第14版【再頒布】 | う~ん、いや、気のせいじゃないの?
▲再配布サイト
豚辞書の初版公開は1994年、最終更新である14版は2001年と、20年前にストップしたプロジェクトですが、未だにクロスワード辞書の内部で現役で、
単語検索ツールを利用する人は裏側でお世話になっていることでしょう。
20年間追従者が現れない、なかなか真似することのできない偉大な試みです。
豚辞書の難点と一般語辞書
広辞苑に匹敵する単語数を抱えているということは、多くの人が知らない単語も収録されていることでもあります。
「謎解きの答えにできそうな単語」が豚辞書の20万語のうち10%あったとすると、
豚辞書で見つかる2単語の組の中で両方が謎解きの答えにできそうな単語になる組は1%しかありません。
見つかった大量のペアの中から良さそうな単語をピックアップする、
干し草の中から針を探すような作業が求められます。
このような検索に利用するため、あらかじめ「謎解きの答えにできそうな単語」のみで構成された辞書データを作っておきたいと思うのは一人二人ではなく、
謎解き界には以前より、一般語辞典と呼ばれる概念がありました。
一般語辞書プロジェクト
豚辞書が何年経っても求められているツールであるのと同様、
一般語辞書も長く使われる需要があるものになりそうです。
20万語は膨大ですが、千里の道も一歩から。
2019年に一般語辞書プロジェクトをはじめました。
結果、謎制作者を中心に、29人に計38000語、豚辞書のおよそ2割を1000語ずつ分類してもらったのですが、上がってきたアウトプットを見て、頭を抱えることになりました。
1000語のうちの8〜9割を残した人もいれば、残した単語が1割程度の人まであり。
「謎解きに使えそうな単語」という曖昧な定義で始めたため、
15%〜45%など、3倍程度の幅はあるだろうなと思っていたのですが、
自分の思っている以上に「謎解きで使える単語」という概念は人によって異なるものでした。
かといって20万語は少数で行うには多すぎますし、分担を機能させる良い解消手段が見つからず、企画は一旦中断することになりました。
協力者の皆様、ありがとうございました!
それでも一般語辞書が欲しい
その後、豚辞書からの以外の手段で一般語辞書を作ることを考え、
使用頻度の高い単語リストや日本語検定一級の語彙など、
日常で利用されている単語の機械的な抽出に取り組み、
3万語程度の辞書データを作成することができました。
できあがったものは、一般語辞書プロジェクトチームに配布したり、
謎解き単語検索βの開発者さんに配布し、検索システムに組み込んでもらいました。
一行一単語の生データファイルを一般語辞書 ver 1.0として、このマガジンで公開します。
マガジンについての説明はこちら
更新履歴
8/23 謎解き単語検索β管理人の白猫さんより指摘をいただき、ファイルを生成しなおしました。
21/8/23 更新 ver1.1
・末尾の半角スペースを削除しました
・「がいしん」を追加しました
ver1.2
・484件ほど重複があったのを削除しました
この記事が気に入ったらチップで応援してみませんか?