見出し画像

この単語ってみんなどうやって使っている?

 文章を書いていてこんな事を思ったことがあります。

 書き言葉はSNSやホームページ、記事、新聞などでで毎日増え続けています。
 私も毎日数百文字であるが、noteにそこはかとなく書きつくっているので、日本語の書き言葉の母数を増やすのにナノレベルでの貢献くらいはしているのかもしれないですね。
 そうして膨らみ続けてきた日本語の用例をまとめて無料で見られるデータベースがあったので覚書しておきます。

「小納言 現代日本書き言葉均衡コーパス」

 書籍、雑誌、新聞、教科書、Yahooブログ、国会会議録などからランダムに抜き出したサンプルの文に含まれる計1億500万語(2012年3月現在)の中で指定した単語がどのように使われているかを、前後の文脈や誰が使った、いつ出版されたなどの情報がわかります。
 これは便利!
 たとえば「note」を検索すると244件がヒットしました。「DEATH NOTE」や「日産NOTE」、「NOTE PC」などの用例がその出典とともに表示されます。
 私がこのコーパスを活かすのならば、

  • 小難しい単語を検索して使い方が合っているか確認

  • 適当な単語を検索して暇つぶし

あたりかなと思います。
 たとえば、私がこのnoteの冒頭で使った「そこはかとなく」という単語を「小納言」で検索すると32件ヒットしました。引用した吉田兼好法師の「そこはかとなく書きつくれば」の一説も出てきましたし、「そこはかとなく醸し出している」、「バジルがそこはかとなくマッチしております」「炊き込められた香が、そこはかとなくにおい、」など実際に使われた場面がわかりやすく表示されます。 

この単語ってみんなどうやって使っているんだろうという疑問に数秒で答えてくれるコーパスでした。

いいなと思ったら応援しよう!

たかみいと
気に入っていただけたらサポートお願いします。いただいたサポートは子供のオムツ代にさせていただきます。