見出し画像

日本語コーパスの面白さに開眼!―『日本語コーパスの世界へようこそ』を読んで

私は英語史を専門的に研究していますが、ゼミなどで英語史について話していると日本語の問題に議論が発展する機会が日に日に増してきているように感じます。「増してきている」というよりは、意図的に「増やしている」と言った方がよいかもしれません。というのも、『言語の標準化を考える―日中英独仏「対照言語史」の試み』(2022年)の出版以降、今日の学界では言語を横断した視点がこれまで以上に求められていることを強く意識し、英語史の諸問題を考える際に「日本語ではどうなんだろう?」と日頃からよく考えるようにしているからです。私のゼミにも、日英比較の観点を取り入れた通時的な研究に興味を持っている学生がいます。このような背景で、そろそろ本格的に日本語学・日本語史について学び始めなければと考えていました。

そんなタイミングで、とてもわかりやすい日本語コーパスの入門書が出版されました。砂川有里子先生の『日本語コーパスの世界へようこそ―気になる言葉の使い方を調べてみよう!』です。本記事では、英語史研究者の立場から本書の内容と魅力をお伝えできればと思います。

本書の内容

本書は複数の日本語コーパスを駆使して、日本語の変異や変化に関する様々な興味深い問題を考察している本です。出版社のホームページから、本書の概要を引用します。

言葉のデータベースで発見 日本語の面白さ

「海外」と「国外」は違う? 「就活」「婚活」などの「◯◯活」にはどんなものがある?――身近な日本語がどのように使われているかを、言葉のデータベース「コーパス」を活用しながら解説。日本語の意外な一面を楽しみながら、コーパスの最も基本的な使い方をマスターできます。「はじめてのコーパス使い方ガイド」付き。

https://www.taishukan.co.jp/book/b648183.html

以下に示した通り、とても幅広い項目が扱われています。

1 「きらきら」と「キラキラ」
2 無意識に使ってしまう「~てしまう」
3 「○○音痴」と「○○外れ」
4 「○○活」と「○○感」
5 逃亡先は「海外」か「国外」か
6 オネエ言葉と女言葉
7 「男」と「女」の描き方
8 職場で人を何と呼ぶ?
9 「うそだい!」 は古めかしい?
10 「全然」と「全く」

目次から作成

本書の魅力

英語史研究者として私が気に入っている本書の特徴は、私達にとって身近な言語である日本語の豊富な事例を通じて、言語研究、とりわけ史的研究において極めて重要な視点を身につけることができる点です。本書に通底しているのは、私も常に大切にしている、共時的な変異通時的な変化への強い意識です。具体的には、言語と社会言語学的・語用論的要因の関係(世代差・性差、使用域、発話者と聞き手との関係など)、言語への人々の態度と言語使用の実態、言語の通時的変化(意識にのぼりにくい文法変化を含む)など、英語史研究においても重要視されている分析上の視点がふんだんに盛り込まれています。

例えば、第8章の「職場で人を何と呼ぶ?」は、「おまえ」や「きみ」のような2人称代名詞を、場面や話者の性別、相手との関係性などの観点から論じています。このような社会言語学的・語用論的な視点は、英語史研究上もっともポピュラーな研究テーマの一つである2人称代名詞のthouとyouの交替を理解する際にとても重要です。

個人的には、「~わよ」の使用に見られる世代差の問題が扱われている第6章「オネエ言葉と女言葉」が一番の盛り上がりポイントでした。言語使用の世代差は、ゼミでもよく議論しているトピックです(以下のnoteにゼミでの議論の様子をまとめています)。

また、本書には随所にコーパスの手ほどきがあるので、実際に検索し、使い方に習熟しながら読み進めることができます。以下は、「婚活」や「朝活」などの「名詞+活」の組み合わせをNLT(後述)で調べた結果です。本書のおかげで初歩的な検索ができるようになりました。

このような理由で、本書は日本語学を専門としている方のみならず、英語学・英語史の分野で研究を始めようと考えている学部生にも強くおすすめしたい一冊です。(ゼミ生にも是非読んでもらいたい!)

日本語の様々なコーパス

以下、本書で活用されているコーパスを、提供ウェブサイト毎に紹介します。

少納言
気軽に日本語コーパスを使ってみたい人におすすめです。登録不要で『現代日本語書き言葉均衡コーパス(BCCWJ)』が気軽に使えます。

中納言
会員登録することで、日本語の様々なコーパスが利用できるようになります。少納言よりも多機能な検索インターフェイスが特徴です。以下、利用できるコーパスの一覧です。

<書き言葉>
現代日本語書き言葉均衡コーパス(BCCWJ)

<話し言葉>
日本語話し言葉コーパス(CSJ)
日本語日常会話コーパス(CEJC)
昭和話し言葉コーパス(SSC)
名大会話コーパス(NUCC)
現日研・職場談話コーパス(CWPC)

<通時>
日本語歴史コーパス(CHJ)
昭和・平成書き言葉コーパス(SHC)

<方言>
日本語諸方言コーパス(COJADS)

<日本語学習者>
中国語・韓国語母語の日本語学習者縦断発話コーパス(C-JAS)
多言語母語の日本語学習者横断コーパス(I-JAS)
北京日本語学習者縦断コーパス(B-JAS)

YouTubeの国立国語研究所 言語学レクチャーシリーズに、日本語話し言葉コーパス(CSJ)と日本語歴史コーパス(CHJ)について解説している動画がありましたので、リンクを貼っておきます。

NINJAL-LWP for TWC(NLT)
インターネット上の記事を収録した11億語の規模を誇る『筑波ウェブコーパス(TWC)」が使えます。コロケーション検索と2語比較機能が特徴です。

NINJAL-LWP for BCCWJ(NLB)
少納言や中納言からも利用できる『現代日本語書き言葉均衡コーパス』をNLTと同じインターフェイスから利用することができます。

おわりに

本書のおかげで、日本語コーパスの初歩を学ぶことができました。なにごとも「習うより慣れよ」だと思うので、これから日常的に利用し様々な活用法を学んでいきたいです。また、専門的な書籍も読み、目的に応じて様々なコーパスを縦横無尽に使えるようになっていきたいと思います。日本語学に関しては完全な素人ですが、今後note上で活用事例を紹介できればと思います。私の地元の方言である茨城弁の話題をお届けする際には、日本語諸方言コーパス(COJADS)が役に立ちそうです。


この記事が気に入ったらサポートをしてみませんか?