
テキストマイニングで文字情報を分析&分かりやすく可視化!
最近メディアで「テキストマイニング」という分析手法を利用した記事を見かけるようになりました。
「テキストマイニング」とは、文章に出てくるワードの「出現頻度」や「特異性をスコア化した数値」などをもとにした分析手法で、アンケート分析や口コミ分析、SNS分析に使われる手法です。
一見難しそうに見えますが、文字情報の統計なので数字情報よりもわかりやすいですし(数値の方が得意!という方もいるかもしれませんが)、無料のツールなどが存在しますので、文系出身の方でも無理なく分析できる手法です。
マーケティングやアンケート分析など様々なシーンで使えますので、是非多くの方に知っていただきたく、今日は記録します。
テキストマイニングとは
テキストマイニングとは、冒頭でも記載した通り「文章を分析する手法」です。
テキストマイニング(英: text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である[1]。
(Wikipediaより)
視覚的に見た方がわかりやすいと思うので、ユーザローカル社(後述)のツールで分析した「ワードクラウド」「単語出現頻度」「共起ワード」を以下に添付します。



こちらは私の9月のnoteの投稿内容を分析したものなのですが、スコア(言葉の特異性)をもとに文字の大きさを表現した「ワードクラウド」を見れば、どのような特徴があるのか視覚的にわかりますし、またそのインプット情報となった「単語出現頻度」を見れば、どの単語がよく使われているのか分かると思います。
また「共起ワード」を見れば、その単語がどのような単語と一緒に使われているのかを知ることができ、文章の傾向を掴むことができます。
テキストマイニング活用事例
私はこれまでにテキストマイニングの手法を使って以下を実施しました。
・育休取得中の人の毎月の振り返り内容を分析し、コミュニティ内で共有
・ワーママ、プレワーママの復職に対するアンケートを実施しその内容を分析し、復職予定のワーママを対象にしたイベントを企画
分析することで、育休取得者やワーママの思いが手にとるように分かったのが記憶に新しいです。
またその内容を育休コミュニティ内のメンバーに共有することで「共感」や「気づき」が得られたのもとても良かったです。(分析結果が理解しやすいので、仲間にもスっと受け入れられました。)
あとこれは誰にも公開してないですが、毎日書いてる日記を1ヶ月単位に分析にかけて、個人的な振り返りをしていました。
分析することで自分がその月何を気にかけていて、どう思っていたかが手にとるようにわかり、とてもよい気づきになりました。
ユーザーローカルのテキスト分析ツール
私が利用しているテキストマイニングのツールはユーザローカル社の「AIテキストマイニング」というツールです。
こちらユーザ登録(無料)をすれば20万文字まで無料でテキストマイニングを行うことができ、また分析結果のビジュアライズも分かりやすくおすすめです。
なお使用は無料ですが、分析した結果を新聞・雑誌などで掲載する際はユーザローカル社に事前連絡が必要です。
※玄人向けにはKHコーダーというものがあります。参考までに。
終わりに
私も初めてテキストマイニングと出会った時は、自分に使いこなせるかなと不安でしたが、とりあえずテキストデータを収集しツールにかけて分析してみると、できました。
もちろんユーザローカル者のツールがとても使い勝手が良いところもありますが、意外ととっつきやすいテキストマイニング。是非気になる方はトライしてみて欲しいと思います。
なおテキストマイニングについて勉強したい!という方は、こちらの和からさんの講座がおすすめ。(無料講座もあり)
それではまた明日。