ドローンのニュースは新しくて興味が惹かれるが、無意識のうちにネガティブになる?テキストマイニングで分析してみました!
皆様、おはようございます。
空道黎明館のくぼーんです。
本日は、テキストマイニングについてお話をしたいと思います。テキストマイニング(英: text mining)は、文字列を対象としたデータマイニングのことです。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す方法です。
空道黎明館では、多様なドローン情報源や膨大なドローンニュースを収集し、「おもしろい」 or 「役に立つ 」と判断したものを抜粋してWEEKLYレポートにまとめています。
先月から始めた取り組みですが、サンプルデータ(175本)も集まったので、一度分析してみようというのが今回の狙いです。UserLocalさんが提供しているテキストマイニングツールを使って、いままでの記事を分析してみました!
自分の記事だけでは偏った見方になりますので、比較用として、ビジネス用のニュースを配信しているドローンニュースさんの記事を分析してみましたところ面白い結果が得られました。
1.ワードクラウド
最初は、『ワードクラウド』です。文書中に出現する単語の中から特徴的な単語を選び出す手法です。当たり前ですが、圧倒的にドローンが多いですね。
2.単語出現頻度
単語出現頻度では、『ドローン』で『できる』までは共通で1位ですね。動詞には、使う、行う、飛ぶなどの実用的な言葉が並びますね。形容詞には、差が出ていますね。空道黎明館は、主観的な要素が大きいので、『楽しい』が一番になっています。共通する形容詞は『新しい』ですね。ここは直感とデータが一致しますね。
3.共起キーワード
文書中に出現する単語の出現パターンが似たものを線で結んだ図です。空道黎明館は、海外サイトの情報が入っていますので、ドローンとDroneで中心点が2つある構成になっていますね。ドローンニュースさんは、ドローンで『できる』ことが中核になっているようです。ビジネス用ですから、予想通りですね。
4.2次元マップ
2次元マップもありましたが、いまいち関連性が見えませんでした。
5.係り受け解析
ここは『ポジティブ』と『ネガティブ』に大きく別れました。バイアスがかかっていますね。直感で主観的な情報を発信する空道黎明館と、客観的かつ中立的な立場を取るドローンニュースさんでは対極な結果になりました。おおもしろいですね。
6.階層化クラスタリング
階層化すると、面白い結果になりました。空道黎明館は、ドローン=DJIと思っているようです(笑)パロットも好きなんですけどねw ドローンニュースさんのクラスタリングは論理的ですね。情報処理のお手本のようです。
○総括:ドローンを持って、ソトに出よう!
総括すると、ドローンのニュースは『新しい』ものが多いので、知的好奇心がそそられて注目しやすい。しかし、メディアは客観的かつ中立的な立場で情報発信をするため、『難しい』のようなネガティブな単語が無意識にインプットされる。
行動につなげるためには、ドローン好きな人が集まる場所に行ったり、ドローンを楽しんでいる人に話を聞いたり、ドローンを飛ばしに行くことである。ドローンを持って、ソトに出よう! 外へ、さらに外へ!
いかがだったでしょうか。テキストマイニングおもしろいですね。
くぼーん自身、自分の情報発信にバイアスがかかっていることを知る良い機会になりました。ぜひ皆様も試してください!
それでは、ご安全に!