RippleのCEOがツイートしてきたことってこんなこと!ど素人がツイートを集めて、テキストマイニングしてみた。
今回は機械学習の手法の1つであるテキストマイニングを使って、RippleのCEOであるBrad Garlinghouseさんのツイートを分析した話です。
えー興味ないわって方はスルーしだされ。。。
昨年、大いに世間を盛り上げた仮想通貨。今年は昨年の水準から値を下げているものの、多くのプロジェクトが進行しており、どれが生き残るのかサバイバルの年だともいわれていますね。どれが生き残るんでしょうか。。。
そんな中、SBIバーチャル・カレンシーズが正式に仮想通貨の現物取引サービスを始めました。現在の取り扱いはXRPだけですが、将来的にはBTCとBCHも購入できるようになるとのことです。
XRPはリップルというRipple Inc.によって開発された送金・決済システム(RTXP)で利用される仮想通貨です。韓国と日本で多く買われているんですよね。XRPを推している人をリップラーと呼ぶ人もいます。
私はリップルの技術に大変興味がありまして、Ripple Inc.の代表であるBrad Garlinghouseのツイッターのアカウントをフォローしているぐらいです笑
次は何をするんだろうかって、時々、ツイッターとかで確認しちゃうんですよね。
で、思ったんですよ。いちいちツイッター見るの面倒くさくないかと。。。文章じゃなくて、イメージでぱっと見られないかと。。。
で、Google先生に聞いたんですよ。
そしたら、見つけました。
これだ!テキストマイニングだ!よく分からんけど。。。
テキストマイニングって大量の文章から有益な情報を抽出する手法として注目されています。今回はその中でも文章データに含まれる情報を整理し、可視化できる「WordCloud」を使うことにしました。
WordCloudって、文章中で出現頻度が高い単語を選んで、その頻度に応じた大きさで図示する手法のことですね。だから、出現頻度が高いと、その単語が多く使われているってことです。
やることは2つ。
1.Twitterからツイートデータを収集すること。
2.そのツイートデータをWordcloudで可視化すること。
さっきの文系女子と理系女子のやり方を踏襲してトライした結果、、、
できましたよ!!!
それが、、、こちら!!!
RIPPLE、XRP、BANK、PAYMENT、、、
Ripple Inc.が目指している世界をBrad Garlinghouseさんがツイッターで発信している、ってことが再確認できました。
やはり、SECは気になっているようですね。
ちなみに、収集したツイート数は1,187件です。
リツイートは除外しています。
さらに、RippleのアカウントのツイートのWordCloudがこちら!
ちなみに、収集したツイート数は2,377件です。リツイートは除外しています。
そして、Ripple Inc.のHPをworldcloudで可視化したものがこちら!
最後に、自分の作業を振り返ってみて、参考になった先をご紹介しますね。
↑分かりやすかったです。
正直なところ、↑が最も簡単でした。Twitterのデータ収集が出来て、感動しましたよ(笑)
あ、あと、Wordcloudはネットで無料なサービスがありますので、それ使えば良いんじゃないかなって思います。どうしてもコーディングしたいんだって人以外は使った方が時間節約できます。
大事なのは、Twitterのデータを収集できるかどうかだと思います。収集さえできれば、Excelやらcsvやらで料理できますからね。
収集してくれるツールがないので、こればかりは自分でやるしかないです。
もし、あったら、教えてください。。。
ツイート分析したいアカウントがまだまだありますので、これからその投稿増えたらすみません。。。
いずれ私がこれまでに参考にしてきた書籍やWebサイト等をブログで整理する予定です。出来たら、お伝えしますね!
あ、Twitterやってますので、良かったらどうぞ。
Twitter(こげぱん@kosupasaikyo)
日々の工夫でハッピーに!