
初心者がtwitterのタイムラインの単語出現頻度を可視化する。[Python]
Twitterのライムラインにはマーケットに参加する人たちの欲と恐怖が現れるといわれています。上昇時には強気な言葉が並び、下落時には弱気な言葉並ぶのでしょうか。自分のtimelineをpythonのWord Cloudライブラリを使って単語の出現頻度を可視化をしてみました。以下が結果です。
逆イールドのニュースが出る前のデータですが、自分がフォローさせていただいているユーザーさんの興味関心が表れているかな、、という結果です。
フォローさせていただいているユーザーさんのプロフィール欄の言葉で可視化をかけた結果は以下の通りです。
投資、FX、先物、トレード、経済、金融、報酬、勉強、研究 などに興味持たれている方をサポートさせていただいているのが分かります。金融関係にユニバースが絞られている・絞っているのが視覚的に分かります。
実は以前、似たような事をやったことがあるのですが、その時は文節くぎりとか単語の品詞分解のモジュールの「MeCab」(形態素解析エンジン)がうまく使えなくて、途中で挫折してしまいました。今回は「janome」を用いての単語分割にしたのですが、思いのほか簡単にできて、前もこれを使えばよかった。。。と思っている次第です。
ただ、それ以外にも
・金融のセンチメントを測るなら英語でやるべきではないか。
・雨が降れば、傘は売れるが、傘が売れたからといって、明日雨が降るかはわからない。
(金融危機が起これば不安なつぶやきが増えるが、不安なつぶやきが増えたからといって、金融危機が起こるとは限らない。)
という理由で、あまり深くはやりませんでした。ただ、少し、思うこともあり、再度やってみるかなと思った次第です。
という、気持ちでいっぱいですが、汗、ちょっと面白いことでもわかるといいなと思っています。
もし役に立った、もっと知りたい、ほかの人にも伝えたい!と思えたら、このnoteのフォローと、ツイッターで@AnalyseTfフォローしてくれるととてもうれしいです!
###追記分###
pythonで資産運用モデルを作成する記事をまとめました。もし興味を持っていただけるなら読んでみてください。
いいなと思ったら応援しよう!
