見出し画像

Base Ball Bearの歌詞をPythonでワードクラウド画像にしてみた

初めに

こんばんわ、クマネキンです。
普段は、Twitterにて、音楽垢のつもりで作ったアカウントで、Base Ball Bearについてのツイートをしています。

設定されていないアイコン、最低限の記載しかないプロフィール、いかにもお高くとまった感じに思わせて

謎の理由で推し武道を読み始める始末です。(なんだこいつ)


ちなみに、現在社会人をしております。
仕事にてまったく必要はないものの、データ整理とかPythonを使えると後々便利だな、と思い、先行投資的に、勉強を始めました。
しかし、ネットに落ちてるコードをコピペしたら大体うまく動くので、やめました。(本当になんだこいつ)

ワードクラウドの紹介記事に出会う

通勤中、ネットサーフィンをしていると、こんなサイトに出会いました。

https://qiita.com/yuuuusuke1997/items/122ca7597c909e73aad5

嵐のファンの方が書かれている記事。
ざっくりいうと「①嵐の歌詞をネットから引っ張ってきて」「②単語の数を並べて」「③WordCloud画像を作成」というもの。
WordCloud画像とは、頻出する単語が大きく画像に写っているニュースとかでよく見るアレです。
要はこれをBase Ball Bearでやってみたくなりました。

結果


できました。(驚きのスピード感)


いや、自分も、この手のプログラミングの記事によくある、ソースコード解説をしてみたかったんですけどね。
どや顔で、「ここだけ、この関数を呼んでる(キリッ」、みたいなことをしたかったんですがね。いやね。

参考にした嵐の方のコードの値を変えるだけで、作れてしまった。

ので、話すことがありません。ふえぇ…。
ので、結果だけ載せておきます。

無加工版

結果画像(無加工)

パッと見た感想として、「てる」とか「する」とか意味のない単語が多いような気がします。
まぁ「愛してる」「曖してる」で「てる」が多くなるのは納得…、なぜか悔しい。

ちなみに、集計対象に「海になりたい part.3」は含まれていません。念のため。


無意味ワード除去版

デフォルトのソースコードでは、無意味そうな単語('そう', 'ない', 'いる', 'する', 'まま', 'よう', 'てる', 'なる', 'こと', 'もう', 'いい', 'ある', 'ゆく', 'れる')を除去する1文が追加されています。その結果がこれです。

結果画像(無意味ワード除去)

何かを感じてください(丸投げ)

まぁ、やっぱり「僕」「君」がでけぇ。
個人的に、ベボベの歌詞は一人称、僕が多いというイメージを持っていましたが、文字の大きさからして、「僕>俺」のイメージは定量的だったようです。

「MAY CRY」とか「それfor」とかリフレインされるフレーズが、以前と変わって出てきたように思えるのもポイントです。
ただ、付記したいのは「それfor」と「forそれ」が別カウントだったりして、歌詞の後の形態素解析に何か起きているんじゃないか、と推測ですが、目は瞑ります。。。

無意味ワード+「僕」「君」除去版

こういうところでオタクを出していく。

https://e.usen.com/archive/sub-archive/37224.html

集計対象にはもちろん、インタビューで触れている「ドライブ」以前の曲も含まれていますが、まぁ、そもそもこのnote自体、やってみただけの記事なので、結果を「ふーん」と眺めて楽しければいいかなくらいのスタンスです。
そんなわけで載せておきます。

結果画像(無意味ワード+「僕」「君」除去)

何のッッッッッッッッッ!!!!!!!!

いや正確には「何」「の」が並んでいるだけですが、ピスタチオみたいになってしまいました。
ただ他の単語で前回の画像と比べると、あまり大きくならなかったものや、逆に想像より大きくなっているものもあり、
「結局、ワードクラウドってどうやって作られてるん?」という疑問を抱く結果となりました。南無三。

終わりに

結局うやむやな結果になってしまいましたが、以上です。
正直、ワードクラウド以上に、「Webスクレイピングのいろはを学べたこと」がやってよかった点かなとおもいました。

あと、ある程度クレンジングすると「誰」「何」という単語が出てきました。ベボベが歌っていることの一つに「普通」というテーマがあり、それは「書籍版バンドBについて」の記載に明るいですが、そうしたものを投げかけたい、という意思が単語の頻出度にも出ていたのかな、と推測。
……ですが、まぁ、これは他のアーティストでも同じことが起きそうなので、個人的な感想としてとどめておきたく。

副産物


そんなところで、記事を終えたい、わけなんですが、実はやりたいことがまだ残っているので、ベボベとPythonの記事はもう少し続きます。

いいなと思ったら応援しよう!