エンジニア女子が触れているプログラミング言語の傾向をPythonを使って分析する - (エピソード4)
Google Spreadsheetsを使って気軽にデータ分析
前回の続きとなります。
前回作成したCSVファイルをgoogle spreadsheetsにimportして、分析を行っていきましょう。
Google SpreadsheetsにCSVをimportする方法
あなたのGoogleアカウントでGoogle Driveを開き、ファイルからインポートを選択します。
インポート画面からアップロードタブを開いて、前回作成したCSVファイルをドラッグ・アンド・ドロップで移動させます。
その後、諸々オプションを聞かれますが、後は適当で良いと思います。
私は下記のようにしてインポートを行いました。
最終的には下記のようなシートが出来上がります。
実に簡単ですね。
エンジニア女子の関心事をspreadsheetを眺めながらピックアップしてみる
このspreadsheet、眺めているだけでもなかなか興味深く面白いので、少しそちらについて書いてきます。
と、同時に明らかに対象外な行や不要そうな行の削除もどんどん行っていきます。
今回ぐらいの情報量だとこういう細かな処理は人の手でサクッとやってしまったほうが楽ですね。
(いちいち不要な行を削除するのが面倒だったので、途中から行の内容だけ削除して、空白行をフィルタして削除するという方法をとっています)
エンジニア女子は絵文字を多用したレビューをしている?
レビューは絵文字や顔文字多めでやり取りをしているということでしょうか?相手へ与える印象も変わってきますし、こういうのって大事ですよね。
エンジニア女子がRuby on Railsを好きな理由
ココらへんの流れはとてもわかり易いですね。Rubyの魅力的なところは記述が簡単・シンプルなところ。納得です。
王様達のヴァイキングやハルロックがお好き?
どちらもエンジニアだったら、興味持って読めるコミックスですよね。
隠れちゃっていますが、トイボックスシリーズという単語もあり、これは本格的なソフビトイらしいです。私は初めて知りました。
こんな感じで抽出した単語を眺めているだけでもなかなか面白いです。
(結構量があるので、ひとまずココらへんにしておきます。)
他にもQiitaやstack overflow、機械学習、フルスタックエンジニア、Evernoteなどなど、Tech系を中心としながらもバラエティに飛んだ単語が飛び交っていました。
あと、ちょっと余談ですが、ジャネット・カーディフも出てきていました。私も好きなアーティストの一人なので、お!と思いました。
単語の出現回数をまとめる...のだが
不要な単語を削除し終えたら、各単語ごとの出現回数を集計するだけです。
...が、今思ったのですが、各単語ごとに記事内での出現回数はまとめられているのですが、それらの数値も込みの上で、各単語ごとの出現回数をすべてまとめるのはそれほど簡単ではなさそうなことに気づきました。
Spreadsheetに書き出したのは、重複する単語を集計する計算式をシート状に記載して、簡単に単語の出現回数をまとめたかったというのもあります。
少なくとも1単語1行、という形でspreadsheet上に記載されている方が集計はとても簡単です。
そのため、一度やり方を変更します。ここまでやっておいて申し訳ない😢
というわけで、次回に引き伸ばさせてもらいます。