エクセル(パワークエリー)の練習
知り合いの方が開催していたパワークエリーの勉強会で、教えていただいたことを試してみたく、福岡県内のコロナの新規陽性者数をオープンデータを使ってグラフにしてみました。
ゴールは、福岡県の地域ごとに、新規陽性者数の推移がわかるグラフの作成です。
ちなみに、福岡県は、北九州地域、福岡地域、筑後地域、筑豊地域の4地域に分かれてます。
この地域ごとに集計したものがオフィシャルにはなさそうだったので、今回作成してみました。
福岡県の新規陽性者数の元データはこちらから入手。
データをのぞいてみると陽性者数のデータが、まあ整備されてない。かなりのクレンジングが必要でした。
もう一つ必要だったのが、4地域と60市町村を紐づけた一覧です。
こういった基礎データはオープンデータにしてないんですね。ということで自製しました。
ここからエクセルをつかってグラフ作成に入ります。
元データは、下の図のように「地域」の情報が入っていません。(都合上不要なデータは削除してます)
今回は「地域」の情報が必要なので、一列追加を行います。具体的には「北九州市小倉南区」であれば、地域が「北九州」という情報を追加します。
パワークエリーの勉強会で勉強する前は、vlookup関数を使ってやってましたが、今回は習ったばかりのパワークエリーで実践しました
マージで、上の表(陽性者数のデータ)の「居住地」と下の表(市町村と地域を整理したデータ)の「市町村」をつなげて、「地域」が入ったデータを作ります。
結果が、下の図です。
新規陽性者のデータに「地域」を追加することができました。
次にグラフ作成に取り掛かります。
ピボットテーブルからピボットグラフを作る(詳細は割愛)と、下の図のグラフができました。福岡県の4地域ごとに、新規陽性者数の推移がわかるグラフです。
今回教えていただいたのなかで便利だと思ったのが「スライサー」という機能。
下の図では、赤の四角で囲んだ部分が「スライサー」です。
ボタンを押すと、年代ごとのグラフに切り替わります。
ちなみに、下のグラフは20代です。
上司に説明するときに、上司から「20代の状況は?」「30代の状況は?」と聞かれても、すぐに切り替えて、画面を見せることができるので、これは便利です。
BIツールだとお金がかかりますが、エクセルだけでも、ちょっとしたデータ分析ができました。
仕事で使える場面がありそうです。