
未経験からデータ分析に取り組む!第4回【データ分析で避けて通れない数字と計算の話】
こちらのブログでは、データ分析の力を身に付けるDATA Saberのプログラムに、データ分析未経験から取り組む上での学びを書いています📝
DATA Saberとは何ぞやはこちらの記事から!
Tableuを通じてデータ分析の力の習得を目指す、90日間のこの取り組みも1/3を残すところとなりました…!
前回、データ分析の何が苦手だったのかを書きましたが、
加えてもうひとつ、絶賛習得チャレンジ中の苦手分野がでてきたので、
こちらも自分の勉強もかねて書いてみます💪
もうひとつの壁
向き合っているもうひとつの壁は…数字と計算!
当たり前ですが、データ分析なので数字と計算に沢山向き合います
これが単純な計算だったら問題ないのですが、複雑な計算がどんどん増えていき、脳のキャパをどんどん越えていきます…!
それはもちろんできる幅が広がっているということでもあるのですが…!それでも苦しい…!
と、言うことで、一度自分の身近なテーマに沿って考えていきたいと思います💪
数字と計算を正しく扱うこと
これがなぜ大事なのかを、宿泊顧客の分析を例に考えていきます
例えばホテルA、ホテルB、ホテルCの3つのホテルを運営する会社で、
宿泊顧客の分析をしたいとした時に、こんなデータがあったとします

これは極端な例で、架空のデータですが、
もしも3ホテル合同で、このリゾート全体の顧客の動向(売上)を分析をしたいとした時に、ざっくり考えるならこのままでもいいんです
ただ、
例えばホテルAは大人向けの、「圧倒的な非日常感」を提供するコンセプトの高級ホテルで、

例えばホテルBはカジュアルさが売りの、「ルーズさ」が売りのカジュアルなホテルだとしたら…

売上の分析結果だけ見て、
じゃあ売り上げの少ないホテルBの利用者にもっとお金を使ってもらおう!高級プランをだそう!としても、ターゲットと不一致になってしまい、うまく行きません
それならどうするか?🤔
ここからが技術的な部分です!
データを正しく扱うためのひとつの方法として
①クエリパイプラインを適切に使う
これはTableauの計算の順番を正しく把握することです
Tableauは以下の順番で計算が行われるので、その順番を踏まえたうえで
どの項目を、どの部分に入れるかを判断します

今回のデータで言うと、分析の目的に合わせて、「宿泊先」を最優先のフィルターとして扱うのがよさそうですし、
目的が変わればまた別の項目のフィルターの優先順位を上げて対応することができそうです💡
もうひとつの方法として、
②LOD計算を適切に使う
これは計算式を使って項目を作る方法ですが、ただ単純に計算式を使うと、前述のように計算の順番がそれぞれあるので望む値が出せません
そのため、確定したい値や除外したい値は適切に計算式でくくりましょうという方法です
今回のデータで言うと、宿泊先でホテルAの顧客の売上を先にFIXEDで抽出して、

その項目を使ってホテルごとの売上を出す&ホテルごとの前年比の売上と比較する…というような計算ができるようになります
このような技術を使っていくと
・ホテルごとの顧客の売上を前年比と比較してそのホテルらしい施策を考える
・どのくらいの日にち間隔で2回目の来訪に繋がっているのかを、ホテルごとに確認
・年代別でどのホテルの利用傾向が多いのか、また前年と比べて増減はあるのかを分析する
というような複雑なデータ分析を行えるようになります
(のでがんばって習得したいです!)
※LOD計算、理解のため、こちらの記事を参考にさせていただきましたm(__)m
データの便利なところと怖いところ
計算式やクエリの順番を覚えることは馴染みがなく、苦手な部分ではありますが、
このような技術を使うことで、新たな発見を得られるようなビジュアライゼーションを作る事、データドリブンな考え方に繋げていく事、そういったやりたいことに繋がっていくので乗り越えていきたいと重います💪
ただ、同時に実感してるのはこの計算を間違えると簡単に見当違いな値が出てきてしまうということ…!😱
かつ、アウトプットのvizは視覚的に分かりやすい形になってるので、間違いに気づくのが難しくなるかもしれません…
だからこそ、技術を自分の言葉で説明できるまで落としきることが大事!
そういったリスクも念頭に置きながら、きちんと数字と計算に向き合っていきたいなと感じてます💪
90日間、最後まで引き続きがんばります!💪