データ分析の初心者はQGBマトリクスを覚えよう - 前半
こんにちは
Hikaru Kashidaです。
僕が誰かというと、2018年時点ではざっくりこういう者です。
Twitter / 取材1 / 取材2 / 取材3 / 登壇1 / 登壇2
前回は分析と水曜日のダウンタウンについての記事を書きました。
第2回目から、実際の分析業務の話を若干離れ、何故かバラエティ番組の話をアツく語ってしまったわけですが、特に反省はしていません。水曜日のダウンタウンの視聴率にわずかながらでも一助となっていれば幸いです。
今回の記事について
さて、うって変わりまして第3回目の今回は、本当はもう少し実際の分析業務に役に立ちそうなPracticalな話をしようと思います。そういった内容の方が世間的にもニーズがある気がしています。
ということで第1回の記事で書いた下記ステップの中で、Step4-5あたりと関係する話をしようと思います。
[ おさらい ] 分析には次の5つのStepがあります
step① 解くべき問い(知りたいこと)を見つける
step② AoB問の形に落とす
step③ そのAoB問にどうすれば解を出せるかを定義する
step④ 必要な数字を揃えAoB問の解を導出する ←こことか
step⑤ 解となる情報を説明可能な形に落とす ←こことか
具体的にこの記事で扱うのは、分析作業と可視化に使える考え方のフレームワーク『QGBマトリクス』の紹介です。ちょっと長くなりそうなので、前半と後半に分けてお送りします。
※ QGBマトリクスは完全に僕が適当に考えた造語です。
第1回目に出てきた造語『AoB問』と一緒に覚えておいてください
今回の話は、データ分析の仕事を日常的に行っている人は、普段はほぼこの考えを無意識のうちに実践していると思います。ですので、そういった方々にとっては特に新しい発見と呼べるほどのものは無いかもしれません。
この記事の対象としては、次のとおりになります。
■ データ分析をそこまで日常的に使っておらず、この期にどういう風に考えたら良いのかを身に着けたい人
■ データ分析をそこまで日常的に使っているが、自分の仕事のプロセスを言語化してちゃんと理解したい人
それでは始めていきます。
データ分析作業でやっていること - 『QGB』の選択
さて、まずQGBとはなにかから簡単に話した方がよいかもしれません。
下記の図を見てください。データを分析するときは、次のような選択が皆様の脳内で行われているはずです。
すなわち、
- データを『数字』と『わけてみる単位』に分類して考える
- それらから、X軸とY軸(もしくは色など)を何にするかを選択する
- グラフなどにしてデータの結果を解釈する
というプロセスです。
ここで『数字』をQuantity Unit (QU)、分ける単位をGroup By Unit (GBU) と便宜的に呼んでいます。
これらの2つの分類については、統計学の正式な用語で『質的変数』『量的変数』という呼び方があります( 参考⇢総務省統計局HP )が、僕はこの呼び方があまり使っていません。
ちょっと堅い感じがするのと、質/量の感じが若干かたちが似ていて、パッと見たときに直感的に紛らわしいからです。
ということで、QU/GBUという造語を勝手に作り、これらを合わせて『QGB』と呼ぶことにします。
GroupByという言葉は、"SQL" や 計算機科学用のプログラミング言語Python(のPandas)を使っているかたにはお馴染みの言葉ですよね
『QGB選択』の例
さて、もう一歩具体的に見てみましょう。
仮にあなたの会社が世界的に商品を販売するメーカーで、『国内市場と海外市場のどちらにより注力しようか』という議題を抱えているとします。
これを第1回目に出てきた『AoB問』の形に落とすために、事業部長にヒアリングして、『注力する市場の条件』を聞き出したところ、次のような前提条件があることが聞き出せました。
・注力すべきは、自社の売上が伸びている市場である
この前提に立つと、解くべきAoB問を以下のように設定できそうです。
自社の売上が伸びている市場は『国内』 or 『海外』?
この答えとして簡単なファクト提示しようと思ったら、例えば次のようなグラフを作るかもしれません。ここでは、少し気を利かせて海外市場は、Asia/Americaを分けて出してみています。
・QU として 『売上の成長率』 を選択 ⇢ Y軸に
・GBU として『国内 or 海外』を選択 ⇢ X軸に
・GBU として『市場のリージョン』を選択 ⇢ 色分けに
このようにQGBの選択が行われ、最終的なグラフのアウトプットになっていますね。
QGB選択について更に理解を深める
QGB選択の例題としては上記で十分ですが、ここでもう一歩進んでQGBのことをより深く理解しておきましょう。
把握しておきたいポイントはふたつです
① AoB問の内容とQGBの選択が密接に絡みあっている
② 可視化にQGBを いくつ、どのように" 選択するか、のバラエティ
さてさて、これが実務だとしたらみなさんは上で書いた、事業部長の『注力する市場の条件』に違和感はないでしょうか?
・注力すべきは、自社の売上が伸びている市場である by 事業部長
もしパッと思い浮かばなかったという方は、少し考えてみてください。
この前提条件は本当に正しいのか?と考え続けることが、AoB問デザイン力のアップにつながります。
--Thinking Time--
いかがでしょう?
まあ正直ツッコミどころは色々とあるのですが、ひとつの大きそう問題としてあるのは、『1億⇢1.5億の50%成長と、100億⇢110億の10%成長』をそれだけで比較しても本当によいのだろうか? というものでしょう。
普通に考えるとダメそうな気がします。
AoB問に応じてQGBを調整する
この点を事業部長に詰め寄ったところ、次のような考え方の前提条件があることがわかりました。
・業績のインパクトを考えると売上が50億以上の規模のところに注力したい
こういった追加の情報の後出しによって分析をやり直ししなければならなくなるのは、実業務では『あるある』です。
データアナリストとしては、最初に念入りにヒアリングするようにするか、後出しが多すぎるタイプの人とはあまり働かないようにしたいところです。
ともあれ、AoB問を次のように変更して分析をし直すことにしました。
売上が50億以上が見込めて、売上がもっとも伸びている市場はどこか?
このAoB問に答えるためには、少なくとも『現状の売上規模』という、もともとのグラフでは使わなかった QU(数字)を新たに選択する必要がありそうです。次のような分析と可視化はどうでしょう。
グラフから、50億以上で一番伸び率が高いのは『Asia』であることがすぐにわかり、AoB問の答えとしては悪くなさそうです。
QGBの選択とグラフ化
ここで、1つ目に作ったグラフと2つ目に作ったグラフを比べてみて、それぞれどのようなQGBが選ばれているのかを見てみましょう。
この2つのグラフについて、どのようなQGBの選択が行われているのかを表にまとめました。
グラフ1ではx軸がGBUだったのに対して、グラフ2ではx軸 / y軸が両方ともにQUになっている点は注目に値します。x軸はGBUとQUの両方が選択できるため、ここをどう選択するかは分析者の力量に関わってくるポイントになります。
また、そもそも使っているQGBの種類数が、グラフ1は3種類 / グラフ2では4種類という違いもありますね。
グラフによる可視化では、頑張れば5種類のQGBを使った表現も可能ではありますが、一般的には4種類以下にとどめておいた方が無難だと思います。
グラフの種類や選択方法についてはまた別途記事を書きたいと考えていますが、今回紹介した『QGB選択』の概念を覚えておいていただけると、グラフや可視化の手法を体系的に理解する上で非常に役立ちます。
前半のまとめ
いつもどおり、そこそこ文字数が増えてきたので一旦筆を置きます。
この記事では "データ分析の初心者はQGBマトリクスを覚えよう" の前半部分として『QGB』の概念と考え方について説明しました。
後半ではいよいよ QGBマトリクス についてお話したいと思います。
次の記事でお会いしましょう!
いつも読んでくださってありがとうございます。 サポートいただいたお代は、執筆時に使っている近所のお気に入りのカフェへのお布施にさせていただきます。