見出し画像

分析スキルを付けるなら、統計学を学ぶより、街に出よう。


データ分析を学びたい若手に良く出会う。

確かに「データ分析」の響きはカッコいい。

データ分析って正しい気がするし、データの裏付けがあると言えれば、何となく正しい気がする。


そして、決まってこんな話を聞く。


データ分析のために、統計を学びたいです!

データ分析のために、Pythonを学びたいです!


うん、その気持ちは分かる。

ただ、統計学もPythonもただの分析の一手段にしか過ぎない。

そして、統計学やPythonよりも、大切だけど、誰も教えてくれない分析の思考法がある。


だから今、あなたがデータ分析力を付けたい!と思っているなら、統計学を学ぶ前に、真っ先にこのnoteを読んで欲しいし、


もし

「私、分析だからデータ分析なんて無理」

と考えていても大丈夫。

実はデータ分析に高度な統計手法なんて必要なくて、むしろ小学校の算数さえできれば、文系的な素養の方が大切だったりする。


この分析力は、全てのビジネスパーソンにとって、大きな武器にある力であるにも関わらず、実は学校でも会社でも教わることのない、いわば差を付けることのできるスキルである。


本noteでは、僕が社会に出てからも、誰にも教わることのなかった「本当に価値のある分析とは何か」について、書いている。

1.分析とは、分けることである。


Q. そもそも、分析とは何か?

データ分析に興味がある人に、この問いを行って、はっきりと答えられる人がどれくらいいるだろうか。


A. 数値を活かして、物事を証明すること。

とでも答えるだろうか。


意外なことに、分析とは何か、ほとんどの人は理解していない。

数学が得意な人でも、分析とは何かを理解していないことは、非常に多い。



そんな分析の本質とは、

分けて、理由を探ることである。


少しわからないと思うので、実際に分析をしてみよう。


Q. 下記10名のデータから法則を導け


<架空の世界です>
A男 既婚 イケメン 金持ち 優しい
B男 既婚 イケメン 金持ち 優しい
C男 未婚 フツメン 金持ち 自己中
Ⅾ男 未婚 フツメン 金持ち 優しい
E男  既婚 イケメン 貧乏  自己中
F男  既婚 イケメン 貧乏  優しい
G男 未婚 フツメン 金持ち 優しい
H男 未婚 フツメン 貧乏  自己中
I男   既婚 イケメン 金持ち 自己中
J男   未婚 イケメン 金持ち 優しい


考えていただけただろうか。



正解は、

イケメンは結婚率が高いである。


すぐに分かったのではないだろうか。


しかし、実際に生きている世界では、イケメンかフツメンかはデータ化されていない。

つまり、見えるのは下記のような世界だ。


A男 既婚 
B男 既婚 
C男 未婚
Ⅾ男 未婚
E男  既婚
F男  既婚
G男 未婚
H男 未婚
I男   既婚
J男   未婚


そう、何も分からないのである。


そして、分析力とは、この男性10名を、

イケメンorフツメンと金持ちor貧乏で分けたら結婚に大切なことが分かるんじゃないか。

と分けて、


(今回のデータの場合は、)

女性はお金や性格よりも、顔を重視する。それはすなわち、理性よりも本能の方が大切であり、モテるには容姿を1番に磨くべきだ!

と結論付けることが、分析なのだ。


つまり、分析とは、データをどう処理するのではなく、どんなデータを使うかによって決まるのだ。


裏を返せば、ゴミデータからは、ゴミデータしか出てこない。


178cm 85kg
160cm 50kg
174cm 65kg
165cm 54kg
189cm 84kg


のデータをどんなにドヤ顔で相関分析して、身長と体重に相関があることが分かりました!

なんて報告をしても、何の意味もないのだ。


そんな小手先の力よりも、


部活動で分けるといいんじゃないか。

部活動を聞いてみよう!

178cm バレー部
160cm 陸上部
174cm 野球部
165cm 水泳部
189cm バスケ部

おお!球技の方が身長が高い!

→陸上部や水泳部は、技術を磨く以上に、全身をがっつり鍛えるから、負荷がかかって身長が止まってしまうのかも。


と結論付けたり、


親の伸長で分けるといいんじゃないかな。

親の伸長を調べてみよう。

178cm バレー部 170cm
160cm 陸上部  171cm
174cm 野球部  183cm
165cm 水泳部  182cm
189cm バスケ部 170cm

あれ、あんまり関係ない?

→身長は親の遺伝子ではなく、部活動の方が影響が強かった。これは、身長は後天的に伸ばせるということではないか。


と結論付けるのが、分析力だ。


全ては、分けることから始まるのである。



2.分けて考える。

そして、分析のコツは、とにかく細かく分けることだ。


A男 既婚 イケメン
B男 既婚 イケメン
C男 未婚 フツメン
Ⅾ男 既婚 フツメン
E男  未婚 イケメン
F男  既婚 イケメン
G男 未婚 フツメン
H男 未婚 フツメン
I男   既婚 イケメン
J男   未婚 イケメン

上記のデータでは、イケメン6人中4人が既婚で、フツメン4人中1人が既婚であることから、イケメンと既婚率に何となくの相関がありそうだと分かる。


しかしながら、良く見ると、

A男 既婚 イケメン 塩顔
B男 既婚 イケメン 塩顔
C男 未婚 フツメン
Ⅾ男 既婚 フツメン
E男  未婚 イケメン ジャニーズ系
F男  既婚 イケメン 塩顔
G男 未婚 フツメン 
H男 未婚 フツメン
I男   既婚 イケメン 塩顔
J男   未婚 イケメン ジャニーズ系

だとすると、イケメンの中でも、塩顔イケメンの既婚率が高いことが分かる。


このように、より深く物事を理解するためには、分解が必要不可欠である。


もう少し実践的な分析として、Twitterのツイートを分析するとしよう。

適当に抽出した僕のツイートだ。

これらを分けると、

15いいね/50字/黒い自己開示
20いいね/57字/黒い自己開示
8いいね/101字/前向きな話
3いいね/138字/前向きな話

こんな感じで分けることができる。


そうすると、2つの仮説が浮かび上がる。

①文字数は少ない方が伸びるんじゃないか
②黒い話は受けるんじゃないか


なので、まずは直近のツイートの文字数といいね数を見てみる。

127字/0いいね
59字/11いいね
88字/10いいね
78字/6いいね
142字/3いいね

と見ると、確かに直近のツイートだけでは、文字数が小さいほうが、伸びていた。


やっぱり、Twitterって何となく見てるから、ぱっと見でも意味が分かるくらい読みやすいツイートが大切なんじゃないか。


と、これで推測ができる。

しかし、文字数が多くても、伸びているツイートもあった。

先程のツイートと比較する。


分ける。

18いいね/137字/結論が先
3いいね/138字/結論が最後


なるほど、結論が先の方が伸びている!


>やっぱり、Twitterって何となく見てるから、ぱっと見でも意味が分かるくらい読みやすいツイートが大切なんじゃないか。

→なるほど、文字数が多くても、結論先で、ぱっと見で意味が分かれば伸びるんだ!

だから、大切なのは、文字数じゃなくて、ぱっと見で何が言いたいが伝わるツイートなんだ!Twitterは、何となく見るから、頭を使わずに理解できる内容が伸びるんだ!


と、より深くまで、事象を理解することができた。


そして、ここで大切なのが、2つのツイートを見比べたときに、

結論が先か、結論が後か。

で分ける発想を持っているかであり、その発想を持つためには、普段からどんな文章が読みやすいか、しっかり考えていることが大切なのだ。


一応、別の点にも触れておくと、


15いいね/50字/黒い自己開示
20いいね/57字/黒い自己開示
8いいね/101字/前向きな話
3いいね/138字/前向きな話

→黒い自己開示が伸びている。


人間は誰しも黒い面を持っているが、隠して生きているから、誰かの黒い面が見えると安心して共感するんじゃないか。

と仮説を立てることもできる。


この一連の流れが、分析をする、ということなのだ。



3.分析力とは何か

さて、ここまで分析を事例を説明したところで、改めて分析力を振り返りたい。


分析の流れは、

①仮説を立てる
②データを集める(分ける)
③差分を見る
④理由を考える
⑤実際に合っているか確かめてみる

の5段階で決まる。


最初の例だと、

①容姿やお金と性格が既婚率と関係ありそう
②容姿やお金をデータ化してみよう
③容姿が大事だった!
④人間は理性より本能が大切なのかな
⑤ちょっとお洒落してモテるか試そう!

のような流れである。


④の段階では、まだ仮説でしかないので、実際に試してみることで、それが本当なのか分かるのである。


そして、改めてこの過程で1番大切なのが、①仮説を立てる力である。


ビッグデータを解析すれば、何となくいい感じの示唆が出てくるわけなんて、多くの場合は、ないのだ。

例えば、Twitterで最初から数値化できるデータは、

フォロワー・ツイート数
いいね・RT・画像クリック数など
文字数
投稿日時

くらいであって、これだと

「22時のツイートは伸びやすい」

のような、浅い分析しかすることができない。


仮に、Amazonのようにユーザーの行動データを大量に確保できたとしても、

「早く届く方が売れそう」
→速達便を作ってみて、行動データを貯めよう

「自分にあった本を紹介したら売れそう」
→A本購入者が他に買った本のデータを作ろう

のように、仮説があって、そこからデータを集めるのだ。


つまり、データは最初から存在せず、仮説に応じて、

「結論が先」
「結論が後」

のように分けてみよう!と、仮説に応じて作られていくのである。


例えば心理学研究では、最初からデータが存在しないから、「自己肯定感と家庭環境の相関があるんじゃないか?」と仮説が生まれて、


下記にどれくらい当てはまるか答えなさい。
「特別何かしなくても価値があると思う」
「他人に否定されてもまあいいかと思える」

のように質問を行い、データを取得し、初めて分析ができるのだ。


そして、この仮説を立てる力は、普段から分けて物事を考える癖が身についているかで決まる。


日々の生活で、

「あれ、この記事読みずらいぞ…」
「あお、この記事は読みやすい!」


だけに終わらず、こういうところが読みやすいな。読みずらいのは、

①改行がない
②言葉が難しい
③抑揚がなくて飽きてしまう

からなんじゃないか。


のように、要因を分けてみる癖をつけることで、磨かれる。

これが分析思考である。


統計学とは、

①仮説を立てて②データを集めてきた際に、③統計的にその違いを処理する方法でしかなく、④その後に理由を考えて、⑤それが本当かを確かめてみるまでがデータ分析のセットである、


それなのに、分析力を磨くために、まず最初に統計学から入ろうとしてしまう人が非常に多い。


まず、分ける癖をつける。

全ての話は、それからである。



まとめ

データ分析力を磨きたければ、統計学ばかり勉強していてはいけない。


まずは、街に出て、色んな体験をする。

映画を見たり、友達と遊んだり、新しい人にあったり、美味しいものを食べたり、ツイートをしてみたり、noteを書いてみたりする。


そうすると、データが出てくる。

映画が面白かったり、つまらなかったり、相性のいい人がいたり、悪い人がいたり、ご飯が美味しかったり、美味しくなかったり、ツイートが伸びたり、伸びなかったりする。


それら全部を分けてみる。

何が面白かったのか、相性がいい人はどんな人か、ご飯が美味しさは何なのか、食材か、調味料か、はたまた、食欲か、一緒に食べる人か、店の雰囲気か。


分けると、特徴が出てくる。

実は、ご飯が美味しいのって、味もあったりするけど、空腹か、そうじゃないか、胃腸の調子がいいか、悪いかが1番大切なのかもしれなかったりする。


本当か試してみる。

精一杯、仕事に打ち込んで、金曜の夜に安いビールと揚げ物を食らってみる。うん、美味しい。つまりは、そういうことなんじゃないか。


そうやって、今まで見えなかった世界を見にいく感性を磨くことで、何をデータ化すればいいのか分かる。

そうやって、統計オタクには気付けない秀逸な分析結果を導くことができるようになるのだ。



僕は文系だけど、多少統計学が分かる。

大学では心理統計を学んでいたから、相関とか、分散とか、誤差とか、回帰分析とか、正規分布とか、人並みには理解している。

難しい話だと重回帰分析とか、共分散構造分析とか、クラスター分析とかも、触れたことがあるし、最低限の概念も分かる。


ベンチャー企業でwebマーケティングをしているから、大量のデータも扱っている。ユーザーの行動とか、広告の効果とかを細かく見ることもできれば、属性ごとに分けて分析することもできる。


でも、実際、難しい統計学なんて、使えるけど、使ったことがない。

筋が良い仮説を立てれば、統計的処理なんかしなくても、例のツイートのように全然違う数値は出てくるし、そんなことは算数ができれば、分かる。


それよりも、「顧客の心を動く要因は、○と○と○に分けられるんじゃないか」と感性を生かして仮説を立てる力の方が、よっぽど役に立っている。



この事実に気付いているビジネスパーソンは、ほとんどいないから、この思考法で分析を行うだけで、簡単に筋の良い分析結果を出し、周りを唸らせることができる。


これが「分析力とは何か」の分析の結論だ。

この記事が参加している募集

サポートだなんて必要ありませんので、よかったら反応いただけますと嬉しいです!