データ分析でデータの海に埋もれないために気を付けていること
仕事で多くのデータを扱い、整理した上で示唆を出すことを求められる場面がよくある。
その際に絶対に忘れないようにしていることは、「データをいじくり回す前に仮説を立てること」だ。これが唯一の鉄則で、この決まりごとだけは破ることがない。
この鉄則を破ったときは大体データの海に埋もれてしまい、酷い目にあう。データを見ると、反射的に「まずはちょっと見てみて…」と少しのつもりでいじり始めてしまう衝動は今でも感じることはあるのだが、これをやったらおしまいである。
仮説を最初に立てるべき理由は単純で、仮説を立てておかないと、データというものは際限なく分析できてしまうためだ。仮説という向かうべき方向を自分の中で立てておくことで、「仮説を裏付けるためにデータを分析する」ことのみに自分の労力と時間を投入することができる。
ではここで言う「仮説」とは何なのかというと、簡単に言えば「こういう結論を出すために、多分こういうデータがあって、こう分析できるはず」と先に考えておくことだ。最初はデータを見る前に仮説を立てることに脳みそが強い抵抗を示すし、仮説が外れることも多いのだが、何回かやっていると大体コツが掴めてくる。
こういったやり方では、データを恣意的にピックアップして見るだけであり、数字に詳しくなれず、数字を見る感覚を養うことができないという指摘もある。ある面では正しい指摘だが、そもそも目的が異なるのだということを忘れてはならない。つまり、「まずデータを触る」のは当該データの細かなところまでいじって詳しくなることには寄与するかもしれないが、「仮説を立ててからデータを触る」のはデータを使って有効な示唆を出し、意思決定上の強力なサポートとすることを目的としているのだ。
データを効率よく役立てるには、まず仮説を立てる。それからデータを触る。この順番が大切である。