「データ分析」は何のためにやるの?
初めまして、「しんゆう」といいます。「データ分析とインテリジェンス」というブログを書いています。
ブログはわりとデータ分析で仕事をしている人向けになってますが、Noteではちょっと芸風を変えて、もっとたくさんの人にデータ分析のことが伝わるような話を書こうと思っています。
データ分析って何のためにやるの?
第一回は、「データ分析って何のためにやるのか」というお話をしたいと思います。
「データ分析」という言葉は特に最近のデータサイエンティストや人工知能のブームとも合わさってよく聞かれるようになってきた言葉ですが、では何をしているのでしょうか。
結構人によって答えが変わると思います。「データ分析とは」で検索するとたくさんの結果が出てきますが、その中からいくつか拾ってみましょう。
・データ分析とは価値のある意味を見出すこと
・データ分析とは「仮説思考」を円滑に回すために存在する
・統計学や機械学習を使って大量のデータを処理すること
ちょっと調べただけでもいろいろな定義が出てきますが、この中にあなたの考える「データ分析」はありましたか。
これらが間違えているとは思いませんが、「データ分析」の一面だけを捉えているように思えます。
では、「データ分析」って何なんでしょうか。
データ分析は「意思決定のため」
最初に結論を言ってしまいましょう。「データ分析」とは「意思決定のため」に行うことです。もっと正確に言うと
「データ分析とは、意思決定の不確実性を減らすための試みである」
ということができるでしょう。
言い換えると、誰の意思決定のためにも使われないような「データ分析」というのは意味がないと言ってもよいわけです。
もちろん趣味とか学術的な発表は話が別です。私自身も書籍やニュースやブログを読むことを楽しんでいますしあれこれ考えます。その蓄積が例えばこうしたnoteとして形になっているわけですが、これは結果的にそうなっただけで、目的も考えずに行った分析が何かの意思決定につながったわけではないのです。
これは本当によくある話で「話のネタになるけど仕事のタネにならない分析」はまさにそうです。その時は聞いた人が面白がってくれるけれども、すぐに忘れられてしまいます。
残念ながら実は世の中で「データ分析」と言われてる話の多くはこのような雑学になっているというのが現状です。
だからこそ、「データ分析」の成否は目的を決めることが非常に、というよりは最も重要な要因になるのですが、その話はまた今度しましょう。
というわけで、データ分析をするときはインプットする時もアウトプットする時も「これで誰がどんなことを決めようとするときに役に立つんだろう?」を意識してみるとよいのではないでしょうか。あるいは「これは趣味だからやりたいことをやる」と振り切ってしまうのもありです。
「データ分析」に関する神話あれこれ
それから、データ分析というと結構な誤解というか神話になっているようなことがたくさんあります。それらを検証してみましょう。
1.データ分析が課題を解決する
× しません。課題を解決するのは行動です。
データ分析の結果が何かをしてくれるわけではありません。データ分析は意思決定を助けるものです。なので意思決定したら行動が伴わなければならないですし、課題を解決するのはデータ分析ではなく行動です。
「データ分析の専門家を雇ったからあとは任せておけばいい」はこの切り分けができていない時に起きる勘違いなのですが、データ分析の結果に基づいて誰も意思決定や行動しないのではいくら良い分析をしても無駄になります。
2.データがあれば何でもわかる
× わかりません。わかることなどごくわずかです。
データ分析をしたら未来や顧客がわかるなどというのは幻想です。理解できることなんてごくわずかであるといっても良いでしょう。
考えてもみてください。データとして見えるのは行動した結果のみです。なぜその商品を買ったのかは数字には出てきませんし、ライバル店で買い物をしている人のことはデータにすら出てきません。
なのでデータがあるだけでわかるのはほんの一部のことでしかありません。だからこそ、知見や経験がある人がデータを読み、データに現れない本質を掴もうとしなければなりません。
3.データ分析なんて無駄だ
× 違います。ただし100%当たる予想以外は無駄というなら無駄です
ではデータ分析は無駄なのかといえば決してそういうことではなく、不確実性を減らすためには役立ちます。ただし絶対に確かな答えが出せないなら無駄である、という人にとっては無駄に見えるかもしれません。
しかしそれは「東京に住んでいるが、家の前から目的地の札幌駅前までいかないから飛行機は使えない。私は歩いていく」と同じです。
大半の人は飛行機を使うでしょう。なぜなら空港までの移動時間があっても全体でかかる時間を考えればその方が早いからです。趣味で使わないのは本人の自由ですが、会社を率いる立場の人がそれでは困ります。
データ分析も同じで完璧な分析や予知などできませんが、全く使わないよりは使ったほうがよいということです。
4.データ分析は専門家がやるものだ
× 違います。データ分析はみんなやっているものです。
データ分析というと「統計学や機械学習が必要。プログラミングもできないと。。。」と言い出す人が必ずいるのですが、それは手段の1つでしかありません。
最初に、「データ分析とは、意思決定の不確実性を減らすための試みである」とお話をしましたが、「今日出かけるのだけど傘を持っていくかどうかか迷う」という時に天気予報を見ませんか。
天気予報を見て「もしかしたら降りそうだな」ぐらいの降水確率だったら、雨が降るならいつどれぐらいか、自分が出かける場所や時間帯はどうか、もし降っても雨除けできるかどうか、濡れても構わないかどうかなどを天気予報に追加して考えるでしょう。
それらを考慮して最終的には「傘を持っていく、いかない、折り畳みにする」のどれかになるわけですが、これってまさに「データを集めて意思決定を助ける」という「データ分析」そのものですよね。
つまり、「データ分析」は特別なことではなくみんなやっているものなのです。
じゃぁ専門家なんていらないじゃないか、というのも違います。みんな自宅で料理ができるのだからプロの料理人はいらない、ぐらいの暴論です。
5.データ分析ってたくさんデータがないと意味がない
× 無ければ集めるか、集まらなければ集まるだけで考えるのが正しいです
これもデータ分析を「データがあるから、それで誰かがうまいことをやってくれる」ぐらいの感覚だと起きる勘違いです。
先に「こういった課題のための意思決定をしたい」があれば「だからデータが欲しい」となり、それから「データが無いなら集める、集まらないならば集まるだけで考える」という流れになるでしょう。
なので「この意思決定のためにはどういったデータが必要か」をまず考えることが重要であり、逆にデータ分析をしようとして「今あるデータで何かできないか」は最もやってはいけないことであるとも言えます。
また、あればあるほど良いこともありますが、たくさんありすぎて手が負えないということもありえます。なので「目的もなくまずデータをたくさん集める」のはやめましょう。金と時間を無駄に消費するだけです。
まだまだある勘違い
長くなったので今回は代表的な話を紹介してみました。データ分析でよく言われていることにはかなり勘違いがあるということが伝われば幸いです。
ようやくnoteデビュー
だいぶ前から準備はしつつもようやく公開に漕ぎつけることができました。芸風を変えると文章は思っていたより書きづらいものですね。
冒頭にも書きましたが、noteではたくさんの人にデータ分析を活用してもらうためにもよりわかりやすく書くことを心掛けます。
ブログと平行してこちらも更新を進めて行きますので、今後ともよろしくお願いします。