仕事でつかえるデータ分析の基礎

データ分析という言葉に身構えてしまう人は多いのですが、実際はそんなに怖いものではありません。一般的な業務内であれば専門的な知識が必要とされるケースは少ないですし、四則演算が出来れば大体対処できます。

このエントリでは、データ分析に苦手意識がある人やデータ分析の初心者の方に向けて、データ分析の基礎となる部分を解説します。

※ このエントリは若手ビジネスパーソン向けに行ったデータ分析の講義をもとに書かれています

[対象読者]
- データ分析に苦手意識が強い人
- データ分析のタスクを依頼されたが、何をやればいいかわからない人
- スキルアップしたい若手ビジネスパーソン
- 数学が嫌いすぎてデータを見ることすら嫌な人

[得られること]
- データ分析の基本的な考え方
- 簡単なデータ分析の手法

データ分析が難しいと感じてしまうワケ

データ分析というと、複雑なデータを難しい数式をこねくり回してさらにはRやSQLを使ったりして何とかする、、、、みたいな難しいイメージを持ってしまう人が多いと思います。

たしかに、世の中に存在するデータ分析関連の書籍の多くは「難しい分析手法」について書かれていることが多く、それらの多くは取っ付きづらいものだと私も思います。

しかし、実際の仕事で行うデータ分析の多くは難しいものではないというのが私の経験則です。実務において難しい分析手法を使うことは殆どなく、平均や最大値を出したり、スプレッドシートで表を作る、、、くらいが必要とされるスキルの大半です。

にも関わらず、なぜデータ分析を難しいと思ってしまうのでしょうか?

その理由の多くは、「難しい分析手法を使って分析をすることがデータ分析だと勘違いしてしまっていること」にあると私は考えています。

このエントリを通してこの部分が解消されることを願っています。

データ分析ってなんで必要なの?

事実の裏付けの必要性

データ分析というタスクは急に湧き出るものではありません。そこには「何かを決めることに困っている」という背景があります。

例えば
・注力する市場を決めたい
・今月の売り上げを伸ばすための施策を決めたい
だとか、そんな感じの「決めたいこと(=仮説)」があるのですが、何かを決めるだけの「理由」がないことが多く、それゆえに困っているのです。

もちろん、何かを決めるだけであれば、鉛筆を転がしたり、占い師にお願いしたりして決めることもできます。とはいえ、普通のビジネスパーソンであればそんな運任せな決断はしないと思います。

それは何故かといえば、「事実の裏付け」がないためです。一般的には事実の裏付けがある決断の方が成功の確度が高く、そして多額の金銭が動くビジネスの場においては日常生活よりもより確度の決断が求められます。ゆえに運任せな決断ではなく、事実の裏付けに基づく決断が重要視されています。

[閑話休題]
事実の裏付けがあったからといって、それが本当に正しい決断かどうかはわからないというのが実のところです。事実はあくまでも過去の話であり、決断はこれから起こる未来についてのことだからです。事実による裏付けが本当に万能なのであれば、世の中はもっと成功に溢れているはずです。

とはいえ事実の裏付けがあることによってより確度の高い決断になるというのは一般則であり、ゆえに決断の際には裏付けを求めるといった慣習が生まれています。

事実の裏付けをどうやって作るか

より良い決断のためには「事実の裏付け」が必要ということは理解いただけたと思いますが、ではその事実の裏付けはどのようにして作っていけば良いのでしょうか。

ここで出てくる手段の一つが「データ分析」です。

つまるところ、
より良い決断をしたい
・そのためには現状の仮説に対しての事実の裏付けが必要
・その一つの手段として「データ分析」がある
といった流れです。

そのため、データ分析を行う場合は「どのような決断をしたいのか」といった決断の背景や、「どんな事実の裏付けがあればより良い決断に繋がるか」といったことを常に意識しておくべきでしょう。

データ分析の別の側面

ここまでは「事実の裏付けを作るためにデータ分析が用いられる」という話をしてきましたが、データ分析にはもうひとつ別の使われ方があります。

たとえば、
・Webサイトの流入を三倍にするための施策を考えて欲しい
・ユーザーの満足度が上がる施策を考えて欲しい
といったことを依頼されたときに、まずは何をするでしょうか。

こちらも鉛筆を転がしたり占い師に頼ったりすることもできますが、普通のビジネスパーソンであればそんなことはしないはずです。

これまでのデータを参考にし、何かしらの施策を考えていく、、というのがよくある流れでは無いでしょうか。

つまり、何かしらの施策という「仮説」を作るというのもデータ分析が持つもうひとつの役割になります。

「仮説を作る」「裏付けを作る」という二つの側面

ここまでの話をまとめると、データ分析は下記の二つの側面を持つことになります。

  • 仮説を見つけるためのデータ分析

  • 仮説を検証し、裏付けを作るためのデータ分析

とはいえこれらは独立しているものではありません。なぜなら、データ分析によって導き出された仮説の裏付けを作るのもデータ分析だからです。

したがって、仕事におけるデータ分析の多くの場合はこのような流れで行われます。

  • その依頼が「何かを決めたい」ものの場合、それらを決めるための裏付けを作るためのデータ分析を行う

  • その依頼が「何かを考えたい」ものの場合、データを元に仮説を立てデータを元に仮説の裏付けを取る

ここまでのまとめ

データ分析は、「より良い意思決定」を行うためにするものです。そして、そのより良い意思決定をするためには「事実に裏付けされた質の高い仮説」が必要です。

そこでは、「仮説を作るところ」から始まることもあれば、「現在存在している仮説を検証する」ことが求められるケースもあります。

これらをまとめると、データ分析の目的は「事実に裏付けされた質の高い仮説を作ること」といえるでしょう。

つまりはデータを見て「このデータからはこんなことが言えそう」だとか「こんな気がする」だとか、そんな仮説を考えた上で、それらの裏付けを作ること自体がデータ分析です。難しい分析手法を使うことだけがデータ分析ではありません

より質の高い仮説を作る場合に難しい分析手法が必要になることもありますが、多くの場合は「平均と比較する」ことや「グラフの中での異常値を見つける」ことなどで十分です。

それらの簡単な行為から仮説を見つけ、さらにそれを深掘りしたい、、、となって初めて難しい分析手法が必要とされるのです。

ですので、まずは「仮説を見つけること」を意識した上で、それらの「仮説の裏付けを作る」ための四則演算をベースにした簡単な分析を行えるようになりましょう。そして、それだけで一般的な仕事で行うデータ分析には十分です。

[補足]  質の高い(=確度の高い)仮説とは?
ところで、質の高い仮説とはどのような仮説を指すのでしょうか。不思議なことに、データによる裏付けがあるからといって、常に質の高い仮説だとはいえません。

例えば、昨年限定で起こった事象から導かれた仮説があったとして、それは今年や来年に適用できないことは自明です。この場合、事実の裏付けはあるものの、仮説として成立しないでしょう。

つまるところ質の高さというのは文脈によって異なります。「期待値の一番高い仮説」が求められたり、「ギャンブル性の一番高い仮説」が求められることもあるでしょう。

データを分析して質の高い仮説を考えたい時は、そもそもなぜその仮説が必要なのかと言う点にも目を向けておきましょう。

仮説はどのように見つけるのか、そして見つけた仮説の裏付けをどう作るのか

データ分析に難しい分析手法は必要ないとわかったとしても、そもそもどうやって仮説を見つけていけば良いのでしょうか。

そして、仮説の裏付けをどう作れば良いのでしょうか。ここからは、その「仮説の見つけ方」や「仮説検証の方法」についてケーススタディをもとに説明していきます。

なお、ケーススタディでは令和四年版自殺対策白書のデータを利用しています。適宜こちらをご参照ください。

※ データの選定はたまたま目についた以上の意味はありません

ここから先は

4,731字 / 5画像

¥ 500

まいにちのご飯代として、よろしくお願いします。