見出し画像

統計学を現代商業に役立てる 〜2〜

統計学は数学自体に限らず、様々な場面で活用されている実践的な分野です。

昨今ではデータサイエンスと呼ばれる業界が台頭してきており、マーケティングの立場からも欠かせない分野になりつつあります。

そんな「統計学」を学んでいく話を始めました。

2回目となる今回は、統計解析について説明します。多岐にわたる情報をどのように扱うか。そのテクニックに関する話です。

統計解析の種類

統計学には様々な解析手法があります。どの解析手法を選択するかは、最初の目的と扱うデータの種類で決まります。データ分析の目的と統計解析をまとめます。

統計解析の用語が多いですが、それぞれ何をすることに相当するのかを説明します。

要約すること

冒頭の基本統計量とは平均値や中央値などデータの傾向を示す指標です。基本統計量はデータ分析を行う場合に必ず最初に求めます。データの傾向をそこから把握するためです。

分布の可視化とはグラフを作成してデータの特徴を把握すること。基本統計量だけでは把握できないデータの特徴などを調べます。代表的な可視化方法には、ヒストグラムや散布図があります。

仮説検定や多変量解析を実施する前にこれらを行うことが、統計解析の基本手順です。多変量解析とは、複数の項目(変数)を用いてデータの特性を捉える統計的手法です。

多変量解析には様々な手法がありますが,複数の変数を統合して新しい指標を作る主成分分析、類似した個体や変数でグループ分けを行うクラスター分析などが主に挙げられます。

差異・関連性を調べること

その差が有意なものなのかを知るために、仮説検定を行います。仮説検定とは、該当するデータを用いて母集団に有意な差があるかを判断する方法です。条件が異なる実験データや標本の属性の違いによる差異が認められるか否かを判定します。

比較する際に用いる統計量の種類や標本数により、様々な検定方法があります。特に比較対象の変数がカテゴリデータ(性別)の場合は、クロス集計表を作成して分析を行います。

変数間の関連性を統計学では相関と言います。相関係数を求めることで、関連性を調べます。

相関係数にも様々な種類があります。一般的に相関係数と言われるのは、量的データと量的データの関連性を調べた場合を指します。

因果関係を調べること

因果関係を調べる手法である回帰分析では、ある変数が別のある変数に与える影響を調べます。

関連性を調べる相関係数と類似しますが、相関係数では因果関係を調べることはできません。回帰分析ではふたつの変数の因果関係の他に、ひとつの変数に対して複数の変数の影響度を調べる重回帰分析があります。

回帰分析より深い分析で因果関係を調べる方法が因果推論です。因果関係を調べる際に重要なのが、調べたい原因以外の要因による影響です。正確な分析を行うために調べたいこと以外の要因は、なるべく取り除く必要があります。

データから調べたい結果と原因に影響を与える要因(交絡因子)を取り除く手法が、因果推論になります。

おわりに

今回は統計解析の様々な用途について解説しました。

統計解析は数学の中でも実践的な方法論なので、多くの分野に対する汎用性が高いです。

今回は初歩的な紹介に尽きましたが、より詳細な話を知りたい方は、個人で調べてみてください。

-------------------------

最後まで読んでいただき、ありがとうございます。実際は非定期ですが、毎日更新する気持ちで取り組んでいます。あなたの人生の新たな1ページに寄り添えたら幸いです。何卒よろしくお願いいたします。

-------------------------

⭐︎⭐︎⭐︎ プロフィール ⭐︎⭐︎⭐︎

⭐︎⭐︎⭐︎ ロードマップ ⭐︎⭐︎⭐︎


いいなと思ったら応援しよう!

この記事が参加している募集