統計学を現代商業に役立てる 〜1〜
近年ではデータ分析に象徴されるように、多種多様で膨大なデータから本質を抜き出すことが、一般的な技術として求められるようになりました。
統計学のことは十分に勉強してきていないのですが、会社(本業)で話題になることも多いですし、工学分野に限らず様々な場面で活躍しています。
今回は「統計学」について、自身の勉強も兼ねて見ていこうと思います。
統計学について
私たちの周りには、数限りないデータがあります。ここで言う「データ」とは、何らかの目的のために取得された数値や符号の集合体です。
それらの集合体を漠然と見ても、そこからは何も得ることはできません。膨大なデータから傾向を見たり、カテゴリで分類をしたり、何らかの手を加えることで初めてデータの性質や意味を知ることができます。
データには必ずばらつき(不確実性)が伴います。例えば、天気予報を見ると地域や日時で天気も気温も異なります。そこで、気温のグラフを描くなどして、明日の気温の予測をしたりします。
統計学とはある程度以上の数のばらつきのあるデータの性質を調べたり、大きなデータ(母集団)から一部(標本)を抜き出して性質を調べることで、母集団における性質を推測するための方法論を体系化したものです。
統計学の体系
統計学には大きく分けて2種類の手法があります。あるデータを集めて表やグラフを作り、平均や傾向からデータの特徴を把握する「記述統計」があります。もうひとつは、母集団から標本を抜き出してその特性から母集団の特性を推測し、それが正しいか否かを検定する「推測統計」があります。
母集団の特徴を知る上では「統計的指標」が一般的に使われます。最も多く使われるのは平均値で、ばらつきのある集団を代表する値です。ただし、データの分布次第では平均値があまり意味を成さない場合もあります。こういう場合に活躍するのが、データの分布を示す「ヒストグラム」です。
記述統計は複数のカテゴリに対するデータを集めて、統計的指標やヒストグラムなどを利用してデータを分析することで、効率的に問題解決を図ることです。
次に推測統計に話を移します。例えば、選挙の際に登場する行事として出口調査があります。出口調査は開票前に開票結果を予測するためのもので、代表的な推測統計です。
どこの投票場で何人に対して出口調査を行なうかはマスコミ各社で異なりますが、いずれも「標本抽出」という推測統計の肝になります。
選挙の開票は母集団の全数調査ですので、標本調査の正しさが1日も経てば完全に検証できます。しかし、多くの標本調査はこのような検証ができません。
従いまして、標本抽出の後に行われた推測統計の結果が本当に母集団の特徴を表しているか、どの程度の確率で正しく表しているかを知ることが、推測統計の重要な関心事になるのです。
統計学が台頭した理由
近年のビッグデータの登場で統計学が注目を集めています。統計学を駆使してビッグデータを分析して、経営戦略やマーケティング戦略の立案、新商品の開発などに活かすことになります。
ビッグデータを迎えて、Webサイトの閲覧履歴や購買履歴などが簡単に取得できるようになりました。マーケティングとしての興味は、ユーザーは何を欲しがり、何を買いたいと考えているかを知ることです。
その点では、ユーザーの行動データが取得できるようになり、広告の世界も劇的に変化しています。誰に対しても同じコンテンツを提示する手法から、個別のユーザーの行動履歴を分析することで、同じコンテンツでも人次第で興味を持ちそうな広告を個別に出し分ける手法に転換しています。
おわりに
今回は統計学について大枠の手法とその意義に触れていきました。
記述統計と推測統計の2種類がある中で、近年は推測統計が発展しています。それはビッグデータの登場に起因するもので、推測統計は高い精度を保持しながら、様々なソリューションを与えていくことでしょう。
次回は統計学の各種手法について、もう少し深掘りをしていきたいと思います。
-------------------------
最後まで読んでいただき、ありがとうございます。実際は非定期ですが、毎日更新する気持ちで取り組んでいます。あなたの人生の新たな1ページに寄り添えたら幸いです。何卒よろしくお願いいたします。
-------------------------
⭐︎⭐︎⭐︎ プロフィール ⭐︎⭐︎⭐︎
⭐︎⭐︎⭐︎ ロードマップ ⭐︎⭐︎⭐︎