#2-1:モデルの話。(はじめての人でも詳しくなれる)
#ビジネスでも使える予想モデルの話 。
RPAの続きもちゃんと書こうと思っていますが、今回はモデルの話をしようと思います。またまたの釣りタイトル・写真ですみません。これはビジネスで近年使われている、「予想モデル」という統計学の話です。
■そもそもモデルって何?
大学で、「気温とアイスクリームの売上予想」を立てるという授業の課題があったのを思い出す。それってどんなものなのかというと、回帰分析を使って、過去のアイスクリームの売上と気温データを元に、明日の売上予想を気象庁の気温予想からするというものです。
(大学、大学院と数学専攻なのです、嘘っぽいですがw)
ん?これってなんでビジネスに使えるの?当たり前のことじゃない?
ビジネスにおいて、売上予想をすることはかなり重要です。というのも、小売業なら、仕入れ数を予想したり、バイトの人員を予想したりと、そこが、ずれると赤字になるのです。
例えば、アイス20個しか売れない日に、200個仕入れて、バイト10人もおいてしまうと、完全な赤字ですし、200個売れる日に、200個仕入れてても、バイト1人しかいず、売り切れないというのもよくないですよね。
だからこそ、色々な企業が予想というものに注力するのです。
それって、中学のときにならった1次関数。2次関数とかでできるんじゃない?と思われるかもしれないですが、結果的に1次関数や2次関数で描けるときもあるのですが、多くの場合は、原因となる変数(アイスクリームの場合、気温)がいっぱいあるので、結構難しいのです。
■今回の内容は...
まず、言葉の定義と大まかな種類について紹介していきます。#2-xくらいの最終的にはどういうフローでどのようなロジックを使うかアタリをつける方法も紹介します〜
■モデルの定義を再度しっかり...
予測モデル(以下モデル)とは、過去のデータを分析し、将来の結果を予測するためのものです。、結果、つまり、目的変数(上の例でいうアイスクリームの売上のことです。)によって、大きく2つの種類(分類モデル・回帰モデル)があります。
ここで、変数の名前紹介。
目的変数:予想したい結果
説明変数:結果の要因となる要素
■モデルの種類
目的変数の種類によって、分類モデルと、回帰モデルの2種類が存在するんですよ〜
ここで、目的変数の種類の言葉の紹介。
質的データ:血液型のようなAかBかなどのように、計算できないデータ
離散的データ:飛び飛びの数字とイメージしてください。
量的データ:体重とかみたいな62kgや78kgのような計算できるデータ
連続的データ:1,2,3,4,...ってなる連続の数字とイメージしてください。
じゃあ、分類モデルと回帰モデルでどんなものなのかなのですが、分類モデルは「〇〇さんの血液型は何?」のように答えは、「A型」となるような結果がでるもので、回帰モデルとは、「〇〇さんの体重は来年どうなっている?」のように答えは、「100kg」となるような結果がでるものです〜
上記みたいに、2つにパックリ分かれるのです。(正確*1には、違うんですが、そのくらいのざっくり捉えていいかと思います)
<ここは覚えなくてもいいですが...>
*1:連続的・量的データであっても、ピニング(一定値ごとにグループ化する)によって分類モデルが使用できる
次回はもう少し踏み込んだ、モデルについて話します〜〜
この記事が気に入ったらサポートをしてみませんか?