見出し画像

#2-1:モデルの話。(はじめての人でも詳しくなれる)

#ビジネスでも使える予想モデルの話
RPAの続きもちゃんと書こうと思っていますが、今回はモデルの話をしようと思います。またまたの釣りタイトル・写真ですみません。これはビジネスで近年使われている、「予想モデル」という統計学の話です。

■そもそもモデルって何?

大学で、「気温とアイスクリームの売上予想」を立てるという授業の課題があったのを思い出す。それってどんなものなのかというと、回帰分析を使って、過去のアイスクリームの売上と気温データを元に、明日の売上予想を気象庁の気温予想からするというものです。
(大学、大学院と数学専攻なのです、嘘っぽいですがw)

ん?これってなんでビジネスに使えるの?当たり前のことじゃない?

ビジネスにおいて、売上予想をすることはかなり重要です。というのも、小売業なら、仕入れ数を予想したり、バイトの人員を予想したりと、そこが、ずれると赤字になるのです。

例えば、アイス20個しか売れない日に、200個仕入れて、バイト10人もおいてしまうと、完全な赤字ですし、200個売れる日に、200個仕入れてても、バイト1人しかいず、売り切れないというのもよくないですよね。

だからこそ、色々な企業が予想というものに注力するのです。

それって、中学のときにならった1次関数。2次関数とかでできるんじゃない?と思われるかもしれないですが、結果的に1次関数や2次関数で描けるときもあるのですが、多くの場合は、原因となる変数(アイスクリームの場合、気温)がいっぱいあるので、結構難しいのです。

■今回の内容は...

まず、言葉の定義と大まかな種類について紹介していきます。#2-xくらいの最終的にはどういうフローでどのようなロジックを使うかアタリをつける方法も紹介します〜

■モデルの定義を再度しっかり...

予測モデル(以下モデル)とは、過去のデータを分析し、将来の結果を予測するためのものです。、結果、つまり、目的変数(上の例でいうアイスクリームの売上のことです。)によって、大きく2つの種類(分類モデル・回帰モデル)があります。

ここで、変数の名前紹介。

目的変数:予想したい結果
説明変数:結果の要因となる要素

■モデルの種類

目的変数の種類によって、分類モデルと、回帰モデルの2種類が存在するんですよ〜

ここで、目的変数の種類の言葉の紹介。

質的データ:血液型のようなAかBかなどのように、計算できないデータ
離散的データ:飛び飛びの数字とイメージしてください。
量的データ:体重とかみたいな62kgや78kgのような計算できるデータ
連続的データ:1,2,3,4,...ってなる連続の数字とイメージしてください。

じゃあ、分類モデルと回帰モデルでどんなものなのかなのですが、分類モデルは「〇〇さんの血液型は何?」のように答えは、「A型」となるような結果がでるもので、回帰モデルとは、「〇〇さんの体重は来年どうなっている?」のように答えは、「100kg」となるような結果がでるものです〜

上記みたいに、2つにパックリ分かれるのです。(正確*1には、違うんですが、そのくらいのざっくり捉えていいかと思います)

<ここは覚えなくてもいいですが...>
*1:連続的・量的データであっても、ピニング(一定値ごとにグループ化する)によって分類モデルが使用できる

次回はもう少し踏み込んだ、モデルについて話します〜〜

この記事が気に入ったらサポートをしてみませんか?