見出し画像

【統計のキソ】ロジスティック回帰分析ってなに?

今週のデータ・アナリティクスの授業も面白かったので言語化しておきます。前回の重回帰分析に続いて、今回はロジスティック回帰分析についてです。この授業は、一人しかいない学生(=私)のあまりに低いレベルに合わせて先生が丁寧に説明してくださっているものです。超基礎的な授業が立教の経営学研究科の博士課程のデフォルトでないことは、学校の名誉のために申し添えておきます!

重回帰分析の振り返り

まず授業の冒頭では、先週のnoteでも扱った重回帰分析についての振り返りから始まりました。

私がM1の時にグループ発表で重回帰分析を扱っていた内容(一週間前時点では完全に忘れてました。。)の説明準備が宿題になっていました。一年半前の発表資料や分析データを読み返してレポートにまとめておき、内容が正しいかを同期で同じグループだったLDC同期のS井さんに時間をもらって(S井さん、ありがとうございました!!)確認・修正しておいたため、無事に説明できました。

説明変数間の相関関係を調べる!

説明後の山口先生からのフィードバックで「なるほど!」と思った点を今後の(主に自分向けの)ポイントとして一つご紹介します。私が説明した資料のうち差し障らない部分をスクショしたものが以下なのですが、先生からのご指摘は、説明変数(キャリア的機能、心理・社会的機能、上司との関係)間の相関関係はどうでしたか?というものでした。

意図としては、相関関係が高い場合、相関関係が強い変数のうちのどちらかを除いて重回帰分析にかけた方が、目的変数(理念への共感)への説明能力(R2)が高まることが多いため、とのことでした。R2あるいは調査済みR2の値が高いようにモデルを工夫することが基本的には重回帰分析の勘所とのことなので今後は注意します。

ロジスティック回帰分析とは

回帰分析のうち、目的変数が量的データである場合には重回帰分析を、質的データの場合にはロジスティック回帰分析を行う、という使い分けが基本です。たとえば野球の投球データの場合、球速、高さ、打者からの距離、といった説明変数によって、空振りしたか(1)しなかったか(0)という質的データを説明する場合には、ロジスティック回帰分析を行うことが適しています。

直観的には、複数の量的データで単一の量的データを説明する重回帰分析の方が有効なケースが多いように感じていたのですが、質的データを説明するロジスティック回帰分析が有効なケースは多いと山口先生は解説されていました。買う(1)か買わないか(0)を分析するマーケティングの世界でも有効ですし、上述したスポーツの領域でも有効なケースは多いようです。

ロジスティック回帰分析で予測モデルを作る

採用における定着や組織からの離職についてもロジスティック回帰分析が使えるそうです。もちろん、数値として%で捉える場合には重回帰分析が有効なケースもあるのでしょうが、さまざまな説明変数をもとに内定承諾するか(1)辞退するか(0)や、勤務し続けるか(1)離職するか(0)を予測するモデルとして有効なケースがあります。

実際の例として入学者数の予測にもロジスティック回帰分析が使えるケースをご紹介いただきました。生々しいデータなので具体的な数値は申し上げられませんが、学部の入学者を定員数と近づけるためにロジスティック回帰分析が有効だそうです。

一般入試を想定した場合、いくつかの説明変数のうち入試の得点があります。入試の得点が高い群の場合、併願している上位校(早慶とか)にも合格するために定着しない可能性が高く、他方で低い群の場合には定着率が高くなる、という解説を伺い納得的でした。

大企業での新卒採用では、ロジスティック回帰分析で予測モデルを構築できるケースが多いのだろうなぁと思いながら説明を聞いておりました。

いいなと思ったら応援しよう!