データを用いて彼氏/男友達の年収を推測する方法

はじめに

  • タイトル通り、恋人を探している未婚女性向け記事。

  • 原則、科学的なプロセスを用いているが、論文にできるレベルでないことはご了承下さい。

データ

  • アメリカの年収データを用いている。が、日本人にも適用できるようデータを簡単に修正(データ加工)している。

    • 米国では、国民皆保険ではなく、公的医療保険制度は、高齢者および障害者、低所得者を対象としたものに限られる。よって、日本人が所得から差し引かれる保険料分は、米国においては所得としてカウントされる。日本では、給与の約5%が保険料として所得から徴収されるので、米国人給与の95%が日本人の給与であると推察

      • その他、所得税・住民税など色々と二国間の違いはあるが、今回は無視する。

解析手法

  1. 上述したデータから、2000人のサンプルを無作為抽出。

  2. SVM(SupportVectorMaschine)という手法を用いて、ある男性が年収650万円以上の結婚に値する人物かどうか判定するアルゴリズムを作成。

  3. 判断材料には、学歴・年齢・労働時間を用いた。

解析結果

学歴×年齢と、労働時間を二次元平面上にプロットし、高年収か低年収かを推測するモデルに判別曲線を引いみたところ、比較的きれいに判別できた。

判別曲線は、以下。赤い人が低年収、青い人が高年収である。黒線は、それを判断する決定境界(判断基準である)。

ここから先は

62字 / 1画像

¥ 100

この記事が気に入ったらチップで応援してみませんか?