データを用いて彼氏/男友達の年収を推測する方法
はじめに
タイトル通り、恋人を探している未婚女性向け記事。
原則、科学的なプロセスを用いているが、論文にできるレベルでないことはご了承下さい。
データ
アメリカの年収データを用いている。が、日本人にも適用できるようデータを簡単に修正(データ加工)している。
米国では、国民皆保険ではなく、公的医療保険制度は、高齢者および障害者、低所得者を対象としたものに限られる。よって、日本人が所得から差し引かれる保険料分は、米国においては所得としてカウントされる。日本では、給与の約5%が保険料として所得から徴収されるので、米国人給与の95%が日本人の給与であると推察
その他、所得税・住民税など色々と二国間の違いはあるが、今回は無視する。
解析手法
上述したデータから、2000人のサンプルを無作為抽出。
SVM(SupportVectorMaschine)という手法を用いて、ある男性が年収650万円以上の
結婚に値する人物かどうか判定するアルゴリズムを作成。判断材料には、学歴・年齢・労働時間を用いた。
解析結果
学歴×年齢と、労働時間を二次元平面上にプロットし、高年収か低年収かを推測するモデルに判別曲線を引いみたところ、比較的きれいに判別できた。
判別曲線は、以下。赤い人が低年収、青い人が高年収である。黒線は、それを判断する決定境界(判断基準である)。
ここから先は
62字
/
1画像
¥ 100
この記事が気に入ったらチップで応援してみませんか?