見出し画像

現代数理統計学の基礎の演習問題(2章問4):MSEとMAEの最小化

現代数理統計学の基礎(久保川達也)の演習問題、2章問4を問いてみました。

問題

画像4

回答

この問題を解釈すると、前者はMSE(Mean Squared Error)、後者はMAE(Mean Absolute Error)について、それぞれを最小化する推定量は何かというものです。これらの評価基準は機械学習でも頻繁に見られるものですが、そんな問題が何気なく出ていることが興味深いです。

まずはMSEですが、これはtで微分して0と置いてtについて解けばよいです。

画像3

実際に計算すると

画像3

よって

画像4

MSEを最小にする推定量は期待値(平均値)であることがわかりました。

次はMAEです。まずは期待値の定義から次のように書けます。

画像5

絶対値があると扱いにくいので外すことを考えます。
x−tが正になるためには以下の2パターンが考えられます。

画像6

1つ目はxがt以下である場合で、これはt-xとすることで常に正になります。2つ目はxがt以上である場合で、これはx-tとすることで常に正になります。
したがいまして、xがtを境にして条件が変わることになりますので、この条件を用いることで積分の範囲を分けることができます。

画像7

この式を最小化することを考えますので、微分して0と置き解きます。

画像8

微分と積分が混在した複雑な式になりますが、ライプニッツの積分法則を使うことで整理することができます。(wikipediaリンクの4つ目の式)
それぞれの項を整理していきます。

画像9

これらを元の式に代入すると

画像10

最後の式変形は確率密度関数の積分は確率(累積分布関数)になるためです。
ところで、確率の定義から以下が成り立ちますので(xがt以上になる事象とxがt以下になる事象は全事象なので確率は1になる)

画像11

したがいまして

画像12

確率(累積分布関数)が1/2になるtは、その定義から中央値です。よてMAEを最小にする推定量は中央値と求まりました。 

参考

現代数理統計学の基礎(久保川達也)
統計学・数理統計学の補足ページ
Median and MAE
Wikipedia 中央値
Wikipedia Leibniz integral rule

いいなと思ったら応援しよう!