【数学的溢れ話13パス目】ガウス「ムッツリスケベは濡れ衣」補筆
これまで以下の様な投稿を重ねてきた訳ですが…
これらの考察の数理的延長線上で執筆したつもりの以下のQiitaの投稿で様相が一変。「オイラーやガウスの様な天体運動や自然現象の様な絶対不動の物理学的存在の観測結果から誤差を除くのが統計の主な役割だった時代の大数学者」を長寿のエルフや魔族、「生物や人間の集団の様なあやふやな対象に統計学的数理を求める様になった時代の統計屋や数学屋」を短命な人類に擬えた割とハード目な歴史観を展開する事になったのです。
まぁ普通に考えて「葬送のフリーレン」の以下の展開に引き摺られた形。その雰囲気が最もトールキン「指輪物語」の悲観的歴史観に近付くくだりですが原典とは「英雄の時代が終わる」事への悼み方がまた異なるという…
まぁ現実の「大数学者の時代」にはガウスがアーベルを、コーシーがガロアを冷遇して早逝させたりと暗黒面があったし、産業革命上の要請から始まった統計革命は彼らの存在感をその数学的功績を残してたちまち過去のものとしてしまったのでした。
とはいえ現実の歴史は物語の様に一筋縄ではいきません。「生物や人間の集団の様なあやふやな対象に統計学的数理を求める様になった時代」が最後の歴史となるとは限らず、実際「$${10^{23}}$$の粒子の運動を統計的に扱う」統計力学の延長線上に現れた情報理論の延長線上に「分布意味論的広がりが$${10^{28}}$$を超えた辺りから劇的にパフォーマンスを向上させる」Transformer系機械学習アルゴリズムが姿を表したりしている次第。
ここで興味深いのがノーバート・ウィーナー「サイバネティクス(1948年初版、1961年増補)」に時代において既に情報理論側から「生物や人間の集団の様なあやふやな対象に統計学的数理を求める様になった展開」に疑問が呈されていて、その予言が実現しつつある様にも見える事。例えば以下のトピックについてですが、どう調べても同じ結論に至るのでChatGPTの優等生的まとめを掲示しておきます。
ただChatGPT、自らが情報理論の落とし子なので、一般には「まだ証明されてない」と考えられてる「エルゴート仮説」についてこんな答えを返してきたりします。
実際マルコフ連鎖モンテカルロ法(MCMC)で収束しないパターンが…
「最大の敵」によりによって「コーシー分布」と大数学者時代のラスボス級の名前がついていたりします。見た目は正規分布に近いのですがとにかく収束しない…
$$
f(x)=\frac{1}{π(x^2+1)}(-∞≦x≦+∞)
$$
こうした全体像を俯瞰すると、当時の大数学者が現代社会に甦っても必ずしも人類側の味方にはなってくれない気がします。そう「転生」といっても「異世界転生」の方でなく「魔界転生」の方って感じ…
最小2乗法から最小N乗法へ
一方、最小2乗法を巡る議論は大体収束したのでここにまとめておきます。
そもそもこの議論の発端はラプラスによる「最小一乗法(1799年)」の発表。詳細は不明ながら「偏差の総計が0となる問題」を絶対値を取る事で解消する技法と推測される。
これに対してガウスが「より優れた理論」として最小二乗法をまとめる(1809年と1823年)の論文。この記述には当然の様に「最小二乗法の最大の泣きどころたる外れ値を除去する」誤差関数への言及も含まれていた。
ここまでの議論は天体観測や地球測量といった物理的存在の観測誤差除去の話だったので概ね平均値と中央値と最頻値が一致したが、産業革命導入などを契機に統計学が生物や人間の集団の様な「あやふやな存在」も観測対象にする様になると貧富格差分布などを扱う為に「最小絶対値法」が復活。今日では「ロバスト回帰」などと呼ばれている。
まぁ最小二乗法、こういう「自然現象の観察においては想定する必要がなかった」状況に極めて弱いのです。
そういう状況で役立つのが「(論破された筈の)ラプラスの亡霊」ロバスト回帰という訳です。初見なので私も全然内容を理解しておりませんが、実用に到達してるだけあって相応に練り上げられた理論に見えます。
驚いたのが機械学習理論の分野ではさらに「最小0乗法」と「最小4乗法」が加えられ「最小N乗法」なるジャンルが構成されたという話…
まぁ「最小4乗法」については最小2乗法に増して外れ値の影響が大きくなる上、曲線に対する曲線のフィッティングになるので「鰻の掴み取り大会」の如き有様となり実用化には程遠い模様。一方「最小0乗法」というと一見偏差を0乗しても1がズラリと並ぶばかりで分布も収束もへったくれもない様に思えますが、そこを「ただの0」でなく「極限としての0($${\lim_{a→0}\lim_{b→0}a^b}$$)」について考える方向での試行錯誤が行われているとか。というのも平均値が「最小二乗法」に、中央値が「最小一乗法(ロバスト回帰)」に紐付く様に「最小0乗法」は(上掲の「その広がりが$${10^{28}}$$をを超えてからが本番の分布意味論空間」において唯一通用する尺度たる)最頻値と紐付いているからで、ひょっとしたらこの分野からまた新しい考え方が台頭してくるかもしれません。
こうして全体像を俯瞰してみると、少なくともこの範囲についてはガウスが「当時の世相に配慮した隠し事」をしてない事は明らか。なので、とりあえず切り離しておく事にしたという次第…
ガウス分布の名付け親はガウスじゃない?
そもそもここで「ガウス分布の名付け親はガウスじゃない」問題が表面化してきます。誰もがあまり語りたがらない統計学の暗黒史…
この話に踏み込むとさらに長くなってしまうので以下続報…