見出し画像

#004 | 僕が機械学習を好きな理由

Noteの世界、4日目/365日です。続いてます。よねです。

目標設定関連を3日連投していました。今日はサクッと「僕が機械学習が好きな理由」をちょっとだけ言語化します。


機械学習との出会い

僕はここ3、4年機械学習を勉強し続けています。大学院時代に研究室の仲間が機械学習を使って現象整理に新たな解釈を持ち込むような研究をしていました。

大学院時代は、ロケットエンジンの燃焼関係の研究をしており、通常は演繹的に考えます。シミュレーションとか簡単な方程式の計算とか。物理学者、数学者、統計学者が作った「この世のルールの数式表現」を使い、「理論」→「真実」の方向で物事を考えていきます。当然理論が難しいので、9割以上の研究は実験研究室だったこともあり、研究価値に対して仮説を立てて、演繹的かつ、実験的にアプローチしていました。

一方で彼は、(色々テーマで揉めてたけど)膨大な過去の実験データを使ってこれまでみていなかったような方向性から研究テーマにアプローチしていました。楽しそうだった

帰納的に真実に対して新たな知見・ものの見方を与える」という機械学習の特徴に惹かれました。

これが僕が機械学習が好きな理由。

大学時代はちょうど2016年とかで、機械学習関連で強化学習とか深層学習が再び脚光を浴びて盛り上がってきたときだったので、その頃からもっと機械学習の存在とか知っておきたかった。(あの頃はほんと何も知らなかった。線形代数ももっとやっておくべきだった)

機械学習を使った挑戦

一般的に、機械学習は膨大なデータがないと使い物にならないとか、話にならないとかそういう捉え方になります。それは間違いないことは確か。また、最近は生成モデルが大量に出てきましたが、まず機械学習を実装しようと思うとやはり教師データ(答えのラベルが必要)が必要な教師あり学習がよく最初に出てくるので、会社で機械学習の話をしても(開発ではなく、研究プロジェクト)、「まだまだ全然使えないもの」くらいの反応を喰らいます。

最近はかなり勉強したこともあり、機械学習の本質がよくわかってきました。その過程で知った有名なプレゼンがあるので、貼ります。

Facebook AI 研究所の創始者のYann LeCun(ヤン・ルカン)がNIPSと呼ばれる人工知能関連の最高峰の学会で強化学習などが広く研究され皆が注目を始めた時期に、「強化学習はケーキのチェリーにすぎない。」と挑発的なプレゼンをしたというものです。チェリーボーイとかけてるんですかね?

「ケーキ理論」教師なし学習の重要性

If intelligence is a cake, the bulk of the cake is unsupervised learning, the icing on the cake is supervised learning, and the cherry on the cake is reinforcement learning (RL).

https://medium.com/syncedreview/yann-lecun-cake-analogy-2-0-a361da560dae

ケーキ全体が機械学習としたときに、強化学習はチェリーくらいのデータしか使用せず、教師あり学習もケーキの甘い外周部分。教師なし学習こそがケーキの土台本体だ。と言っています。

データ使用量を考えれば当たり前ですが、こう描かれるとすごく印象に残ります。

教師なし学習はデータの全てを使って、

  • データそのものの構造を理解する

  • データの構造からデータを分類する

みたいな使い方ができます。僕の開発する部品が扱う現象にも同じことが使え、要は膨大なデータがあるけども難解(多次元、多層構造、非定常)であることから開発に使えるような情報にはなっておらず、定性的な使い方しかされてませんでした。

僕はここにメスを入れています。機械学習のきっかけで触れた、「異なる方向性」を導入できるからです。

人間は多数のデータを理解しようとしても、3次元までしか理解できません。データ自体はより高次元のデータを取り扱っているので、パッとみたときにデータの構造や差を理解することはできないです。

僕は、教師なし学習のような手法を実験データに適用し、新たなデータ構造解釈に挑戦予定です。近年は、アメリカをはじめとして、膨大な試験・解析データに対して「データ駆動的(Data-driven)」に自然現象を理解し、整理したり、簡略化されたより低次元の情報を使うことでより高速なシミュレーション技術を構築することや、確率論的方程式を入れ込むことでデータのばらつきまでを入れ込んだ機械学習モデルの構築などが今まで以上に注目されています。昔より、高品質かつ大量のデータを扱えるようになったことも大きいはずです。

これもあってアメリカの大学の講義や、分厚い英語の専門書を読んだりしてます。勉強マニアになりました。

まとめ

今日のまとめ。

今年の目標達成関連投稿の箸休めとして、今日は今年さらに頑張ろうと思っている機械学習への考えや今後のチャレンジを言語化しました!

今日も最後まで見てくださってありがとうございました!好きです!
よね。

いいなと思ったら応援しよう!