データサイエンスの適性として何が必要かが議論されることが多い。実際にこの領域で成果を出されているエンジニアの方を見ると物理系の出身の方が多い。これは、世界の階層性に対する問題意識や習慣が、モデル作成前の仮説設定の段階で本質的に重要な要素になっているのではないかと思う。
このMIPHA(AI 搭載材料情報統合システム)は、解析エンジンとしてスパースモデリングの特徴をもつニューラルワークスPredictを活用して、学習データが少ない段階でも高いパフォーマンスで運用できる点が特に優れている。 https://www.jstage.jst.go.jp/article/isciesci/61/5/61_188/_article/-char/en
例として、この材料ゲノムを研磨等を通じた2D画像取得から3D画像を再構成し、特徴抽出。実験により得られる特性値との関係性を機械学習によりモデル化し、材料設計に活用できるソリューション(MIPHA)が(株)新興精機より提供されている。 https://www.youtube.com/watch?v=WbDtJ_jzxCQ
すなわち、ものごとには階層性があることを経験的に認めて問題を単純化し、数理モデル等を活用しながら本質的な理解にたどり着く。そこからモデルに基づくシミュレーションから問題への根本的な対策を打つことになる。社会現象であれば、人の行動予測モデルがデータサイエンスの中心的テーマとなる。
物理モデルを立てて対象の理解を進めるとき、まず初めに関心のある特性がどの物理的自由度により発現するかを考える。例えば、対象が半導体材料の電気特性であれば、原子・分子・電子、宇宙の高エネルギーの世界であれば素粒子、生物であればDNAを最小単位として計測される特性との関係を考える。