研究室紹介（１）：課題解決型の応用研究を志す

2024年3月9日 16:50

京都大学大学院情報学研究科にある研究室（ヒューマンシステム論分野）の紹介をしてみる．研究室の公式ウェブサイトをまったく更新していないのだけれども，ある学会から研究室紹介記事を書くようにとの依頼があって，意を決して書いたので，その原稿を編集した内容をここに残しておくことにする．

課題解決型の応用研究を志す

私が大学院修士課程に在学していたとき，橋本伊織先生（当時の教授）から「加納君，基礎研究の対極は応用研究か？」と尋ねられた．私は「そりゃそうでしょ」と思った．

研究には基礎研究と応用研究がある．そうだろうか．基礎の反対は応用であると考えがちだが，基礎でも応用でもない研究がある．心当たりはないだろうか．Fig. 1 に示すように，基礎研究の反対は非基礎研究であり，応用研究の反対は非応用研究である．そう指摘されたのは市川惇信先生である．国立環境研究所の所長に着任されたとき，「国立環境研究所のこれから」と題した記事において，市川先生は次のように書かれた[1]．

基礎研究とはブレークスルーを生み出す研究である．ブレークスルーの対立概念はインクリメンタルである．これを「非基礎」といおう．応用研究とは，人類の持つ知見を人類にとって有用な知見に変換する研究である．応用の対立概念はしたがって「非応用」である．当然のことながら，応用研究の中にも基礎研究は存在し，逆も真である．我々は第IV象限の研究を行わないこととしよう．

実に厳しい指摘である．応用研究ではないから基礎研究だということにはならない．それは単に非応用研究である．非基礎かつ非応用の研究には手を出すな，そうでなければ何でも好きな研究をしていい，とボスから諭された私は，応用研究に取り組むことに決めた．基礎研究に取り組むという選択肢もあったが，現実社会の課題を解決する研究がしたいと思っていたからだ．

プロセスデータを活用する

1992年4月に京都大学大学院工学研究科化学工学専攻の修士課程に進学してから，2012年2月に同大学院情報学研究科に異動するまでの約20年間，私はプロセスシステム工学研究室に在籍した．プロセスシステム工学（Process Systems Engineering: PSE）は化学工学の一分野で，石油や化学などのプロセス産業を対象としたシステム工学である．多くの工学分野では分析的アプローチが採用され，対象を細分化して分析することで対象についての理解を深めてきた．その成果は実に素晴らしいものだが，対象を分解して細部に注目するが故に全体が見えなくなる恐れがある．プロセスシステム工学は，分解して得られた知見を装置の設計や運転に活用するために，その合成を目指してきた．このため，合成の学問とも呼ばれる．

プロセスシステム工学は極めて広範な研究領域を対象とするが，私は特にプロセスデータ解析に関する研究に携わってきた．というのも，今でこそ製造業でもデジタルトランスフォーメーション(DX)の実現が求められ，データ活用の重要性が認識されているが，私が研究者として歩み始めた頃には，データ活用に関心を持つ技術者は少なく，製造現場のデータはデータベースに埋もれたまま放置されており，これではいけないと感じたからである．当時，企業の方々には「データベースがデータの墓場になっていませんか？」と問いかけていた．

プロセスデータ解析に関する研究といっても，その内容は多岐にわたる．これまで私が取り組んできた内容を荒っぽくまとめると，Fig. 2 のようになる．製品を製造している以上，仕様を満たす製品をできるだけ低コストで製造するのが製造現場の役割である．そのためには，製品特性を制御する必要があるが，製品特性をリアルタイムに測定できることは希である．通常，抜き取り検査を行い，時間と労力をかけて製品特性を分析する．このため，製品特性をフィードバック制御できないという問題が生じる．この問題を解決するためには，リアルタイムに測定されていない製品品質を推定する仮想計測（ソフトセンサー）が有効である．その他，製品の不良や装置の異常を，あるいはそれらの兆候を，できるだけ早く正確に見付けるための異常検出，それらの原因を明らかにするための異常診断，制御系が満足のいく性能を発揮しているかを監視する制御性能監視，最適な運転条件を求めるための運転条件最適化，そして継続的な品質改善などに取り組んできた．これらの技術はいずれも製造業DX実現のために重要な役割を果たす．

これらの技術の成否は合目的的なモデルを構築できるかどうかにかかっている．モデル構築には２つの方向性がある．１つは，データを利用して統計モデルを構築する方法である．モデル構築には，多変量解析や機械学習を用いることができる．もちろん，深層学習（ニューラルネットワーク）を用いてもよい．こうして構築される統計モデルは，入力と出力を結びつける関数さえ導出できればよいので，その中身がよくわからないという意味で，しばしばブラックボックスモデルと呼ばれる．もう１つは，物理や化学の法則に基づいて，あるいは現象論に基づいて，第一原理モデル（物理モデル）を構築する方法である．この方法ではドメイン知識が重要になる．ブラックボックスモデルの対極にあることから，ホワイトボックスモデルと呼ばれる．

そうすると，Fig. 3 に示すように，統計モデルと第一原理モデルを組み合わせた，ブラックボックスモデルとホワイトボックスモデルの中間にある，グレイボックスモデルの存在に気付く．私は，ほぼすべてのモデルはグレイボックスモデルであると考えている．製造プロセスのモデルを構築する場合，真黒なモデルも真白なモデルも現実的ではない．統計モデルを構築する場合，出力変数と入力変数を決める必要があるが，純粋にデータだけから決めることができるだろうか．製品や設備の知識が必要ではないだろうか．第一原理モデルを構築する場合，反応や伝熱などに関する未知パラメータを推定する必要があるが，ドメイン知識だけで推定することができるだろうか．データが必要ではないだろうか．つまり，黒色に近い場合も白色に近い場合もあるが，ほぼすべてのモデルはグレイボックスモデルだと解釈できる．一方，Fig. 3 には，黒色でも白色でも灰色でもない領域が存在する．科学法則もデータも使わない領域で，経験・勘・度胸(KKD)に頼った操業を意味する．後進的であるが，そのような製造現場は少なくないだろう．ちなみに，プラトンは対話編「ゴルギアス」において，ソクラテスに「およそ理論を無視したものなら，そのようなものを技術とは呼ばないよ」と言わせている [2]．

グレイボックスモデルの構築方法には大別して３種類がある [3, 4]．Fig. 4 を用いて説明しよう．１つ目は，第一原理モデルの予測誤差を外部統計モデルで予測する方法であり，このモデルをパラレル・グレイボックスモデルと呼ぶ．予測誤差を予測するというのは奇妙に感じるかもしれないが，第一原理モデルは構造が限られており，すべての情報（データ）を活用できるわけではない．一方，統計モデルは自由であり，例えばニューラルネットワークを用いてもよく，第一原理モデルでは表現できない現象も表現できる．このため，測定変数すべてを入力変数の候補とすることで，予測誤差を予測することが可能となる．２つ目は，第一原理モデルに含まれる未知パラメータの最適値を内部統計モデルで推定する方法であり，このモデルをシリアル・グレイボックスモデルと呼ぶ．通常，未知パラメータはデータに合うように最小二乗法で決定されるが，実プロセスでは未知パラメータが経時的にあるいは運転状態に依存して変化することが多い．例えば，触媒の劣化，装置の汚れ，部品の摩耗などによってパラメータが変化する．シリアル・グレイボックスモデルでは，運転状態の関数としてパラメータの最適値を推定する内部統計モデルを第一原理モデルに組み込むことで，予測性能を向上させる．最後に３つ目は，パラレル・グレイボックスモデルとシリアル・グレイボックスモデルを組み合わせる方法であり，このモデルを統合型グレイボックスモデルと呼ぶ．

＜研究室紹介（２）につづく＞

参考文献

市川惇信，国立環境研究所のこれから，国立環境研究所ニュース，11，3，2-4 (1992)
プラトン，ゴルギアス，岩波書店 (1967)
I. Ahmad, M. Kano, S. Hasebe, H. Kitada, Gray-box modeling for prediction and control of molten steel temperature in tundish, J. Process Control, 24, 375-382 (2014)
I. Ahmad, A. Ayub, M. Kano, I.I. Cheema, Gray-box soft sensors in process industry: current practice, and future prospects in era of big data, Processes, 8, 243 (2020)

研究室紹介（１）：課題解決型の応用研究を志す

課題解決型の応用研究を志す

プロセスデータを活用する

参考文献

いいなと思ったら応援しよう！