スパースモデリングとは何か?
「スパースモデリング」という新しい方法論が、AIに関連して注目を集めている。
これは、「スパース構造を持つデータ」を扱う方法である。「スパース 」(sparse) とは、「すかすか」という意味だ。「全体のデータは大規模だが、意味のある情報はごく一部しかない」というようなものが、スパース構造を持つデータだ。実際のデータには、こうしたものが多い。
「スパースモデリング」とは、このような性質を持つデータに対して、少ない情報から全体像を的確にあぶり出す方法だ。本質を自動的に抽出する方法である。
スパース構造を持つデータの場合には、均一なデータ取得をしても、取得している情報のほとんどが無駄だ。そうした無駄を省けば、少数のデータで質を下げずに測定ができることになる。
MRIの画像解析がその例だ。
MRIでは、巨大な磁石を用いて、患者の体の断面の画像を作成する。鮮明な画像を作成するには長時間にわたって検査をする必要になるが、それでは、患者にとって負担となる。
ところが、体内の画像は、同一物質内では均一であり、画像が大きく変化する箇所は、物質と物質との境界しかない。そうした箇所だけに注目すれば、必要なデータ数は少なくてすむ。
いいかえれば、均一なデータ取得をしても、取得している情報のほとんどが無駄だということになる。そうした無駄を省けば、少数のデータで質を下げずに測定ができる。
無駄を省いた分を活用することによって、時間的な変化のデータを取得し、動画を取得することが可能になった。こうした技術は、「圧縮センシング」と呼ばれる。
スパースモデリングの手法は、IoT(モノのインターネット)で収集される情報の分析、通信ネットワークの劣化箇所の検出、天体観測など多くの分野に応用されている。
ビッグデータという言葉が流行語になったため、できるだけ大量のデータを持つことが重要と考えられがちだ。確かに、データ量は多い方がよい。しかし、多いことが問題をもたらす場合もある。例えば、大量のデータに埋もれて本質が見えにくくなってしまうという問題だ。これは、「過学習」とか「オーバーフィッティング」と呼ばれる。
こうした状況に対応するために、スパースモデリングは重要な意味を持っている。
参考文献
『AI 入門講座』(東京堂出版、2,018年11月)、第7章