データビジネス創造コンテストを終えて
DIG18
慶應義塾大学SFCキャンパスが中心となって開催しているデータビジネス創造コンテスト(通称DIG)は、高校生・大学生・大学院生のチームが、データ分析を利用した新たなビジネスのアイディアを競うコンテストで、2014年から合計18回開催されています。毎回、「ビジネスパートナー」と呼ばれる企業が、テーマの決定と賞金の提供を行い、さらに学生にはなかなか得られないデータや分析ソフトなどを素材として提供します。各参加チームは、提供データを分析したり、チームが独自に集めてきたデータと組み合わせることで、ユニークなビジネスを提案します。
今年開催された第18回コンテスト(DIG18)では、ビジネスパートナーとなった花王株式会社が、「ライフケアイノベーション ~多次元データが拓く豊かな人生~」というテーマで、データを提供する代わりに 仮想人体生成モデル(VITA NAVI) という生成モデルへのAPIアクセス権を提供する、というユニークな形で行われました。私は、企画段階からVITA NAVIの開発に関わってきましたが、今回はDIG18のビジネスパートナーという立場でVITA NAVIの利用に関する支援をすると共に、審査員としても審査に関与しました。
DIG18がアナウンスされたのは、2024年の4月のことです。4月12日にはオンラインで勉強会が開かれ、そこでデータの代わりに提供されるVITA NAVIについて解説しました。予選締切の7月末までに、97チームが登録し、うち65チームが実際に予選提案書を提出してくれました。その後予選を突破した11チームが9月7日の本選でプレゼンテーションを行い、最優秀賞など6つの賞が選ばれました。登録チーム数、提案書提出チーム数は、過去18回の中でそれぞれ2位、1位で、関心の高さをうかがい知ることができました。興味を持ってくださった多くの方々に感謝します。
VITA NAVIとは何か
VITA NAVIは、年齢・性別・体重・血圧など人体に関わる様々な属性の同時分布を近似した生成モデルです。これらの属性には、年齢・性別などのデモグラフィック情報、体重や血液検査のような健康診断で得られる情報、ある疾病で医者にかかる年間回数など健康保険のレセプトから得られる情報、体組成・毛髪・皮膚などの測定値、認知機能テストの結果、腸内菌叢・口腔菌叢・皮脂RNAなどから得られるシーケンス情報に加えて、食生活・ストレス・睡眠・入浴習慣・女性特有の悩みなどアンケートから得られる情報などを含み、全部で2,000を超える属性があります。
VITA NAVIのAPI(アプリケーション・プログラム・インターフェース)は、このモデルに対して「66歳男性の収縮時血圧の分布を求めよ」のような条件付きのクエリを出すことができます。他に類を見ないVITA NAVIの独自性は、これら約2,000の属性のどの組み合わせを入力条件にしてもよいことです。これによって、「このような血液検査結果を持つ男性の平均年齢はいくつか」のように「血液年齢」ともいうべき指標を出すこともできますし、「体臭に悩むことと強く関連する属性は何か」のように、今まであまり知られていなかった関連(相関)を探索することもできます。
VITA NAVIはこのように非常に汎用性の高い生成モデルなのですが、逆にその汎用性があだになって、2023年2月の商用サービス開始以来、あまり利用が伸びていないことが悩みのタネでした。私がDIGに注目したのは、若い人たちの新鮮な視点で、私たちが思ってもみなかったVITA NAVIの使い方が提案してくれるのではないかと期待したからでした。
今回のDIG18では、審査員長村井先生を始めとした15名の審査員が審査にあたりました。本選当日には、11チームのプレゼンを聞き、質疑応答をし、その後審査結果を集計し、さらに審査員の間で議論を重ねて各賞の受賞チームを決定しました。以下では予選を勝ち抜いた11チームが、VITA NAVIをどのように提案に組み込んだか、そのパターンを見ていきます。
生成モデルの使い方
背景情報としての利用
一番多かったのは、ビジネスアイディアを導くための背景情報としての利用でした。
例えば花王賞を受賞した専修大学のチームサバの煮込み定食は、VITA NAVIを使って女性の一週間の入浴回数と、自己効力感など幸福度効果に関するいくつかの指標が連動することを見出しました(図参照、チームサバの煮込み定食の本選プレゼン資料から抜粋)。この結果を背景知識として、BathNaviという女性のための入浴管理アプリというビジネスアイディアにつなげていました。入浴頻度と幸福度との関係、というのは私たちも考えてみたことがなかったので、目からウロコでした。
同様に、最優秀賞を受賞した創価大学チームしむテックは、泣くこととと月経過多、居眠りと月経不順の関係がVITA NAVIに見られることから、統合的に女性の生理を管理するアプリ「リリフル」を提案しましたし、未来創造賞を受賞した広尾学園のチームMY Duoも女性の生理が、精神的なストレスなどと関連することをVITA NAVI上で確認し、そこから「ぽかどーる」というぬいぐるみのアイディアにつなげています(このぬいぐるみについては後述します)。
以上3チームはフェムテックでしたが、ストレスやうつなどの精神的な辛さをどうにかしたい、というチームも多くありました。専修大学のチームえびまよのナップザックはVITA NAVIで見つけた職業性ストレスと睡眠の関係から、デジタル化に伴うストレスを軽減するビジネスを提案しましたし、同じ専修大学のチーム小籠包のショルダーバッグはストレスホルモンに注目してそれと連動する属性からヒントを得て、孤独感を軽減するための、音声認識で開くスマートロックを提案していました。また、大阪府立水都国際高等学校のチームキムチの青春はVRによるストレス軽減策を提案しましたが、そのターゲット層の絞り込みにVITA NAVIから得られる分布を利用していました。
これら背景知識としてのVITA NAVIの利用は主に、VITA NAVIのサンプルアプリ(プログラミングせず、Webアプリから呼び出せるようにした簡略版)にいくつかの入力を手で入れて結果をプロットしたものであり、APIを使って自動化したものではありません。VITA NAVIはAPIを売るビジネスですので、本来はAPIを使ってほしかったのですが、よく考えてみると入浴・食生活・女性の悩み・ストレスなど多様な属性間のデータが簡単に得られない現状では、「XXとYYの間に関連があるのだろうか」という素朴な疑問に簡単に答えることができる、というのはVITA NAVIの大きな訴求ポイントになるのだ、ということに気付かされました。
未知の属性値の推定
APIを通して未知の属性値を推定する、というのはVITA NAVIが持つ基本機能です。優秀賞を受賞した慶応大学・大学院のチームPork Starsは、レセプトデータから得られる「この人はこの疾病で年に何回医者にかかりそうか」という推定値をVITA NAVIから得て、それを基に企業における各従業員の休業日数の推定値を算出し、さらにそこから企業の健康経営を支援するというビジネスを提案しました。当然、全従業員に対して毎年の推定値を計算しなければなりませんから、VITA NAVIをAPI経由でシステムに組み込むビジネスです。ビジネスケースもしっかり作ってあり、すぐにでもビジネス化できそうな提案でした。
未知の属性値の推定という意味では、審査員特別賞を受賞した関西学院大学のチームMJAN2024は反事実推論という大変面白い使い方をしていました。令和6年能登半島地震のような災害が起きたときに、避難所での健康管理は非常に重要な課題です。このチームは「避難生活による血圧上昇・栄養素不足がおきたとしたら、この人にはどのような疾病リスクがあるだろうか」という、仮定の上での推論(反事実推論)にVITA NAVIを使っています。そもそも、VITA NAVIの訓練データには避難所という特殊条件でのデータは入っていませんし、血圧上昇・栄養素不足という操作変数の値が適切か、という問題はありますが、1つの目安としてこのような指標は役立つ可能性があるだろう、という期待をもたせるものでした。
最適化
APIの高度な利用として最適化があります。高校生部門賞を受賞した広尾学園のチームデメトナ(といっても、1人しかメンバーがいないチームですが)は、疲労と栄養素の関係に注目し「1️17種の栄養素取得量のどのような組み合わせだったら、疲労度が一番低いと推定されただろうか」という問いを、ブラックボックス最適化ツールOptunaを使って解いてみせました。
探索と合成データの生成
VITA NAVIは生成モデルなので、合成データを作ることができます。武蔵野大学のチームWellness Informaticsは、うつに関連する属性を、抑うつ尺度を変化させながら探索してみせました。これもAPIを使わなければ到底できないことです。さらにこのチームは一歩踏み込んで、見つかった65属性を含む合成データを生成し、そのデータを用いてランダムフォレストなどの機械学習モデルを訓練し、精度高く抑うつ尺度を推定できることを示しました。生成モデルから合成データを得る、というのは大変おもしろい使い方なのですが、この機械学習モデルは、本来の抑うつ尺度を推定しているのではなく、VITA NAVIから出るであろう出力を推定しているに過ぎない、という点に注意する必要があります。VITA NAVIに限らず、生成モデルは現実世界の近似であり、必ずそこに誤差があります。生成モデルを模倣する2次モデルを作った場合には、それがいくら精度高く生成モデルの出力を模倣できたとしても、それは現実世界の値を推定しているのではありません。抑うつ尺度の推定には、そのままVITA NAVIの推定APIを使ってほしかったな、と思います。
項目定義だけを使う
最後に、VITA NAVIを統計モデルとしては使わなかったが、というおもしろい提案を紹介します。東京理科大学・大学院のチーム敏感肌が提案した婚活マッチングアプリです。VITA NAVIの属性定義の中から、生活習慣・生活スタイル・性格に関連する117の属性を抽出し、その類似度が高いほど相性が良いだろう、というアイディアです。VITA NAVIを企画したとき、「ヒトの状態を表示したり交換したりするとき、VITA NAVIの属性定義を共通フォーマットとして使ってほしい」という裏の野望がありました。そういう使い方の可能性を示してくれた提案だったと思います。
女子学生の活躍とフェムテック
データサイエンティストへの期待の高まりから、多くの大学でデータサイエンス学部が創設されていますが、まだまだ女子学生の割合は思ったようには伸びていません。例えば、データサイエンス学部第1号である、滋賀大学のデータサイエンス学部は、2024年6月の段階で在籍するおよそ400人の学生のうち女子学生の割合はおよそ20パーセントにとどまっている、と言われています(出典:NHK 滋賀 News Web、2024年6月)。一方、このデータビジネス創造コンテストでは、毎回女子学生の活躍が見られます。今回も、大学生チーム、高校生チームを問わず女子学生の活躍が目立ちました。
最優秀賞のチームしむテックは、「私たちには夢があります!」という宣言から始まるプレゼンで審査員の心を掴みましたが、なんといっても最優秀賞に輝いた原動力は、その質疑応答でした。村井審査員長による、「フェムテックについては広く使われている既存サービスがあるのに、提案はそれとどこが違うのか、なぜ勝てるのか」という厳しい質問に対して、「待ってました」とばかりにバックアップスライドを出して切り返したのは見事でした。
未来創造賞のチームMy Duoも質疑応答で点を稼いだチームです。生理の辛さを軽減するために「ぽかどーる」というぬいぐるみを販売するのだ、という提案だったのですが、その裏の意図がプレゼンではなかなか伝わらなかったのだと思います。質疑応答の中から「ぬいぐるみを外から見えるように持ち歩くことで、(マタニティ・マークのように)自分が生理中であることを周囲にアピールすることが当たり前になる社会を作る」という本来の意図を引き出すことができ、それが高い評価につながりました。
審査員には私を含め昭和世代が大半だったのですが、女性の生理について堂々と議論できる時代になったのだな、という感想を持ちました。
終わりに
以上、本選に出た11チームについて感想を述べましたが、もちろん予選落ちしたチームにも様々な良い提案がありました。中には、せっかく良い提案なのにスライドの作り方で損をしていると思われるものもいくつかありました。予選落ちした提案の中で、特に私の印象に残ったもの中に、非常に個人的な悩みを持っていた高校生が、VITA NAVIの属性の中にその悩みが入っていることを知り、VITA NAVIで健康や幸福感などとの関連を調べたものがありました。VITA NAVIに出会ったのが、予選締切の直前だったために、迫力あるビジネス提案に結びつけるところまでできず、予選落ちしてしまったのですが、本来VITA NAVIが狙っていた「ニッチだけど本人にとっては重要」というニーズに答えることができたのかな、と思いました。
VITA NAVIはまだ荒削りですが「ライフケア・イノベーションの民主化」という狙いに向けて手応えのあるデータビジネス創造コンテストでした。ビジネスパートナーとして受け入れてくださった村井先生・植原先生・DIG事務局の皆様、大量のパワーポイント資料を読んで審査してくださった審査員の皆様、コンセプト的に難しいVITA NAVIの使い方を各チームに懇切丁寧にサポートしてくださった学生コンシュルジュの皆様、予選通過チームのブラッシュアップに力を貸してくださった社会人コンシュルジュの皆様、そしてなにより多くのアイディアを提案してくださった参加チームの皆様に深く感謝いたします。ありがとうございました。