DEIM2024@姫路 参加レポート!
こんにちは、Advanced Innovation Strategy Center(AISC)の橋本です。
AISCではAI・データサイエンス領域の活性化に貢献すべく、産学連携の取り組みにも力を入れています。今日は昨年から参加しているDEIM2024の参加報告をします。
DEIMとは
DEIMは「データ工学と情報マネジメントに関するフォーラム」です。
昨年も408件と多数の論文発表があり、注目されています。
扱うテーマの幅は広く、Track構成は以下になります。
自然言語処理・機械学習基礎
ビッグデータ基盤技術・セキュリティ・プライバシ
情報検索・情報推薦・ソーシャルメディア
メディア処理・HCI・人間中心情報マネジメント
高度なデータ利活用・ドメイン応用(医療情報、教育、地理情報等)
JSAI(人工知能学会 全国大会)の「不動産とAI」などでお世話になっているLIFULL 清田さんに声がけいただいたことをきっかけに、昨年より参加しています。昨年は岐阜、今年度は姫路での開催でした。
本参加報告ではチュートリアルを中心に紹介します。
チュートリアル紹介
チュートリアルは全8つ、昨年見られなかった”生成AI”関連の発表が3つ(生成系AI/LLMと音声/LLMの嘘)あったのが印象的でした。
私も当初は生成AIを聴講予定だったのですが、昨年のチュートリアル「差分プライバシーによるクエリ処理の基本・実践・最前線」がとても興味深かったのを思い出し「[TU-D-1] 連合学習のすゝめ。」を聴講しました(結果、大正解!)。
[TU-D-1] 連合学習のすゝめ。
連合学習とは各クライアントが保持するデータをサーバと共有せずに、学習済みモデルを共有することで、高精度なモデルを構築する分散型の学習アプローチです。プライバシの保護および通信量の削減が可能であるため、研究開発だけではなく実際のサービスに既に応用されています。
発表の冒頭にありましたが「Google Scholarの検索hit数で連合学習(Federated learning)が既にDeepLearning(Graph neural networks)を上回っている」とのことで、今後のさらなる技術深化・応用が期待されます。
発表で印象に残ったのは以下です。
データ不均一性(Non-iid)への対処として個人化連合学習の8つの技術分類を紹介
データ/タスクにより高精度な手法が異なるため難しい(後半の発表では”どれを使えばよいかわからない”の記載もあり)
プライバシーリスクとのトレードオフ
やはり差分プライバシー(Differential Privacy)が良さげか
ベンチマークでの評価が中心。実利用での性能は未知数。”実際のサービスに使える枯れた連合機械学習技術”の登場に期待
同感!
MELLODDY:創薬会社10社が協力して薬効予測における連合学習を実証。3年間で30億円、266億件以上のヨーロッパでの大規模プロジェクト。各タスクで相対的な性能向上(1〜9%)が見られたが、一方でコストを鑑みて”割に合うか?”という議論あり
さすがにこの議論が起こるのはわかる・・・
他に金融系の事例として”クレジットカードにおける不正取引検出”などが紹介されており、不動産業界における家賃滞納などへの転用などが想起されました。
不動産業界のデータは(高額商材ゆえに)少量・(IT化が遅れていてアナログなため)低品質・(規制や慣習で)低透明性など課題が多いですが、データ活用に向けたアプローチの一つとして、連合学習は長期で追っていきたい技術と改めて思いました。
その他
チュートリアルの後半は「[TU-D-2] LLMの嘘:ハルシネーション解説」に参加しました。ハルシネーションに焦点を当て、解消に向けたアプローチを広く紹介いただき、わかりやすかったです。
その後、インタラクティブセッション(ポスター発表)を拝見して、帰途につきました。
(不動産テーマの発表や客員准教授を務める電気通信大学の発表がいくつもあり、個人的に嬉しかったです。)
自分自身の勉強も兼ねて、また来年も是非参加しようと思います!
謝辞
運営的には負担が増えると思われますが、それでも人との接点を創出するべくオンライン+オフラインの直列ハイブリッド方式で開催いただいた運営組織とトラックチェアのみなさまに心よりお礼申し上げます。
この記事が気に入ったらサポートをしてみませんか?