用語集: 「ドメイン適応」
今回は「ドメイン適応」について見ていきましょう。
_*_*_
ドメイン適応?
「ドメイン適応」: 人工知能(AI)の分野において、ある特定のデータセット(ソースドメイン)で学習したモデルを、別のデータセット(ターゲットドメイン)に適用できるようにする技術です。
なぜドメイン適応が必要なのか?
AIモデルは、学習に使用されたデータ(トレーニングデータ)の特徴を強く反映します。そのため、トレーニングデータと異なる特徴を持つデータに対しては、性能が低下してしまうことがあります。これをドメインシフトと呼びます。
例えば、ある画像認識モデルを、昼間の晴れた日に撮影された画像で学習させた場合、夜間や雨天の画像に対しては、認識精度が低下してしまう可能性があります。これは、昼間の晴れた日と、夜間や雨天という異なる環境(ドメイン)間で、画像の分布が異なっているためです。
ドメイン適応は、このようなドメインシフトの問題を解決し、AIモデルの汎用性を高めることを目的としています。
ドメイン適応の具体的な例
医療画像診断: ある病院で撮影された医療画像で学習したモデルを、別の病院の画像に適用する。
自然言語処理: 新聞記事で学習したモデルを、SNSのテキストに適用する。
音声認識: 室内での音声で学習したモデルを、騒音のある環境での音声に適用する。
ドメイン適応の手法
ドメイン適応の手法は、大きく分けて以下の2つに分類されます。
教師ありドメイン適応: ターゲットドメインに少量のラベル付きデータが存在する場合に適用する手法です。
教師なしドメイン適応: ターゲットドメインにラベル付きデータが存在しない場合に適用する手法です。
教師ありドメイン適応では、ソースドメインとターゲットドメインのデータを組み合わせ、両方のドメインの特徴を学習することで、モデルの汎用性を高めます。教師なしドメイン適応では、ソースドメインのラベル付きデータのみを用いて学習し、ターゲットドメインのデータの分布をソースドメインの分布に近づけることで、モデルを適応させます。
ドメイン適応の応用
ドメイン適応は、様々な分野で応用されています。
コンピュータビジョン: 画像認識、物体検出
自然言語処理: 機械翻訳、質問応答
医療: 医療画像診断、薬物発見
自動運転: センサーデータの処理
まとめ
ドメイン適応は、AIモデルの汎用性を高め、実用的なAIシステムの開発に不可欠な技術です。特に、データ収集が困難な分野や、ドメインシフトが頻繁に起こる分野において、その重要性はますます高まっています。