見出し画像

Label-Efficient Microscopy Image Recognition with Cell Image Characteristics

2023年度研究会推薦博士論文速報
[コンピュータビジョンとイメージメディア研究会]

西村 和也
(国立がん研究センター研究所 計算生命科学ユニット 特任研究員)

邦訳:細胞画像特性を用いたラベル効率の良い顕微鏡画像認識

■キーワード
Pattern recognition (パターン認識)/Machine learning (機械学習)/Label-efficient learning (ラベル効率の良い学習)

【背景】深層学習により顕微鏡画像の認識が高精度に実現可能になった
【問題】深層学習には撮影環境毎に学習データが必要である
【貢献】細胞画像の特性を活用することにより学習データの作成コストの低い画像認識を提案した

 深層学習に基づいた画像認識手法により,細胞検出,細胞形状認識,細胞追跡などの顕微鏡画像認識は高精度に実現可能となりつつある.しかし,深層学習に基づいた画像認識手法には,人手で作成する十分な量の学習データが必要である.さらに,顕微鏡画像では撮影条件(撮影に使用した顕微鏡の種類,細胞種等の条件)に応じて画像の見た目が大きく変わるため,撮影条件毎に学習データを用意する必要がある.画像の撮影条件は観察したい対象毎に変わるため,実験毎に学習データの作成が必要であり,学習データの作成コストが深層学習に基づいた画像認識技術の実応用の障壁となっている.

 そこで,学習データの作成コストを削減するために細胞画像の特性から簡易に取得できる情報に着目した.図に示すように細胞画像を撮影する際に画像を撮影した時刻,細胞の種類などは実験時に記録される.さらに細胞核を染色しておけば,画像に対する細胞の大まか位置(核の位置)は人手の画像認識用の労力なしで取得可能である.これらの細胞画像の特性から取得できる情報を画像認識に役立てる方法を探求することにより,画像認識に必要な学習データの作成コストの削減が期待できる.

 具体的には「細胞画像特性から簡易に取得できる情報を用いたラベル効率の良い画像認識手法の提案」を目標に3つの研究を行った.細胞画像から簡易に得られる情報は画像認識の直接的な学習データとはならず,画像認識するためには不十分なことがある.そこで,簡易に取得できる情報から目標の画像認識タスクに必要な情報を取得する手法を検討した.

 第一の研究では,核染色した細胞から取得できる大まかな細胞位置を学習データとして細胞領域認識に着手した.細胞形状認識を目標とすると細胞の大まかな位置は,形状に関する情報が不足した学習データである.そのため,形状に関する情報を補う必要がある.そこで,人が細胞検出をする際のプロセスに着目し,細胞検出の過程で形状情報が取得されるという仮説をもとに,細胞検出を学習した深層学習モデルから形状情報を取得する方法を考案した.

 第二の研究では,細胞の大まかな位置と細胞の種類のラベルを用いた細胞形状認識に着手した.細胞種により細胞形状が変化するため,細胞種のラベルから細胞の領域と背景領域を取得できる.そのため,細胞の位置と細胞の領域を二種類のラベルから取得できる.しかし,細胞間の境界に関する情報は不足する.そこで,画像のコピーアンドペーストを駆使し,細胞間の境界ラベルを擬似的に作り出す方法を考案し,作成した細胞間境界ラベルを用いて形状認識性能の向上を実現した.

 第三の研究では,人手の学習データと画像の撮影タイミングを活用したタイムラプス画像からの細胞検出手法を提案した.細胞が非侵襲な顕微鏡で撮影されている際には,短い撮影間隔で細胞画像を撮影することができる.撮影間隔が短ければ細胞の移動量も少ないため,あるフレームに細胞検出ラベルを付与すればその近接フレームにおいても高精度に細胞検出が可能である.この特性に着目し,少ない学習データから近接フレームにおいて正しく検出できている推定結果を選択することを考え,高精度な細胞検出を実現した.

■Webサイト/動画/アプリなどのURL
https://naivete5656.github.io/

(2024年6月1日受付)
(2024年8月15日note公開)

ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー
 取得年月:2024年3月25日
 学位種別:博士(情報科学)
 大学:九州大学

ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー

推薦文[メディア知能情報領域]コンピュータビジョンとイメージメディア研究会
医生物学分野で重要な顕微鏡画像における細胞の自動認識を少数の教師データからでも実現することを目的とした研究である.細胞画像の特徴を巧みに活用することで,少数の教師からでも高性能な認識モデルを構築する方法を提案した.この技術は,教師データ作成という実活用のボトルネックを打破する価値のある研究である.

研究生活 私が研究しているパターン認識の分野は驚くべき進歩を遂げている分野です.犬や猫などの一般画像に関しては今日も数多くの論文が投稿されています.一方,一度応用分野であるバイオメディカル画像認識の分野に目を向けると日々生み出されている最新技術は有効活用されておらず,日々生み出される技術を駆使することで,バイオメディカル画像認識に一石を投じることができるのではないかという期待に胸に研究に邁進しておりました.しかし,思い描いた可愛い研究テーマたちも実際に研究を進めていくと思うようには行かず失敗の連続で,紆余曲折しながらもがく日々でした.その渦中で学会投稿を目指し,自分を鼓舞した日々,仲間と先生と議論を重ねた日々などほかでは経験できないかけがえのない日々を過ごせました.