医療画像のPublic Data (内視鏡画像編)
医療画像を対象とした研究や開発において、まとまった量のデータを確保することに苦労することは多いと思います。
そんなときに役立つのがPublic Dataです。
Deep Leraningを活用したモデルの学習はもちろん評価の際にも使うことができます。特に研究の場合は再現性確保の観点からも、モデル評価だけでもPublic Dataを使って行うと良いかもしれません。
また、医療画像を対象とした開発を勉強したいが、データがなくて困っている方にも役立つと思います。
そこでこの記事では、論文で使われているのをよく見かける内視鏡画像のPublic Dataをいくつか紹介しようと思います。
HyperKvasir
ポリープや潰瘍性大腸炎といった病変や解剖学的ランドマークといった23クラスのラベルと画像のセット
アノテーション付きの動画373本
画像、segmentation mask、bounding-boxのセット
約10万枚のラベルなし画像
といったものがすべてセットになったデータセット。
Kvasir
ポリープのsegmentationデータ。
1000枚の画像と教師データのセット。
CVC-ClinicDB
https://polyp.grand-challenge.org/CVCClinicDB/
こちらもポリープのsegmentationの画像と教師データのセット。
LDPolypVideo
ポリープのアノテーション付きの内視鏡動画160本のセット
colorectal polyp classification dataset
WLIとNBIの画像セット