"誰でも"無料で癌の医用画像をダウンロードし放題!!
米国国立癌研究所が癌画像アーカイブを公開している事を知りました。
いろんな方法で撮影された、いろんな部位の癌画像がダウンロードし放題です。それも正解ラベルもついてるときたもんです。
USA! USA!
使い方はとっても簡単。
① 好きなデータを選んでクリック&ダウンロード
すると、"***.tcia"という拡張子のデータがダウンロードされます。私は下記をダウンロードしてみることにしました。
こいつを展開して利用するには②をダウンロードする必要があります。
② NBIA Data Retrieverのインストール
下記URLからいけます。自分のOSを選択して、あとはクリックするだけでいけるはずです。
私はWindows 10でやりましたが、クリック1,2回しかせずにいけました。
③ ①のファイルをダブルクリック
すると下記のような画面が展開されるので、あとは保存場所を選んでstartするだけです。
このデータファイルは全部で100GB分ほどありました。
画像はDICOM形式(医用データの拡張子)で提供されています。DICOMを見たい場合はAppoloViewLiteがお手軽でお勧めです。
ついでにラベルデータ(.csv)もダウンロードしてみました。中身はこんな感じ。
画像ID、データの所属、年齢、性別、人種、たばこについて、%GG...?、腫瘍の位置(RULってなんだ...?)、Tステージ、Nステージ、Mステージ、KRAS変異の状態、補助?療法の有無、化学療法の有無、その他色々、うーんよく分からないステータスが多いです。
驚きなのが没年月日。1995年前後に亡くなった患者のデータがゴロゴロあります。研究のために改めてデータが引っ張り出されたのでしょうか。ちょっと感動です。当時と今とではモダリティの性能が全然違うでしょうから、同じノリで学習データにしてしまっていいのかは疑問です。
何はともあれ、特に登録とかも必要なく、誰でも医用データにアクセスできることが分かりました。アメリカは太っ腹ですね。
日本は今どういう段階でしたっけ。どんどんアメリカと中国に置いて行かれている気がします。「質はいい」とか言ってる場合なんでしょうか。周回遅れなのに勝算があるのでしょうか。私にはよく分かりませんが、頑張ってほしいですね。