見出し画像

A Novel Vision Transformer with Residual in Self-attention for Biomedical Image Classification

1. 本研究の学術的背景,研究課題の核心をなす学術的「問い」は何ですか?
本研究の学術的背景は、生体医用画像の分類には特定の特徴分布に基づくバイオインフォマティクスの捉えが必要であることにあります。このようなアプリケーションの多くでは、疾患のサンプルが限られていたり、データセットのバランスが悪かったりといった課題があります。

2. 本研究の目的及び学術的独自性と創造性は何ですか?
本研究の目的は、多頭自己注意のビジョントランスフォーマー(ViT)の新しいフレームワークを提案し、画像分類と分析に必要な特定の画像特徴を捉えることです。独自性と創造性は、多頭注意の各ブロックの最良の注意出力を累積するための残差接続の概念を使用している点にあります。

3. 本研究の着想に至った経緯や、関連する国内外の研究動向と本研究の位置づけは何ですか?
本研究は、生体医用画像の分類に関する研究動向に関連しています。本研究では、新しい多頭自己注意のビジョントランスフォーマーベースのフレームワークを提案し、2つの小規模なデータセットを使用して評価しました。

4. 本研究で何をどのように、どこまで明らかにした?
本研究では、提案されたフレームワークが、従来のViTと他の畳み込みベースの最新の分類モデルよりも優れた性能を発揮することを示しました。

5. 本研究の有効性はどのように検証した?
本研究では、2つの小規模なデータセットを使用してフレームワークを評価し、提案手法が従来のViTよりも優れた性能を発揮することを示しました。

いいなと思ったら応援しよう!