モストグラフは機械学習モデルで小気道機能障害(SAD)診断能アップ

2024年7月28日 09:27

iOSデータとML(ランダムフォレスト（RF）、アダプティブブースティング（ADABOOST）など）の組み合わせで小気道機能障害(SAD)診断

慢性呼吸器症状と肺機能が維持された被験者における小気道機能障害（SAD）の診断における機械学習（ML）アルゴリズムの使用について調査しています。著者らは、SADにおける呼吸変化の診断を支援するために、インパルスオシロメトリー（IOS）分析に関連するいくつかのMLアルゴリズムのパフォーマンスを評価しました。彼らは、健常対照群、肺容量によるSADのない群、スパイロメトリーによるSADのある群を含む280人の被験者を対象にIOSとスパイロメトリーを測定しました。サポートベクターマシン（SVM）、ランダムフォレスト（RF）、アダプティブブースティング（ADABOOST）、単純ベイズ（BAYES）、K近傍法（KNN）など、さまざまな教師あり機械学習（ML）アルゴリズムと特徴選択戦略を調べました。彼らは、MLアルゴリズム、特にADABOOSTとRFが、IOSパラメータのみを使用した場合と比較して診断精度が大幅に向上することを発見しました。さらに、特徴選択手法により、診断精度を維持しながら、IOSパラメータを最も有用なもの（R5、（R5-R20）/ R5、およびFres）に減らすことができました。著者らは、IOSとMLアルゴリズムの組み合わせが、慢性呼吸器症状があり肺機能が維持された被験者におけるSADの診断のための有望なアプローチであると結論付けました。

Xu, Wen-Jing, Wen-Yi Shang, Jia-Ming Feng, Xin-Yue Song, Liang-Yuan Li, Xin-Peng Xie, Yan-Mei WangとBin-Miao Liang. 「Machine Learning for Accurate Detection of Small Airway Dysfunction-Related Respiratory Changes: An Observational Study」. Respiratory Research 25, no. 1 (2024年7月24日): 286. https://doi.org/10.1186/s12931-024-02911-1.

背景
機械学習（ML）手法の利用は、慢性的な呼吸器症状および保持された肺機能（PPF）を持つ被験者における小気道機能障害（SAD）の診断を改善する可能性があります。本論文では、呼吸変化の診断を支援するためにインパルスオシロメトリー（IOS）解析に関連する複数のMLアルゴリズムの性能を評価し、このタスクの最適な構成を見つけ出しました。

方法
健康な対照群（n = 78）、正常なスパイロメトリー群（n = 158）、異常なスパイロメトリー群（n = 44）を含む280人の被験者でIOSとスパイロメトリーを測定しました。サポートベクターマシン（SVM）、ランダムフォレスト（RF）、アダプティブブースティング（ADABOOST）、ナイーブベイズ（BAYES）、およびK-近傍法（KNN）などのさまざまな教師あり機械学習（ML）アルゴリズムと特徴選択戦略を検討しました。

結果
本研究の最初の実験では、健常対照群（CG）と肺容量定義SADがない患者群（PPFN）を比較した場合、最良のオシロメトリックパラメータ（BOP）はR5であり、AUC値は0.642でした。
対照群のBOPのAUC値は、スパイロメトリーで定義されたSAD（PPFA）の患者と比較して0.769でした。
第二の実験では、ML技術を使用しました。
CGvsPPFNでは、RFとADABOOSTが最良の診断結果（AUC = 0.914、0.915）を示し、BOPと比較して有意に高い精度を示しました（p < 0.01）。CGvsPPFAでは、RFとADABOOSTが最良の診断結果（AUC = 0.951、0.971）を示し、有意に高い診断精度を示しました（p < 0.01）。
第三、第四および第五の実験では、異なる特徴選択技術により最良のIOSパラメータ（R5、（R5-R20）/ R5およびFres）を見つけることができました。
結果は、特徴選択器の適用後もADABOOSTの性能が基本的に変わらない一方で、残りの四つの分類器（RF、SVM、BAYES、およびKNN）の診断精度がわずかに向上することを示しています。

結論
IOSとMLアルゴリズムの組み合わせは、慢性的な呼吸器症状およびPPFを持つ被験者におけるSADの診断に新しい方法を提供します。本研究の結果は、この組み合わせがこれらの患者における呼吸変化の早期診断に役立つ可能性があることを示しています。

インパルスオシロメトリー（IOS）: 強制振動技術（FOT）に基づき、静かな呼吸中に呼吸力学を測定し、被験者の努力に依存しない。小気道の特徴との相関が高く、SADの検出に敏感。
IOSの欠点: 臨床的に解釈が難しく、高価な検査機器が必要。初心者には解釈が困難。
機械学習（ML）: MLベースの支援システムがIOSの機能を強化し、喘息やCOPDなどの診断、監視、治療を支援できる。
仮説: MLとIOSの組み合わせが、PPF集団における小気道機能の診断を改善する。
研究目的: 複数のMLアルゴリズムの性能を評価し、最適な構成を見つけること。

研究対象

研究デザイン: 単一施設での観察研究、実施場所は四川大学の西中国病院の肺機能ラボ。
期間: 2020年5月1日から9月1日まで。

参加基準

対象者: 持続的な呼吸器症状を有する成人患者で、肺機能検査を受けた人（PPF基準：FEV1/FVC ≥ 0.70）。
除外基準: 拘束性肺疾患（FVC < 80%予測値）、喘息、間質性肺疾患、肺がん、2週間以内の呼吸器感染症、心筋虚血、肺手術の履歴、舌位置エラー、声帯閉鎖、または嚥下による不完全なIOS。
健康な対照群: 正常な胸部X線を持つ、非喫煙者（喫煙歴が1パック年以下）で、活発な肺疾患や不安定な心血管疾患がない人。

データ収集

デモグラフィックデータ: 身長、体重、年齢、性別、BMI。
検査: IOS、スパイロメトリー、症状に関する定性的および定量的評価の質問票、気管支挑発試験または気管支拡張試験。

インパルスオシロメトリー（IOS）

測定機器: ERSガイドラインに基づき、MS-IOS Jaegerを使用。
測定方法: スピーカーが生成する圧力振動を口器を介して30〜45秒間、通常の呼吸に重ね合わせて測定。
パラメータ:
1. R5: 呼吸システムの総粘性抵抗。
2. R20: 中央気道抵抗。
3. R5–R20: 周辺気道抵抗。
4. (R5-R20)/R5: 周辺気道抵抗と総気道抵抗の比率。
5. X5: 呼吸システムの総弾性抵抗。
6. AX: 低周波数の反応の積分。
7. Fres: 反応がゼロになる共振周波数。

スパイロメトリー

測定機器: MasterScreen PFT System (Jaeger Corp. Germany)を使用し、ATS/ERSガイドラインに従って測定。
パラメータ: FEV1、FVC、FEV1/FVC、FEF25–75%、FEF50%、FEF75%を予測値のパーセンテージとして記録。

データセット

被験者グループ: 280人の参加者からの測定値。
- PPFNグループ: PPF患者でSADなし（158セット）。
- PPFAグループ: PPF患者でSADあり（44セット）。
- CGグループ: 健康な対照群（78セット）。
データ分割: 訓練データとテストデータを7:3の割合でランダムに分割。

分類器

使用した機械学習アルゴリズム:
1. ランダムフォレスト
2. サポートベクターマシン（SVM）
3. ナイーブベイズ
4. アダプティブブースティング（ADABOOST）
5. K-近傍法（KNN）
6. SelectKBest: 特徴選択手法。
7. RFECV: 再帰的特徴除去とクロスバリデーションを組み合わせた特徴選択手法。
8. SelectFromModel: 特徴重要度に基づく特徴選択手法。

実験デザイン

実験1: 各IOSパラメータのSAD識別能力の評価。
実験2: MLアルゴリズムの性能評価と単一IOSパラメータとの比較。
実験3: SelectKBestを使用した特徴選択の効果の評価。
実験4・5: RFECVとSelectFromModelを使用した特徴選択の調査。

仮説検定

方法: パラメトリック検定とノンパラメトリック検定（ウィルコクソン順位和検定、クラスカル・ウォリス検定、マン・ホイットニーU検定）を使用し、AUCの仮説検定には置換検定を使用。

IOSパラメータの多くが3グループ間で有意に異なる (p < 0.05)。
PPF患者は健康な人に比べてR5およびR20が高く、気道抵抗が大きい。
PPFグループのSAD患者はR5、R5-R20、AXV、Fresの値が高い。

Discussion要約

早期スクリーニングと治療: GINA 2023やGOLD 2024などのガイドラインは、小気道機能の早期監視を推奨。
前回の研究: IOSは慢性呼吸器症状とPPFの被験者においてSAD検出においてスパイロメトリーよりも敏感。
IOSパラメータ: R5、R5-R20、AX、Fresの4つが関連パラメータであり、診断効率は低い（AUC値が0.7を超えない）。
研究目的: MLアプローチを使用して、PPF集団におけるSADの診断価値を向上させること。
結果:
- R5が最良のAUC値を持ち、感度が高く特異性がやや低い。
- MLアルゴリズム導入後、予測モデルのAUC、感度、特異性が大幅に向上。
- MLアルゴリズム（特にADABOOSTとRF）が診断精度を向上させた。
実験結果:
- 実験1: R5のAUC値は低い診断精度（0.642と0.769）。
- 実験2: MLアルゴリズムが診断精度を向上。ADABOOSTとRFが最良の結果。
- 実験3: SelectKBestによる特徴選択が診断精度を向上。
- 実験4・5: RFECVとSelectFromModelが有効な特徴選択を提供。
MLの有用性: 特徴選択により、少ない特徴で高い診断精度を維持。
実用性: R5、(R5-R20)/R5、Fresの3つの主要基準でグループを明確に区別可能。
IOSの限界: 解釈が難しく、知識と経験が必要。
早期発見の重要性: SADの早期発見は病気の進行を抑え、症状を軽減し、健康状態を改善する。
アルゴリズムの応用: 他の呼吸器疾患（喘息、COPD、間質性肺疾患など）にも応用可能。
技術の統合: IOSと他の画像診断技術の統合が臨床診断と科学研究を強化。
データ共有の促進: 標準化とデータ共有プラットフォームの構築が重要。
限界と将来の研究:
- 中国の特定地域に限定されており、他の人口への一般化が難しい。
- データセットが小さく、MLモデルの複雑性を慎重に管理する必要がある。
- 特徴選択は過適合を防ぎ、分析を簡略化する手段として有効。