論文の読み方:救急搬送における診断予測モデルの研究を読む①
お盆休みも終わったので久々に。
昨日のTXP勉強会では僕が発表担当だったので、救急搬送における重症度予測モデルの論文を紹介しました。あまり細部にこだわりすぎず、何を思って読んでいるかを可視化することに重きを置いて発表しました。ちょっと長くなるので(投稿数稼ぐため)分割します。
対象論文:Lindskow et al. Prehospital Early Warning Scores to Predict Mortality in Patients Using Ambulances. JAMA Netw Open. 2023;6(8):e2328128.
LisenceはCC-BYなので翻案なども引用を明記する限り可能です。
JAMA Openはインパクトファクターが14くらいあるので(JAMA本誌は157)、掲載されたら嬉しい人が多いのではないでしょうか。APCが$3000しますが研究費あるなら良いですよね。ただ、JAMA Openは論文の質は比較的保たれているものの、JAMA本誌に比べるとかなり玉石混交な印象です。論文の読み方はもちろんこちらを参照ください↓
1. なぜこの論文を選んだか
いくつか理由があるのですが、TXP Researchは観察研究が主体で、しかも救急領域における診断や予測系が多いからというのが一つめの理由です。次に、因果推論やあまりに良すぎる論文は良いところ悪いところの指摘が結構難しかったりするので、良いところ悪いところが分かりやすそうな論文の方が教育的には進めやすかったからです。あと、新しい。ミーハーなのでこれは大事。
2. タイトル・著者・所属
論文は予備知識がどの程度あるかどうかで読み方は変わります。 僕はこの領域の知識があるので、タイトルをぱっと見た感想は下記の通りでした。
普段ならこの時点でアブストラクトをチラ見して読むのをやめるのですが、今回は抄読会に用いるために読みました。
逆に早期警告スコア(Early Warning Score: EWS)って何?という人は、知識を日本語でいいのでおさらいしておくと論文が面白くなります。予備知識のない論文を読んでも大して面白くありません。EWSはバイタルサインから病棟内で急変する患者を早期に検知しようというスコアです。イギリスで開発されたNational Early Warning Score (NEWS)が有名で、qSOFAなんかもここに含められることがあります。これを救急隊向けに応用したという研究は数多くあります。
次に著者ですが、研究する側としてはどんな人が書いているかは気になるので、ちゃんと読む時はFirst、Second、Last authorsの研究背景を軽くチェックします。Google Scholarで下記を見ると、non-MD PhDなので救急隊関連の方でしょうか。救急の中でも特にプレホスピタル中心の研究を行っており、主にデンマークのレジストリを使った研究をしている様子。LastはMDで同様。デンマークはいわゆるマイナンバーでの患者追跡が可能なので、死亡や再入院などのアウトカムを取りやすいから、その辺は多分強いです。あと地域レベルの住民全てを対象とした救急搬送レジストリがありそれを色々解析してきているのだろう、ということまでは想像がつきます。また、共著者に疫学系の人がいなさそうなので方法論は少し注意して読みたい感じはします。
3. Key Points
Question: 救急搬送患者において、成人の死亡率と集中治療室入室を予測する上で、EWSsはどのように機能するか?
Findings: 約11万人、22万の救急搬送を対象としたこの予後研究において、EWSは死亡率と集中治療室入院の予測において中等度の予測能を示した。典型的なカットオフでは、偽陰性と偽陽性が多く、undertriageとovertriageのリスクを示唆していた。
Meaning: 病院前での患者の適切なトリアージと早期同定には、EWSsの改善が必要であることが示唆される。
JAMAはじめ雑誌によってはsummary/key pointsなどがあるので、アブストラクトより先にここを確認します。ぱっと見はまあ、そうだろうね、という予想通りの結果でした。数多くあるはずの先行研究が気になったのでConnected Papersでこの論文を入れると2022年にsystematic reviewがあります。内容を読むとassociation measureとしてのオッズ比などしか出ていないのでちょっと直感的ではないですが、それなりにまとまってはいそう。また、Googleで「early warning score porehospital ncbi」と検索したら何本も出てきました。
いくつか目を通すと、どれもEWSの予測精度はイマイチといった内容です。そこで、この研究はこれらの過去の研究に何を一体add onするのか?What newは何か?を研究背景では知りたいなと思いました。
個人的にやや穿った視点で見ると、おそらくこの研究は何らかの下地であり、今後新規スコアの開発やAIモデルの開発などに繋げるための研究、あるいはbig registryがあるからとりあえず検証して論文にしてみた系かなとか思ったり。
4. ここまでで読むべきところがある程度明確になる
そもそもEWSはバイタルサインを用いるので、それだけで死亡などに対する予測性能がAUROC 0.90とか、偽陽性偽陰性を減らすのは無理があるはずです。しかも簡便なスコアにした以上それはより顕著であり、多少完璧で無くても臨床で役立てばそれでいいと思いますが、単なる数字しか示されていません。
ここまでの情報で、頭の中では「この辺に注意したいな」という点がある程度思い浮かび、それを踏まえて読んでいくことになります。
【背景】
読みたいところは当然knowledge gapです。先行文献から見るにgapは既にほとんど埋まっていそうなところであり、タイトルからして既に「あ、これ知りたい!」と思わせてくれるような研究ではないので、過去の研究の何が欠点で、この研究が何を埋めるのかは知りたいです。
【方法】
研究対象はおそらくpopulation-based studyであると思われるため、対象患者に対してはそんなに突っ込むところはなさそうです(この研究内容で単施設とかではJAMA Openに乗らないと思う)。ただ、心停止患者を除外したかどうかは気になるところです。なぜなら心停止患者はそもそもEWSの適応にならないため、心停止を入れることで、見た目の予測性能だけが向上して逆に臨床的価値を損なう可能性があるからです。
それから方法で特に知りたいのは、そもそもの救急搬送システムと記録様式(国によって違う)のところと、予測因子の定義、欠測割合とその対処。予測の研究は、「いつ、誰が評価した、どの予測因子を、どのタイミングで用いるのか?」が大事なので、バイタルサインの欠測と評価者&評価方法、あとタイミングはちゃんと読みたいという意識が働きます。バイタルサインは絶対に全て測定できないでしょうし、欠測に関してはどの項目がどの程度欠けているか、そして欠損の割合と対処法が正しいかどうかを知る必要があり、またこれらの欠測はnot at randomな可能性が高いです(最重症者や最軽症者では取得されない可能性)。しかもこれはモデル開発ではなく妥当性検証なので、安易に欠測をimputeできません。
また、アウトカムが何か、それが救急隊が用いるEWSのアウトカムとして妥当かどうかは気になります。一方で、統計は正直そんなに気になりません。おそらく単にAUROCや感度特異度などを計算しているだけでしょうから。
【結果】
AUROCはどれも大して変わらない結果が出ると思うので、もし大きく何かが予想と異なっていたらそこを中心に読みますし、そうでなければ、さっとfigureを眺めておしまいの可能性が高いです。Supplementalにも必ず目は通して、気になる結果がないかは眺めます。色々評価項目あるだろ、と思うかもしれませんが、そもそもdiscrimitation abilityが良くなければそれ以上色々言っても仕方ない、というのと、この研究はclinical impactを見ていないのでどこまで行っても数字の値しか評価できません。
【考察】
Key Pointsまで眺めた範囲内では、Discussionに関して自分がこの論文を書いたとしても、あまり書けることはないだろうなという印象です。どれか一つが良かったとしても多分大して差がないからこういうkey pointsになったんだろうと思うので、読むところは少なそうです。
一方、予備知識がないのであれば、背景と考察を読み通すことで理解が深まるのではないかなと思います。ナラティブなところなので読みやすいですし。
それから研究限界として何があるか。おそらく欠測とそれに対する対処がメインと考えられますが、それ以外にどのような研究限界があるのかは要チェックや。
【結語】
ここで気にしたいのはSpinとメッセージ。ここまでに述べたとおり、やや懐疑的な視点で見ているのですが、どのような結語になっているかは気になります。
To Be Continued…(突然流れる例の音楽)