抑うつは指数分布に従う

今回は、抑うつ尺度の総スコアの数理パターンの話である。分布の数理パターンを調べるには、なるべくサンプルの多いデータセット(できれば数千以上)を複数比較することが大切である。サイズが大きくなるほどデータはあるべく分布に近づくし(大数の法則)、複数のデータセットを比較した方が数理パターンを見つけやすいからである。

#1 抑うつスコアの分布の数理パターン
 K6という抑うつ評価尺度のデータを用いて、抑うつスコアの分布の数理パターンを調べた。K6は日米で行われている大規模な行政調査で使用されているからである。日本では国民生活基礎調査、米国ではNHIS(National Health Interview Survey)、BRFSS (Behavioral Risk Factor Surveillance System)、NSDUH(National Survey on Drug Use and Health)と、4つの調査でK6が使用されている。それぞれ数万人から数十万を対象とした大規模調査なので。分布の形を検証するには適切なデータと思う。

K6は米国人研究者のKesslerらによって開発された尺度である。現在もうつ病や不安障害のスクリーニング目的に世界中で使われている。K6は、「1.神経過敏」「2.絶望的」「3.そわそわ、落ち着かない」「4.気分が沈み込んで、何が起こっても気が晴れない」「5.何をするのも骨折り」「6.自分は価値がない」、の6項目から成る。Kessler が作成した6項目の尺度なのでK6という。

被験者は過去一か月間に、6項目の症状がどの程度あったかを、「全くない」「少しだけ」「ときどき」「たいてい」「いつも」の5段階から選択する(0-1-2-3-4)。6項目からなる、5段階の評価尺度なので、総スコアは最小0点から最大24点まで分布する。なおK6では、うつ病スクリーニングのためのカットオフ値として13点以上が推奨されている。

図1はそれぞれの調査のK6スコアの分布を示している。いずれのグラフも右肩下がりを示している。

グラフの点線(13点)はうつ病スクリーニングのためのカットオフ値であるが、K6が13点以上の比率を調べると、日本の国民生活基礎調査はでは3.1%、米国のNHIS、BRFSS、NSDUHではそれぞれ4.0%、3.6%、6.4%であった。つまり日米いずれもうつ病と診断される可能性が高い人々が、人口の3∼6%程度、存在するということである。

図1 K6総スコアの分布(A)国民生活基礎調査(B)NHIS(C)BRFSS(D)NSDUH 点線は13点であり、うつ病のカットオフポイントを示す。Tomitaka et al. BMC psychiatry 2021

上記4つのグラフに共通する数理パターンは存在するだろうか?図1からわかるのは、すべてのグラフが右肩下がりを示しているということである。一般的に右肩下がりを示す分布モデルには、指数関数、ベキ関数、対数正規分布、等がある。

すべてのK6の分布を対数グラフに重ねてみた(図2)。対数グラフは分布の数理パターンの鑑別に有用だからである。ちなみに対数グラフに入力すると、指数分布は直線を示し、正規分布は二次関数を示し、ベキ分布は対数関数を示す。

図2 日米におけるK6の分布の対数グラフ。国民生活基礎調査、NHIS, BRFSS、NSDUH。点線は13点であり、うつ病のカットオフポイントを示す。Tomitaka et al. BMC psychiatry 2021

図2の対数グラフを見ると、すべてのグラフが直線を示しており、かつほぼ平行である。すべてのグラフが直線を示しているということは、K6の分布はいずれも指数関数に近似するということである。なお4つグラフが平行であるということは、それぞれの指数分布の減少率(λ:パラメーター)がほぼ等しいということである。スコアが増えるごとにλの比率で減少するということである。ちなみに指数分布の数式は下記のように と表すことができる

λ(ラムダ)はパラメーターで指数分布の減少率を示す

図2を見るといずれのグラフも直線を示しているが、少し直線から外れる部分がある。矢印が示すようにスコア0点の近くでは少し上にシフトしている。つまりスコア0点の近くでは実際のデータが指数分布から外れるということである。

指数分布が他の分布モデルより抑うつスコアの分布にあてはまるかどうかも検証した。一般的にモデルは単純で、かつデータに近似することが望ましい。モデルの近似と複雑さのバランスを調べるための統計量にAICやBICがある。AICやBICといった情報量基準の結果からも、ベキ分布や対数正規分布よりも指数分布がモデルとして適切であることが確認できた。

以上より、日米いずれのデータを分析しても一般社会における抑うつスコアK6の分布は指数分布に近似することが明らかになった。

その後日米欧の抑うつ尺度(PHQ-9、CES-D)のデータを用いて抑うつスコアの数理パターンを調べた。いずれでのデータでもやはり指数分布に近似していた(Tomitaka S.)。 

#2 メルツアーらの先行研究
なお文献を検索したところ、抑うつ尺度の総スコアが指数分布に従うことを報告した先行論文が一つだけ見つかった。メルツアーらのグループは、2002年に英国における抑うつ尺度の総スコアの分布がy軸近傍を除いて指数分布に近似することを報告していた(Melzer D, et al, Psychol Med. 2002)

メルツアーらは、うつ病と非うつ病で抑うつスコアの分布が数理的に非連続となることを想定した。その仮説を検証するため、英国の抑うつスコアの分布の数理パターンを分析した。CIS-Rという抑うつ尺度のデータを分析したところ、その分布はカットオフ値前後でも連続しており、指数分布を示した。またy軸の近傍では指数分布を外れていた。つまり我々と同じ結果を認めたということである。

残念なことに、メルツアーはこの論文を一つ発表しただけで、このテーマの研究を止めてしまった。他の尺度でも抑うつスコアが指数分布に従うことの再現性を確認したり、なぜ指数分布を従う理由を研究することもなかった。メルツアーらがこのテーマの研究を継続しなかった理由は不明である。もしかしたら、彼らの研究仮説からすれば、抑うつスコアがカットオフ値前後でも連続して指数分布を示すという結果はネガティブデータだったからかもしれない。

現在メルツァーは精神疾患に関する研究はしておらず、環境ホルモンの疫学研究者として活躍している。抑うつ尺度の総スコアが指数分布を従う所見に関しては、先行した研究が一つ存在したことは記しておきたい。


文献
1) Tomitaka S, and Furukawa TA. Mathematical pattern of Kessler psychological distress distribution in the general population of the US and Japan. BMC psychiatry 2021 21: 1-9.

2) Melzer D, et al, Common mental disorder symptom counts in populations: Are there distinct case groups above epidemiological cut-offs? Psychol Med. 2002 32:1195-201.

3) Tomitaka S. Patterns of item score and total score distributions on depression rating scales in the general population: evidence and mechanisms. Heliyon. 2020 6: e05862.

いいなと思ったら応援しよう!