見出し画像

信頼性・妥当性・反応性から考える “標準的な評価を使うべき” 理由

こんにちは。
BRAINの針谷です。

LINEオープンチャットと脳卒中EBPプログラムの参加者の方から似たようなご質問をいただきました。

ざっくり言うと「世界的によく使われる評価を使った方がいいのですか」です。

回答としては「世界的によく使われる評価を使った方がいい」です。

個人的に理由は二つあると思っていて、一つは「介入による予後予測がやりやすくなるから」、もう一つは「評価の性能が高いことが多いから」です。

これまで前者の話をよくしてきたので、今回は後者の話をしたいと思います。

信頼性・妥当性・反応性について簡単に解説


最初に検査の性能を表す「信頼性・妥当性・反応性」についてです。

実際は複雑なのですが、信頼性・妥当性・反応性を初めて聞いたという方もいると思いますので、今回は簡単に紹介します。

信頼性:正確にその人の能力を表すことができるか
妥当性:測りたいものを測れているか
反応性:その人の能力の変化が反映されるか


国家試験の模試に例えて説明します。

信頼性は正確にその人の能力を表すことができるか


まず信頼性です。

信頼性は「正確にその人の能力を表すことができるか」です。

例えばあなたが理学療法士を目指している学生だとして、今年の2月に国家試験を受けるとします。

国家試験は280点満点、合格ラインは168点です。

自分が国家試験に合格するかどうかを知りたいので、模試を受けることにします。

慎重な性格のあなたは、午前と午後で同じ模試を2回受けることにしました。

午前中の模試(1回目)を受けた結果、280点満点中、200点という結果になりました。

合格ラインを超えています。

しかし、午後の模試(2回目)を受けたら、280点満点中、100点という結果になってしまいました。

合格ラインを大幅に下回っています。

1日の中の午前と午後でテストを受けているので、あなたの知識が大きく変わった(知識を忘れてしまった)わけではありません。

このように、同じテストを受けているのに、全然違う結果になってしまったら「どっちの結果を信じればいいの?」ということになりますよね。

これが信頼性が低い状態です。

妥当性は測りたいものを測れているか


続いて妥当性です。

妥当性は「測りたいものを測れているか」です。

あなたは理学療法士を目指している学生なので、理学療法士の国家試験に合格するかどうかを知りたいわけです。

なので、理学療法士の国家試験模試を受け、「理学療法士の国家試験に合格する力があるのかどうか」を知る必要がありますよね。

このとき、言語聴覚士の模試を受けても「理学療法士の国家試験に合格する力があるのかどうか」はわからないわけです。

妥当性は「測りたいものを測れているか」なので、「理学療法士の国家試験に合格する力があるのかどうか」を知るためには理学療法士の模試は妥当性が高く、言語聴覚士の模試は妥当性が低い、ということになります。

反応性はその人の能力の変化が反映されるか

最後に反応性です。

反応性は「その人の能力の変化が反映されるか」です。

前回(3ヶ月前)、理学療法士の模試を受けた時に100点しか取れませんでした。

そこから猛勉強して、知識も技術も増やしました。

そうすればテストの点数も上がっているはずですよね?

なのに、今回同じ模試を受けたのにまた100点という結果になってしまいました。

これは「模試の反応性が低い」ことを意味します。

改善したら改善した分だけテスト結果に表れていないからです。

※前提として、ここでは「あなたの知識・技術が向上していた」とします。

一方、30点分の知識・技術を身につけたのであれば100点から130点に、100点分の知識・技術を身につけたのであれば100点から200点に点数が変化するのを「反応性が高い」といいます。

改善したら改善した分だけ、テスト結果に表れている状況です。

なぜ “標準的な評価を使うべき” なのか

ここまで模試で説明してきましたが、信頼性・妥当性・反応性の大事さが伝わりますでしょうか。

これはリハビリでも同じことが言えます。

患者さんの評価をするとき、信頼性・妥当性・反応性が優れている評価を使わないと、「ちゃんと患者さんの状態を把握できない」ということになります。

リハビリの評価指標は色々ありますが、いずれも開発された段階で、信頼性・妥当性・反応性がちゃんと確認されます。

確認されて「信頼性・妥当性・反応性が高い」、つまり「優良な評価である」と判定されたものが “よく使われる評価” になり、 “世界的に標準的な評価” になっていきます。

言い換えると、現時点で世界的に標準的な評価になっているものは、過去に信頼性・妥当性・反応性の確認がなされ、「優良な評価である」ことが示されているものであると言えます。

ですので、原則的には世界的に標準的な評価を使うべき、ということです。

※全ての評価がそうとは限りません。理想的には、これからご自身が使おうとしている評価について、信頼性・妥当性・反応性が優れているのかを確認した方がいいと思います。

オリジナルの評価を使うとどうなるか 


脳卒中リハビリの領域においては、神経科学が発展してきているため、まだ基礎研究で明らかになっているものの臨床研究につながっていないものもたくさんあります。

でも、神経科学の知見を無視するわけにはいかないので、患者さんの中枢神経系で何が起こっているのかを探ろうと、オリジナルの評価をするケースがあります。

これはやむを得ないこともあるのですが、基本的にオリジナルの評価だけに頼るのは良くないです。

オリジナルの評価というのは、例えば、「歩いているときに足がリズム良く前に出るようになったからCPGが働いてきたな」とか「この動きが出てきたから6野が働いてきたな」とか「患者さんが左手をよく使うようになってきたから身体所有感が改善してきたな」とか、そういうものです。

こういうオリジナル評価は、信頼性・妥当性・反応性について検証されていないですよね。

つまり、「ちゃんと患者さんの状態を把握できるかわからない」評価です。

もしかしたら的外れの評価になっている可能性もあります。

的外れの評価を受けて困るのは患者さんです。

なので、患者さんの状態をちゃんと把握して、有効なリハビリプログラムを作るために、信頼性・妥当性・反応性が確認された評価を使いましょう、という話でした。

この記事が気に入ったらサポートをしてみませんか?