【Data Validation】 Google Pixel WatchとFitbit(睡眠編)
閲覧ありがとうございます。データサイエンティストの杉尾です。主にデジタルバイオマーカーの開発プラットフォームである(SelfBase)の機能開発や、そこで収集されたデータの解析を担当しております。
今回は、Googleから発売されている「Google Pixel Watch(以下 Pixel Watch)」と「Fitbit」の比較記事です。比較と言えど、機能の比較などではなく、取得されるデータの違いを実際に取得したデータを可視化し、見ていきたいと思います。また、この比較によって生じる差異はどちらかを劣勢と位置づけるものではなく、あくまで、システム仕様的に生じる差を正確に把握し、データ分析に活かすためのものであります。
検証内容
検証データ項目
我々の方では、以下の項目を検証しました。
なお、各項目を「全日・活動時・睡眠時」ごとにも比較しております。
なお、この記事では、赤字の項目に関して可視化されたサンプルをご用意しています。他の項目も見たい!もっと詳細が知りたい!といった場合は、弊社(SelfBase)までお問い合わせ下さいませ。
今回は、睡眠に関する比較です。心拍数に関する記事は以下のリンクです。
実験の詳細
実験期間:6/8 ~ 6/20
実験した人の属性:男性、30~40歳
それぞれの機器
Fitbit:Charge 5
Google Pixel Watch:Bluetooth/Wi-Fi版
データ計測上の仕様など
右手首:Fitbit、左手首:Pixel Watchで計測
実験期間のうち、装着率80%以上、両デバイス間の装着率の差異が1%未満の日付のデータを使用
相関係数:スピアマン順位相関係数
記事用の簡単化のため、トレンドや時系列性を考慮するなどの計算過程は省略
誤差:fitbit - pixel
検証結果
図の説明
以下に、今回利用しているグラフのサンプルとその簡単な内容を載せています。
睡眠に関しては、主睡眠に限定しています。
睡眠開始・中央・終了時刻
はじめに、睡眠の内、睡眠開始時刻、睡眠中央時刻、睡眠終了時刻を比較しています。Y軸は時刻を扱いやすく数値化するために、それぞれの時刻から睡眠が発生したの日付の0時0分を引いた値(分)に変換しています。
結果としては、睡眠開始時刻、睡眠中央時刻がかなり高い相関を持っており、睡眠終了時刻はやや強い相関を持っていました。相関係数は、睡眠開始時刻で0.935、睡眠中央時刻で0.981、睡眠終了時刻で0.69でした。個人的には、ここまで高い相関が算出されたことにはびっくりしました。心拍数はLEDを使った脈波PPGを計測するという計測手法が明らかなのに対して、睡眠時刻は、判定処理を要するため、機器による差が生じるだろうと想定していたのですが、これは思いがけない良い結果です。パターンAもパターンBもバッチリ合っていますね。
相関係数としては、睡眠終了時刻は相対的に低く見えるのですが、プロットを詳しく見ても、正直言うと、差をあまり感じません。観測誤差によるものが多いと考えられますので、より多くのデータを取って検証してみたいと思います。
ベッド内時間・睡眠時間・起床回数
次は、睡眠の内、ベッド内時間、睡眠時間、起床回数を比較しています。Y軸はその時間(分)と回数を表しています。
結果としては、どれも高い相関を持っていました。相関係数は、ベッド内時間で0.839、睡眠時間で0.881、起床回数で0.707でした。ここで着目したいのは、起床回数です。この起床回数は睡眠中に起床状態と判定されたその回数を意味します。起床判定にはおそらく心拍数に加え、加速度計の動きなどを見て判定をしていると思います。異なるデバイスなのに、高い相関が算出されていて、素晴らしいという感想を持ちました。ただし、パターンBを見ると、他のグラフに比べ、差が大きい日があるので、相対的に差が生じやすいようではあります。
深い・浅い・レム睡眠時間
最後に、睡眠の内、深い睡眠の時間、浅い睡眠の時間、レム睡眠の時間を比較しています。Y軸はその時間(分)を表しています。
結果としては、深い睡眠の時間は高い相関を持っていましたが、浅い・レム睡眠の時間の相関係数は高くはありませんでした。相関係数は、深い睡眠の時間で0.861、浅い睡眠の時間で0.587、レム睡眠の時間で0.33でした。
深い睡眠は、いわば睡眠中の眼球運動なども起こらない完全な睡眠・休息状態を表します。つまり呼吸及び脈拍も究極の安定状態になっているため、予測判定の難易度としては比較的簡単で、どのアルゴリズムでも判定精度が良い、また同じになる可能性が高いです。逆に、眼球運動などが発生し、脳は活性状態だけど、身体は睡眠・休息状態であるといったレム睡眠は、その判定自体はデバイスごとに実装されたアルゴリズムごとでは差が生じているのかもしれません。また、睡眠状態が、レムまたはノンレムと大別される中で、浅い睡眠というのが、レム睡眠側に位置しているとは思うのですが、ここは定義がそれぞれのアルゴリズムで違う可能性がありますね。何が正解かわからないため、これ以上言及できませし、仮説の域を越えないので、今後、医療機器を揃えたバリデーションなども実験してみたいものです。
まとめ
今回は、Googleから発売されている「Google Pixel Watch」と「Fitbit」の比較を行いました。繰り返しになりますが、この比較によって生じる差異はどちらかを劣勢と位置づけるものではなく、あくまで、システム仕様的に生じる差を正確に把握し、データ分析に活かすためのものであります。
今回の実験では、睡眠に関連する多くの項目を検証しました。結果は、両デバイスから計測されたデータは、多くの項目で高い相関を持っており、違和感のあるズレの少ない状態になっていました。細かく見れば、計測値のズレが生じている箇所があったり、判定アルゴリズムの差をさらなる実験で詳しく検証しないと正確な言及ができなさそうなものがありました。また、それらには計測状態による誤差も含まれるため、さらなる実験により、各デバイスの傾向を把握し、品質の高いデータ分析に活かしていきたいと思います。
最後に
弊社では、デジタルバイオマーカーを作成するために、多くのウェアラブルデバイス・医療機器を扱い、データの取得・分析を実施しています。その上で、欠かせないのは、機器同士のデータの比較や既存の医療機器とのバリデーションです。それぞれの機器にはシステム上の仕様や扱われる環境(使われ方)による誤差の発生の仕方の癖があります。それらを比較検証し、自社サービス及びデジタルバイオマーカー作成のための分析に活かしております。上記の内容は、一部に過ぎないので、より詳細をお聞きになられたい場合は、弊社までお問い合わせ下さい。