見出し画像

【Data Validation】 Google Pixel WatchとFitbit(歩数編)

 閲覧ありがとうございます。データサイエンティストの杉尾です。主にデジタルバイオマーカーの開発プラットフォームである(SelfBase)の機能開発や、そこで収集されたデータの解析を担当しております。

 今回は、Googleから発売されている「Google Pixel Watch(以下 Pixel Watch)」と「Fitbit」の比較記事です。比較と言えど、機能の比較などではなく、取得されるデータの違いを実際に取得したデータを可視化し、見ていきたいと思います。また、この比較によって生じる差異はどちらかを劣勢と位置づけるものではなく、あくまで、システム仕様的に生じる差を正確に把握し、データ分析に活かすためのものであります。


検証内容

検証データ項目

 我々の方では、以下の項目を検証しました。

表1. 取得・検証項目

 なお、この記事では、赤字の項目に関して可視化されたサンプルをご用意しています。他の項目も見たい!もっと詳細が知りたい!といった場合は、弊社(SelfBase)までお問い合わせ下さいませ。

 今回は、歩数に関する比較です。

他にも、心拍数と睡眠に関する記事を用意しています。

実験の詳細

  • 実験期間:6/8 ~ 6/20

  • 実験した人の属性:男性、30~40歳

  • それぞれの機器

    • Fitbit:Charge 5

    • Google Pixel Watch:Bluetooth/Wi-Fi版

  • データ計測上の仕様など

    • 右手首:Fitbit、左手首:Pixel Watchで計測

    • 実験期間のうち、装着率80%以上、両デバイス間の装着率の差異が1%未満の日付のデータを使用

    • 相関係数:スピアマン順位相関係数

      • 記事用の簡単化のため、トレンドや時系列性を考慮するなどの計算過程は省略

    • 歩数:

      • 観測している時間の方が少ない

      • グラフの見やすさため、計測タイミングにおいて、4回以下のデータは除外

    • 誤差:fitbit - pixel

検証結果

図の説明

 以下に、今回利用しているグラフのサンプルとその簡単な内容を載せています。

図1. グラフパターンAの説明
図2. グラフパターンBの説明(ユーザー1名分)

歩数(日中)

 結果としては、歩数はかなり高い相関を持っていることが確認できました。グラフパターンAを見ると、分布の形状もそこそこ類似しており、相関係数も0.814と高い数値でした。またグラフパターンBにおいても、波形のトレンドも大体は一致していることが確認できました。
 しかし、グラフを書いてみた結果、他の心拍データ系に比べて、扱いの難しい点がいくつかありました。

  • 課題その1:歩数ゼロデータの扱い

    • 歩数を観測していないことの方が多いため、0付近のデータが非常に多いです。それによりデータを可視化によって確認しづらい傾向にありました。

    • 今回の可視化・相関係数の確認においては、計測されたタイミングの歩数が4回以下のデータは除外するようにしました。これらを含めた上で、計測性能の比較なども行っていきたいものです。

  • 課題その2:装着する場所による差が大きい

    • 歩数は加速度計により推計していると思います。そのため、その装着箇所により、数値に差が生まれている傾向が高いと思います。

    • 今回は、右手首:Fitbit、左手首:Pixel Watchで計測しました。参加者の利き手が右手であるため、fitbitの方が歩数を大きく観測している可能性がありました。グラフパターンAの右側のグラフで、右下にデータの点が多く観測されていることからも推察できます。

    • 検証を進める上でも、実際に実験する上でも、計測した歩数を扱うにはそのような観点まで視野に入れた方が質の良いデータの準備や結果の考察になるかもしれません。

図3. 歩数のグラフパターンA
図4. 歩数のグラフパターンB

まとめ

 今回は、Googleから発売されている「Google Pixel Watch」と「Fitbit」の比較を行いました。繰り返しになりますが、この比較によって生じる差異はどちらかを劣勢と位置づけるものではなく、あくまで、システム仕様的に生じる差を正確に把握し、データ分析に活かすためのものであります。
 今回の実験では、歩数を検証しました。結果は、両デバイスから計測されたデータは、高い相関を持っていることが確認できました。しかし、細かく見れば、歩数ならではの計測値のズレが生じている箇所があったり、データの扱いに気をつけるべき点がありました。今後もさらなる実験により、各デバイスの傾向を把握し、品質の高いデータ分析に活かしていきたいと思います。

最後に

 弊社では、デジタルバイオマーカーを作成するために、多くのウェアラブルデバイス・医療機器を扱い、データの取得・分析を実施しています。その上で、欠かせないのは、機器同士のデータの比較や既存の医療機器とのバリデーションです。それぞれの機器にはシステム上の仕様や扱われる環境(使われ方)による誤差の発生の仕方の癖があります。それらを比較検証し、自社サービス及びデジタルバイオマーカー作成のための分析に活かしております。上記の内容は、一部に過ぎないので、より詳細をお聞きになられたい場合は、弊社までお問い合わせ下さい。

この記事が気に入ったらサポートをしてみませんか?