スマホ利用時間データをノーコードツールで解析してみる|①可視化編
あけましておめでとうございます。
この記事が2023年最初の投稿となります。本年も当noteのご愛顧のほど、よろしくお願いいたします。
さて、近頃はたいそう便利な世の中になったもので、スマホさえあれば、ちょっと気になることがあったらすぐに検索、保存しておきたいシーンはすぐに写真か動画にすることができます。我々の生活にスマホは欠かせないものになりました。
ちなみに筆者におきましては、自宅の鍵、定期、電子マネー、書籍、地図、音楽、睡眠のログのビューワーなどなどさまざまなことをスマホさんにしていただいています。もちろん、これに加えて本業であるところのコミュニケーションツールとして大活躍なわけであります。
先日もスタッフと「QRコードを読めなかったら注文のひとつも満足にできないね。」などと話したことを思い出しました。スマホを使えないと経済活動も制限される昨今・・・、などと言いだすと、ちょっとディストピア感がにじり寄ってきます。しかしながら今後、「テクノロジーに置いて行かれる」ということはそういうことだという、わかりやすい話なのであります。
さて、ちょっと怖い話をしたところで本題に入ります。
自己紹介が遅れました。ヒューマノーム研究所 次世代先端教育特命研究員の辻敏之です。普段は中学校と高校で教員をしています。
今回は先日大学入試センターから公開された共通テストの試作問題「情報I」の問題について考えてみます。解析にあたっては、当社が開発する表データ用AI開発ノーコードツール「Humanome CatData(以下 CatData)」を使用します。
今回の解析で利用するデータ
今回の解析で利用するデータは、社会生活基本調査 平成28年社会生活基本調査 調査票Aに基づく結果 生活時間に関する結果 生活時間編 です。総務省が作成したもので、第4問で使われたのではないかと考えられるデータであり、e-STATで公開されています。
このことはT. Matsushima(@tkmium)さんの以下のツイートで教えていただきました。ありがとうございます!
このデータは、1日にパソコン・スマートフォンをどのくらい使うか、また、それらを触っていなかった時間に何をしていたかをまとめたものです。「していたこと」には20項目あり、睡眠、仕事、学業、食事、介護など多岐にわたります。このほかに都道府県、年齢、性別などのカテゴリとして分けられています。
つまり、このデータをみると、「東京都」に住んでいる「20-24歳」「男性」で「1日1-3時間スマホを使用する」人が、平均的にどんなことに時間を費やしているのかがわかります。カギ括弧で示したところがカテゴリとして分けられているものです。
今回の解析では、パソコン・スマートフォン使用時間の区切りと利用者の年齢幅を以下のように定義しました。実際のデータでは年齢は5歳区切りで15〜19歳から80歳以上というカテゴリが定義されています。
パソコン・スマートフォン使用時間:6カテゴリ
使用しない
1時間未満
1〜3時間未満
3〜6時間未満
6〜12時間未満
12時間以上
年齢:7カテゴリ
15〜19歳
20〜24歳
25〜29歳
30〜39歳
40〜49歳
50〜59歳
60歳以上
仮説を立て、可視化で検証する
それでは、スマホを使う時間によって、どんな変化が生じるのかCatDataを用いて解析してみようと思います。CatDataは「AI構築プラットフォーム」として提供されていますが、データの前処理、可視化などデータ解析をするための道具も一通り備えています。
早速CatDataを使って、試しに可視化してみましょう。すべての項目について可視化するのは大変ですし、意味がないものもたくさんあります。ですので、まず仮説を立ててから解析に取り組むことが重要です。ここでは「スマホの使用時間と睡眠時間は反比例する」という仮説を立ててみます。
スマホの使用時間と睡眠時間は反比例するか?
仮説を元に15〜19歳のデータで蜂群図を作ってみたのが図1です。プロットされた点のひとつひとつは各都道府県の平均値を示しています。
パソコン・スマートフォンを使用しないというグループ(図1 オレンジ色)は睡眠時間が長い傾向にありそうです。これは仮説通りですが、1時間以下のグループ(図1 青色)の睡眠時間が最も短いように見えます。その逆に6〜12時間使用するというグループ(図1 紫色)の睡眠時間が長い傾向があることも分かります。この蜂群図を見る限り、パソコン・スマートフォン使用時間と睡眠時間には強く関係があるとは言いづらそうです。
これを受けて、学業との関係を検討しようと考えました。仮説としては「パソコン・スマートフォン使用時間と学業に費やす時間は反比例する」となります。
パソコン・スマートフォン使用時間と学業に費やす時間は反比例するか?
先程と同様に蜂群図を書いてみました(図2)。最も勉強に時間を使っていたのは1時間以内のグループ(図2 青色)でした。続いて使用しないループ(図2 オレンジ色)、1〜3時間(図2 ピンク色)、6〜12時間(図2 紫色)という順番に見えます。こちらの仮説はなかなかよかったのではないかということが分かりますね。
睡眠時間と学業に費やした時間の関係を見たのが図3です。パソコン・スマートフォン使用時間に関わらず負の相関があることが分かります。睡眠時間が短いと勉強時間が長く、睡眠時間が短いと勉強時間が長くなることが分かります。つまり、勉強は睡眠時間を削って行うものという傾向が見えているわけです。
よく見ると、オレンジ色で示されているパソコン・スマートフォンを使用しないグループが、かたまりの右上にいることが分かります。このことから、オレンジ色のグループは、この分布の中で睡眠時間も勉強時間も長いグループであると言えます。また1時間以内のグループ(図3 青色)は、睡眠時間が短く、勉強時間が特に長いという特徴があること、6〜12時間のグループ(図3 紫色)は睡眠時間が長い傾向があり、勉強時間が短いことが分かります。
検証のまとめ
ここまでの解析で、パソコン・スマートフォン使用時間が短い学生は規則正しい生活を送り、使用時間が長いと怠惰な生活をする学生像がおぼろげながら浮かんだような気がします。パソコン・スマートフォン使用時間が長いから怠惰な生活になるのか、怠惰な生活だからパソコン・スマートフォン使用時間が長いのか、因果関係は分かりませんが、関係があることは間違いなさそうです。
このように、データを読み込み、ちょっと可視化すると、ただの数値の羅列だったExcelシートから生活の様子が想像できるようになります。
もちろん、Excelでこれらのデータを観察することもできますが、これらのグラフをExcelでいちいち書くのは意外と面倒です。CatDataなら軸にしたい項目をプルダウンメニューから選択するだけでよいので本当に簡単です。
次回は、CatDataの本領であるAI構築を絡めて、このデータの本質に迫ってみたいと思います。どうぞお楽しみに!
データ解析・AI構築の初学者向け自習テキスト
表データを利用したAI学習テキスト(Humanome CatData)
画像・動画を利用したAI学習テキスト(Humanome Eyes)
AI・DX・データサイエンスについてのご質問・共同研究等についてはお気軽にお問い合わせ下さい!