高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 #3
株式会社リュディアです。引き続き総務省より公開されている高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 についてまとめてみます。
総務省の元資料はこちらから参考にしてください。
また私どもリュディアがまとめている前回までの 高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 に関するまとめ へのリンクは以下を参考にしてください。
今回はビッグデータについてまとめてみます。皆さん、ビッグデータといわれるとどのようなイメージでしょうか?あるいはどのような組織がビッグデータを持っていそうでしょうか?使っていそうでしょうか?
Google、使ってそうですね。毎日、膨大な検索結果を得られるのでデータの規模も半端ではないです。Amazon、ここもたくさんデータを持ってそうですね、世界中の人が買い物をするために検索したり、実際にお金を払って買い物をするわけですから。Facebook、ここもたくさんもってそうですね。いわゆる GAFA と呼ばれる企業群や、米国系の IT企業はたくさんデータを持っていて、かつ扱っていそうです。
また中国の企業もたくさんのデータを持ってそうです。BATHと呼ばれる企業群を筆頭に多数のデータを持ち、また活用してそうです。
ビッグデータというキーワードはすぐに IoT により集められた多数のデータにより、と書かれているものが多いです。IoT と言われたときに例としてあげられるものは以下のようなものが多いですね。
スマートフォンから集計されたデータ
あちこちに設置されたネット接続されたセンサー
その他
米国系や中国系の IT企業ばかりが筆頭としてあげられますが、日本でも皆さんの身近にビッグデータをうまく扱っている企業はあります。
大阪ガス
ガスの検針装置は多数のデータを集めています。普段、私たちは料金しか意識しませんが、給湯器でエラーが出た、とか1日の間で使い方にどのような分布があるかも情報として持っています。そして大阪ガスはビッグデータをうまく扱っている会社の筆頭です。以下のページも見てください。
また以下のような書籍も出しています。これは面白かったです。
ダイドードリンコ
ダイドーの自販機でデータを集計しています。特にアイトラッキングによるデータ分析をしていることを知ったときには驚きました。購買者が購入する際に自販機のどの部分を目で見ているかをトラッキング、つまり補足しているとのことなのです。このアイトラッキングデータと実際の購買データを一緒に利用することでマーケティング効果があがったというのです。
以下の総務省のページにも記述があります。
例えば大阪ガスとダイドードリンコという一般消費者に身近な会社もすでにビッグデータを取得しビジネスに利用しているということを知ってもらいたかったので2つの例をあげました。決して IT 企業や携帯キャリアだけがビッグデータを扱っているわけではないということを意識してください。
最後に元資料にあるビッグデータで重要な 5 つの V についてです。これは 3つのV、5つのV、7つのV、10個の Vのように、いろいろな V があります。時代とともに変わることもあります。しかしこの資料にある 5 つの V が最もしっくりきます。
Volume(データ量)、Variety(多様性)、Velocity(スピード、更新頻度)、Veracity(正確さ)、Value(価値)
この5つですね。特に自分でビッグデータを扱う際には以下のことに注意してください。
Volume(データ量)は日々、指数関数的に増加することが多いです。それをあらかじめ意識して、対応可能なシステムにしておく必要があります。またVelocity(スピード、更新頻度)についても、更新頻度が高いのは良いことなのですが、高い更新頻度にシステムが追随できる必要があります。この2つはシステムを作っているうちにデータに負けてしまうことが無いように注意すべき項目です。
高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 に関するまとめの続きは以下からどうぞ。
では、ごきげんよう。