高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 #2

株式会社リュディアです。引き続き総務省より公開されている高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 についてまとめてみます。

総務省の元資料はこちらから参考にしてください。

また私どもリュディアがまとめている前回までの 高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 に関するまとめ へのリンクは以下を参考にしてください。

今回はデータサイエンスとはという切口でまとめてみます。いろいろな定義があると思うのですが、私がデータサイエンスの定義として考えているのは以下の 2 つです。特に目新しさはないと思います。

A. 大量のデータから要求される情報を抽出したり計算したりすること
B. 大量のデータから有意な情報を得ること

このうち A はどちらかといえば従来にエクセルでされてきたような内容を大規模化したものと考えてください。数学を高校1年くらいでやめてしまった人のデータサイエンスのイメージは A に近いと思います。何を言っているのかというとあらかじめ必要な情報を指定されて大量のデータの中からこれらを抽出するのが A です。

例えばコロナ禍で人の動きがどのように変化したか?携帯キャリアが大きな駅の周辺での自社基地局との接続情報から人流の情報を公表することがあります。予め人がどの程度、屋外に出て活動しているかを確認する、という明確な目標があり、そのためのデータも存在します。つまり集計作業のわけです。

一方の B はどのようなイメージでしょうか?こちらが現在、データサイエンス分野でエンジニアに要求されるスキルです。多数のデータを分析し有意な情報を得ることになります。たとえばある分野のデータを得た場合に、その分野の事情に精通している必要があると思います。また統計学を含む数学も必要になるでしょう。自分でコーディングまでするならプログラミングの技術も必要になります。

このように広くデータを扱う学問がデータサイエンスであるため、少なくとも必要なスキルの定義は可能ですが、これだけあれば大丈夫というスキルを定義することは非常に難しいです。またある特定の分野でデータサイエンティストとして活躍していた人が、異分野でもデータサイエンティストとして活躍できるかというと難しい、もしくは活躍できるまでには時間がかかるというのが正直なところではないでしょうか。一例として金融分野と製造業では扱うデータや知っておくべきことが異なりますよね。

今はデータサイエンティストという特殊な業種が存在しています。しかし私は10年後くらいには特別な存在としてのデータサイエンティストは一部に必要ですが、一般の方もデータサイエンティストとして最低限のことは身に着けておく必要があると考えています。

例えば20年前、多くのビジネスマンがノートPC を持ち歩き、1日の多くをノートPCの前で仕事をする状況を想像できたでしょうか?当時はノートPCあるいは PC を扱う人は一部特殊な人であったわけですが今では PC を使って仕事をすること、Word やエクセルを使えることは必須といってもよい時代に入っています。データサイエンスについても同じようになるのでは、というのが私の予想です。

もちろん誰にでも扱いやすいようにブラックボックス化されると思いますが、その際に、本当にブラックボックスとして扱っている人と、おおよそ内部で何をしているのかわかってる人では使いこなし具合が変わると思います。今の PC でもそうですよね。中身を理解して使っている人と、操作だけ覚えている人では各段の差があります。

またデータサイエンスを理解していると、その先に AI のアルゴリズムがあるため具体的なイメージを持って理解することが可能になると思っています。そのため AI の勉強をするにもデータサイエンスの基礎スキルを持っていることは重要だと思います。

今回はデータサイエンスについてまとめてみました。あくまでリュディアの見解であり、これから勉強を開始しようとする高校生や学生の皆さんへのコメントです。さまざまなレベルの方がさまざまな意見をお持ちだと思いますし、学びを続けることは重要だと思います。

高校数学における「情報II」のためのデータサイエンス・データ解析入門 第1章 に関するまとめの続きは以下からどうぞ。

では、ごきげんよう。


この記事が気に入ったらサポートをしてみませんか?