見出し画像

高校生向け「データサイエンス講座」

はじめまして、三菱UFJフィナンシャル・グループの戦略子会社であるJapan Digital Design(以下 JDD)でMUFG AI Studio(以下 M-AIS)に所属する、田邊です。

同僚の平山と、10月3日にスーパーサイエンスハイスクール(以下 SSH)の指定校である「山形県立米沢興譲館高等学校(以下 米沢興譲館)」にて、高校2年生向けにデータサイエンス講座を行ってきました。
本記事では、どのような講座を行ったのか、講座の一部をご紹介します。


データサイエンス講座を行った高校

SSH第Ⅳ期の3年目を迎える米沢興譲館では、SSHの取り組みの一つとして、科学技術が世の中でどのように活用されているかを外部講師を通して学ぶ講座を毎年開催しており、今年はJDDが講師を務めさせていただきました。

スーパーサイエンスハイスクール(SSH)とは

文部科学省では、将来の国際的な科学技術人材の育成を図るため、平成14年度より科学技術、理科・数学教育に関する研究開発等を行う高等学校等を「スーパーサイエンスハイスクール」に指定し、理科・数学等に重点を置いたカリキュラムの開発や大学等との連携による先進的な理数系教育を実施しています。

(引用:スーパーサイエンスハイスクール(SSH):文部科学省 (mext.go.jp)

弊社OBが米沢興譲館のSSHコーディネーターを務めており、本講座が実現しました。

データサイエンス講座の内容

講座は、データサイエンスが地域・社会にどのように貢献するか、データサイエンスとは何かをハンズオンやディスカッションを通して体験してもらうことを目的として行いました。

講座は理数探究科の2年生57名(男子35名、女子22名)に参加いただき、休憩も含め約4時間のスケジュールで行いました。

1. データサイエンスが地域と社会にどう貢献するか

まず最初に、本講座を聞くモチベーションにしてもらえるよう、データサイエンスが世の中でどのように利用されているかを紹介しました。

過去のAIブームについて触れながら、現在の第3次AIブームは豊富なデータとコンピューティング能力の向上により過去最高の盛り上がりであること、他社事例を含めながら様々な分野(食品、アパレル、エンターテイメント、農業、自動車、日常生活の改善など)でデータサイエンスが利用されている点を紹介しました。

生徒からは、
「職人の経験や勘をデータ化する事例に驚いた」
「企業や社会でデータを利用することが重要であるとわかり、勉強していきたいと思った」
「データサイエンスは今後多くの分野で必要とされるスキルであり、データを扱う能力を身に付けていきたいと思った」
という声をいただきました。

2. データサイエンスを体験する(本講座の目的)

実際に考えて手を動かしてデータサイエンスを体験してもらうことを目的に、前半では「データを理解すること」について、後半では「機械学習」についてハンズオンで行いました。

2-1. 金融と経済のデータ(データ理解)

金融と経済のデータ(※)を利用しながら2つのディスカッションを通して、データを理解するために必要なポイントを学んでもらえるようにしました。

金融と経済のデータ(A):平均年収は直近上がっている。私たちは裕福になっているということ?
金融と経済のデータ(B):60万円のApple Vision Proを購入。どの支払い方法を選択する?

(※)MUFGでは、社会貢献の一環として小中高向けの金融教育教材があります。金融や経済に関しても触れてもらえるよう、金融教育教材を参考にテーマを選びました。

金融と経済のデータ(A)では、データから物事を理解・判断する際には目的に沿ったデータを利用し、比較することが第一歩であることをお伝えしました。

生徒同士でディスカッションしてもらい、代表の何名かの生徒に回答いただきましたが、
「収入だけではなく支出も見なければいけない」
「収入が増えていても物価が上がっていたら裕福とは言えない」など、
皆さん経済観念がしっかりしており驚きました。

金融と経済のデータ(B)では、Excelを利用して複利計算を実際に行ってもらうことで、当初イメージしていた支払金額と、実際に計算した支払金額の違いを感じてもらいました。

上記(A)(B)の他にも、データを理解する際に誤解が生まれやすい「平均(算術平均)と中央値」、「相関と外れ値」についても事例紹介(※)やnotebook(※)を動かしながら体験してもらい、統計量(平均・相関等)だけで満足してはいけない点をお伝えしました。

(※)「相関と外れ値」の事例紹介で利用したサイトリンク:
Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing
(※)「相関と外れ値」で利用したGoogle Colab notebook:
探求学習_相関.ipynb

2-2. ポケモンのデータ(機械学習)

実際に機械学習を体験してもらう時間では、ポケモンのデータ(※)を利用し、Google Colab上でnotebook(※)に用意したプログラムを各自編集・実行して、可視化、特徴量追加、モデルの学習と検証に取り組みました。

(※)ポケモンのデータ:
Pokemon with stats (kaggle.com)
(※)利用したGoogle Colab notebook:
探求学習_ポケモンの特徴を用いた「伝説のポケモン」予測モデル.ipynb

HPや攻撃力のデータから、伝説のポケモンか、そうでないかを判別するタスクになります。

講座では、オリジナルのデータから「Total」の項目(伝説のポケモンであるかを判断するために重要な指標であるが他の項目から計算できる)を除いたものを使用し、高校生達に試行錯誤してもらうようにしました。

1年生の際にpythonの基本を学んでいたとのことでしたが、この「機械学習」の時間は結構難しかったという声をもらいました。
(新しい単語や概念が多く、Google Colabの利用にも少しハードルがありました。)

フィードバックアンケートでは、
「コード自体は知っていたが、実際に手を動かして実行するとエラーが出たりして難しかった」
「ポケモンがテーマだったこともあり苦手意識が薄れ取り組みやすかった」
等の声があり、問題自体は難しかったですが、良い体験をしてもらえたかなと思います。

3. 機械学習の仕組み

最後にまとめとして、実際に手を動かしながら体験してもらった機械学習について、AIや深層学習等の関係性、機械学習やLLMの仕組みについて背景知識を講義形式でお伝えしました。


振り返り

私たちが高校生の頃は外部の方から社会や世の中について聞く機会は無かったため、今回この話をいただき、高校生が進路を考える一助になればと思い参加させてもらいました。

このような講座を行うことは初めてであり改善点も沢山見つかりましたが、いただいた生徒からのフィードバックアンケートを見ると普段接することの少ない「金融」や「データサイエンス」について興味関心を持ってもらうことができたのではないかと感じます。

先生方からは
「学校だけではなかなかできないレベルの高い授業ができて良かった」
との声もいただき、学校側の助けにもなれたようで嬉しかったです。

また、現在の高校生は私たちの頃とは異なり、情報の授業やPCを利用した授業などもあり、今の高校生を少しですが知ることができてとても新鮮でした。

来年も機会があれば今回の講座をブラッシュアップした内容で、データサイエンティストを目指したり、データサイエンス技術を活用できる人材の育成に貢献していきたいと思いました。

この記事を見ていただいた他の高校の方々で、今回の教材を使いたいなどの要望があれば相談に乗りますので、ぜひご連絡ください。



Japan Digital DesignのMUFG AI Studio(M-AIS)では、AI技術を軸に、顧客&データ起点で金融体験をアップデートすることに挑戦してくださる仲間を募集しております。

カジュアル面談も実施しておりますので下記リンク先からお気軽にお問合せください。

この記事に関するお問い合わせはこちら


M-AIS Data Scientist
田邊