【Master DS4E】UCバークレー大学のデータサイエンス授業を最新のAIとJupyterHubでマスターする6か月
こんにちは、Choimirai Schoolのサンミンです。
【主要なアップデート】
(2023.07.16)Master DS4Eプログラムが7月24日から生まれ変わります
0 はじめに
2023年7月24日(月)から「DS4E」プログラムが生まれ変わります🎊。
今回の note では「Master DS4E」の詳細を説明させていただきます。Pythonの基礎から始め、データサイエンスの授業を受講します。
1 「Master DS4E」をスタートした経緯
2021年9月9日にData8のコンテンツをChoimirai Schoolでも提供したく、UCバークレーの担当者に連絡をしたところZoomの会議で詳細を話すことに。
【2021年9月16日】早朝に会議をし、Privacy Agreementに同意すれば授業を行うための資料をシェアしてくださることが決まりました。
【2021年9月17日】Data8で導入しているJupyterHubやOkPyは既に触ったことがあるシステムでしたので、シェアしてもらった資料を元に学習環境の設定や生徒側がどんな流れで学習を進めるかまで確認できた次第です。
2 UCバークレー大学のData8とは?
Data8はUCバークレーが2015年からキャンパスの学部生を対象に教えていたFoundations of Data Science講義を2018年からオンラインで提供しているプログラムです。
UCバークレーでは年に3回提供しているクラスですが毎回1400前後の学生が受講している非常に人気の高い授業です。受講生はコンピュターサイエンスの学部生を含め、政治、経済、建築、生物学、脳科学など60を超える学部から受講しているようです。
UCバークレーの在校生ではない人がData8を受講する方法は2つあります。
①UCバークレー大学のオンライン講義
②edXの講義
前者は全部で33個の動画になっていて一つの講義は50分前後。一方で、後者は、33項のレクチャーを3つの授業に分けて、動画も166個と講義の内容をより細かく分けてあります。そのため、英語を第二言語として学ばれた方にはedXの授業がお勧めです。
「Master DS4E」でもedXのフォーマットを採用しています。
3 データサイエンス・機械学習を勧める理由
Master DS4Eでは33項のレクチャーを3つの授業に分けて進めます。
①Data Science: Computational Thinking with Python
②Data Science: Inferential Thinking through Simulations
③Data Science: Machine Learning and Predictions
Pythonを通じてソフトウェア的な解決方法を学び、それからデータサイエンスと機械学習のスキルを身につけるカリキュラムとなっています。
MITの学長はデータサイエンスや機械学習のスキルと専門知識を兼備した人材を「the bilinguals of the future(未来のバイリンガル)」と定義しています。
また、LinkedInの調査によりますと2020年にもっとの人気のあった職業として、1位が人工知能の専門家で、3位にはData Scientistがランクインされています。
時代の流れを考えても今後機械学習専門家のニーズは益々増えるはずです。
4 プログラムの特徴①:ほぼ全ての学習はJupyterHubとNotion上で
「Master DS4E」では全ての学習をNotionとJupyterHub上で行います。
YouTubeの講義動画(全部で167本)はスクリプト付きでJupyterHubとNotionに埋め込んだ状態でシェアさせていただきます。
一つの講義を受講する流れは、
①重要な箇所にタイムスタンプ+メモを取りながら講義を見る
②Jupyter Notebookでコードを確認
③最新の人工知能とチャットをしながら学ぶ
④日々の学びをご自分の言葉でまとめる
■重要な箇所にタイムスタンプ+メモを書きながら講義を見る
Notionでは簡単にYouTube動画へのタイムスタンプが作られるようになっています。重要だと思われる箇所にタイムスタンプをつけながら見るようにしてください。動画は15分前後となっていて消化しやすい分量となっています。
■Jupyter Notebookでコードを確認
講義の動画を最後まで見終わりましたら、続けてnotebookのコードで理解を深めることができます。
■他の関連資料があれば合わせて読む+メモを書く
「Master DS4E」では講義の動画だけでなく講義内容の理解を深めるため、関連教材のチャプターもシェアしています。
関連教材が埋め込まれている場合は、合わせて読んでメモを取るようにしてください。
5 プログラムの特徴②:内容を日本語に訳すのも簡単
全てのコンテンツはJupyterHubとNotion上で埋め込んで学習を進めますので、必要に応じて講義動画のスクリプトや教材をDeepLなどの機械翻訳で訳すのも簡単です。
6 プログラムの特徴③:Jupyter Notebookの自動採点
「Master DS4E」ではUCバークレー大学が開発したJupyter Notebookの自動採点システム、otter-graderを導入しています。Labや宿題では、間違えた箇所があればすぐわかって、ヒントも出してくれますので大変助かります。
7 プログラムの特徴④:Canvasでスマホからの学習も可
「Master DS4E」の講義はRoamだけでなくCanvasのサイトから受けることもできます。Canvasを採用することで移動中でも動画を見たりクイズが解けるメリットがあります。
また、クイズを解くことで全体の進捗を確認することもできますので、クイズはCanvasから進めることをお勧めしたいです。
8 プログラムの日程
「Master DS4E」は全部で4つのセクションに分かれています。
①NotionとJupyterHubに慣れる
②Computational Thinking with Python:Pythonの基礎
③Inferential Thinking through Simulations:データサイエンスの授業
④Machine Learning and Predictions:機械学習の授業
参加者の知識レベルにもよりますが、基本的には下記の日程で進めさせていただきます。
9 まとめ
Kaggle Competitionに参加できるレベルのスキルを鍛えるのはそう簡単ではありません。しかしながら、自分を信じて最新のAIと協力しながら学びますと、なりたい未来の自分に近づけることができます。
6か月後の未来の自分のために、報われる努力を始めませんか?
「Master DS4E」は2023年7月24日(月)から生まれ変わります。