見出し画像

【内容一部公開】MDASH準拠!手を動かしながら基本を学ぼう――近刊『データサイエンス実践テキスト』

まもなく発行される新刊書籍、『データサイエンス実践テキスト』のご紹介です。
同書の一部を、発行に先駆けて公開します。



***

まえがき

「風が吹けば桶屋が儲かる」とは日本の有名なことわざですが、現代では「人・モノが動けばビジネスチャンスが生まれる」と言い換えることができます。さらに、このことわざに補完的な解釈を付け加えると、「人・モノの動きでデータが生まれ、そのデータを分析することが商売につながる」となり、より現代的な格言のように思えます。

2019年に日本政府が打ち出したAI戦略に基づき、高等教育機関では「数理・データサイエンス・AI教育プログラム認定制度」に沿った授業が実施されるようになりました(筆者の所属する東京都立産業技術高等専門学校もこの制度のリテラシーレベルの認定を受けており、本書はそのモデルカリキュラムに準拠した内容です)。これは来るべきデジタル社会に向けて、国民全員が数理的にデータ処理やAIを扱えるようになることを目的としています。高等学校で「情報」科目が必修になったことからも、このようなスキルの重要性をうかがい知ることができると思います。

この「数理・データサイエンス・AI教育プログラム認定制度」では習熟のレベルに合わせて複数の段階が設定されていますが、まずはリテラシーレベルの学習が必須であるとされています。その内容はSociety5.0に移行する社会の変化に伴い、データ倫理やデータの利活用(読む、説明する、扱う)、そしてプログラミングといった非常に広い範囲に及んでいます。また、学生の専攻を問わず全員が習得する必要があるので、各高等教育機関ではそれぞれの特色に合わせて多様な教育が実施されています。

そのような中、私たちは理系技術者を育てる立場から、本書を執筆しました。私たちは日頃から、自然科学の知見を応用して社会を進歩させるための実学を教えており、それらの内容を修得した学生を世の中に多く輩出しています。そのような学生たちに期待していることは「社会に出たときに実践的に使える知識・技術を習得すること」です。そのため、リテラシーレベルの教育でも、統計処理、プログラミングの実装などに重きを置くべきだと考えています(理系技術者にも倫理や社会的規範は重要なので、もちろんそれらも教育します)。データサイエンスを通じて、さらなる価値を創造し、「データを分析することがビジネスにつながる」という現代の格言を、身をもって学んでほしいと思っています。

よって本書は、世の中で出版されているデータサイエンス分野の教科書とは少し異なり、手を動かしながら学ぶ内容が中心です。これは、実践的な能力が求められている技術者にマッチしている内容であるとともに、すでに社会に出た方々も日頃の業務を通じて実践できる内容です。本書が皆さんの御力になれば幸いです。

なお、本書のサポートサイトにて、学習に必要な各種データやサンプルファイルを提供しています。以下のURLにアクセスして、活用してみてください。

https://github.com/DsTMCIT/DS

Excelファイルはマイクロソフト社のExcel2022で作成していますが、バージョンに依存する関数は使用しないようにしているので、ほかのバージョンでも動作します。

Pythonファイルは、グーグル社のGoogle Colaboratory上で動作するものを掲載しています。ご自身のパソコンで実行させる方法については、ほかの書籍などを参考にしてください。なお、2024年10月時点でのGoogle ColaboratoryのPythonのバージョンは3.10.12です。

***

東京都立産業技術高等専門学校 山本昇志(共著)
東京都立大学 下川原英理(共著)
東京都立産業技術高等専門学校 齋藤純一(共著)
東京都立産業技術高等専門学校 真志取秀人(共著)

**********************************
「数理・データサイエンス・AI教育プログラム認定制度(MDASH)リテラシーレベル」のモデルカリキュラム準拠!
手を動かしながらデータサイエンスの基本を学ぼう
**********************************
 
データサイエンスの基本をしっかりと学ぶ入門書。認定制度のモデルカリキュラムで扱う内容、具体的には、データサイエンスが求められている社会的背景から、データの扱い方、確率や統計の基礎、簡単なデータ分析までを一冊にまとめました。
データサイエンスの世界への第一歩を、この本で踏み出しましょう。 

《本書の特長》

  • 認定制度のモデルカリキュラムに準拠した内容で、データサイエンスの基本事項をもれなく学べる。

  • フルカラーのイラストや図表、写真を豊富に用いて解説しているので、視覚的にわかりやすい。

  • ExcelやPythonで実際のデータを触りながら分析ができるので、理論と実践が結びつく(プログラムは[ダウンロード]にあります)。

  • 確率は中学校の復習から、Pythonについてはプログラミングの基礎からしっかり解説。既習知識があやふやでも心配なし!

【目次】
第1章 データ・AIの利用/活用

1.1 Society5.0
1.2 ビッグデータとデータサイエンス
1.3 データサイエンスの実施サイクル
1.4 データサイエンスとAIの関係
1.5 AI技術の進歩
1.6 生成AI
1.7 データサイエンスの活用分野

第2章 データやAIを扱ううえでの倫理
2.1 データやAIにおける倫理
2.2 AI活用7原則
2.3 開発者の倫理的・法的・社会的課題
2.4 AIの危険性
2.5 データの透明性・アカウンタビリティ
2.6 データバイアス

第3章 データの正しい扱い方
3.1 情報セキュリティ
3.2 セキュリティ事故の例
3.3 データの秘匿化
3.4 データの分析の結果を正しく判断するには

第4章 データの特徴を知る:統計の基礎
4.1 データサイエンスにおける統計学の役割
4.2 基本統計量①:代表値
4.3 基本統計量②:散布度
4.4 記述統計の基礎
4.5 推測統計の基礎

第5章 データの頻度を知る:確率の基礎
5.1 試行と事象
5.2 順列と組合せ
5.3 確率を求める
5.4 加法定理
5.5 乗法定理
5.6 条件付き確率
5.7 条件付き確率とデータサイエンスの関係

第6章 Excelによるデータ処理と簡単な分析
6.1 データの種類と分析処理の手順
6.2 データの読み込み
6.3 データの整理
6.4 データの加工
6.5 データの保存
6.6 データの簡単な分析

第7章 Pythonによるプログラミング
7.1 Pythonについて
7.2 プログラミングの基礎①:数の扱い
7.3 プログラミングの基礎②:プログラムの作成
7.4 アルゴリズム入門

第8章 Pythonによる簡単なデータ分析と可視化
8.1 データサイエンスにおけるPythonの利用
8.2 簡単なデータ分析
8.3 グラフの作成

第9章 Pythonによる一歩進んだデータ分析
9.1 外れ値を除去する
9.2 二つのデータ間の関係を探る

第10章 データサイエンスの実施に向けて
10.1 オープンデータの利用
10.2 データ分析が終わったら

解答例
索引


いいなと思ったら応援しよう!