Pythonデータ解析入門

https://pythondsbook.github.io/ | 出版所: 東京大学…

Pythonデータ解析入門

https://pythondsbook.github.io/ | 出版所: 東京大学出版会 | ISBN: 978-4-13-062466-4 | note管理・文責: 森 純一郎(著者)

最近の記事

  • 固定された記事

『Pythonデータ解析入門』 まえがきより

データサイエンスや人工知能(AI)を担う人材を幅広く育成するために,全国の高等教育機関で現在,数理・データサイエンス・AI教育が進められています.そのような教育の推進の中心を担っている数理・データサイエンス・AI教育強化拠点コンソーシアムでは,「リテラシーレベル」と「応用基礎レベル」のモデルカリキュラムを公表しています.特に「応用基礎レベル」では,数理・データサイエンス・AIを活用するための基礎的な知識・スキルの習得,さらにそれらの専門分野への応用基礎力を習得することが目標と

    • Introduction to Data Analysis with Python

      In response to the growing demand for expertise in data science and artificial intelligence (AI), Japanese higher education institutions are spearheading initiatives to nurture diverse talent in these fields. This textbook, focusing on data

      • 『Pythonデータ解析入門』 第13章 ニューラルネットワークの基礎

        本章ではニューラルネットワークの基礎について学びます.ニューラルネットワークは,神経細胞の間の情報伝達の仕組みをコンピュータでモデル化したものです. ニューラルネットワークのモデルは入力に対して多段の変換を行うことで任意の関数を近似的に表現することができ,そのモデルをたとえば機械学習の回帰や分類などのタスクに用いることができます. 特に,深い多層のニューラルネットワークである深層ニューラルネットワークに基づく機械学習の技術は,深層学習として近年著しく発展し実社会のさまざま

        • 『Pythonデータ解析入門』 第12章 ロジスティック回帰

          本章ではロジスティック回帰の基礎について学びます.ロジスティック回帰は,入力に対して離散値を予測する教師あり学習のタスクである分類に適用することができます.たとえば,機械学習を応用した画像認識,機械翻訳,音声認識などでは対象の問題を分類として解くことをしており,分類は実社会のさまざまな実問題に適用することができます. まず,ロジスティック回帰モデルによる分類の基本的な考え方について学びます. 次に,1つの入力の変数に基づく2クラス分類の例から始め,勾配降下法を用いたロジス

        • 固定された記事

        『Pythonデータ解析入門』 まえがきより

          『Pythonデータ解析入門』 第11章 モデル選択

          本章では機械学習のモデル選択の基礎について学びます.機械学習では,モデルが訓練に用いたデータだけでなく,未知のデータに対しても正しく予測を行うことができるように適切にモデルの複雑性を決定することが重要になります. まず,モデルが複雑化することで生じる過学習の問題について,多項式回帰を例に学びます.また,過学習の問題を解決する方法の1つとして正則化について学びます. 次に,機械学習のモデルの複雑性を適切に選択するモデル選択について学びます.特に,期待される汎化誤差をなるべく

          『Pythonデータ解析入門』 第11章 モデル選択

          『Pythonデータ解析入門』 第10章 線形回帰

          本章では線形回帰の基礎について学びます.回帰は入力に対して連続値を予測する教師あり学習のタスクで,たとえば将来の需要,消費量,価格,人流などの数値を予測することに応用することができます. まず,回帰の基礎となる線形回帰の基本的な考え方について学びます. 次に,線形回帰のモデルを学習するための基本的な考え方となる最小二乗法について学びます.また,モデルのパラメータを具体的に推定するための方法として勾配降下法について学びます. 最後に,回帰のモデルの評価方法について学びます

          『Pythonデータ解析入門』 第10章 線形回帰

          『Pythonデータ解析入門』 第9章 主成分分析

          本章では主成分分析の基礎について学びます.主成分分析は,データの高次元な特徴空間を低次元の特徴空間に変換する次元削減の手法の1つです.主成分分析によりデータがその特徴空間において持つ情報を要約するような新たな特徴を見つけることができ,データの圧縮やデータの可視化に応用することができます. まず,主成分分析による次元削減の基本的な考え方について学びます.次に,2次元のデータの直線上での表現を例にして,分散を最大化するという主成分分析の基本的な考え方について学びます.最後に,主

          『Pythonデータ解析入門』 第9章 主成分分析

          『Pythonデータ解析入門』 第8章 クラスタリング

          本章ではクラスタリングの基礎について学びます.クラスタリングを用いると,たとえばマーケティングのための顧客のセグメント,商品推薦のための嗜好が類似するユーザの抽出,遺伝子発現パターンのグループ化などの応用例のように,データセットから類似した特徴を持つ事例をまとめてグループ分けを行うことができるようになります. まず,クラスタリングの基本的な考え方について学んだ上で,具体的な手法として階層化クラスタリングについて学びます.次に,クラスタリングの別の手法としてK-means法に

          『Pythonデータ解析入門』 第8章 クラスタリング

          『Pythonデータ解析入門』 第7章 機械学習の基礎

          本章では機械学習の基礎について学びます.まず,機械学習におけるデータの表現の仕方について学びます.次に,機械学習の教師あり学習の考え方として具体的なタスクである分類と回帰を例に学びます.その際,機械学習において重要となる汎化性能の考え方についても併せて学びます.次に,教師なし学習の考え方について学びます.最後に,データをもとにモデルを学習するという機械学習の過程について学びます. プログラミング演習では,教師あり学習の回帰を例にして,実際のデータを用いた簡単な機械学習の処理

          『Pythonデータ解析入門』 第7章 機械学習の基礎

          『Pythonデータ解析入門』 第6章 ネットワークデータ分析の基礎

          本章ではネットワークデータ分析の基礎について学びます.特にネットワークデータを例として,データ間の関係を行列として表し処理を行う方法について学びます. まず,データ間の関係に着目した分析であるネットワーク分析について概観した上で,ネットワークを行列として表現する方法を学びます.次に,ネットワークにおける距離として最短経路の計算方法について学びます.最後に,ネットワークの各点の重要度を示す指標である中心性の計算方法について学びます.特に,固有ベクトル中心性とページランクでは,

          『Pythonデータ解析入門』 第6章 ネットワークデータ分析の基礎

          『Pythonデータ解析入門』 第5章 テキストデータ分析の基礎

          本章では,テキストデータ分析の基礎について学びます.特にテキストデータを例として,データのベクトルによる表現と処理の方法について学びます. まず,テキストデータについて概観した上で,テキストを分割する処理である分かち書きと形態素解析について学びます.次に,単語を特徴としてテキストをベクトルとして表現する方法を学びます.最後に,テキスト間の類似度をベクトルの演算に基づき計算することを学びます. プログラミング演習では,実際のテキストデータを用いて,ベクトルとして表現したテキ

          『Pythonデータ解析入門』 第5章 テキストデータ分析の基礎

          『Pythonデータ解析入門』 第4章 データ分析の基礎

          本章ではデータ分析の基礎について学びます.まず,データの表現の仕方とデータの種類について整理します.次に,データの収集について学んだ上で,データを観察してその特徴を理解するための方法として記述統計量の計算や可視化について学びます.最後に,実際にデータ解析を行うにあたり,前処理として必要となる欠損値や外れ値の処理などのデータの整形と加工について学びます. 本章の学習を通して,データ解析を行う準備となるデータの収集から前処理までの一連の基本的な処理について理解し,実データに対し

          『Pythonデータ解析入門』 第4章 データ分析の基礎

          『Pythonデータ解析入門』 第3章 Pythonのモジュール

          本章ではPythonのモジュールの使い方を学びます.具体的には,モジュールの基本的な使い方を学んだ上で,データ解析のためによく用いられる代表的なモジュールであるNumPy, pandas, Matplotlibの使い方について学びます. 本章の学習を通して,これらのモジュールの基本的な使い方を理解した上で,Pythonを用いてデータの読み込み,データの集計や抽出,データの可視化などの基本的な処理ができるようになることを目標とします. 3.1 モジュール 3.2 pand

          『Pythonデータ解析入門』 第3章 Pythonのモジュール

          『Pythonデータ解析入門』 第2章 Pythonの基礎

          本章ではPythonプログラミング言語の基礎を学びます.具体的にはPythonの基本的な文法として,算術演算,変数と関数の定義と使い方,条件分岐や繰り返し処理などの制御構造の定義と使い方,リストや辞書などのデータ構造の定義と使い方について学びます. 本章の学習を通してPythonの基本的な文法を理解した上で,簡単な計算の手続きをPythonのプログラムとして実装できるようになることを目標とします. 2.1 Python プログラミング言語 2.2 算術演算 2.3 変

          『Pythonデータ解析入門』 第2章 Pythonの基礎

          『Pythonデータ解析入門』 第1章 データ解析を学ぶ

          情報端末・機器,インターネット,ウェブなど情報通信技術の発展と普及によりさまざまなデータが生み出され,その量は爆発的に増加しています.特に,膨大で多様なデータはビッグデータと呼ばれ,それらのデータを処理・分析し,データから価値を創造するための技術であるデータサイエンスの重要性が高まっています. (データサイエンスのスキルを備えた人材をデータサイエンティストと呼びます.データサイエンティストは,数学,計算科学,統計学を土台にして,専門家と適切にコミュニケーションを図りながらデ

          『Pythonデータ解析入門』 第1章 データ解析を学ぶ