DSへの道を一歩ずつ歩け:読書メモ:データサイエンティスト養成読本 登竜門編
米国データサイエンティストのブログで、紹介されていた順番に、データサイエンティストの勉強をやることにした。(2020年12月から)
一部、渋谷データサイエンティストおすすめ本を、追加したり、入れ替えたりあり。
- DATA SCIENCE LIFE - データサイエンスを全ての人に
渋谷駅前で働くデータサイエンティストのブログ (hatenablog.com)
11冊目の本
データサイエンス養成読本 登竜門編
データサイエンティイストとして、知っておくべき知識を広範囲に説明されている。
ビジネス、エンジニアリング、データサイエンス、その範囲は、すごく広い。
この、「広い」をいうことを、改めて認識した。
データサイエンティイストとして必要な知識が広く掲載されているので、一通り読んで、全容をざっくり把握して、詳しくは別の書籍と実践で。
それにしても、守備範囲は広く、一人で全部こなすのは、至難の業。
機械学習は、数学が基本になっており、この本でも統計の基礎として扱われているが、数式はすっと入ってこない。
数式は、具体例を抽象化して表現したものであり、問題解決の思考方法を強化するうえでも、学んで損はないと思う。
目次
1章 データサイエンティストへの道しるべ
2章 データ分析環境構築ガイド
3章 初めてのシェル
⇒25年前は、得意だったのに。今は真っ赤に錆び付いている。
4章 データベース構築入門
⇒RDBの基礎知識は、必須だと思う。
初めて触れた。勉強になった。
5章 RStudio/Jupiter最速攻略
6章 データ前処理の基礎知識
7章 比べて学ぶR/Excelデータ分析の基本
⇒Excelも、小さな規模の解析では重宝する。Excelで簡単に済むことを、あえてRとかPythonとかでやる必要ない。
PowerPivot、PowerBIを使えれば、機械学習前の可視化と解析には、スクリプトは不要だと思う。
8章 クローラでWeb上の情報を収集しよう
9章 コーディング前に知りたい統計知識
10章 さまざまなデータの理解と表現
11章 機械学習入門
---道標---
https://datawokagaku.com/statistics_book_beginner/
【超入門】全くの初心者におすすめする統計学の「超」入門本【米国データサイエンティスト厳選】
★・統計学がわかる (ファーストブック)⇒読了! 2020年12月
★・統計学がわかる 【回帰分析・因子分析編】 (ファーストブック)⇒読了! 2020年1月
★・図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術⇒読了! 2020年2月
★・マンガで分かる統計学 ※もうちょっと、ざっくり分かりたかったので追加⇒読了! 2020年3月
https://datawokagaku.com/statistics_basic/
【基礎編】超おすすめの統計学の本【米国データサイエンティストが本気で厳選】
★・Rによるやさしい統計学 kindle版おすすめ⇒読了!2020年5月
・初めての統計学 (未読了手持ち本を追加)
・Rで学ぶ確率統計学一変量統計編(渋谷データサイエンティストおすすめ入れ替え)
・Rで学ぶ確率統計学 多変量統計編(渋谷データサイエンティストおすすめ入れ替え)
・実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専門書)(渋谷データサイエンティストおすすめ入れ替え)
・新版 統計学のセンス ―デザインする視点・データを見る目― (医学統計学シリーズ1)(渋谷データサイエンティストおすすめ入れ替え)
・よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ) (「心理統計学の基礎」の予習として追加。アマゾンレビューから)
以下、保留
・心理統計学の基礎―統合的理解のために (有斐閣アルマ)
・続・心理統計学の基礎―統合的理解のために (有斐閣アルマ)
・基本統計学 第4版
・Think Stats
・Think Bayes
・現場ですぐ使える時系列
・データ分析・多変量解析法入門
https://datawokagaku.com/math_books/
【機械学習のための】数学を勉強するのにおすすめの本とロードマップ【米国データサイエンティスト厳選】
・人工知能プログラミングのための数学が分かる本(入門として、手持ち本追加)
・ディープラーニングが分かる数学入門(入門として、手持ち本追加)
・線形代数キャンパス
・微分積分キャンパス
・常微分方程式キャンパス
・偏微分方程式キャンパス
・ラプラス変換キャンパス
・フーリエ解析キャンパス
・プログラミングのための線形代数
https://datawokagaku.com/machinelearning_books/
機械学習のおすすめの本とロードマップ【米国データサイエンティスト厳選】
・機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning)(渋谷データサイエンティストおすすめ追加)
・見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑(渋谷データサイエンティストおすすめ追加)
・An Introduction to Statistical Learning: with Applications in R(通称ISL) 英語版はネットで読める http://faculty.marshall.usc.edu/gareth-james/ISL/
・Rによる 統計的学習入門(上の日本語版)
・仕事ではじめる機械学習(手持ち本、渋谷サイエンティストもおすすめ)
・言語処理のための機械学習入門
・はじめてのパターン認識
・フリーソフトでつくる音声認識システム パターン認識
・機械学習の初歩から対話システムまで
https://datawokagaku.com/easy_books/
【読み物系】データサイエンス全般おすすめ本【統計/機械学習/人工知能の一般教養】
★・人工知能は人間を超えるか ディープラーニングの先にあるもの⇒数年前に読了
★・脳・心・人工知能 数理で脳を解き明かす⇒2021年2月読了
★・統計学が最強の学問である⇒2021年3月読了
★・AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出](渋谷データサイエンティストおすすめ追加⇒2021年4月読了
★・データサイエンティスト養成読本 登竜門編 (Software Design plus)(渋谷データサイエンティストおすすめ追加)⇒2021年7月読了
・戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック(他の方推薦追加)
・物理学者、ウォール街を往く。―クオンツへの転進
・IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる
https://datawokagaku.com/recommend_books_engineers/
【米国AI開発者が厳選】全てのエンジニアに読んでほしいおすすめの良書一覧【必読書】
★・リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック⇒2021年1月 読了
・コンピュータはなぜ動くのか~知っておきたいハードウエア&ソフトウエアの基礎知識~
・アルゴリズムを、はじめよう
・プログラミングコンテスト攻略のためのアルゴリズムとデータ構造
・Webを支える技術 -HTTP、URI、HTML、そしてREST
・コーディングを支える技術 ~成り立ちから学ぶプログラミング作法
・GPUを支える技術 ――超並列ハードウェアの快進撃
・理科系の作文技術
・まんがでわかる 理科系の作文技術