優良データサイエンス関連教材をたっくさんまとめてみた
今まで僕がデータサイエンス関連で勉強してきて実際にやった&良いと聞いた、優良教材や無料の教材をまとめました。
今後もどんどん更新していきますので、保存してご活用ください!
自己紹介
データサイエンティストを目指して日々勉強している、慶應大学理工学部4年生(2023.12.31時点)
取得資格、コンペ優勝経験など、リアルタイムの情報は👇👇👇をみてね
X: @A7_data←こういう者です。
プロフィールページ👇👇👇
優良教材まとめ
自分が利用したことのあるもの、利用していないけど良さそうなものを分野別にまとめました。
必須ツール
ChatGPT (GPT-4)
みなさんご存知、神です。ただのチャットボットだと思っている人はいますぐ考え直すべき。わからないことがあったらこれに聞けばめちゃくちゃわかりやすく教えてくれる。勉強のロードマップも立てられる。練習問題や100本ノックさえも作成可能。論文も爆速で読めます。
これで月20ドル(だいたい2500円くらい?)なんて、まじで安すぎる。必須です。ちなみに、GPT-4に触れるとGPT-3.5にはもう戻れないと感じるくらいの差はあるので、ぜひ課金しましょう。
僕がTOEICで915点を1ヶ月ちょいで取れたのも、GPT-4のおかげです。詳しくは☝️☝️☝️
GitHub Copilot
プログラミングをするなら絶対に入れたい、プログラミングの神。ChatGPTをプログラミングに特化させたものと考えればだいたいOK。書きたい処理をコメントすればそのコードを書いてくれる。しかもバグの出ないコードで、簡潔に。普通に勉強にもなるし、時間・労力共に削減できるのでよりプログラミングする時間を増やせる
学生なら無料で使えるので、まじで学生は試してみて。詳しいことはこの記事に書いたので、見てみてください
データサイエンス関連
おすすめ発信者(よく見てる人。この他にもたくさんいらっしゃると思う)
米国データサイエンティストかめ
神。無料でここまでのクオリティ、おかしい。Udemy講座は機械学習編以降新しいのが出るたびに買ってます。。笑
ヨビノリたくみ
理系学生ならおそらく全員知っている神様。僕はこの人のおかげで進級できている。「全ての授業をヨビノリにやってほしい」が口癖になる程、授業がわかりやすい。
アイシア=ソリッド
日本人なのでご安心を。特に深層学習のモデルを学びたいならこの人の動画がおすすめ。深層学習の発展の歴史から各モデルが詳しく、そしてめちゃくちゃわかりやすく解説されてる。
QDくん python×機械学習×金融工学
統計学、データサイエンス、プログラミングの勉強に役立つ情報を発信されており、優良な無料教材が多く紹介される。おすすめ。カレーちゃん
日本人Kaggle Grandmasterの方。コンペのことなどがためになる。。kenken
日本人Kaggle Expertの方。完全初心者から2年でそこまで。。。といった感じ。笑
データサイエンス全般
OREILLY Python Data Science Handbook
無料。あの有名なオライリー本。日本語だと有料だが、英語版はpdfが無料公開されている。英語は必須。。。
数理・情報教育研究センターリテラシーレベル
無料。東京大学が公開しているデータサイエンスの資料を見られる。基礎的なデータサイエンスの社会での活用事例から、時系列解析、テキスト解析まで。
数理・情報教育研究センター
無料。東京大学が公開しているデータサイエンスの公開講義を見られる。理論的なものから応用面まで、本当に豊富。
datamix データサイエンス講座
無料。Python, 機械学習、統計学を無料受講できる。僕はデジタルマーケティング入門を少しずつやってる
筑波大学オープンコースウェア
無料。筑波大学が公開している講座。データサイエンスだけでなく色々な授業をみられる。講座資料もダウンロードできるし、あの落合陽一さんの授業もあって、面白いものが多そう。
キカガク
無料。データサイエンスの基礎から画像認識、自然言語処理まで、コードとわかりやすい説明付きでとても良い。PyTorchとTensorflowの両方に対応している点もすごくいい。
総務省統計局DS
無料。総務省統計局が作成しており、社会人のためのデータ分析や、統計オープンデータについてなどの講義がある
California University Python for Data Science
無料。英語。カリフォルニア大学が出しているDS講義。「Learn to use powerful, open-source, Python tools, including Pandas, Git and Matplotlib, to manipulate, analyze, and visualize complex datasets.」らしい。
DSA (Data Science: Theories, Models, Algorithms, and Analytics)
無料。データサイエンスについて。英語だが無料。めちゃくちゃ詳しい。
https://srdas.github.io/Papers/DSA_Book.pdf
The Art of Data Science
無料。ちゃんと読んだことはないが、題名に惹きつけられた。笑
A Biginner's Guide to Clean Data
無料。英語だが、前処理についてたくさん書かれている。
コンペ関連
Kaggleで勝つデータ分析の技術
説明不要の必携書。通称Kaggle本。Kaggle初心者なら迷わず買うべき。評価指標から前処理、特徴量エンジニアリング、各種モデル、アンサンブルまでコード付きで丁寧に解説されている。
Kaggle Grandmasterに学ぶ機械学習実践アプローチ
こちらも有名なKaggleの本。最近買ったので、読み込んでいきたい。
Kaggleに挑む深層学習プログラミングの極意
2023年冬に発売された、話題の新書。PyTorchの基本を触れ終わったらやろうと思っている
統計学
ISL (An Introduction to Statical Learning)
無料。あの有名なISLの英語版は無料公開されている。東京で電車内でiPadでこれを読んでいる人を見つけたら、僕かもしれない。
IMS (Introduction to Modern Statistics)
無料。あの有名なIMSも無料で読める。全部英語だけど。英語。。。なんか「日本語だと有料だけど英語なら無料」が多くて悲しい。
https://srdas.github.io/Papers/DSA_Book.pdf
ベイズ推論による機械学習入門
ベイズ統計を用いて機械学習をする本。数学が割と必要。でも要点をしっかり抑えられており、説明も丁寧なので数式アレルギーじゃなければ良い。シンプルにベイズ統計が難しい。。。
Pythonでスラスラわかるベイズ推論「超」入門
ベイズ統計を学びたい人向けの超入門書。本当にゼロから1歩ずつ解説されているので、僕みたいに挫折した人でも大丈夫だった。本当に赤石先生の本はすごくわかりやすい。
Causal Inference: What if
数多くの大学院・大学の授業で利用されている、ハーバード大学の先生による因果推論についての本。359ページで、基本から各手法についてまで学べる。たまに更新されるらしいので要チェック。
機械学習
東京工業大学 機械学習帳
無料。東京工業大学が作成した機械学習を無料で学べる教材。コードと理論がセットになっていてとてもいい。回帰からニューラルネット、SVM、主成分分析まで。無料でとりあえずやってみたい人には超おすすめ。
筑波大学 機械学習講座
無料。筑波大学の機械学習講座(動画)。少し古いけど無料で受けられる。
全20回で単回帰から主成分分析、確率的識別モデル、そしてRNN, GANまでいく。
【前編】米国データサイエンティストがやさしく教える機械学習超入門【Pythonで実践】
おすすめ発信者でも挙げた米国データサイエンティストのかめさんのUdemy教材。手を動かしながら、そして数式と直感をバランスよく使った説明はとてもわかりやすい。ただ、定価で買うのは高いので本人のTwitterで発行されるクーポンを使うことをおすすめします。回帰モデルを扱う
【後編】米国データサイエンティストがやさしく教える機械学習超入門【Pythonで実践】
おすすめ発信者でも挙げた米国データサイエンティストのかめさんのUdemy教材。前編同様、とてもわかりやすい。分類器をを扱う。
かめさんの教材に関しては、今後も続編が出るらしい。僕はもう購入を決めています。笑
出ました。そして買いました。
【本番編!!】 米国データサイエンティストが優しく教える機械学習超入門 【Pythonで実践】
おすすめ発信者でも挙げた米国データサイエンティストのかめさんのUdemy教材。これからやるけど、まあほぼ確実にわかりやすいでしょう!
いまにゅさんの機械学習100本ノック(超入門)
キカガクのいまにゅさんの動画。わかりやすいし、レベルも初心者向きなので、機械学習に少し慣れてきた人にちょうど良い
ゼロからつくるPython機械学習プログラミング入門
線形回帰からSVM、クラスタリングや因子分析、主成分分析、そして強化学習まで、機械学習モデルの理論に重きを置いた本。pythonコード付きで手を動かしながら理解できる。ただ、数学が割と必要なので、「入門」に騙されないように。DSLの第1回輪読会で使用した。
DSML (Data Science and Machine Learning)
無料。データサイエンスと機械学習について。英語だが無料。さすが有名なDSML、めちゃくちゃ詳しい。
https://people.smp.uq.edu.au/DirkKroese/DSML/DSML.pdf
Microsoft Learn
Microsoftのサービス。機械学習から何から、いろいろ学べる。
深層学習
分析モデル入門
おすすめ配信者アイシアさんが書いた本。勾配ブースティングやランダムフォレストから数多くの深層学習モデル(AlexNet, RNN, Transformerなどなどたくさん)、強化学習モデルまで、分析モデルをできるだけ直感的に説明されている。普通にどんなアイデアでモデルが生み出されたのかがわかるのでとても面白い。Twitterのフォロワーさんに買ってもらった。ありがとうございます😆
NY大学 深層学習
無料。深層学習の歴史からCNN, RNN, GAN, 自然言語処理、ベイズまで講義動画、資料付きで学べる。講義は英語、文章は日本語。惜しい。。
https://atcold.github.io/pytorch-Deep-Learning/ja/
最短コースでわかるPyTorch&深層学習プログラミング
本当に説明が丁寧。初心者でも挫折しないで基礎を身につけられると思う。ちなみに僕がKerasじゃなくてPyTorchの本を選ぶ理由は、ロゴが好きだから。
OREILLY ゼロから作るDeep Learning
あの超有名な「ゼロつく」シリーズの深層学習版。パーセプトロンからCNNまでを扱う。ゼロからというだけあって、説明がめちゃくちゃ丁寧。これを一番最初に買えば良かったと後悔してる。
PyTorch公式チュートリアル 日本語版
無料。PyTorchの公式チュートリアルの日本語版。本当にありがたい。無料でPyTorchを学びたい人におすすめ。
OREILLY ゼロから作るDeep Learning2
「ゼロつく」深層学習シリーズの2つ目。自然言語処理編。単語の分散表現、word2vecからRNN, LSTM, Attentionまで。フレームワークを使わないで実装するので、根本から理解できる。さすがはゼロつく、めっちゃ分かりやすかった。
PyTorchによる発展ディープラーニング
発展的な内容をPyTorchで学べる。転移学習、SSD、GAN、異常検知、動画分類、BERTなどなど。まだやってないけど、評判良かったし、なぜか300円くらいで買えたので買っちゃった。
GPT-3 完全初心者への徹底解説: 最強の文章生成AIの実像
最近話題のChatGPTの根幹技術であるGPT-3について解説された本。数式なしで、実際の使用例や無料で体験できるサイト、そしてGPT-2の解説もあって初心者が雰囲気を掴むのに最適。ChatGPT登場前に書かれた本ではあるが、GPTの弱点や利用シーンの予測はちゃんと当たっている。
データ分析
データの前処理や特徴量エンジニアリングのための本たち。
いまにゅさんのPandas20本ノック
いまにゅさんのPandas20本ノック。本当に初心者向けで量も少ないので、まずはこれからやってみるのもいいと思う。
Python 実践データ分析100本ノック第2版
Pandasによるデータ整形だけでなく、数理最適化や簡単な自然言語処理なども扱う。幅広いデータ分析のスキルに関する100本ノック。
データサイエンス協会によるデータ分析100本ノック
無料。Python, R, SQLについて100問用意されている。こっちはデータ整形などのみで100本。結構勉強になるし、これを身につければ怖くないんじゃないか??環境構築にDockerを使うので、初心者は躓きやすいが、しっかり優しい資料がついているので安心。すでに2周した。
ビジネス関係
【簿記3級】ふくしままさゆきさんのYouTube
無料。簿記3級の内容が全てまとまっている。しかも定期的に更新される。これとネット上にある無料の練習問題さえやれば、1週間で合格可能。
CPA ラーニング
無料。簿記3級から1級まで、テキスト、授業動画、問題演習が全て無料というバグってるサービス。簿記2級はこれを使おうと思ってる。
統計検定関連
さらに詳しいことはまた今度Qiita記事にまとめます。Twitterには既に色々書いたので、そっちもみてね
まとめました。詳しいことはそっちも参考にしてね
統計検定2級
僕のQiita記事
僕の記事。統計検定とは?から合格に必要なことをまとめたもの。 僕の記事を読んで合格する人がいたら、嬉しいなあと思ってたけど、実際twitterのDMで何人か「この記事のおかげで受かりました!」という連絡をくれた。。嬉しいなあ
統計学の時間
無料。統計検定2級の範囲が網羅された神サイト。僕はこのサイトと過去問しか買わなかったけど、優秀成績賞取れたので、このサイトは本当に優秀。
統計検定2級公式問題集(CBT対応版)
過去問。僕のTwitterではPBT版を紹介していたけど、最近CBT対応版が出たので、こっちの方がおすすめ。過去問を買わない手はおそらくない。統計学の時間だけでは問題演習の量が足りなすぎると思う。
統計検定2級公式問題集(2018〜2021)
過去問。僕が受けた時はCBT対応版がなかったので、PBT版のこっちを2周解いて試験に挑んだ。ちなみに、2021年6月の問題は「難しすぎる」で有名なので、解けなくてもご安心を。
統計検定2級公式暗記集
僕のツイート。検定や推定で用いる公式をまとめたもの。これを全て覚えて試験に望んだ。間違っているかもしれないので、そこはチェックをお願いします🙇
ベイズの定理(ヨビノリ)
僕を進級させてくれている神様の動画。ベイズの定理は最初つまずきやすいけど、よくわからなかったらこれを見れば解決する。はず。
統計検定準1級
統計検定準1級を1回不合格になったのち、最優秀成績賞で合格した話【攻略法】
不合格になった時の話と、合格した時の話の両方が書かれているので、結構参考になる。試験の情報、おすすめ教材、戦略なども書かれているので、めちゃくちゃいい記事。ちなみに、筆者は僕
僕のツイート
要点をぎゅっとまとめてみた。
統計学実践ワークブック
準1級の公式テキスト。むずい。でも結局これ。要点がまとまりすぎていて、理解した後に読み返すととても良い。けど、0から読むのは本当に骨が折れる。ただ、この問題演習が全てできるようになれば、かなり良い。
統計検定準1級公式問題集
過去問。6回分が載っている。2級みたいにCBT対応版はまだ出てないので、これをやるしかない。2021年6月はまたなぜかめちゃくちゃ難しいので、解けなくてもご安心を。
統計検定準1級公式暗記集
僕のツイート。受験前に覚えていった公式を全てまとめたもの。もしかしたらミスがあるかもなので、最終確認はお願いします。たくさん覚えないといけないから大変だったよ、、、
僕のツイート
確率分布の関係をまとめたもの。この頃は(うわあ、2級で出てきた確率分布ってほんの一部だったんだ〜、準1級やばいなあ)とか思ってた。でも、これさえもほんの一部だった。。。
十分統計量を直感的に理解する
十分統計量についてよくわからなかったけど、これをみたらいけた。
連続補正について
連続補正をなぜするのかよくわからなかったけど、これをみたらすぐに理解できた。
サイコロのネックレス
教材でもなんでもない。ただ、合格した後嬉しくなって、(統計を勉強する者として、サイコロの一個くらい身につけないと。)と思い、購入。今のところ理系の人にはとてもウケがいいが、文系の人と女の子にはウケが悪い。不思議だ。
データサイエンティスト検定関連
詳しいことをまとめたQiita記事を書きました!こちらもぜひ
僕のツイート
要点をぎゅっとまとめてみた。
DS検定リテラシーレベル対応 データサイエンティスト基礎講座
無料。データサイエンティスト検定リテラシーレベルの対策動画(約10時間)。これだけでは不十分だが、僕は電車の中でこれをみてた。
DS検定リテラシーレベル対策アプリ
1200円。僕が使っていた頃は300円だったのに。。演習問題がたくさん出てくる。他の人がどれだけ解いているかもみられる。黒本とどっちかでいいと思う。
DS検定公式リファレンスブック
これをすべて覚えれば合格できる。データサイエンスの全体像を掴める内容になっていて、今でも時々見直す。データサイエンス全体の地図が手に入るようなものなので、とても良い。問題演習付き。
DS検定問題集
通称「黒本」。問題演習が少なくて困っていたけど、これで解決できた。知識を活かすかの雰囲気を掴めた。さっきのアプリとどっちかでいい気がする。
Python関連
東京大学 Pythonプログラミング入門
無料。東京大学が作成しているPythonの教材。初歩の初歩から関数、デバッグ、Numpy、クラス、そしてscikit-learnまで。pythonコードと練習問題付きで学べる。これさえあれば基礎はできる。プログラミングスクール不要。
CODEGYM ACADEMY
全くの初心者でも半年かけてハーバード大学のCS50をみんなで受け、その後はチーム開発などの経験を詰める。自分が参加したときは無料だったが、その後変わるかもしれないと言われていた。なかなかハードだが、半年で変われる。ハーバードの講義の修了証ももらえる。
AIZU ONLINE JUDGE
無料。様々な言語の練習問題が多数。コードを提出すると即時自動採点してくれ、他の人のコードも見ることができる。上手い人の真似ができる。特に作ってみたいものがないけどプログラムを書きたい人はおすすめ。
ORIELLY Think Python
無料。オライリーのThink Pythonの英語版は無料公開されている。
https://greenteapress.com/thinkpython2/thinkpython2.pdf
ORIELLY Think Stats
無料。オライリーのThink Statsの英語版は無料公開されている。
https://greenteapress.com/thinkstats2/thinkstats2.pdf
ORIELLY Think Bayes
無料。オライリーのThink Bayesの英語版は無料公開されている。コード付きなのでよき。
R関連
OREILLY R for Data Science
無料。オライリーのRによるデータサイエンスの英語版が無料公開されている。Rでデータサイエンスをやりたい人はいいかも。
Computer Science関連
プログラミングちゃんとやるなら、コンピュータサイエンスわかってないと全然ダメだよね、って実感しているので、これも。
僕はCODEGYM Academyに入ってハーバード大学のCS50をやって基本は覚えたけど、CS50自体は誰でもできるのでおすすめ。
CS50
ハーバード大学の初心者向けコンピュータサイエンスの授業。修了するとハーバード大学の授業の修了証が貰えてかっこいい。メモリとか、アルゴリズムとか、本当にプログラミングの初歩の初歩からやる。ハーバード大学生のレベルの高さも実感できて刺激にもなる。
Recursion Academy
有名なサービスRecursionの学生なら無料で受けられるプログラム。半年間で720時間を学習し、0からチーム開発までがっつり行う。このサービス限定の特別選考もある。なかなか量が多くてハードだけど、アウトプットが多いから身につきやすい。
Web制作関連
主にHTML, CSS, JavaScriptについて
Progate
結局これかも。笑 初心者がまずやるならこれ。HTML, CSSはこれで勉強した。無料の範囲だけでもいいけど、有料でも月1000円で本一冊より安いレベルなので結局これ。
セイト先生のWeb・ITエンジニア転職ラボ
HTML, CSS, JavaScriptの基礎文法の動画は作りながら学べるのでとても良い。倍速でこなしたけど、十分理解できたし、よき。
クラウド関連
work in progress...
Linux
【LinuC/LPIC合格講座】シリーズ
OSとは、Linuxとは、仮想マシンとは、などなどLinux関係の知識をめちゃくちゃわかりやすく、優しく教えてもらえる。洗濯物干しながら見るのが一時期ブームだった。
競プロ関連
競技プログラミングの鉄則 ~アルゴリズム力と思考力を高める77の技術~
LeetCodeやAtCoderをやるなら知っておきたい本らしい。まだやってないが、いいプログラムを書くためにはアルゴリズム力がないと始まらないので、そろそろやろうと思ってる。
参加したコンペ、イベント、ハッカソン
CODEGYM ACADEMY
大学3年の春ー夏に参加したプロジェクト。参加して良かったと感じてる。CS50というハーバード大学の講義動画をYouTubeで見たり、毎週出る課題をこなしながらプログラミング力を上げていく。割と課題はキツめで、半分以上の人が途中で退校処分になった。でも夏休みはチーム開発を経験でき、プロダクトを一つ作るのでとても良い経験になる。就職する人はスポンサーと繋いでもらえるのでなおよし。完全初心者でも全然参加できるし、運営もいい人ばかりだし、卒業生も友達作れて関わり続くし、迷ってるなら参加すべし。ていうかこれで無料はおかしい。
第一回金融データ活用チャレンジ
大学3年の冬ー春に参加。SIGNATEで行われた、FDUA主催のコンペ。住宅ローンの延滞する人を予測する大会で、何かと頑張った。そしてDataBricks賞を頂いた。初めてちゃんと参加した大会で、いろいろな経験ができてよかった。
コンペ中に書いた記事↓
振り返り記事↓
work in progress...
100 program
大学3年の春休みに参加。東京大学産学共創本部主催、Todai to Texas運営のハッカソン。2-3月の回に参加し、アイデアの出し方からチーム開発まで、一通り経験できる。めちゃくちゃ良いのが、アイデアを出す方法やチーム開発のノウハウ、プロダクトを開発する上で知らないと損することなどなど、たっくさんのことをハイレベルに学べる。さらに参加者の半分以上が東大生で、普通に修士課程、博士課程の人もごろごろいるからレベルが高くて楽しい。参加を迷うなら絶対参加すべし。
振り返り記事はまた書きます。work in progress...
その他
米国AI開発者がゼロから教えるDocker講座
おすすめ発信者でも挙げた米国データサイエンティストのかめさんのUdemy教材。手を動かしながら、図を用いた説明はとてもわかりやすい。ただ、定価で買うのは高いので本人のTwitterで発行されるクーポンを使うことをおすすめします。Dockerアレルギーも治ると思う。笑
Git: もう怖くない!チーム開発で必要なGitを完全マスター
いつもお世話になっている山浦さんの講座。おかげさまでGitアレルギーが治りました😌
Gitでのバージョン コントロールの概要 (Microsoft)
Gitを無料で学びたいならこっちもあり。3時間くらいで手を動かしながら学べる。環境構築とかもいらないので、やりやすい。
番外編(自分が今まで読んでめちゃくちゃ良かったなと思う本)
統計学が最強の学問である
統計検定2級を合格する前に読んだので、よく分かってなかった。今度読み返す。
なぜあなたの仕事は終わらないのか
仕事術の本。なぜそんなにたくさん勉強できるのか、勉強してるくせに遊んでもいるのか、よく聞かれますが、時間術の本をいくつか読むことをおすすめします。この本はMicrosoftでWindows95を作った方が書いていて、面白いです。僕はApple信者ですが。。
AI分析で分かったトップ5%社員の習慣
AI分析で分かったトップ5%シリーズは全ておすすめです。これを最初に読んでから変わりました。本当に。まだ僕は社員でもないですけど
確率思考の戦略論 USJでも実証された数学マーケティングの力
あの超有名マーケター、森岡毅さんの本。めちゃくちゃ評判良くて、読んでみたら本当に良かった。マーケティングに統計や確率をどう使うか、どういう戦略を立てるのか、市場のメカニズムなどが書かれている。マーケティングに関わる仕事に就くなら、必読。
コメント
僕が実際にやったことのある教材を中心にまとめました。少しでも助けになっていたら、嬉しいです。ともに成長していきましょう🔥🔥🔥
Twitterの方はQiitaに書くまでもないことや、短くまとまった情報を呟いているので、みてみてね。
Twitter → @A7_Data
Amazonアソシエイト参加中
全て個人の意見です。所属の組織、団体は一切関係ありません。
今回の記事で紹介した本の数冊はKindle Unlimitedなら追加料金なしで読み放題です。僕もずっと利用していておすすめです。
詳しくは上の記事で解説していますので、ぜひ😌