見出し画像

優良データサイエンス関連教材をたっくさんまとめてみた

今まで僕がデータサイエンス関連で勉強してきて実際にやった&良いと聞いた、優良教材や無料の教材をまとめました。
今後もどんどん更新していきますので、保存してご活用ください!

こちらの記事はもともとQiitaにあったものをNoteに移行したものになります。

自己紹介

データサイエンティストを目指して日々勉強している、慶應大学理工学部4年生(2023.12.31時点)

取得資格、コンペ優勝経験など、リアルタイムの情報は👇👇👇をみてね

X: @A7_data←こういう者です。
プロフィールページ👇👇👇

優良教材まとめ

自分が利用したことのあるもの、利用していないけど良さそうなものを分野別にまとめました。

どんどん更新していきます

必須ツール

  • ChatGPT (GPT-4)
    みなさんご存知、神です。ただのチャットボットだと思っている人はいますぐ考え直すべき。わからないことがあったらこれに聞けばめちゃくちゃわかりやすく教えてくれる。勉強のロードマップも立てられる。練習問題や100本ノックさえも作成可能。論文も爆速で読めます。

これで月20ドル(だいたい2500円くらい?)なんて、まじで安すぎる。必須です。ちなみに、GPT-4に触れるとGPT-3.5にはもう戻れないと感じるくらいの差はあるので、ぜひ課金しましょう。

僕がTOEICで915点を1ヶ月ちょいで取れたのも、GPT-4のおかげです。詳しくは☝️☝️☝️

  • GitHub Copilot
    プログラミングをするなら絶対に入れたい、プログラミングの神。ChatGPTをプログラミングに特化させたものと考えればだいたいOK。書きたい処理をコメントすればそのコードを書いてくれる。しかもバグの出ないコードで、簡潔に。普通に勉強にもなるし、時間・労力共に削減できるのでよりプログラミングする時間を増やせる

学生なら無料で使えるので、まじで学生は試してみて。詳しいことはこの記事に書いたので、見てみてください

データサイエンス関連

おすすめ発信者(よく見てる人。この他にもたくさんいらっしゃると思う)

  • ヨビノリたくみ
    理系学生ならおそらく全員知っている神様。僕はこの人のおかげで進級できている。「全ての授業をヨビノリにやってほしい」が口癖になる程、授業がわかりやすい。

  • アイシア=ソリッド
    日本人なのでご安心を。特に深層学習のモデルを学びたいならこの人の動画がおすすめ。深層学習の発展の歴史から各モデルが詳しく、そしてめちゃくちゃわかりやすく解説されてる。

  • QDくん python×機械学習×金融工学
    統計学、データサイエンス、プログラミングの勉強に役立つ情報を発信されており、優良な無料教材が多く紹介される。おすすめ。

  • カレーちゃん
    日本人Kaggle Grandmasterの方。コンペのことなどがためになる。。

  • kenken
    日本人Kaggle Expertの方。完全初心者から2年でそこまで。。。といった感じ。笑

データサイエンス全般

  • OREILLY Python Data Science Handbook
    無料。あの有名なオライリー本。日本語だと有料だが、英語版はpdfが無料公開されている。英語は必須。。。

  • 数理・情報教育研究センター
    無料。東京大学が公開しているデータサイエンスの公開講義を見られる。理論的なものから応用面まで、本当に豊富。

  • 筑波大学オープンコースウェア
    無料。筑波大学が公開している講座。データサイエンスだけでなく色々な授業をみられる。講座資料もダウンロードできるし、あの落合陽一さんの授業もあって、面白いものが多そう。

  • キカガク
    無料。データサイエンスの基礎から画像認識、自然言語処理まで、コードとわかりやすい説明付きでとても良い。PyTorchとTensorflowの両方に対応している点もすごくいい。

  • 総務省統計局DS
    無料。総務省統計局が作成しており、社会人のためのデータ分析や、統計オープンデータについてなどの講義がある

  • California University Python for Data Science
    無料。英語。カリフォルニア大学が出しているDS講義。「Learn to use powerful, open-source, Python tools, including Pandas, Git and Matplotlib, to manipulate, analyze, and visualize complex datasets.」らしい。

https://srdas.github.io/Papers/DSA_Book.pdf

コンペ関連

  • Kaggleで勝つデータ分析の技術
    説明不要の必携書。通称Kaggle本。Kaggle初心者なら迷わず買うべき。評価指標から前処理、特徴量エンジニアリング、各種モデル、アンサンブルまでコード付きで丁寧に解説されている。

統計学

  • ISL (An Introduction to Statical Learning)
    無料。あの有名なISLの英語版は無料公開されている。東京で電車内でiPadでこれを読んでいる人を見つけたら、僕かもしれない。

  • IMS (Introduction to Modern Statistics)
    無料。あの有名なIMSも無料で読める。全部英語だけど。英語。。。なんか「日本語だと有料だけど英語なら無料」が多くて悲しい。

https://srdas.github.io/Papers/DSA_Book.pdf

  • ベイズ推論による機械学習入門
    ベイズ統計を用いて機械学習をする本。数学が割と必要。でも要点をしっかり抑えられており、説明も丁寧なので数式アレルギーじゃなければ良い。シンプルにベイズ統計が難しい。。。

  • Causal Inference: What if
    数多くの大学院・大学の授業で利用されている、ハーバード大学の先生による因果推論についての本。359ページで、基本から各手法についてまで学べる。たまに更新されるらしいので要チェック。

機械学習

  • 東京工業大学 機械学習帳
    無料。東京工業大学が作成した機械学習を無料で学べる教材。コードと理論がセットになっていてとてもいい。回帰からニューラルネット、SVM、主成分分析まで。無料でとりあえずやってみたい人には超おすすめ。

  • 筑波大学 機械学習講座
    無料。筑波大学の機械学習講座(動画)。少し古いけど無料で受けられる。
    全20回で単回帰から主成分分析、確率的識別モデル、そしてRNN, GANまでいく。

かめさんの教材に関しては、今後も続編が出るらしい。僕はもう購入を決めています。笑

出ました。そして買いました。
【本番編!!】 米国データサイエンティストが優しく教える機械学習超入門 【Pythonで実践】
おすすめ発信者でも挙げた米国データサイエンティストのかめさんのUdemy教材。これからやるけど、まあほぼ確実にわかりやすいでしょう!

  • ゼロからつくるPython機械学習プログラミング入門
    線形回帰からSVM、クラスタリングや因子分析、主成分分析、そして強化学習まで、機械学習モデルの理論に重きを置いた本。pythonコード付きで手を動かしながら理解できる。ただ、数学が割と必要なので、「入門」に騙されないように。DSLの第1回輪読会で使用した。

https://people.smp.uq.edu.au/DirkKroese/DSML/DSML.pdf

  • Microsoft Learn
    Microsoftのサービス。機械学習から何から、いろいろ学べる。

深層学習

  • 分析モデル入門
    おすすめ配信者アイシアさんが書いた本。勾配ブースティングやランダムフォレストから数多くの深層学習モデル(AlexNet, RNN, Transformerなどなどたくさん)、強化学習モデルまで、分析モデルをできるだけ直感的に説明されている。普通にどんなアイデアでモデルが生み出されたのかがわかるのでとても面白い。Twitterのフォロワーさんに買ってもらった。ありがとうございます😆

  • NY大学 深層学習
    無料。深層学習の歴史からCNN, RNN, GAN, 自然言語処理、ベイズまで講義動画、資料付きで学べる。講義は英語、文章は日本語。惜しい。。

https://atcold.github.io/pytorch-Deep-Learning/ja/

  • OREILLY ゼロから作るDeep Learning
    あの超有名な「ゼロつく」シリーズの深層学習版。パーセプトロンからCNNまでを扱う。ゼロからというだけあって、説明がめちゃくちゃ丁寧。これを一番最初に買えば良かったと後悔してる。

  • OREILLY ゼロから作るDeep Learning2
    「ゼロつく」深層学習シリーズの2つ目。自然言語処理編。単語の分散表現、word2vecからRNN, LSTM, Attentionまで。フレームワークを使わないで実装するので、根本から理解できる。さすがはゼロつく、めっちゃ分かりやすかった。

  • PyTorchによる発展ディープラーニング
    発展的な内容をPyTorchで学べる。転移学習、SSD、GAN、異常検知、動画分類、BERTなどなど。まだやってないけど、評判良かったし、なぜか300円くらいで買えたので買っちゃった。

  • GPT-3 完全初心者への徹底解説: 最強の文章生成AIの実像
    最近話題のChatGPTの根幹技術であるGPT-3について解説された本。数式なしで、実際の使用例や無料で体験できるサイト、そしてGPT-2の解説もあって初心者が雰囲気を掴むのに最適。ChatGPT登場前に書かれた本ではあるが、GPTの弱点や利用シーンの予測はちゃんと当たっている。


データ分析

データの前処理や特徴量エンジニアリングのための本たち。

  • データサイエンス協会によるデータ分析100本ノック
    無料。Python, R, SQLについて100問用意されている。こっちはデータ整形などのみで100本。結構勉強になるし、これを身につければ怖くないんじゃないか??環境構築にDockerを使うので、初心者は躓きやすいが、しっかり優しい資料がついているので安心。すでに2周した。

ビジネス関係

  • CPA ラーニング
    無料。簿記3級から1級まで、テキスト、授業動画、問題演習が全て無料というバグってるサービス。簿記2級はこれを使おうと思ってる。

統計検定関連

さらに詳しいことはまた今度Qiita記事にまとめます。Twitterには既に色々書いたので、そっちもみてね
まとめました。詳しいことはそっちも参考にしてね

統計検定2級

  • 僕のQiita記事
    僕の記事。統計検定とは?から合格に必要なことをまとめたもの。 僕の記事を読んで合格する人がいたら、嬉しいなあと思ってたけど、実際twitterのDMで何人か「この記事のおかげで受かりました!」という連絡をくれた。。嬉しいなあ

  • 統計学の時間
    無料。統計検定2級の範囲が網羅された神サイト。僕はこのサイトと過去問しか買わなかったけど、優秀成績賞取れたので、このサイトは本当に優秀。

  • 統計検定2級公式問題集(CBT対応版
    過去問。僕のTwitterではPBT版を紹介していたけど、最近CBT対応版が出たので、こっちの方がおすすめ。過去問を買わない手はおそらくない。統計学の時間だけでは問題演習の量が足りなすぎると思う。

  • 統計検定2級公式問題集(2018〜2021)
    過去問。僕が受けた時はCBT対応版がなかったので、PBT版のこっちを2周解いて試験に挑んだ。ちなみに、2021年6月の問題は「難しすぎる」で有名なので、解けなくてもご安心を。

  • 統計検定2級公式暗記集
    僕のツイート。検定や推定で用いる公式をまとめたもの。これを全て覚えて試験に望んだ。間違っているかもしれないので、そこはチェックをお願いします🙇

  • ベイズの定理(ヨビノリ
    僕を進級させてくれている神様の動画。ベイズの定理は最初つまずきやすいけど、よくわからなかったらこれを見れば解決する。はず。

統計検定準1級

  • 統計学実践ワークブック
    準1級の公式テキスト。むずい。でも結局これ。要点がまとまりすぎていて、理解した後に読み返すととても良い。けど、0から読むのは本当に骨が折れる。ただ、この問題演習が全てできるようになれば、かなり良い。

  • 統計検定準1級公式問題集
    過去問。6回分が載っている。2級みたいにCBT対応版はまだ出てないので、これをやるしかない。2021年6月はまたなぜかめちゃくちゃ難しいので、解けなくてもご安心を。

  • 統計検定準1級公式暗記集
    僕のツイート。受験前に覚えていった公式を全てまとめたもの。もしかしたらミスがあるかもなので、最終確認はお願いします。たくさん覚えないといけないから大変だったよ、、、

  • 僕のツイート
    確率分布の関係をまとめたもの。この頃は(うわあ、2級で出てきた確率分布ってほんの一部だったんだ〜、準1級やばいなあ)とか思ってた。でも、これさえもほんの一部だった。。。

  • 連続補正について
    連続補正をなぜするのかよくわからなかったけど、これをみたらすぐに理解できた。

  • サイコロのネックレス
    教材でもなんでもない。ただ、合格した後嬉しくなって、(統計を勉強する者として、サイコロの一個くらい身につけないと。)と思い、購入。今のところ理系の人にはとてもウケがいいが、文系の人と女の子にはウケが悪い。不思議だ。

データサイエンティスト検定関連

詳しいことをまとめたQiita記事を書きました!こちらもぜひ

  • DS検定リテラシーレベル対策アプリ
    1200円。僕が使っていた頃は300円だったのに。。演習問題がたくさん出てくる。他の人がどれだけ解いているかもみられる。黒本とどっちかでいいと思う。

  • DS検定公式リファレンスブック
    これをすべて覚えれば合格できる。データサイエンスの全体像を掴める内容になっていて、今でも時々見直す。データサイエンス全体の地図が手に入るようなものなので、とても良い。問題演習付き。

  • DS検定問題集
    通称「黒本」。問題演習が少なくて困っていたけど、これで解決できた。知識を活かすかの雰囲気を掴めた。さっきのアプリとどっちかでいい気がする。

Python関連

  • 東京大学 Pythonプログラミング入門
    無料。東京大学が作成しているPythonの教材。初歩の初歩から関数、デバッグ、Numpy、クラス、そしてscikit-learnまで。pythonコードと練習問題付きで学べる。これさえあれば基礎はできる。プログラミングスクール不要。

  • CODEGYM ACADEMY
    全くの初心者でも半年かけてハーバード大学のCS50をみんなで受け、その後はチーム開発などの経験を詰める。自分が参加したときは無料だったが、その後変わるかもしれないと言われていた。なかなかハードだが、半年で変われる。ハーバードの講義の修了証ももらえる。

  • AIZU ONLINE JUDGE
    無料。様々な言語の練習問題が多数。コードを提出すると即時自動採点してくれ、他の人のコードも見ることができる。上手い人の真似ができる。特に作ってみたいものがないけどプログラムを書きたい人はおすすめ。

  • ORIELLY Think Python
    無料。オライリーのThink Pythonの英語版は無料公開されている。

https://greenteapress.com/thinkpython2/thinkpython2.pdf

  • ORIELLY Think Stats
    無料。オライリーのThink Statsの英語版は無料公開されている。

https://greenteapress.com/thinkstats2/thinkstats2.pdf

  • ORIELLY Think Bayes
    無料。オライリーのThink Bayesの英語版は無料公開されている。コード付きなのでよき。

R関連

  • OREILLY R for Data Science
    無料。オライリーのRによるデータサイエンスの英語版が無料公開されている。Rでデータサイエンスをやりたい人はいいかも。

Computer Science関連

プログラミングちゃんとやるなら、コンピュータサイエンスわかってないと全然ダメだよね、って実感しているので、これも。

僕はCODEGYM Academyに入ってハーバード大学のCS50をやって基本は覚えたけど、CS50自体は誰でもできるのでおすすめ。

  • CS50
    ハーバード大学の初心者向けコンピュータサイエンスの授業。修了するとハーバード大学の授業の修了証が貰えてかっこいい。メモリとか、アルゴリズムとか、本当にプログラミングの初歩の初歩からやる。ハーバード大学生のレベルの高さも実感できて刺激にもなる。

  • Recursion Academy
    有名なサービスRecursionの学生なら無料で受けられるプログラム。半年間で720時間を学習し、0からチーム開発までがっつり行う。このサービス限定の特別選考もある。なかなか量が多くてハードだけど、アウトプットが多いから身につきやすい。

Web制作関連

主にHTML, CSS, JavaScriptについて

  • Progate
    結局これかも。笑 初心者がまずやるならこれ。HTML, CSSはこれで勉強した。無料の範囲だけでもいいけど、有料でも月1000円で本一冊より安いレベルなので結局これ。

クラウド関連

work in progress...

Linux

  • 【LinuC/LPIC合格講座】シリーズ
    OSとは、Linuxとは、仮想マシンとは、などなどLinux関係の知識をめちゃくちゃわかりやすく、優しく教えてもらえる。洗濯物干しながら見るのが一時期ブームだった。

競プロ関連

参加したコンペ、イベント、ハッカソン

CODEGYM ACADEMY

大学3年の春ー夏に参加したプロジェクト。参加して良かったと感じてる。CS50というハーバード大学の講義動画をYouTubeで見たり、毎週出る課題をこなしながらプログラミング力を上げていく。割と課題はキツめで、半分以上の人が途中で退校処分になった。でも夏休みはチーム開発を経験でき、プロダクトを一つ作るのでとても良い経験になる。就職する人はスポンサーと繋いでもらえるのでなおよし。完全初心者でも全然参加できるし、運営もいい人ばかりだし、卒業生も友達作れて関わり続くし、迷ってるなら参加すべし。ていうかこれで無料はおかしい。

第一回金融データ活用チャレンジ

大学3年の冬ー春に参加。SIGNATEで行われた、FDUA主催のコンペ。住宅ローンの延滞する人を予測する大会で、何かと頑張った。そしてDataBricks賞を頂いた。初めてちゃんと参加した大会で、いろいろな経験ができてよかった。

コンペ中に書いた記事↓

振り返り記事↓

work in progress...

100 program

大学3年の春休みに参加。東京大学産学共創本部主催、Todai to Texas運営のハッカソン。2-3月の回に参加し、アイデアの出し方からチーム開発まで、一通り経験できる。めちゃくちゃ良いのが、アイデアを出す方法やチーム開発のノウハウ、プロダクトを開発する上で知らないと損することなどなど、たっくさんのことをハイレベルに学べる。さらに参加者の半分以上が東大生で、普通に修士課程、博士課程の人もごろごろいるからレベルが高くて楽しい。参加を迷うなら絶対参加すべし。

振り返り記事はまた書きます。work in progress...

その他

  • 米国AI開発者がゼロから教えるDocker講座
    おすすめ発信者でも挙げた米国データサイエンティストのかめさんのUdemy教材。手を動かしながら、図を用いた説明はとてもわかりやすい。ただ、定価で買うのは高いので本人のTwitterで発行されるクーポンを使うことをおすすめします。Dockerアレルギーも治ると思う。笑

番外編(自分が今まで読んでめちゃくちゃ良かったなと思う本)

  • なぜあなたの仕事は終わらないのか
    仕事術の本。なぜそんなにたくさん勉強できるのか、勉強してるくせに遊んでもいるのか、よく聞かれますが、時間術の本をいくつか読むことをおすすめします。この本はMicrosoftでWindows95を作った方が書いていて、面白いです。僕はApple信者ですが。。

  • 確率思考の戦略論 USJでも実証された数学マーケティングの力 
    あの超有名マーケター、森岡毅さんの本。めちゃくちゃ評判良くて、読んでみたら本当に良かった。マーケティングに統計や確率をどう使うか、どういう戦略を立てるのか、市場のメカニズムなどが書かれている。マーケティングに関わる仕事に就くなら、必読。

コメント

僕が実際にやったことのある教材を中心にまとめました。少しでも助けになっていたら、嬉しいです。ともに成長していきましょう🔥🔥🔥
Twitterの方はQiitaに書くまでもないことや、短くまとまった情報を呟いているので、みてみてね。
Twitter → @A7_Data

Amazonアソシエイト参加中
全て個人の意見です。所属の組織、団体は一切関係ありません。

今回の記事で紹介した本の数冊はKindle Unlimitedなら追加料金なしで読み放題です。僕もずっと利用していておすすめです。

詳しくは上の記事で解説していますので、ぜひ😌

いいなと思ったら応援しよう!