![見出し画像](https://assets.st-note.com/production/uploads/images/45479547/rectangle_large_type_2_9bb2641a421b51c3e96ac907b8fa658d.png?width=1200)
100日チャレンジ31日目~東京大学のデータサイエンティスト育成講座~
こちらのチャレンジの31日目です。
ルールはこちら
時間
・毎日07:15 ~ 08:00 (難しかったら20:15 ~ 21:00)
・休む場合は中一日
やること
・2021年6月の統計検定準1級合格に向けた勉強
※諸事情で統計検定に向けた勉強ができない場合は別の取り組みを行う予定(教材が手元にないなど)
今日は統計検定用の教材が手元になかったので、『東京大学のデータサイエンティスト育成講座』の勉強を行いました。
これまで実際に分析を行う際はRを使っていたのですが、Pythonの扱いも知っておかないと、他の人の書いたコードが読み解けないなどが起こるので、この本で分析周りのコードの書き方を知れればと思っています。
今日は第4章「確率と統計の基礎」ということで、分布周りのコードの書き方を学習しました。
既存の関数を利用して分布を出す以外にも、一から実装する形で二項分布からのサンプリングをする要素もあり、Pythonの使い方の勉強になりました。
ただ、データの読み込みが面倒で、本書ではローカル環境でJupyter Notebookを扱う形で書かれていますが、自分はcolabratoryでコードを書いているので、データの格納先などがいまいち分かっていない点があります。
そこの調整に少し手間取っている点があるので、どうしようかなあと思っていたりします。