最近の記事

Courseraのデータサイエンス専門講座を受けた感想その5

Courseraのデータサイエンス講座の7、8、9、10コース目を受講し、全て完了させました。前回のコースの受講感想はこちらになります。 Regression Models  7コース目は回帰モデル全般を学習しました。多変量回帰から線型モデル、ロジスティック回帰、ポアソン回帰について学ぶことができました。特に多変量回帰と線型モデルは残差評価とモデルに対する調整方法を詳しく知ることができます。残差による回帰モデルの評価はあまり触れられない話題ですが、この残差について散布図を作

    • Courseraのデータサイエンス専門講座を受けた感想その4

      Courseraのデータサイエンス講座の6コース目を受講しました。前回のコースの受講感想はこちらになります。 Statical Inference 6コース目は統計的推論を学ぶことができます。確率論における基本的な知識から検定についても学ぶことができます。確率論は条件付き確率からベイズの法則、期待値などを学べます。また、コースでは確率の問題も解くことができますが、問題文も英語が書かれています。人によっては確率よりも英文の解釈が難しいかもしれません。  また、基本的な分布とし

      • Courseraのデータサイエンス専門講座を受けた感想その3

        Courseraのデータサイエンス講座の4コース目、5コース目を受講しました。前回のコースの受講感想はこちらになります。 探索的データ解析 R言語を使ってデータをグラフを使って可視化することについて学べます。最初はデフォルトで使えるグラフのプロットをする関数を使い、pngに保存するまでをします。ですが、デフォルトのグラフではモノクロな図しかできず、あまり見やすくはありません。なので、ggplotを使って色の使いわけからより高度な可視化をする方法を学ぶことができます。ここでは

        • Courseraのデータサイエンス専門講座を受けた感想その2

          Courseraのデータサイエンス講座の2コース目、3コース目を受講しました。1コース目の受講感想はこちらになります。  Rプログラミング 2コース目はRプログラミングについてのコースです。Rプログラミングが生まれた経緯から、基本的な構文を学べました。こちらに関してはRプログラミングに関するWebサイトや書籍がすでに多くあるので、時間に余裕がなかったり、もうすでに知っている人は飛ばしてしまっても良いコースだと思いました。  また、この講座だけでRプログラミングをかけるように

        Courseraのデータサイエンス専門講座を受けた感想その5

        • Courseraのデータサイエンス専門講座を受けた感想その4

        • Courseraのデータサイエンス専門講座を受けた感想その3

        • Courseraのデータサイエンス専門講座を受けた感想その2

          Courseraのデータサイエンス専門講座を受けた感想

           Courseraのデータサイエンス講座を1コース受講してみました。受けてみた講座はJohns Hopkins大学が開講しているものです。今回はこちらの感想を書いていきたいと思います。 受講前に 上記講座は日本語対応していません。また、この講座ではいくつかの課題は他者の解答をレビューすることが条件になっています。なので日本語で講座を受けたい方や英語でのコミュニケーションに自信がない方は他の講座もありますのでそちらを探してみるといいと思います。また、想定される受講期間も約8ヶ

          Courseraのデータサイエンス専門講座を受けた感想

          [書評]統計的因果推論 -モデル・推論・推測

           本書は人工知能で重要な人物であるJudea Pearl教授の著作です。統計学では相関と因果は違うということはよくいわれますが、統計で因果推論をするとはどういうことをするのかについてはあまり話題になっていないと思います。この本を通して、統計的因果推論では何を問題にし、どのようなことが議論されているかを知ることをモチベーションとして読みました。今回は要約をせず、交絡と反事実の概要に絞って書評を書きたいと思います。  交絡 交絡とは観測されない因子のことをいいますが、これを統計

          [書評]統計的因果推論 -モデル・推論・推測

          [書評]ビッグデータを支える技術―刻々とデータが脈打つ自動化の世界

           本書はビッグデータを取り扱う基本的な技術についてまとめた本です。基本的な考え方や探索と蓄積、そしてビッグデータの分散処理や分析基盤などについてを網羅的に解説しています。ビッグデータの取り扱いや背景などがわかりやすく解説されています。 分散処理   ビッグデータに置いて特に問題になるのは高速化です。どんなに大規模なデータを集めたところで、それを許容できる時間内で扱うことができないと意味がないです。高速化をするために考えられたのが分散処理です。分散処理を扱うものとしてHado

          [書評]ビッグデータを支える技術―刻々とデータが脈打つ自動化の世界

          アフターデジタルの書評+After Digital Campの勉強会の感想

             中国のIT事情を知りたく、アフターデジタルという本と、Aftrer Digital Campを参加しました。信用スコアやQR決済などがどのように活用されているかについて得られたものが多かったので、そちらの感想を書きたいと思います。 中国の技術の発展 中国の技術については様々な事が言われています。とてつもなく発達したという意見から、ただのパクリだとする意見もあります。実際の発展を見るところ、確かにある時期まではパクリと言わざるを得ない事があります。しかし、現代の中国の

          アフターデジタルの書評+After Digital Campの勉強会の感想

          [書評]形式化された音楽

           本書はヤニス・クセナキスによる数学を使って音楽を作ろうとする試みを記した本です。構成としては、第1章から第6章までは音楽を数学的に解析し、それを数式に落とし込んで作曲までについて書かれています。第7章から第9章までは歴史上で音楽に対してどのような試みがあったかの紹介をし、それらと第6章までの内容を元に音楽の数学化をより発展していき、最後には作曲をするアルゴリズムを作り出しています。  第10章から第14章までは立場を変えて作曲家として論じています。時間、空間についての考察を

          [書評]形式化された音楽

          [書評]現場で使えるDjangoの教科書《基礎編》

          https://www.amazon.co.jp/dp/4802094744  DjangoとはPythonでWebアプリケーションを作成するためのフレームワークで、必要なものはなんでも揃っているのが特徴でフルスタックと呼ばれています。  Djangoは海外ではInstagram、edXなどで利用され、日本でも日経電子版や、connass、PyQなどの事例があります。小から大規模のWebアプリケーションで利用されています。   本書は公式ドキュメントの内容を整理した上で、ア

          [書評]現場で使えるDjangoの教科書《基礎編》

          [書評]パターン認識と機械学習 下

           本書はパターン認識と機械学習の下巻です。上巻は下記のページで書評を書いています。本書は上巻を読んでおいてから読むと良いと思います上巻の内容を全て理解しておく必要はなく、わからない部分があればその都度戻って確認をするという程度で良いと思います。 https://note.mu/curthey/n/n4ec6c1438c30 第6章 カーネル法 カーネル方は元は静電力学における考え方ですが、この方法が機械学習にも輸入され、のちにサポートベクトルマシンに発展しました。この方法

          [書評]パターン認識と機械学習 下

          [書評]パターン認識と機械学習 上

          https://www.amazon.co.jp/dp/4621061224  本書は学部3,4年生や研究者、開発者を対象にしています。パターン認識や機械学習について予め知っておくことはないですが、多変数微積分や基礎的な線形代数についての知識は必要です。確率については、本書で説明しているので、これも知識は不要ですが、知っておくと理解のて助けになると思います。 第1章 序論 機械学習における基本的な用語や数学知識について説明しています。特に機械学習の根幹となるベイズ確率は今

          [書評]パターン認識と機械学習 上

          [書評]ハイパフォーマンスPython

          https://www.amazon.co.jp/dp/4873117402  Pythonは記述力が高く習得しやすい言語と言われています。特に機械学習が注目されたことにより、人気のある言語となりました。その一方で、処理が重い言語としても有名です。本書はなぜ処理が重いのか、どのようにパフォーマンスを高めるかについて言及しています。 ボトルネックの発見のためのプロファイリング Pythonではボトルネックの発見のためのプロファイリング機能があります。IPythonの%tim

          [書評]ハイパフォーマンスPython

          [書評]レガシーコード改善ガイド

          https://www.amazon.co.jp/dp/4798116831/ 始めに 本書ではレガシーコードをテストがないコードと定義しています。コードの綺麗さ、オブジェクト指向か、カプセル化されているかなどは関係ありません。何故なら、ソフトウェアは変更されるものであり、テストがない限り変更が正しく行われたかどうかはわからないからです。  これは綺麗なコードや優れた設計は価値がないということはなく、むしろ有益です。しかし、大規模な変更をするときはそれだけでは不十分で、より

          [書評]レガシーコード改善ガイド