[備忘録] Week05: 自走できるAI人材になるための6ヶ月長期コース
キカガクさんの半年にわたる講義の備忘録
2020.06.06(土) Week 05
第5週目で機械学習の内容は一段落。来週からはどうやったデータを集めるのか?という内容になる。今日までの情報では到底機械学習エンジニアにすぐ転身はできないとは思う。しかし、仕組みは分からないけど、なぜか結果が出るレベルにはなったと思う。
備忘録
Week 5 実施内容
・時系列解析の基礎
・時系列解析で分類
・自然言語処理の基礎
・演習:文書分類
RNN
補講動画でRNN: Recurrent Neural Network で何を実施しているか確認。
Long-Short Term Memory 直近の情報、昔の情報をどの程度勘案して未来予測をするのかのパラメータ調整をしてくれる手法
list の中でfor 文を回す方法 @phthon
Facebookの時系列予測ツール (統計処理、機械学習ではない)
Prophet
Prophet 以下のperiods には予測したい未来の期間を入れる
model.make_future_dataframe(periods=xxx)
torch.tensor の記述方法
PyTorch で時系列データを(サンプル数, 入力変数) の形に変更する必要がある
# 失敗例
torch.tensor(x, dtype=torch.float32).shape
→torch.Size([2622])
# 成功例
torch.tensor(x, dtype=torch.float32).view(-1, 1).shape
→torch.Size([2622, 1])
RNNの隠れ層について
RNN 隠れ層 (hidden_size) を変更すると何が変わるかが分かりそうなサイト。hidden_size を増やすとどの程度過去の情報まで参照するのかという情報になると思っていたけど違うのかな。単純に各時刻(step)におけるhの数なのかな。
公式ドキュメントからは想像できない