マガジンのカバー画像

シリーズ:生存時間分析

6
生存時間分析の基礎から機械学習系の生存時間分析のアルゴリズムまで git: https://github.com/Greenwind1/survival-analysis
運営しているクリエイター

記事一覧

生存時間分析の基礎 6(比例ハザード仮定の検討 その 2)

生存時間分析の基礎の第 6 回目となります. 今回もぼちぼちやっていきましょう. 前回は Cox PH モデルの前提である「比例ハザード仮定」が成立しているかどうかを検証する方法として,グラフを使う方法を解説しました. グラフを使う方法はグラフを視て判断するという定性的な方法でした. どんな方法であったか忘れてしまった方は前回を振り返ってみてください. 今回からは,都合数回に渡って定量的な統計的検定手法である「適合度を使った方法」をみていきたいと思います. 分析結果を公に

生存時間分析の基礎 5(比例ハザード仮定の検討 その 1)

生存時間分析の基礎の第 5 回目となります. なんと・・・前回の記事から二年以上も間が空いてしまいました. 更新が遅くてすみません. ぼちぼちと再開していきたいと思います. そういえば,しばらくみないうちに note の仕様が大幅に改良されていますね.Tex 形式で数式が表現できるようになっていて,とても嬉しいです. 内部的には MathJax を使用しているのでしょうか. さて,今回からは計 3 回に渡って,Cox PH モデルの前提であった「比例ハザード仮定」が成立し

生存時間分析の基礎4(Cox 比例ハザードモデル)

秋になり大分涼しくなってきましたが,皆さんお元気でしょうか? 前回から大分間が空いてしまいましたが,本シリーズも第 4 回目となりました. 本シリーズの内容の多くは,「エモリー大学クラインバウム教授の生存時間解析(サイエンティスト社)」にもとづいたものとなっていますので,より詳しく勉強されたい方は合わせてそちらを読んでみることをお勧めします. さて,今回からモデリングのお話へとうつっていきます. 最終目標は「機械学習の生存時間分析モデルの紹介」ですので,まだまだ先は長そうで

生存時間分析の基礎3(生存曲線の検定)

前回の記事を up してからかなりの期間をあけてしまいましたが,ようやく重い腰をあげて続編を up しました. ペースの遅い投稿者ですみません(汗.このような感じで遅々としてやっていくと思いますが,気がむいた際にでも読んでいただけますと幸いです. ちなみに,続編を執筆せずに何をやっていたのかといいますと,昨年の 11 月から 今年 1 月上旬にかけて開催されていた ProbSpace の「浮世絵作者予測」や 昨年末から今年 3 月上旬まで開催されていた Kaggle の 「

生存時間分析の基礎2(生存曲線と推定生存曲線・Kaplan - Meier 生存曲線)

お久しぶりです.お元気ですか? 本記事の執筆時点(2019 年 12 月末),急激に寒くなり体調を崩しやすい時期となりました.私はといいますと・・・,先日開催された Kaggle Days Tokyo にて,風邪のためマスクをつけて登壇しお話をする羽目になりました.皆様も体調管理にはお気をつけてお過ごしください. 発表内容は私の Speaker Deck にアップしてありますので,ご興味のある方はご覧いただけると嬉しく思います.欠損値の補完(主に多重代入法)に関するお話となり

生存時間分析の基礎1(生存時間分析とは・生存時間分析のデータ形式)

本記事は,生存時間分析の基礎シリーズの第一回目となります. 更新は不定期で著者のきまぐれに左右されてしまいますが,もしよろしければお付き合いください. 先日,生存時間分析モデルの種類の調査を行っていた際に,こちらの記事にであいました. 非常によくまとめてくださっていて,ありがたく拝見させていただきました.紹介されていた数々のモデルの中でも,個人的なニーズと興味から Random Survival Forests (RSF; Ishwaran et al., 2008) を