『RStudioではじめる医療統計(第2版)』(献本)
僕が留学した10年ほど前にはSTATAかRかPythonか、という感じでしたが、今はもうRとPythonでいいでしょう。STATAが流行した際にはSPSSなんて…という人も多かった気がしますが、今はSTATAがその位置にあります。当時SPSSやSASは古いと言ってSTATA使っていた人は気をつけてください笑(弘法筆を選ばずですし、結果が出ればなんでもいいとは思うのですが)
Rのセミナーや教科書は本当にたくさんありますし、GPTに聞けばコードも教えてくれるので、いわゆるアンチョコ本の価値というものがこれまでよりも下がっていると思います。
私が解析する時にもGPTに投げることの方が多いです。
ただ、「立ち返るための一冊」というものはあった方がいいと思っていて、GPTとかだと断片的な知識で学んでいるのと、それが正しいかどうかが分かりません。私は生成AIは基本的にある程度基礎がある人が飛躍的に効率を上げるためのツールで、体系的に学ぶためのツールではないと認識しています(あとは新しくチャレンジする時のパートナー)。
それからもう1つ、同じRのスキルでも臨床疫学的な医療統計と機械学習的な側面の統計だと微妙に求められるものが違ったりします。これはデータへの意味付けや疫学的な側面が大きいでしょう。
そういうところにはGPTだと対応しきれないのが現状です。たとえば、傾向スコアマッチングや予測の研究など、医学領域で求められることをちゃんと明示してくれているのが重要。もちろん因果推論などの疫学的領域の知識になってしまう部分もあるので、そちらも合わせて勉強できるとよりベスト。
そのせいでRの本を買う時には色々な本がありすぎて迷うのですが、その点において本書が良くて、医学研究者にとってその立ち返るための一冊としては僕は昔からこの本を推しています(下記マニュアルでも推奨しています)。僕が東大SPHで少しお世話になっていた時に指導していただいた先生方というのもあり、そこに対する信頼もあります。
この本の欠点としては、どうしても結果の図表が多いので、人によってはチカチカするというか読みにくい印象を受けるかもしれません。ただ、ナラティブに読み進める本ではなく、手元に基本に立ち返るための本として持っておくのであれば問題ないです。
あとはサンプルデータがついているのですが、東大SPHなどが行っているサマーセミナーなどで一緒に手を動かすのがおすすめです。一人でサンプルデータを使って手を動かすのは中々大変ですから。僕はいつも三日坊主なので、こういうのを淡々とできる人は尊敬します。