編集後記『超入門! すべての医療従事者のためのRStudioではじめる医療統計』(第2版)
医学領域専門書出版社の金芳堂です。
このマガジンでは、新刊・好評書を中心に、弊社編集担当が本の概要と見どころ、裏話をご紹介し、その本のサンプルとして立ち読みいただけるようにアップしていきたいと考えております。
どの本も、著者と編集担当がタッグを組んで作り上げた、渾身の一冊です。この「編集後記」を読んで、少しでも身近に感じていただき、末永くご愛用いただければ嬉しいです。
◆ ◆ ◆
■書誌情報
無料で使える統計ソフトRのハードルをとことん下げたあの書籍が、最新版のRに対応してアップデート!
◆ ◆ ◆
■編集後記
ぶんぶんぶん ぶぶんぶぶん 水分!
ぶんぶんぶん ぶぶんぶぶん 水分!
京都市、3日連続最高気温39度以上という予報をみてしまい、それだけで干からびています。Aです。(※編集者注:原稿をもらったのは7月31日でした)
医書界隈でRの本が売れるかよ! と思われながらもよく売れた『超入門! すべての医療従事者のためのRStudioではじめる医療統計-サンプルデータでらくらくマスター-』の第2版がついに出ます。
第1版発売時のRはバージョンは 3.6系列でしたが、発売後4年が経ち、今では4.2です。パッケージ読みこんだときや、データ解析したときのメッセージもぜんぜん違うやん! ということも当たり前になりました。
まずい。
初心者向けなのにエラーじゃないとはいえ出力がちがうと迷いが出てしまう。改訂せねば!
というわけで『それをしたらダメ! NG事例から学ぶ臨床研究デザイン』の発売直後から改訂作業をしていただきました。結果、
初版:168頁
第2版:240頁
50%増量です! 何を増やしたのか、というと大きく分けて2つです。データフレームの取り扱いと、新しい高度な分析方法(予後予測モデル・傾向スコアマッチング)の追加です。後者はわかりやすいと思いますが前者が初版の32頁から55頁に増えています。データ調整の細かいところに手が届く充実の改訂です。初版の読者の皆様からいただいた質問やお悩みにも答えるコラムも充実させました。
この物価高のご時世、こんなに頁が増えたのにお値段も300円しか値上げしていない。本書を片手にRをぶんぶんふりまわしてください。
◆ ◆ ◆
■序文
本書の目的は、臨床家が学会発表や論文執筆を行うにあたり、無料で使えるソフトウェアであるRを用いて統計解析を行うことができるようになることです。第1版では、臨床研究において必須の基本的な統計手法を、Rを使って実践する方法を紹介しました。本書第2版ではさらに内容を掘り下げ、より発展的なデータ操作方法や、臨床予測モデルや傾向スコア分析といった新たな統計手法の実施方法を追加し、より多様なニーズに応えることを目指しました。
私たちは東京大学の公衆衛生大学院で学びながら、Rの導入に苦労した経験があります。この経験を基に、同じように困難を感じる臨床家がRをスムーズに活用できるよう手助けしたいという思いから本書第1版を出版しました。幸いにも多くの読者からご支持をいただき、Rを用いた統計解析の実践に役立てていただけたことを非常に嬉しく思います。
第2版では、データの操作方法について詳述し、データの前処理の技術を強化しました。特に第5章は大幅に改訂し、発展的なデータ処理方法を解説してあります。難しく感じるかもしれませんが、本書を手元に置きながら、必要に応じて参照していただくような使い方を想定してあります。これにより、研究の全体的なプロセスを効率的かつ効果的に進めるためのテクニックがより具体的に利用できるようになるでしょう。Part2ではさらに深い知識を提供するために、臨床予測モデルや傾向スコア分析を追加しました。これらの手法は今や広く使われるようになってきており、実際に臨床研究を実施する上で知っておくべき必須のものとなっています。
本書は、初版に引き続きサンプルデータを用いて練習することで、読者が実際のデータに対して適用できる実践的な知識を身につけられる構成となっています。各統計手法については、対応するRパッケージの解説、スクリプトの例、そしてその出力を順に示し、実際の解析手順を具体的に理解できるように配慮しています。これにより、Rを初めて使う方から、既に活用している方まで、幅広い読者にとって有用な参考書となることを目指しています。また、サンプルデータでの練習が終わった後も、自分のデータを解析する際に手元にあると便利なマニュアル的な使い方ができるようになっています。
第2版の出版に際しても、多くの方々のご協力をいただきました。特に金芳堂の浅井健一郎様には、第1版に続きご支援とご協力を賜りましたこと、心より感謝申し上げます。また、本書がさらに多くの臨床家の方々にとって、Rを活用するための一助となることを願っています。
2024年6月
笹渕裕介
◆ ◆ ◆
■目次
第2版 はじめに
Part1
第1章 RおよびRStudioのインストール
1 Rとは
2 RとRStudioのダウンロードとインストール
第2章 RStudio操作の基本
1 RStudioを起動してみよう
2 各ペインの機能
3 スクリプトを書いてみよう
4 RStudioを終了する
第3章 パッケージ利用の準備
1 パッケージとは
2 インストール方法
3 help
第4章 プロジェクトの作成とデータ読み込み
1 プロジェクト
2 データの読み込み
3 データの表示
第5章 データフレームの取り扱い
1 readr
2 dplyr
3 NAの取り扱い
4 連続変数のカテゴリー化
5 日付データの取り扱い
6 文字列の取り扱い
7 データの変形と結合
第6章 データの概要の確認
1 データの俯瞰と要約
2 tableoneパッケージ
第7章 ggplot2
1 散布図
2 折れ線グラフ
3 ヒストグラム
4 箱ひげ図
5 グラフの保存
第8章 2群間の比較
1 統計手法の選択
2 連続変数の比較
3 カテゴリー変数の比較
第9章 3群以上の比較
1 多重比較法
2 統計手法の選択
3 連続変数の比較
4 カテゴリー変数の比較
第10章 重回帰・ロジスティック回帰
1 重回帰
2 ロジスティック回帰
第11章 生存時間分析
1 生存時間分析
2 データの整形
3 Survivalオブジェクトの作成
4 カプランマイヤー法とログランク検定
5 コックス回帰
Part2
第12章 データ作成
1 データの作り方のコツ
2 文字コード
3 変数名
4 変数の中身
5 最終手段
第13章 Rで使うデータ型とデータ構造
1 Rの代表的なデータ型
2 Rの代表的なデータ構造
第14章 相関係数
1 相関係数
2 複数の相関係数を同時に算出する
第15章 ROC曲線
1 ROC曲線とは
2 Rのスクリプト
3 ROC曲線の比較
第16章 予測モデル
1 予後予測モデル
第17章 傾向スコア分析
1 傾向スコアとは
2 傾向スコア重み付け
3 傾向スコアマッチング
Column
同じ関数名の競合
freadによる高速読み込み
baseとtidyverse:2種類のパイプ
tibbleとdata.frameの違いは?
for loop
summarytoolsパッケージ
係数、95%信頼区間、P値の簡単な求め方
コードが実行できません
自作関数
おわりに
索引
著者略歴
◆ ◆ ◆
■サンプルページ
◆ ◆ ◆
■終わりに
今回の「編集後記」、いかがでしたでしょうか。このマガジンでは、金芳堂から発売されている新刊・好評書を中心に、弊社編集担当が本の概要と見どころ、裏話をご紹介していきます。
是非ともマガジンをフォローいただき、少しでも医学書を身近に感じていただければ嬉しいです。
それでは、次回の更新をお楽しみに!
◆ ◆ ◆
この記事が気に入ったらサポートをしてみませんか?