泣かない研修医、エクセルを学ぶ

現役の外科医、中山祐次郎さんのベストセラー小説「泣くな研修医」シリーズ。ご自身の姿が色濃く投影されているであろう主人公の研修医「雨野隆治」(あめのりゅうじ、ニックネームは「アメちゃん」)が患者さんや同僚との出会い、病との戦いを通して成長していくお話です。病院と医療のリアルが丁寧に書かれていて引き込まれます。
学会発表の準備という新たなチャレンジ
シリーズ第3作「走れ外科医」では、救急外来での診察や手術に忙殺される雨野に新たなタスクが課されます。上司から、学会発表に向けてデータを整理するようにと指示されたのです。
「前に言ったと思うけど、7月にある学会の準備を進めろ。抄録は作って提出しといたからな。ま、解析やらスライド作りやら、勉強だと思ってやってみな。」
勤務する病院の患者データを整理し、要約統計と分布を作ることが分析の第一歩なので、やってみなさい・・・ということですね。そんなん、簡単じゃないか‥‥と言うなかれ。雨野はこれまでエクセルをほとんど使ったことがなかったのでした。大学で少しだけ学んだこともすっかり忘れており、たくさんあるボタンの機能を一つずつ試してみることにします。ひたすらクリックしてみるのを繰り返しますが…。
ーーこれは‥きつい‥‥。患者さんの話を聞くのとも、救急外来で重症患者を診るのとも、そして手術の細かい手技ともまるで違う能力が求められる。隆治はイライラしながら続けた。
平均値と中央値って違うものなの?
慣れないエクセルと格闘する雨野は続いて、要約統計量の壁にぶち当たります。要約統計(summry statistics または記述統計descriptive statistics)とは、たとえば分析対象となる患者さんの年齢はどのくらいなのか、Aさんは87歳、Bさんは65歳‥‥ではなく、全体を要約するとどうなるのかを表す統計です。おそらく最もよく知られていてわかりやすいのが平均値(average, またはmeanという)でしょう。全員の年齢を足して、患者の数で割れば、患者の平均年齢を求められます。ですが、ここで雨野が計算しなければならないのは平均ではなく「中央値」(median)でした。
ーー中央値?平均とは違うものなのか?なんで平均じゃいけないんだ?
隆治にはかなり初歩的なこともまったくわからない。
そこに現れたのが同期の川村(耳鼻科)。中央値はエクセルの関数(MEDIAN)ですぐ出るよ、とさくっと計算してくれた上、「‥‥もしかして、平均値と中央値って、どう違うとか、聞いちゃったりしても‥‥」(p.175)と恐る恐る尋ねた雨野に親切に教えてくれたのです!ありがとう、川村先生!要約統計とは、川村先生の言う通り、「この集団はこういう人たちですよって言いたいだけ」なんですが、データサイエンスにおいては、まず最初の大事な一歩です。
まずはエクセルを学ぼう
雨野がここでやっているようなデータの整理や要約統計はエクセルなどの表計算ソフトやプログラミングで簡単にできます。一般教養課程「データサイエンス」ではまず、エクセルの使い方を学んで、データってどんなものなのか、データをどう料理したら知りたいことがわかるのかーーをやってみます。将来、研修医になってもならなくても、損はないです。
これまでそういう勉強を全然せず、ただ患者さんのことと手術ばかりを学んでいたのだ。差がついてしまった、そのことで焦る気持ちも小さくなかった。耳鼻科ではそんなに学会発表のトレーニングをしているんだろうか。
ーーしかし、病棟と手術の知識だけじゃダメなんだろうか?こういうのは必要なのかな?
病棟と手術の知識だけじゃ・・・ダメです(笑)。でもこれは他の分野にもあてはまることです。大谷翔平さんも、いつもベンチで対戦相手のデータを見ていますよね。自分が直接経験できること(=自分がかかわる患者さんや手術)には限りがあります。データ(=もっと広い世界の患者や手術に関する情報)を読み解くことができれば、治療方法の選択肢も増えるかもしれません。そして、自分たちの症例をデータとしてまとめて発表すれば、医学の発展に小さい一歩ながら貢献できるのです。
一般教養科目「データサイエンス」では、エクセルを使った経験が全くないまたはほとんどない人向けに、6回にわたってデータ分析のためのエクセル操作を教えます。
基礎の基礎
簡単な計算
関数
要約統計
グラフ
ピボットテーブル
これらの詳しい内容についてはまた別の機会に。
「泣くな研修医」シリーズの最新刊(第7巻)は「迷うな女性外科医」。雨野の頼りになる先輩である佐藤先生が主人公です!(まだ読んでない)。佐藤先生はデータ分析が得意なのかどうかも知りたいので(笑)、早く読みたいです。