【医師のイギリス公衆衛生大学院留学】Term2の記録②
Imperial College LondonのMSc Epidemiologyに在籍しています。Term2の試験も残すところ後1つとなり、試験勉強にも疲れてきました。現実逃避がてらTerm2の各授業の振り返りや感想などを記録しておこうと思います。ちょっと長くなりそうなので2つの記事に分けます。なお、以下の記事にTerm2全体に関するざっくりとしたことは記載しており、そこから続きで読んでいただくとわかりやすいかもしれません。
*カバー写真はHampton Court Palaceです。この時期Tulip Festivalというものが行われていて、とっても綺麗でした。
はじめに
Term2は全てのモジュールが選択制でした。選択における制約としては、
合計のECT(単位数)が30ECTsになるように選択する。
Bayesian Reasoning and Methods for Spatio-Temporal Dataは10週間のコースで10ECTsに相当する。
Bayesian以外のモジュールは全て5週間で、それぞれ5ECTsに相当する。
OutbreakはFurther Methods in Infectious Diseases Modellingを受講していないと選択できない。
上記のルールのため、Bayesianを受講する場合は合計5モジュール、Bayesianを受講しない場合は合計6モジュールが最低の受講数になる。
Term2は前半5週間、後半5週間の2部制で、5週間のモジュールはここで切り替わる。前半後半でバランスよく3+3モジュールのように取る人もいれば、4+2のようにする人もいて、これに関して制約はない。
30ECTs以上の選択が可能かどうかは不明で、知る限りそこまで頑張っているクラスメートはいなかった。
選択するモジュールの希望調査はTerm1の最後に行われました。選択に際しては、各モジュールの詳細(どのような内容か、試験や課題にどんなものがあるか、具体的なスケジュールなど)が記載されたハンドブックを参照できる他、Term1の最後の方に全モジュールのmodule leadの先生たちが説明会を開いてくれました。モジュール選択の時点でTerm3の研究プロジェクトの指導教官が確定している人は少ないですが、決まっている人はTerm3に向けて履修しておいた方が良いモジュールの選択に関して相談をしたりしていました。私は感染症疫学を勉強するためにこのコースに来たので、必然的に関連の4モジュールを選択し、残りは感染症数理モデルの研究などでも手法をよく見かけるということでBayesianを選択しました。特に強い希望がなかったり、興味が定まっていないクラスメートの中には各モジュールがどのように学生を評価するかを最も重要な判断材料として選択している人もたくさんいました。
なお、以前の記事にも掲載しましたが、Term2の全モジュール名は以下の通りです。このうち私が履修したのは太字のモジュールです。
Bayesian Reasoning and Methods for Spatio-Temporal Data / 10週間、10ECTs
Emerging and Neglected Tropical Diseases / 5週間、5ECTs
Advanced Regression / 5週間、5ECTs
Further Methods in Infectious Disease Modelling / 5週間、5ECTs
Environmental Epidemiology / 5週間、5ECTs
Genetics of Infectious Disease Pathogens / 5週間、5ECTs
Molecular and Genetic Epidemiology / 5週間、5ECTs
Nutritional Epidemiology / 5週間、5ECTs
Outbreaks / 5週間、5ECTs
Health Impacts Assessment / 5週間、5ECTs
Bayesian Reasoning and Methods for Spatio-Temporal Data
概要
Spatio, Temporal, Spatio-temporalデータを扱えるようになるためのモジュールです(日本語で正確になんというのか不明ですが「時空間解析」とググるとそれっぽいページがヒットするので以下このように訳します)。空間・時空・時空間解析は、いわゆるビッグデータをはじめとした空間的・時空間的ヘルスデータが近年多く利用できるようになってきたり、このような複雑な解析に用いることのできる計算技術の開発により、過去10年くらいで急速に発展した分野のようです。
たとえば日本国内の全都道府県のCOVID-19流行時のデータを数ヶ月または何年分か振り返って何かしらの研究をするとします。隣接する都道府県は流行に際して互いに影響しあっているだろうし、ある都道府県のある月の流行数は先行する月から影響を受けるはずです。このため、あるタイミングにおける各都道府県の症例数は空間データです。ある都道府県の経時的な症例数は時空データです。時空間解析では、このような空間的・時空的な影響を加味して解析を行います。
このモジュールでは、ベイズモデリングと推論の概念、空間・時空間的データの分析に使用される統計手法が包括的に紹介されました。 コースの前半では、確率と推論に対するベイズアプローチの主な理論的概念について学びました(といってもベイズ統計に関する基本的なことはWeek1のみで一瞬で通りすぎましたが…)。続いて、空間的・時間的なデータを操作し、効果的に可視化し、モデル化するための概念・方法論・実践的スキルを教わりました。このような解析はMarkov chain Monte Carlo (MCMC)でも計算負荷が高いとされ、モジュールの実践的なところはほとんどR-INLAを用いて行いました。
一日の流れ
本モジュールは毎週月曜午前10時からライブでの授業、午後にRを用いた実習という形で行われました。実習は時空間解析に用いる生データが渡されて、与えられた課題をこなしていきます。適宜不明点はその場にいる先生たちやPhDの学生さんに質問することができました。基本的に自分のペースで進めていくことになるので、早く終われば早く帰っても全くお咎めなしでした。以下に詳細を述べますが、モジュール期間中は一切の課題・試験・グループワークなどはありませんでした。
課題や試験
本モジュールの評価はグループワーク(モジュール全体の30%に相当)と筆記試験(70%に相当)で行われました。グループワーク課題はモジュールが終わった後にリリースされ、試験は春休み期間の一番最後の1週間で行われました。
グループワークは4人ずつくらいのグループがランダムに割り振られて、生データから解析を行い、学術論文の体裁でレポートを提出するというものでした。私のグループは2020年上半期のメキシコ全土におけるCOVID-19の毎週の新規報告数と、各地域における高血圧・肥満などの慢性疾患の有病率が含まれる生データが渡されて、好きに研究仮説を立てて解析してね、というものでした。
このグループワークは10週間の授業が全部終わった後の、Easter Breakに入った瞬間に課題が発表されて2週間後に提出する必要がありました。なおグループ間で与えられるデータは全く異なるので、自分たちのグループのことは自分たちで解決しないといけません。課題発表後早々にどのような研究仮説を立てて、どのような解析計画で進めるかを相談して、いつまでに主要なコーディングを行い、いつまでにレポートのドラフトを作るかなどを相談する必要がありました。
私のグループは4人グループで、私以外は全員中国の子達でした。他の3人ともバックグラウンドは数学や統計などで、このモジュールの数学的な側面は私より強そうでしたが、研究仮説を立てたり結果を解釈したりするところは苦手そうでした。コーディングスキルはみな同じくらいという感じでした。自然と私が毎回の議論をリードすることが多くなりました。
最終のレポートはRのコードも全部埋め込んだR markdownとhtmlファイル/PDFで提出する必要がありました。その上でメインとなるパート(Abstract, Introduction, Methods, Resutls, Discussion)はA4 5枚以内、おさまらない分とReferenceはSupplementaryに回すなどの制約があり、出来上がったものは内容はともかくさながら学術論文のようなものでした。R markdownはこのコースに来て幾度となく使ってきましたが、それを用いてレポートを作ったのは初めてだったので、R markdownの使用方法もこの課題を通して習熟する必要がありました。
筆記試験はTerm3が始まる1週間前のExam Week内で行われました。90分間のin-personで、自分のノートや授業スライドなどを参照して良いopen bookの試験でした。試験は各自のラップトップで行い、オンライン上のポータルに提出します。問題数が結構多く、その場で適宜調べながら答えることが出来るほど余裕はありませんでした。グループワークでcodingはたくさん行ったので、この試験ではモジュール全体を通してのコンセプトや解析結果の解釈に関する問題が多かったです。主要なモデルの背景となる数式を書いて説明せよ、というような問題も多く出題されました。
感想
とにかく辛い10週間+試験期間でした。モジュール選択の時に戻れるならば、このモジュールは絶対に取るなと自分を説得したいです。全体のコンセプトというか、時空間解析の背景知識を理解できたのは良かったです。一方でどの授業スライドも数式だらけで、見たこともない数学記号が頻出、モデルを規定するパラメータにはさらにそれを規定するハイパーパラメータがあって…みたいな、私の頭で理解するためにはとてもつもない時間が必要なことの連続でした。
自分が全然理解できていない内容に関してグループワークでリーダー的役割をすることほどしんどいことはありませんでした。他のメンバーの子達はお願いしたことは快くやってくれましたが、逆にお願いしないとやってくれないし、それ以上のことはやってくれませんでした。結果として合っているのかどうかもわからないcodeを持ち寄って、それを元に大変浅い議論をして、だいぶ怪しいレポートを書いてなんとか締め切りに間に合わせたという感じです。
逃げ場もなく、結果としてcodingスキルも向上しましたし、多分今後この分野を独学しようとしても個人的には絶対ムリだと思うので、そういう意味では良かったのでしょうか…。ただ、同じ疫学のコースを修了してこの分野に進む人も中にはいるだろうことを考えると、自分ははっきりと向いてない分野だと感じました。
Emerging and Neglected Tropical Diseases
概要
新興感染症(EIDs)と顧みられない熱帯病(NTDs)に関する幅広い知識を養い、EIDsとNTDsの公衆衛生戦略、制圧プログラム、監視システムを批判的に評価できるスキルを身につけることを目標としたモジュールでした。MPHコースの希望者も受講することができるモジュールでした。EIDs(エボラなどのウイルス性出血熱、MERS、SARS、COVID-19などなど)、NTDs(オンコセルカ症、シャーガス病、リーシュマニア症…など全部で21疾患あります)に関する基礎知識・疫学・介入・モニタリングと評価・サーベイランス・アウトブレイク調査など、さまざま側面について浅く広く勉強しました。
一日の流れ
火曜日の午前中にオンラインでの講義、午後にキャンパスで様々な内容の実習を行いました。午前中はオンラインなので自宅から参加できますが、基本的にはまる一日拘束されるモジュールでした。
午後は、第1週目こそなぜかオンコセルカ症の数理モデルに関する実習でみんなポカンとしていましたが、2週目以降は国際保健的な内容のグループワーク、ディベートなど多岐にわたりました。
課題
個人エッセイ(モジュール全体の75%)とグループワーク(25%)で評価されました。
エッセイはviewpoint-essayというスタイルで書く必要があり、与えられた課題に関して現状と課題を分析して、なんらかの公衆衛生的な提言をするというものでした。モジュール開催中の第2週にお題が発表されて、2週間後に提出しました。合計1500 wordsまでで、参考文献は40点までというルールでした。テーマは以下の3つから選択することができました。
蚊が媒介するアルボウイルス(例:デング熱、ジカ熱、チクングニア熱)を任意の中・低所得国の都市部で総合的に制御することを目的とした戦略の成功と課題について、批判的に論じる。そのようなプログラムの成果をモニタリングし、評価するための推奨事項を提案する。
人獣共通感染症のリスクに取り組む上でのワンヘルス・アプローチの重要性を批判的に論じ、ワンヘルスの概念的アプローチを運用する際に直面する困難について、任意の具体例を用いて説明する。
接触者追跡(contact tracing)は、新興感染症アウトブレイクの伝播を減少させるために極めて重要な要素であり、アウトブレイクを管理するために迅速に展開できる。デジタル・アプローチへの移行は、COVID-19の大流行を通じて、多くの国が接触者追跡のためにデジタル技術を採用したことでますます実証されている。デジタル・アプローチを次のような新興感染症に使用する機会と課題について、批判的に論じる。ある国(高所得国、中所得国、低所得国のいずれか)において、任意の新興感染症にデジタルアプローチを用いる機会と課題、およびそのような技術を用いる際に必要な主な考慮事項について批判的に論じる。
私は3のcontact tracingを選び、日本のコロナ禍におけるCOCOAにまつわる悲喜こもごもと、それに伴う意見をまとめました。すでに70%くらいの得点率で返却されており点数に関しては大いに満足しているのですが、フィードバックには「コロナ以外の疾患を選んで欲しかった、この経験から他の疾患の制御に応用するとすればどんなことが言えるのか論じてほしかった」的なことが書かれており、上記の課題文章から全く読み取れないリクエストだったので、フィードバックの真意を現在確認中です…。
グループ課題はMPHとMSc Epiが混合になるように割り振られた7~8人のグループで、サハラ以南のアフリカ諸国のうちどこかが割り振られて、それぞれの国の公衆衛生当局に対してEIDs・NTDsに関する向こう5年間におけるアクションプランを作成して助言するための資料を作成するというものでした。サハラ以南のアフリカ6カ国は西アフリカ3カ国(リベリア、ナイジェリア、シエラレオネ)、中央アフリカ1カ国(コンゴ民主共和国)、東アフリカ2カ国(ウガンダ、タンザニア)で、私のグループはシエラレオネを割り振られました。資料はパワーポイントのスライドにまとめて提出しました。
他のモジュールのグループワークは毎回胃が痛い思いで過ごしていましたが、このモジュールのグループワークはメンバーに恵まれて非常に楽な思いをさせてもらいました。全員が真面目で各自で決めた宿題以上のことをきっちりやってくれましたし、背景知識も私の医学に始まり、微生物学に精通している人が2人、学部で公衆衛生をやっていた人が1人いた上に、英語ネイティブが2人いたのも有難かったです。この課題はリリースから提出まで2ヶ月近くあったので、毎週時間を決めてweb会議をしながら少しずつ進めました。
感想
このモジュールはMSc Epiの学生が通年で選択できる中で、唯一codingや数式が登場しないqualitativeな内用でした。このコースに進んでおきながら数学的側面に非常に苦労している自分にとっては、とても有難かったですし、内容も興味のあるものでした。感染症医としてEIDsもNTDsも基礎知識は持ち合わせていますが、日本では診ることはほぼない疾患ばかりだったので学ぶことは大変多かったです。特に2010年台のアフリカ諸国におけるエボラアウトブレイクで活躍された先生達の話や、NTDs制御に関するグローバルな研究グループのリーダー的役割をされている先生達の話は大変興味深く、実習のたびにそのような先生達からいただくフィードバックはとても新鮮でした。
課題もリーズナブルというか、個人課題もグループ課題も難易度的にも時間的にも無理なく仕上げることができました。強いて言えば内容が盛りだくさんで独学に頼るところがたくさんあったので、10週間かけてくれても良かったのではないかと思うくらいです。
終わりに
Bayesianが辛すぎて思うところがありすぎたので、2つのモジュールだけで長くなってしまいました。結局は自分がどれだけ興味関心を持って楽しく勉強できるか次第で、それぞれのモジュールの感想は異なってくると思います。Bayesianは非常に手厚く盛りだくさんですが、私にとってはヘビーで消化不良気味です。他の3モジュールについては追ってまとめようと思います。