論文の作成法と統計学の取り扱い説明書
【総論】
1.総論|学会発表(ポスター発表、口頭発表)、論文するとはどういうことか→人類の未到達点を少し広げること
1.1.論文作成の人生における意味
1.2.誰もやっていないことの楽しさと調べるのに付随して実力がつく
1.3.サイエンスの諦観に克つ
1.4.書き方のコツは二元論を酷使するのみ
1.5.論文に書き終えなければ、どんな研究もやったことにならない
1.6.論文を書いているうちに、論文を読む能力と解釈する能力と生み出す能力が自然についてくる。
2.ネタを見つける。仮説をたてる。
3.データを集める。
4.データを解析する。
5.仮設が正しい、正しくないとわかって、みんなに知ってもらいたい内容がでてきたら、学会でポスターにするか口頭発表する。
6.学会発表する。雑誌に投稿する。そして、論文になる。Pubmedにのる。
6.1 ポスターをデザインする。
7.『仮想論文作成』-速聴写真記憶法による成績上昇率と合格オッズ比
8.EBMとはなんなのか。
【各論】
2.【医学統計学】統計学も二元論でスッキリ使いこなす方法。論文執筆技術データベース。
3.ポスター作成技術。バイブル「伝わるデザインの基本」にみる二元論とその対象化
4.科研費取得法
以下、本文。
1.総論|学会発表(ポスター発表、口頭発表)、論文するとはどういうことか→人類の未到達点を少し広げること
1.1.論文作成の人生における意味
論文を作るのは、こんなイメージだとあるひとが言ってました。
『人類の叡智が地球の大きさだとしたら(1周4万キロメートルの球体)、
論文を出すのは、1mmだけ、その球体から出っ張ることだ』
と。
世の中にないものを作る(新しいエビデンスを作る)というのは、株式会社に入れば、仕事としてやることになりますが、科学者(特に医者)は自分のやる気で、新しいものを作る必要があります。
上記の本を読んで、せっかく、医者になったんだから、健康診断や寝当直のバイトばっかりやってないで、人類の健康に奉仕しましょう。
PhD、博士になるっていうのは、
●論文が読めるようになること
●統計学が操れるようになること
の証明である。
これができると、スタートアップをやるにしても、
最新の研究にアクセスできるから、ブルーオーシャン
ファーストペンギンになれる。
これがわかってない大企業病のひとが多すぎる。
1.2.誰もやっていないことの楽しさと調べるのに付随して実力がつく
世界で誰も知らないことを、自分だけが知っているという状況が生まれます。これにときめきや情熱を感じることができれば、あなたはすでに論文を書けているも同然です。
口うるさい上級医も、偉そうにしている診療部長も知らないことを、自分だけ知っているし、そして、そのことについて、誰よりも詳しいというのは、研修医時代になめられていた分だけ、優越感を抱けるようになります。
ひとつのことを深く掘り下げると、様々な論文を付随して読み込む必要があります。そこで得た知識は、他の疾患にも敷衍することができ、他の疾患の理解が容易になるというメリットがあります。
1.3. 医学界におけるサイエンスへの諦観
医者は科学者なんですが、『おれ、臨床だけやってたい。金にならないし』、とか、『わたし、論文とかムリ。こどもほしいし。もう疲れたし。』というひとが8~9割がたです。(独自の統計なので、もっといるかもしれません。現役で論文を1年に1個以上だしていない医者の割合です。)これが、ぼくが命名した『医学界におけるサイエンスへの諦観』問題です。
多くの医者が現状の給料に満足しており、家庭環境や労働環境からも、論文を書くのを諦めています。
残り1割の医者ががんばって、医学の地平線を広げています。それで、医学が発展しているのだから、そりゃ日進月歩だよなぁと思います。
逆に、臨床よりも、論文を書くことや、実験に興味があると、サイコパスなんじゃないかとか、コミュニケーションが嫌いなアスペルガー症候群の自閉症スペクトラムの医者なんじゃないかと、うがった見方をされがちです。臨床できるほうが偉いとか、地方の大病院で手術件数が多いほうがすごいという発想になる。
こういう発想がさらに、『医学界におけるサイエンスへの諦観』に拍車をかけます。
1.4.書き方のコツは二元論を酷使するのみ
分析 VS 統合
定量 VS 定性
帰納 VS 演繹
これらを使いまくっているうちに論文ができてきます。
逆にいうと、これらがうまく意識して使われていない論文はダメウーマンならぬダメ論文です。
二元論が使えなければキャリアウーマンになれず、ダメウーマンです。
まず、帰納的にやっていきましょう。
先行論文を大量にPubmedから検索してダウンロードします。
探し方は紹介した本の50のテクニックの中に入っていますのでそれを参照。
そして、分析です。
とりあえず、イントロダクション。
この中の最初に書かれているのはたいてい、疫学です。
疫学から書きましょう。
大量に探し出した先行論文の疫学の文章を抽出します。それらの参考文献を孫引きします。
そして、ダウンロードして、疫学の記述があっているのか、検証します。
先行論文の疫学の文章をひとつひとつ並べて眺めます。演繹です。
たいてい同じ内容が書いてあるので、 SVC をシャッフルして、同じ意味だけど、同じ動詞や名刺、形容詞を使わないように文章をずらします。thesaurusが頭に入って入れば調べなくても、文体を変えるだけでコピペ防止AIから逃れられます。
Fool-proof Englishになっているかチェックして完成です。冗長な表現はシンプルにでしたね。
あとは引用文献を投稿する雑誌に合わせて引用するだけです。
この作業を疫学以外にも、治療法などにも応用します。
5回くらいこの作業をすると、気づかぬうちに統合され、イントロダクションができあがります。
おめでとうございます。みなさんはもうすでに論文がかけるようになったも同然です。
マテリアルズ アンド メソッズでは定量的になにを分析したかを表現し、要素還元主義に徹します。
みなさんの論文を使って、実際に治療するときに必要な知識をそこにすべて盛り込みます。冗長になる場合はアペンディクスに入れましょう。
再現性の高さが問われます。
定量データは常にEZRを使って統計解析したり、エクセルに打ち込んで、定性的な図、表を作ります。
分析 VS 統合
定量 VS 定性
帰納 VS 演繹
結局、これしか使わずに、論文も作れてしまうことがわかってしまいましたね。
総じて、論文執筆には『二元論を使う』だけだってことです。
1.5.論文に書き終えなければ、どんな研究もやったことにならない。強固な鎖をつくれば、自分の誇りになる。
No work is done, until the paper is done. (ポォーん ♪)
山中伸弥教授のプロフェッショナル仕事の流儀を見ました。
http://www.nhk.or.jp/professional/2017/0911/
なぜ山中伸弥教授はここまでNHKの密着取材をさせたのかと思いました。
プライベートもさらけ出して。
それは、『職業紹介』と『寄付金集め』と『後進を育てる』ためだと思います。
日本は科学技術立国です。世界でもっとも、サイエンスとテクノロジーで『すんげぇ~』と人類を言わしめる国。ジャパン。
アメリカや中国みたいに広大な国土と人口がないので、ドイツを見習って、サイエンスとテクノロジーで人類の叡智を押し広げてきた。
医学の世界でも、『iPS細胞で臓器を作り出してしまえば、どんな病気になっても臓器ごと交換してしまえばいいので病気を克服できる』という裏技を山中伸弥教授が作り出したわけ。(病気の理屈や薬の開発を待たなくても克服できるところがすごい。がんも治せないけど、がんになった臓器を交換すれば死なない状態を作れる。脳転移したらだめじゃないかって?脳転移はガンマナイフでもぐらたたきし続けられる)
父親の肝臓がん罹患がきっかけで、そんなミラクルを実現させようとおもったところがすごい。
整形外科を志望して、発生生物学に変えちゃうところもすごい。
「論文を書く」ということが「鎖のひとつになる」ということ。
「バベルの塔を築くため、階段を一段作る」でもなんでもいい。
天才的科学者はかならずこの哲学というか思想というか、キャッチフレーズをいいますよね。
NHKのホームページから以下、引用。
『この春山中は、ひとりの研究者として、新たな研究に本格的に着手。その極秘の研究現場に、初めてカメラの密着が許された。iPS細胞に匹敵するかもしれないと取り組むのは、遺伝子「NAT1(ナットワン)」。まだ多くの謎に包まれており、その解明に挑む。山中は、さまざまな専門家の力を結集して、徹底的に多角的に、粘り強くNAT1を調べ上げていく。そこには、「鎖のひとつになる」という山中の哲学があった。生命科学はあまたの研究の積み重ね。iPS細胞を作成できたのも、それまでに多くの研究者たちがつないできた長い長い鎖があったからこそなしえたと山中は考える。ひとつひとつの鎖の輪をつなげていけば、いつか真実にたどりつく。だから、自分の目の前の鎖をしっかりと完成させる。それが、研究者としての誇りだという。』
初めての論文を書き終えた自分だから言えるのですが、やっと、ひとつ自分にも鎖をつなげられたなぁと思う。
ブログや電子書籍を書くということも通底する思想は同じなのですが、公的に認められた鎖は結局、論文を投稿して受理されることしかない(医学の世界だと)。産業の世界だったら、特許を取ること。
日本は鎖の数と質が良い方だったから、貿易大国になれた。
少子高齢化で若い人が特許や論文を出さなくなったらと危惧されてますが、ぼくはまず、ひとつ鎖を作りました。
中高生のみなさんも、二元論とデータベースと速聴写真記憶で論文なり特許なりを作ってください。
つぎの目標は特許かなぁ。
追伸。
『職業紹介』と『寄付金集め』と『後進を育てる』について。
『職業紹介』:ノーベル賞を取った現役の科学者の生き様が見られるのは、この番組だけ。中高生にとって、これほど、魅力的なテレビ番組はない。
『寄付金集め』:日本人の富裕層よ。無駄に贅沢品ばっかり買わないで、無駄に相続税払わないで、新進気鋭の科学者に研究費を寄付してください。お願いします。京都大学のiPS研究所の研究員はみんな少ない給料で、派遣社員扱いです。こんなに世界でも最先端のことをやっているのに不当すぎる。本当にかわいそう。
『後進を育てる』:後進であるぼくもそうですが、かなり影響を受けました。国や企業から研究費をもらって、送迎リムジンもついて、日本とアメリカを股にかけて研究するっていうのは、カッコイイですよね。
今、まさに、そこにいる、患者を救うのに間に合わせる基礎研究ってすごい。
ぼくも、そういう特許を生み出したいと思ってます。
【追記】
電子書籍にして下記の本にぼくの知識を全部まとめて一冊にしました。
ぼくの持ってる知識、知恵、全部書いてます,
Just because NO JOB is finished, until the PAPERWORK is done.(書かなきゃ意味ないよ。伝えて残さなきゃ意味ないよ。誰でも読めるようにしなきゃ意味ないよ。英語にしなくちゃ意味ないよ。世界中の人が読めないと意味ないよ。日本人しか読めないのは意味ないよ。)
だからです。二郎ラーメンでいうところの、全マシです。
おすすめの
無料試し読み(寄付)の方法
があります。
リンクのKindle Unlimitedに入会いただき、ぼくに500円の紹介料:アフィリエイト:寄付をいただき、筆者のやる気スイッチを押していただき、
さらに、Kindle Unlimitedでぼくの本を最初から最後まで流し読みで飛ばし読みしていただくと、
合計4000円分の寄付をしたことになります。(後半、全部英語ですが、ここも飛ばし読みしてください!)
ただ1冊購入するより、はるかに筆者をやる気にさせます。
よろしくおねがいいたします。
30日以内に読み終えて退会すれば、無料でぼくの本が読めて(読者WIN)、かつ、寄付もできる(筆者WIN)!
Amazon(ジェフ・ベゾス)ありがとう!
浮いたお金で、ぜひアマゾンで好きなものでも買ってください。僕の本を購入すると、この本、一生アップデートされ続けます。
追記おわり。
1.6. 論文を書いているうちに、論文を読む能力と解釈する能力と生み出す能力が自然についてくる。
他人の論文を批判できるのは、自分がうまい論文を書けるからにほかならないことは、自分が論文を書き終わったことによって痛感しました。
論文を書くには、「この部分は、他のパイセン(先行論文の執筆者)はどう書いてごまかしたんだろう?」という疑問を持ちながら読むことになります。
論文はたいていわかっていないことだらけの部分に立ち入るので、パイセンもごまかして書いています。わかりきっていることなんて、論文に書く必要ないんです。
このごまかしかたがわかってくると論文を書くスピードがあがる。
『論文はAbstractとマテメソ、resultだけで価値が決まる。強い鎖かどうかわかる。』
二元論が使えている論文執筆者かどうかは、上記3つを読めばすぐにわかります。
イントロダクションもディスカッションもコンクルージョンも読まなくていい。この3つを読んでもなにも新しいことは書いていません。いかにわからないことをごまかしたかどうかが書いてあります。
これが読む能力。
次に、解釈する能力。
ガイドラインは「鎖(山中伸弥教授の記事を参照)」をつなげて解釈しています。
つまり、ガイドライン作成者の鎖のつなげ方によって、解釈が変わってしまうリスクがあるということです。
鎖の本質は、マテメソとリザルトです。ここから得られるp値からどれだけ信頼できる二元論が得られるかがわかる。
「Aという治療をすると、B%のひとがCになる(p値)」だから、Aという治療が勧められる(推奨度D)
ガイドラインを棒読みしてると、つまり、論文を孫引きせずに、マテメソとリザルトを読まないと、なにも解釈せずにガイドラインを鵜呑みにしているだけです。
これをやっちゃうと山中伸弥教授でいうところの「プロフェッショナル」にはなれません。
http://www.nhk.or.jp/professional/2017/0911/
山中伸弥教授:「プロフェッショナルとは自分が何もわかっていないということをわかっているということ。
そして、それを乗り越えるように、ずっと努力ができること。」
ガイドラインを読んだだけでは、自分が何もわかっていないということをわかっていることにはなりませんよね。
次に、生み出す能力。
さきほど、いかにわからないことをごまかして書いたかパイセンの論文を探しに行くと書きましたが、そのごまかしを研究すればいいんです。かんたんですよね。
クリニカルクエッションなんてすぐに見つかる。論文を書けば。
ごまかして書かざるをえない状態に追い込まれるので、否応なく、次のネタをぶち当たってしまう。
論文を書こうとしないで、読んでばかりいても、表面だけさらっているだけなので、このごまかしに気づけません。
また、
また山中伸弥教授のプロフェッショナル仕事の流儀からの引用ですが、「予想外にこそくらいつく」ことでも、論文のネタになります。
患者さんが予想外に副作用がでたり、出なかったり、予想外に治ったり、治らなかったりしたら、患者さんに感謝して、それを論文のネタにさせていただく。
2.1 ネタを見つける。
2.2 ネタを見つけてデータを集め始めた時点から、論文を書き始める。
イントロダクション、マテメソはデータを集めながらも、書き始められる。
方向性が見えたら、リザルト、ディスカッションも書ける。
データを集め終わったら、解析して、アブストラクトを書く。
タイトルをつけて、即、投稿。
7.『仮想論文作成』-速聴写真記憶法による成績上昇率と合格オッズ比
ぼくが提唱している勉強法におけるコアな方法論である速聴写真記憶法
これを利用した被験者群Aといままでの勉強法を続けていたコントロール群Bで成績があがるかフォローします。
その結果、3年後に大学に合格できるかを定量します。前向き研究です。
タイトル
速聴写真記憶法による成績上昇率と合格オッズ比
アブストラクト
イントロダクション
マテリアル & メソッド
リザルト
コンクルージョン
ディスカッション
リファレンス
アクノレッジメント
アペンディクス
論文作成に必要なツール
1.PCまたはMAC
MACの Word と Excelはとても使いづらいので、すべてWindowsで統一するほうがいいと思います。
かっこよさと見栄えでMACBOOKをつかっていますが。科研費で買うのはWindows Surfacebookにしようと思います。
2.アプリ
2.1. Excelでデータ入力
デファクトスタンダード。これ以外ない。
2.2. Scrivenerで論文書いて、推敲
2.3. Dropboxでつねにバックアップ
2.4. Google chromeでPubmedで先行研究検索。
すぐにDropboxで連携し、スマホで読む。
PDFに書き込みながら読むのを何度かやりましたが、そのうち、必要ないと気づき始めます。
2.5 Papers3は使えないので、フォルダを階層構造にして整理する。
EndnoteやPapers3などの論文管理ソフトは結局使えないことがわかったので
1.7.EBMとはなんなのか。
evidence-based medicine そして、臨床経験が増えてくるに従って、やりたくなってしまう
experince-based medicine
どっちにせよ、医者になって、問診から診断、治療に至るまで、『教科書やガイドラインに書いてあるから』という理由で判断するのではなくて、
『●の病気を疑ったら、問診で●を聞く。検査で●をする。
その問診や検査で陽性所見があったら、●倍その病気らしい。
陰性所見があったら、●倍その病気らしくない。
その病気だと●倍だけ、疑わしいなら、治療効果が他の治療法よりも●倍治りやすいから、●の治療法を選ぶ。』
という思考が良医の条件だと思っています。定性VS定量です。
この定量の部分がかけると二元論的に失敗しています。
ガイドラインも教科書も基本的に、●倍の部分は書いていません(優秀なものは載ってる)。
この●倍の部分は95%が統計学で出来ています。
だから、『医療を学ぶ』 イコール 『統計学で定量を学ぶ』
1.8. 論文を書ける側の人間かどうかは、新しいスタディデザインを作れるかどうか。
スタディデザインっていうのは、論文において、統計学的に有意差が出るあるいは、出ないかどうかを確かめる実験方法のこと。
スタディデザインが作れるひとと、作れないひと。
作れない人は、作られたものを忠実に実行する側の人間になるしかない。
作れる側の人間になったほうがいいに決まっているが、たいていのひとはなれない。
コロナウイルスがパンデミックになるタイミングで大量の論文を読むことになりました。
正直言って自分の専門以外でこんなに大量の論文を読むことになるとは思いませんでした。
それだけこのコロナウイルスがパンデミックになるというのは人類にとって最初に経験する一大イベントなんだったと思います。
自分が論文を読める能力が備わったタイミングでコロナウイルスがパンデミックになったのも一つの縁だと思って大量にコロナウイルスに関する論文を読みました。
その中で様々なスタディデザインを読むことになりました。
ひとつ残念だったのが第一線で活躍している感染症学の教授が最初マスクをすることを否定していたことです。
マスクに関するエビデンスがまだ出ていなかった段階とはいえ、臨床推論においてマスクが感染リスクを下げることは誰でも予想できました。まっとうな医者であれば。
自分がもともとマスク嫌いだったからといって統計学の申し子である大学教授がマスクについてはエビデンスがないので私はしませんと公言するのが驚きでした。
話が横道にそれました。
コロナウイルスに関しては最新の論文が出るかどうかをランセット、ニューイングランドジャーナル、JANA、Natureなどのコロナウイルス情報センタートップページからブラウズしたり、 PubMed や Google スコラを利用して、プレプリントでもいいので、どのような研究があるのか批判的に読んでみる練習をしました。
(僕はまだ査読依頼をされたことがないです)
様々な論文を読むにつれて、自由な発想でスタディデザインを組んでいる論文に感動できるようになりました。
そういう意味で、Phase3の論文のスタディデザインは超簡単。そういうのをデザインして、大きい学会で発表しようと、なにも偉くないというのも実感できるようになりました。
逆に、Phase3は誰かが作ったものを真似すればいいだけっていう、クソ論文になりがちで、本当に知りたいことが埋もれがち。血の通った統計ができていないことが多い。
本当に賢い、臨床をよくわかっているひとが、スタディデザインを組めば、サブ解析で本当に知りたいこと以外もあぶり出せるようになる。
今、臨床のなかで困っていることを、『困ってるけどしょうがないよねー』って言い続けないで、
『解決する方法はなにかないかなぁー』って思い続けると、サウナや風呂の中で、ぱっと思いつくもんなんだと思います。
1.9 サイエンティストの基礎データベース【新しい論文を作るコツ】
①ドメインナレッジを身につける。
ドメインナレッジっていうのは、
【よみ】どめいんなれっじ【英名】Domain Knowledge特定領域において中心軸となりうる専門的な知識のこと。 ドメインナレッジを習得するには、初期段階では学習せざるを得ない環境下で強制的に知識習得をさせる必要もあるが、ある一定段階以上では本人による自発的な学習が必要になる。(https://www.finchjapan.co.jp/2492/より)
っていうこと。
②ドメインナレッジのなかで、『困ったこと』を見つける。あるいは、『疑問』。
医療だとクリニカルクエッション、CQって言ったりする。
あるいは、アンメット・メディカル・ニーズ。
③具体化が終わったら、抽象化する。
二元論です。
呼吸するように、具体化と抽象化を行ったり来たりしましょう。
一般化したり、抽象化するっていうのは、ざっくりさせるってこと。
複雑なこと、煩雑なことが嫌いっていうのは、サイエンスに向いている。
なるべくシンプルにして、ミスらないようにデザインを組めるひとのほうが、大成できる。
ちなみに、このデータベース化するっていうぼくの大好きなブログの記事のスタイルは、抽象化するっていうことです。
この世には、複雑なことが正確にできることを誇りに思っていたり、
几帳面な性格で、正確にやることを至高だと思っている輩がいます。
往々にして、そういうひとが上司になると、つらい思いをすることになります。
こういうひとたちは、サイエンスには向いていません。
新しい領域を作るというよりは、後ろ向きスタディを力技で、大量のnでカバーするという発想しかできない。
重いコンダラ、星飛雄馬、高校野球全力少年みたいなものです。
④別のサイエンス領域を味見して、使えるものがないか物色する。
自分の興味のある分野でいいので、面白い内容を探ってみる。
おすすめは、
NHK Eテレの、サイエンスZERO
日経サイエンス
ブルーバックス
ニュートン
おもしろい科学雑誌はいろいろあるので、関係ない内容でも、アンテナを張ってみる。
関係のない学問分野の融合領域は一番やりやすい。やったもんがちで、ネタがいっぱい転がってる可能性が高い。
Deep Technologyは深すぎて、ニッチすぎて、やり尽くされている可能性が高いが、新しく出てきたテクノロジーはアーリーアダプターやイノベーターしか手を出さないので、ブルーオーシャン。
(アーリーアダプター、イノベーター、https://ja.wikipedia.org/wiki/アーリーアダプター)
(ブルーオーシャン、https://ja.wikipedia.org/wiki/ブルー・オーシャン戦略)
なるべく、空いているところを狙えってこと。
⑤正常vs異常、あるいは、コントロールvs遊び。
うまくいく実験って、大量の遊びの中の氷山の一角なんですよね。
研究費が湯水の如く必要になるのはそういう理由。
失敗しまくることで、精度がどんどんあがっていく。
大切なことは、良い結果がでて喜んだり、悪い結果がでて、悲しんだりしないこと。
いちいち、一喜一憂しないこと。
「トライ!トライ!トライ!」(ぼくのスコットランドの親友の言葉)
試してみたいっていう、根源的な欲求に従いましょう。
まだやったことがないっていうことは、プライスレスな価値を持っている。
ちなみに、ぼくは、まだ試したことがない、経験したことがないことに対しては、お金を積極的に使いますが、ルーチン化して面白くないことに対しては、ケチです。
多少高くても、経験を買えると思うと、お金を使う満足度は高くなる。
⑥ジェネラリストvsスペシャリスト
https://www.nature.com/articles/s41467-017-01265-1
ジェネラリストでいろんな知識を持っているひとのほうが、サイエンス業界でも生き残れる可能性が高いかも。
いろんなことに興味があることは才能のひとつ。
⑦いつでも妄想できる能力
お風呂でも、電車の中でも、サウナでも、マインドフルネスつかって、脳を空っぽにして、妄想できる能力があると、天からアイデアが降りてきます。
これがルーチンでできるひとのほうが、セレンディピティを発揮できる。
⑧最後は運。
どんなに努力しようが、最後は運であると、経済学者が言っていました。
セレンディピティというか、運だというか、どっちでもいいですが、チャンスが舞い降りたら、全力で捕まえに行くべきだってことです。
これは結婚相手にも同じことが言える。
良縁かどうかは最後は運。
⑨なぜ、その研究をしたいのか。
CQの解決。
アンメット・メディカル・ニーズの解決。
Question-driven
あるいは、
Data-driven
データがいっぱいあるから、解析してみた的な。
良善水の如し。
論理が流れるから、つぎの流してるだけ。
論理ドリブン。
思いついちゃったから。
興味ドリブン。
⑩とりあえずやってみるから始める。
ぼくも、とりあえず、ピペットをなれるところから、クリーンベンチを使えるようになるところからとりあえず、よくわかんないけどやってみたわけで、よく理解してなくても、やってるうちに理解できてくるので、まずはやってみることが大切っていうね。
数学的帰納法です。
やってるうちに、理解できてくると、共著者レベルになれて、
自分で、⑨が作れるようになると、博士号取得レベルになれる。
⑪リアクション技術思考 vs ウケる技術思考
(https://ja.wikipedia.org/wiki/エドワード・デボノ)
論理的な思考の持ち主は、大学教授とかに多いんだけど、リアクションしかしてくれない。
こんな問題を抱えています。と質問すると、
じゃあ、こうすれば。。。と言ってくれるだけ。
リアクション芸人です。
上から下に論理を流してるだけ。
おいしい食事をして、おいしぃー、身がぷりぷりして、とっても歯ごたえがありますねぇーと食レポするのと同じ。
リアクションしてるだけで、つまらない。
一方、
Projective thinkingっていうか、ウケる技術を使った思考は全く違う。
予想されるものをわざと外すことで面白さが出てくる。
それはテキトーな外し方ではなく、いくつか定型化された外し方の中から、よりおもしろくなるもので外す。
これは、ハッシュタグ大喜利に似ている。
リアクション芸人は基本的に大喜利はできない。
大喜利ができるひとは、日頃から、ウケる技術を駆使し続けてるひとにしかできない。
【各論】
2.【医学統計学】統計学も二元論でスッキリ使いこなす方法
***************:
【もくじ】どぞ。
1.総論
1.1.統計学とわたし
1.2.電子カルテから臨床情報を抽出して、統計原本を作る。
2.各論
2.1. シロート統計学でEZRを学ぶ。
2.2. エクセルで統計原本を作る技術
2.2.1 下準備系
2.2.2 入力系
2.2.3.出力系
2.2.4.分類不可能系
3.論文執筆関係の技術
3.1.先行論文のコピペは絶対禁止やで。
3.2.メンター論文を見つける。
3.2.1 メンター論文の見つけ方
3.3.スクリベナーのリサーチに論文をどんどんコピペする。
3.4.iPadにスクリベナーをアップストアで買ってインストールする
3.5.スクリベナーの堅牢性がすごい。
3.6.引用のスタイル
3.7 投稿先を選ぶ
3.8 投稿先のフォーマットに合わせる。
3.9 できあがったら、英文校正を依頼する。
**ちょっと個々の部分をChatGPTについて追記しなくちゃいけないですね。
そのうち、書き足します。
4.論文発売後の10万字インタビュー。
以下本題。
1.総論
1.1.統計学とわたし
統計学は学問の王様であり、ずっと使いこなすことに憧れていたけど使えていなかった。
それが徐々に使えるようになってきたのでこの記事を書いてます。
今の大学教育(医学部に関して)は、統計学を教養科目として学ぶけど、「大学のかったるい授業」の域を脱してなくて、「帰無仮説とかp値の説明、t検定、カイ二乗検定でおわり。」
臨床研究や実臨床にもっとも大事である、EZRやHRや陽性尤度比の話は全然教えてくれない。
ぼくの統計学レベルは
レベル1 大学の教養課程の統計の授業を理解できる
レベル2 研修医のときに、総合診断科教授から臨床統計の授業を理解できる
レベル3 論文に書いてある統計学用語、統計結果を理解できる
レベル4 で自分が持ったクリニカルクエッションに対して統計的に分析できる
の段階に成長できてきました。
つぎのレベルはさしづめ
レベル5 メタアナリシス、RCTなどの統計方法を実践する
レベル6 統計学部の博士号をとれる
かもしれません。
社会人になって、統計学の知識は本当に有用ですが、その大切さについて教えてくれるひとはあんまりいません。教授も勉強しとけっていう感じで実践的なことは教えてくれないし。
というわけで、ぼくが実感した統計学のありがたみをこの記事に書いていこうと思います。
1.2.電子カルテから臨床情報を抽出して、統計原本を作る。
臨床研究において、FileMakerを使って、日頃からデータベースをWIKIで、つまり大人数で統計データベースを入力することをしていない医局に所属すると、自分でデータを電子カルテから情報を抽出する必要がある。
日頃から、FileMakerでデータベースを構築している医局ってどのくらいの割合で存在するのだろう。
抽出したデータはFileMakerが病院のパソコンにインストールできていないなら、エクセルに入力することになる。
エクセルのデータはたいていの病院内のサーバーに保存できるので、もっとも現実的なデータベース構築ソフト。
ファイルメーカーじゃないので、値の入力はそういうわけで、エクセルのセルに直接入力する。細かい入力のコツは2.2.で書いていく。
2.各論
2.1. シロート統計学でEZRを学ぶ。
<a href="https://haru-reha.com/" target="_blank" title="https://haru-reha.com/">https://haru-reha.com/</a>
まずは、上記リンクで、ハル先生のブログを御覧ください。長い間、医学の統計学をやってきて、ずっとモヤモヤしていたんですが、
やっと、二元論ユーザーの先達に出会えました。先生がこの世に文章を残す前 vs 後で世界は変わりました。
(先生がおすすめしている
①初心者でもすぐにできる フリー統計ソフトEZRで誰でも簡単統計解析 著者神田 善伸
②EZRでやさしく学ぶ統計学 EZRでやさしく学ぶ統計学~EBMの実践から臨床研究まで 著者神田善伸
③みんなの医療統計 多変量解析編
の本を立ち読みしかしてないっていうのが最大の原因かもしれませんが。)
今までのぼくの勉強法は、いかにも、分析的で総合されていなかった。micro noteばっかりで、MACRO noteが作れなった。
先生は以下のように、医学統計学を総合させています。
「医学統計学は以下の11しかない。
①独立した2群間の連続変数を比較する
②対応のある2群間の連続変数を比較する
③独立した2群間の比率を比較する
④対応のある2群間の比率を比較する
⑤独立した3群以上の間の連続変数を比較する
⑥対応のある3群以上の連続変数を比較する
⑦2つの連続変数の相関を評価する
⑧比率についての多変量解析を行う
⑨連続変数についての多変量解析を行う
⑩2群間の生存曲線を比較する
⑪生存曲線についての多変量解析を行う」
以上。
しかも、それぞれをさらに二元論で、エレメント、要素をまとめています。
①「独立してる,independent」vs「独立していない、従属である、対応のある、depedent」
独立:A群 vs otA群
例:二重盲検してA群とnotA群でわける。
従属:A群 vs A'(えーぷらいむ)群
従属パターンはTime(同一人物の治療前vs治療後)とか
②「2群」vs「3群以上」
①の例は2群
3群:
A群 vs 群 vs 群
あるいは
A vs A' vs A''(えーだぶるぷらいむ)
治療前 vs 治療1年後 vs 治療5年後
③「連続変数 Continuous Variable(定量的)」vs「離散変数 discrete variable(定性的)、名義変数(nominal variable)、順序変数(ordinal variable) 」 nd 「比率、ratio」
(http://www.statisticshowto.com も参照しました。)
連続数:年齢、体重、期間
vs
名義変数:Gender、生き死に、Event発生有無
順序変数:PS、Child-Pugh分類、TNM分類
順序変数は比率を使わず、中央値や平均値で連続化して扱われる。
このうち、
名義変数の比率(離散数の連続化ともいえる)
つまり、
「①である②の③を評価する」ってこと。
次。
④相関 vs 多変量解析 vs 生存曲線
●相関:独立あるいは従属しているかもしれない、2つの連続変数の関連の強さを定量する。
従属していれば、正あるいは負の相関があり、
独立していれば、相関がない。
●多変量解析:「原因→function→結果」のFunctionがどんだけ強いかを定量する。
原因→結果にはいろんな交絡因子が入ってくるので、その雑音みたいなものを除去するのが多変量解析の役割。
年齢 性別
↓ ↓
分子標的薬した →→→→→→→→→→→→→→ とある重大な副作用でた
↑ ↑ ↑
S 以前化学療法 後療法
連続変数も比率も多変量解析はできる。
●生存曲線:エベント発生するまでの期間を定量する
治療したA群 vs 治療していない not A群の生存期間比較
は最もよく見るやつ。そして、RCTしたときのインパクトがもっともでかい。NEJMとかにのっちゃうやつ。
年齢 性別
↓ ↓
分子標的薬した →→→→→→→→→→→→→→ 生存期間のびた
↑ ↑ ↑
S 以前化学療法 後療法
次。
「EZRで検定を選んでぽちっとする。」
11の調べたいことに対して、EZRで押すべきボタンはなにかというと検定名です。
検定名が多いので、11の調べたいことに対して、どの名前を選べばいいのかわからなくなる。
即刻、すべての名前をナンバリングして、
t検定は第一検定、対応のあるt検定は第2.0検定、Wilcoxon~検定は第2.1検定とかしたくなりますね。
無駄に人名とか記号で命名するとか、本当に統計屋さんはセンスがないです。
「パラメトリックparametric」 vs 「non-parametric」
パラメーター:parameter
parametricは正規分布にもどついている vs on-parametricは非正規分布
nが50以上あれば、グラフがジグザグしていないきれいな統計がとれるので、parametric
nが25くらいしかないような希少疾患を相手にする統計では、non-parametric
あるいは、変数が順序変数で5-6個しか変数がないなら、non-parametric
ってこと。
データをEZRで分析させる。
●データ要約する。
「統計解析」→「連続変数の解析」→「連続変数の要約」→「連続数をぽちっ」→「層別して要約」→「群をぽちっと」
A群とnotA群の平均値、標準偏差、四分位範囲、n数がわかる。
いままでエクセルでnを数えさせていたし、平均値、中央値とかもエクセルの関数でやっていました。お恥ずかしい限りです。
こんなに便利だったとは。さずがEZR。
●パラメトリックかどうかチェックする。
「グラフと表」→「ヒストグラム」→「連続数ぽち」→「群をぽち」
これで山になってたらOK
あるいは、
「統計解析」→「連続変数の解析」→「正規性の検定」→「● == “○”」
●は群の種類:たとえば、chemotherapy
○はそのうちの1つの群の名前:たとえば、CDDP
これでたとえば、化学療法でCDDPつかった群が正規分布かどうかわかる。p値が0.05より大きければ大きいほど、正規分布っぽいという余事象です。
もうひとつの群、たとえば:TC
TC群が正規分布かわかる。一個ずつ調べる。
あるいは、
「グラフと表」→「QQプロット」→「連続変数ぽち」
これで、y=xに近い分布ならOK
●等分散かチェックする。
t検定で群どうしを比較するときは、どっちの群もデータの散らばりが同じくらいでなければならないので。
これで準備おしまい。
「①独立した2群間の連続変数を比較する」 を実行できるようになる。
ここで、あらためて、11の比較、評価の方法のうち、パラメトリックvsノンパラメトリックの二元性で検定名を一覧にして目次整理します。
【目次】
①独立した2群間の連続変数を比較する
パラメトリック:t検定
ノンパラメトリック:Mann-Whitney U 検定
②対応のある2群間の連続変数を比較する
パラメトリック:対応のあるt検定
ノンパラメトリック:Wilcoxon符号付順位和検定
③独立した2群間の比率を比較する
パラメトリック:Fisherの正確検定
ノンパラメトリック:カイ2乗検定
④対応のある2群間の比率を比較する
パラメトリック:なし
ノンパラメトリック:McNemar(マクネマー)検定
⑤独立した3群以上の間の連続変数を比較する
パラメトリック:分散分析(ANOVA)
ノンパラメトリック:Kruskal-Wallis検定
⑥対応のある3群以上の連続変数を比較する
パラメトリック:反復測定分散分析(repeated-measures-ANOVA)
ノンパラメトリック:Friedman(フリードマン)検定
⑦2つの連続変数の相関を評価する
パラメトリック:pearsonの積率相関係数
ノンパラメトリック:spearmanの順位相関係数
⑧比率についての多変量解析を行う
パラメトリック:なし
ノンパラメトリック:ロジスティック回帰分析
⑨連続変数についての多変量解析を行う
パラメトリック:重回帰分析
ノンパラメトリック:なし
⑩2群間の生存曲線を比較する
パラメトリック:生存期間の比較(Logrank検定)
ノンパラメトリック:なし
⑪生存曲線についての多変量解析を行う
パラメトリック:Cox比例ハザード回帰分析
ノンパラメトリック:なし
以上で目次おわり。
「統計解析」→「連続変数の解析」→「2群の等分散性の検定」→「目的変数を連続数でぽち」→「グループを群の名前でぽち」
●パラメトリックで、等分散だったら、安心して、①独立した2群間の連続変数を比較することができる。
●①独立した2群間の連続変数を比較する
パラメトリック:t検定
「統計解析」→「連続変数の解析」→「2群間の平均値の比較」→「連続変数ぽち」→「群の名前ぽち」
これでP値がわかります。AとnotAで平均値に差があるかどうかわかる。
nが30くらいあれば、ぎりぎりパラメトリックで等分散なので、①独立した2群間の連続変数を比較することができそうだということ。
●①独立した2群間の連続変数を比較する
ノンパラメトリック:Mann-Whitney U 検定
独立した2群間の連続変数を比較したけいど、
①2群間で順序尺度を比較する場合
②数が少なすぎて、正規分布に従わない2群間の連続変数を比較する場合
は、「統計解析」→「ノンパラメトリック検定」→「2群間の比較」→「nの少ない連続変数あるいは順序変数ぽち」→「群の種類」
これでP値がわかります。AとnotAで中央値に差があるかどうかわかる。
この検定は平均値ではなくメディアンで比較してくれます。
次、
●②対応のある2群間の連続変数を比較する
パラメトリック:対応のあるt検定
*先にパラメトリックかどうかチェックする。
時間軸で、前 vs 後
で比較する。
「統計解析」→「連続変数の解析」→「対応のある2群間の平均値の比較」→「前の連続変数ぽち」→「後の連続変数ぽち」
たとえば、治療前の腫瘍の大きさが REセンチメートル vs 治療後の大きさが OSTセンチメートル
p値が3.61E-10。つまり、10のマイナス10乗で、
「これって超有意差のある治療だよね」ってこと。
論文ではこの形式で書かれるのはあんまり見かけないのは、多変量解析のほうが正確だからかもね。治療後って治療して何ヶ月で、何cmなんだよっていうツッコミが来る。
●②対応のある2群間の連続変数を比較する
ノンパラメトリック:Wilcoxon符号付順位和検定
対応のある2群間の連続変数を比較するのうち、連続変数が順序変数の場合は
「統計解析」→「ノンパラメトリック検定」→「対応のある2群間の比較」→「前の順序変数ぽち」→「後の順序変数ぽち」
たとえば、治療前の腫瘍のステージが RE期 vs 治療後のステージが OST期
p値が3.61E-10。つまり、10のマイナス10乗で、
「これって超有意差のある治療だよね」ってこと。
これもあんまり見ないかなぁ。
次、
●③独立した2群間の比率を比較する
パラメトリック:Fisherの正確検定
「統計解析」→「名義変数の解析」→「分割表の作成と群間の比率の比較」→「行の変数を「名義変数」、列の変数を「群の種類」ぽちぽち」→「パーセントの計算ぽち」→「Fisherの正確検定ぽち」
2かける2=4のボックス
よく見るのが、RCTのCharacteristics
新薬 vsコントロール群で男女比に差があるかどうか調べたいときに使う。
ときどき、キャラクターで差が出ちゃう残念なRCTがあるけど、nが大きければ大きいほど、差が出ない。
③独立した2群間の比率を比較する
ノンパラメトリック:カイ2乗検定
nが100以上だと、「Fisherの正確検定ぽち」の代わりに、「カイ2乗検定」を使うらしい。理由がよくわからない。
次、
●④対応のある2群間の比率を比較する
パラメトリック:なし
ノンパラメトリック:McNemar(マクネマー)検定
「統計解析」→「名義変数の解析」→「対応のある比率の比較(二分割表の対称性の検定, McNemar検定)」→「行の変数を「PREの名義変数」、列の変数を「POSTの名義変数」ぽちぽち」
治療前後で、名義変数が変わるかわかる。
割合が治療前後で変わるかどうかっていう検定は、あんまり見たことないなぁ。
次、
●⑤独立した3群以上の間の連続変数を比較する
パラメトリック:分散分析(ANOVA)
「統計解析」→「連続変数の解析」→「3群以上の間の平均値の比較(一元配置分散分析one-way ANOVA)」→「目的変数は連続変数、比較する群の種類ぽちぽち、等分散は「はい」ぽち」→「tukeyの多重比較ぽち」
「統計解析」→「ノンパラメトリック検定」→「3群以上の間の比較(Kruskal-Wallis検定)」→「目的変数はノンパラメトリックな連続変数あるいは、順序変数、比較する群の種類ぽちぽち」→「Steel-Dwass法ぽち」
●⑤独立した3群以上の間の連続変数を比較する
ノンパラメトリック:Kruskal-Wallis検定
3群で値がバラバラすぎる場合はKruskal-Wallis検定
たとえば、がんなら、「CDDP」vs「TC」vs「分子標的薬」で治療後の腫瘍の大きさの縮小率に差が出るかとかね。
ふつう、患者ごとに縮小率が違うから。
次、
●⑥対応のある3群以上の連続変数を比較する
パラメトリック:反復測定分散分析(repeated-measures-ANOVA)
「統計解析」→「連続変数の解析」→「対応のある2群以上の間の平均値の比較(反復〔経時〕測定分散分析」→「連続変数は時系列のT1、T2・・・CTTLで全部選択、群の種類を選ばない。」→「Bonferroniの多重比較ぽち」
たとえば、ある治療をして、時系列でIQが落ちていくとか、肝障害があがるとかがわかる。
一本調子であがるかさがるかがわかるってこと。
次、
●⑥対応のある3群以上の連続変数を比較する
パラメトリック:反復測定分散分析(repeated-measures-ANOVA)
「統計解析」→「連続変数の解析」→「対応のある2群以上の間の平均値の比較(反復〔経時〕測定分散分析)」→「連続変数は時系列のT1、T2・・・CTTLで全部選択、群の種類を選ぶ!」→「Bonferroniの多重比較ぽち」
たとえば、ある治療した群としていない群を比較をして、時系列でIQが落ちていくとか、肝障害があがるとかがわかる。
今回の検定では「介入」と「時間経過」に交互作用があるかどうかがわかる。
時間とFactorと介入のFactorの独立具合がわかる。
⑥対応のある3群以上の連続変数を比較する
ノンパラメトリック:Friedman(フリードマン)検定
「統計解析」→「ノンパラメトリック検定」→「対応のある3群以上の間の比較(Friedman検定)」→「繰り返しのある変数」は「時系列などで変化する対応のあるT1~Tn」を全てぽちる。(Ctrlキーを押しながらクリックして複数選択)→「Bonferroniの多重比較ぽちる」
ぼくの専門分野での医学論文ではほとんどみたことない。
抗癌剤治療とかって、たいてい複数の時系列で追うことがないからね。1ヶ月後、2ヶ月後の治療効果の比較とかあんまり意味ないから。
⑦2つの連続変数の相関を評価する
パラメトリック:pearsonの積率相関係数
「統計解析」→「連続変数の解析」→「相関係数の検定(Pearsonの積率相関係数)」→「連続変数の種類をふたつぽちぽち」
こうすると、散布図で視覚的に相関があるかがわかる。p値は相関の確からしさがわかる。強さはわからない。
相関の強さを表すのは「相関係数」で、x、y平面の傾きをあらわしている。
相関係数は-1~1までの値を取る。
1に近いほど「正の相関が強い」。y=xの比例
-1に近いほど「負の相関が強い」。y=-xの比例
相関係数の絶対値が
0.2未満:ほとんど相関なし
0.2~0.4:弱い相関あり
0.4~0.7:相関あり
0.7以上:強い相関あり
たとえば、FDG異常集積の強さ vs 生存期間 とか。
がんの大きさ vs 生存期間 とか。
この統計手法の欠点は3つ。
1.相関はこのような交絡因子の存在を無視してしまう可能性
2.因果関係の順序が不明
3.たまたま相関しているかも
そういうわけで、nが少なくて多変量解析が行えない場合に関連性あるかもっていうのに使える程度。
1対1対応のかなり因果関係が単純なものにしか使えない。
この弱点を克服したのが多変量解析ともいえる。
あるいは、1対1対応を証明するのが多変量解析ともいえる。
⑦2つの連続変数の相関を評価する
ノンパラメトリック:spearmanの順位相関係数
記載なし。
⑧比率についての多変量解析を行う
パラメトリック:なし
ノンパラメトリック:ロジスティック回帰分析
多変量解析とは、ある結果を表す変数をその他の変数によってどの程度説明(予測)できるかを解析するツール。
ある結果→従属変数または目的変数
他の因子→独立変数または説明変数
目的と説明というテクニカルタームはとても文学的な響きがするので、使わないことにします。数学で使い慣れた、従属と独立でいいですよね。
従属変数=独立変数+独立変数+独立変数+独立変数+独立変数+独立変数+・・・
独立変数+独立変数+独立変数+・・・=従属変数
ぼくのWikihikagle勉強法で
学習能力=理解力×記憶力×ノート力×ノート整理力×時間管理力
とか書いてますが、同じ理屈です。+という記号か*という記号化の違い。
重回帰の場合、独立変数の種類は(サンプル数÷10)個と決まっている。
Nが100の統計なら、10種類までの独立変数の評価が可能ということ。
多変量解析のときは、みやすさのために、名義変数を全部0vs1で表現する。どうやるかっていうと、
「アクティブデータセット」→「変数の操作」→「データセット内の変数を一覧する」
すべての種類がINT、つまり整数の連続変数になっているので、変換する必要がある。
「アクティブデータセット」→「変数の操作」→「連続変数を因子に変換する」→「変数で種類をえらび」→「因子水準で数値で ぽち」
こうすると選んだ変数がFACTORになり、0vs1で表現できるようになった。
準備おしまい。
「統計解析」→「名義変数の解析」→「二値変数に対する多変量解析(ロジスティック回帰)」→「目的変数に従属変数の種類ぽち」→「説明変数に独立変数の種類をダブルクリックしまくる」
結果の解釈:
●モデル全体のP値 これで予測式が意味があるかどうか分かる。
●VIFは独立変数間での相関(多重共線性)を調べる指標。
VIFが
5以上:多重共線性の可能性あり
10以上:多重共線性の可能性がかなり高い
●オッズ比
オッズ比が 1以上 : 合併症の可能性を上げる
1 : 合併症に影響しない
1以下 : 合併症の可能性を下げる
「0 と比べて 1 のオッズ比」を表している。なし と比べて、あり はオッズ比が●だ といえる。
たとえば心筋梗塞かどうかの陽性尤度比。問診してオッズ比がどんどんあがるイメージ。
(心筋梗塞かどうか)=(吐き気がある)+(冷や汗をかいている)+(動悸がある)+(胸が痛い)
=2×3×1.5×3
問診すれば、心筋梗塞の陽性尤度比がわかるというやつですね。
95%信頼区間が1をまたいじゃうと、p値が0.05よりでかいってことになる。
⑨連続変数についての多変量解析を行う
パラメトリック:重回帰分析
ノンパラメトリック:なし
「統計解析」→「連続変数の解析」→「線形回帰(単回帰、重回帰)」→「目的変数に独立変数の種類を選ぶ」→「説明変数に従属変数の種類を多く選ぶ。」
結果の解釈:
●モデル全体のP値 これで予測式が意味があるかどうか分かる。
●「Adjusted R-squared」「決定係数(R²)」 に近いほどモデルの当てはまりが良い
●Estimateとは「回帰係数推定値」
Aは「-k」、Bは「-l」、Cは「+m」、そしてIntercept(切片)は「i」。これはXが以下のような予測式になったことを表す。
X=(-kA)+(-lB)+(+m*C)+I
ABCのそれぞれのP値がわかり、それぞれがどれくらい影響を与えるのかがわかる。InterceptのP値は関係ない。
ABCの値を代入すれば、Xが求まるってこと。
たとえば、
(あるガンの生存期間)=(+kPS)+(-lStage)+(+m*年齢)+I
とかね。
●VIFは独立変数間での相関(多重共線性)を調べる指標。
VIFが
5以上:多重共線性の可能性あり
10以上:多重共線性の可能性がかなり高い
●どの独立変数を選ぶか問題
●重回帰 総症例数を15で割った数まで
●ロジスティック回帰 イベントありとなしの小さい方を10で割った数まで
●Cox比例ハザード回帰 イベントありの数を10で割った数まで
●何がアウトカムと因果関係をもつかを、データを見ずに先行文献や医学的観点から考え、アウトカムとの関連性の上で重要なものから選んでいく(ぼくが自然にやって身につけていたことを、この本で指摘してくれています。)
●タブーは・データ解析後にP値などをみて独立変数を選ぶ・ステップワイズ法によって独立変数を選ぶ
⑩2群間の生存曲線を比較する
パラメトリック:生存期間の比較(Logrank検定)
ノンパラメトリック:なし
生存期間だけは特別扱いする変数。
なんでかっていうと、イベント発生有無 vs イベント発生するまでの期間
のふたつが入ってくるから。
生きてる0、フォロー切れ0 vs 死んだ
「統計解析」→「生存期間の解析」→「生存曲線の記述と群間の比較(Logrank検定)」→「観察期間変数にOS」→「10の変数に VENTを選び」→「At riskのサンプル数を表示する ぽち」→「生存率を表示するポイント 3年生存なら36、5年生存なら60を入力」
これで古き良き定番グラフであるKaplan-Meier(カプランマイヤー)曲線が描かれる。
生存曲線に時々縦線が入っているのは、打ち切りサンプルを表している。死ぬとかくっと下がる。
生存期間中央値、Median survivalもわかる。
中央値が計算できないとNAとなり、論文では「未到達」と表現されたりする。
⑪生存曲線についての多変量解析を行う
パラメトリック:Cox比例ハザード回帰分析
ノンパラメトリック:なし
「統計解析」→「生存期間の解析」→「生存期間に対する多変量解析(Cox比例ハザード回帰)」→「時間はOS、イベントはEVENT、説明変数は独立変数をダブルクリック」→「比例ハザード性の分析を行う」にチェック
GENDERなどは vs1化してFACTORとして扱っておく。
これでハザード比,Hazard ratio,HRがわかる。
「イベントの発生と、発生するスピード、時間経過を加味した相対的なリスク」
1より大きい:リスクを上げる
1 :リスクは同等
1より小さい:リスクを下げる
Cox比例ハザード回帰の場合、比例ハザード性が保たれていることが解析の前提になる。
p値が0.05より大きければ問題ない。
小さいと、比例ハザード性が保たれない場合、2つの生存曲線はどこかでクロスする。
●傾向スコアマッチングとは「疑似RCT」
Nが多い研究ならやってもいいけど、ぎりぎりなnだと目減りしてよくわからない統計結果になるかも。
「グラフと表」→「サンプルの背景データのサマリー表の出力」→「群別は比較したい群の種類名」→「カテゴリは比較したい名義変数や順序変数」→「比較したい連続変数選ぶ」
こうすると、勝手にA群とB群で単純な比較をしてくれる。
OSがAとB群で違ったとして、PSや年齢が偏っていたから差が出てしまったのではないかという交絡因子を疑ってしまう。
この疑念を払拭する。
まずは傾向スコアを算出し、それをデータセットに追加する。
「統計解析」→「名義変数の解析」→「二値変数に対する多変量解析(ロジスティック回帰)」→「目的変数に群の種類」→「説明変数にOS以外の背景因子を全部ましまし」→「モデル解析用に解析結果をアクティブモデルとして残す」
*傾向スコアマッチングの場合は、説明変数は交絡因子となりそうなものを全部ましましにする。OS以外を。
「標準メニュー」➡「モデル」➡「計算結果をデータとして保存…」→「予測値」だけにチェックをつけてOK(デフォルトは全てにチェックが入っている。予測値以外は外す)
これで傾向スコアがデータセットに追加された。
次に、傾向スコアによって、2群をマッチングする。
「統計解析」→「マッチドペア解析」→「マッチさせたコントロールの抽出」→「比較する群の変数を選び」→「マッチさせる変数に:fitted.GLM.2 を選択」→「マッチしないケースを削除するか」→「削除する」→実行すると→「データセットが劇的ビフォーアフターに!」
なんということでしょう~。匠の技により、nは大幅削減に!
これでOS以外の背景因子がすべてRCTしたように有意差がなくなります。
この状態でOSを比較すると、レトロでも、リアルガチで介入したかどうかでOSが変わったかがわかる。
2.2.エクセルで統計原本を作る。
電子カルテから臨床情報を抽出して、統計原本を作ります。
まず、統計をとるためにエクセルをつかうんですが、最近、コツが溜まってきました。横断的に書き連ねます。
2.2.1 下準備系
2.2.2 入力系
2.2.3.出力系
2.2.4.分類不可能系
に分類してみます。
2.2.1 下準備系
②患者のピックアップは医療情報センターの事務さんにやらせる。(電子カルテ導入前のデータは捨てるしかない。医局でデータベースソフトを導入していないと、後ろ向き研究は自力では無理。)
紙カルテでレトロスペクティブスタディをやるのは実質的に不可能です。
データの信頼性が低いから。
字も汚いし。読みづらいし。検索しづらいし。
③連結化させる。パスワードをかけるのも忘れずに。
エクセルは名前をつけて保存のときに、オプションで選択する。
USBとパソコンとエクセルに全部パスワードをかける。
連結化についてはそれぞれの病院で規則があるので、それを参照してください。
④担当患者登録に患者の通し番号で数字で登録する。(富士通の電子カルテだったら)。このとき、半角英数で入力しないと、ソートがうまくいかないので注意。短い期間で全員登録すれば、期間を指定するだけで全員一覧化できる。患者を二度調べるときに、役に立つ。エクセルで患者IDをコピペしないですむだけでかなり楽。(クリップボードにコピーだと、このエラーがでないらしい。日本語を日本語として名義変数として使える)。
⑤そのときに、最初に、OSだけ全員分登録する。他のデータを逐一入れてると発狂するから。
⑥生年月日、性別、Last visitは医療情報の事務で登録してもらう。
なるべく多く、事務ができることはやってもらう。
⑪調べるべき、連続変数や名義変数、順序変数はすでに存在している先行論文、とくにインパクトが強いやつを真似する。そのインパクト強い論文が引用している論文も参考にして調べるべき値をさらに真似する。
このとき、COXで多変量解析している名義変数をしっかり調べるべき。それ以外は無視していい。
たいして良いデータが出ない可能性が高いから。
いくつもの先行論文でP値に意味がない予後因子なら、最初から調べなくていい。自分の論文でもそれが予後に関係しないことくらい予想できるから。
そんなことを証明したくて、データを集めているんじゃないんだ!
(本当にResultやDiscussionになにもつながらないデータを集めさせる上司がいて辟易する。何度、なんでその値調べさせたのって発狂しそうになったか。たいしてその分野について知らないと、適当にデータを調べさせたりしてくる上司がいるので、気をつけてください。あたりをつけて、高速に因子を調べないといつまでたってもゴールにたどりつけない)
⑫まずは、日本のガイドラインをよく読む。そして、その引用している論文を全部チェックする。なぜ、ガイドライン作成委員会のひとがその論文を選んだのか、気持ちを汲み取る。偉い先生なら、なぜそれを選んだのか書いてくれている。たとえば、「nが30未満は入れなかった」と書いてくれれば、nが35になるような論文を作れば、ガイドラインに入れてもらえるってこと。
⑬最新のレビューを探す。ガイドラインに載る前の最新の動向は偉い教授がレビューを投稿してくれている。レビューはPUBMEDで簡単に見つけられる。でも、キーペーパーは初心者には見つけられない。とりあえず、レビューを読めば、どれがキーペーパーなのかすぐにわかる。
2.2.2 入力系
①背景色を黒っぽい色を付けると、ブルーライトカットできる。
ダークモードがエクセルにも標準でついていればいいんですけどね。
②セル内の一番上の行は日本語でいい。
日本語にしないと、一覧性が悪くなるから。
ただし、中身の数字や名義変数は英語で統一する。
エクセルファイルをEZRでインポートするときに、一番上の行だけ変更すればいいから。
男と女は male vs female
生死は od vs alive vs lost
大文字と小文字は区別されない。
コメント欄は日本語でいい。
⑧データが取れなかったら、とりあえず、NAと入力して先に行く。
ひとりの患者に20分以上時間がかかると発狂しうる。煮詰まる。
⑨介入ありと介入開始日、介入開始から何日経過したかは列として連続させる。
たとえば、名前はChemotherapy/that start when/that end when/that how long/とかね。
それがいつからなのかと即右のセルで確認できるようにする。
⑩使うExcelの関数一覧。
=MEDIAN(F2:F3)
=COUNTIF(I2:I3,”0”)
=COUNTIF(W2:W66,"cr")
=MIN(L2:L3)
=MAX(L2:L3)
=IF(F3>60,"1","0")
=DATEDIF(E6,K6,"m")
=DATEDIF(J1,E1,"y")
⑪カットオフを設けて、0VS1の名義変数化するのは、=IF(F3>60,"1","0") F関数
あるいは、手打ち
手打ちはミスる可能性があるので多様しないほうがいい。
あるいは、統計ソフトにまかせてしまうか。
このとき、IF関数の原本となる列は保存し、その右隣に1VS0の行を作る。行の名前は最初に「01chemo」
とかすると、統一できる。
⑫EZRは解析するときに、選ばなければならないので、よく使うOSとEVENTの列は「A OS」としておくと、アルファベット順に並んでいるので、選ぶ欄の一番上に来る。01にするとX01CHEMOとかなって一番下になるのでやや見つけやすくなる。
2.2.3.出力系
⑦実際データが揃ったら、EZRが日本語および、ローマ字の全角入力に対応していないために、エクセルのコピペができないので、エクセル内のすべてのセルを半角英数に書き換える。
例えばB(日本語フォントのB)とB(英数のB)が両方とも区別できず、エラーがでて取り込めないという状態に陥らないように、名義変数は半角英数で入力すべき。
日本語入力と併存が一番良くない。
どちらか迷ったら、列をひとつ増やせばいい。
⑨パラメトリックに統計できる最小の30例を先にガチで調べて、有意義なデータになるかどうか試す。それで、有意義な値にならないデータは捨てる。そうすれば、残りの70例くらいは調べずに済む。このとき、最初にOSを出しておくことが効いてくる。OSが長いひとのほうが、いろいろ学ぶことが多いから。
⑩なるべく、2回、同じ患者を開かないで済むように、⑨を実践し、短い期間で全部調べるべき。じゃないと、間延びして、データを忘れてしまう。
どういう患者が予後が良いとか、ひとりひとりの傾向を調べていくうちに、どの因子で統計を取ると新しいことがわかるか推論できるようになる。
臨床実感が伴わない統計は大外れする可能性がある。
⑪TABLEへSPSSやEZRのコピペはダメ。
データは四捨五入する。単純な数字にして見やすくする。基本2桁。3桁目をまるめて2桁にする。p値は強さを示すので、これだけは例外的に細かく書く。
2桁でも、2.0は2と表現して、点ゼロは省略する
95%信頼区間の表現は、95CI, 1-2; 0.05
と形が決まっている。詳しくは文末、文頭に紹介した本を見てください。
⑫EZRで解析した結果は、スクリベナーに「解析結果」というファイルを追加してそこにコピペしておく。
EZRも解析結果を保存しますかと聞かれるけど、データの場所が煩瑣になる。スクリベナーにデータを集約すれば、すぐに検索できる。
⑬シロート統計学では、シフトでセルを選んで、コピペでEZRに毎回読み込ませているけど、ぼくはEZR用のエクセルファイルに直接、シフトでセルを選び、ピペして、それを使って、「エクセルファイルをインポート」している。こっちのほうが、やや読み込みから計算まで時間が短い。
どっちでもなれている方でやればいいと思う。
⑭EZRで解析しながら、リザルトをどんどんスクリベナーに書いていく。
解析中にわかったことで、新たな解析方法を思いついたり、見つかったりするので、なるべく早く、解析する段階に入ったほうがいい。
先行論文で解析している内容は全部やったほうがいい。解析方法や使っている検定が先行論文に書いてあるので、それを参考にする。
その解析方法をメソッドのところに書く。解析方法は大抵が先行論文のコピペになってしまうので、語順や動詞を変える。
⑮リザルトについても、削ぎ落としていくと、結局、先行論文と似通ってしまう。同じ解析をしているので、書き方も似てしまうのは仕方ない。複数の先行論文のいいとこ取りをした書き方をすると、コピペにならずに済む。
⑯リザルトが書き終わったら、導けた新しいことをdiscussionに書いていく。
これもメンターになる先行論文の骨格をコピペする。論理の流れがあっていれば、それらしいdiscussionになっていく。
横道にそれないように、Conclusionにむかって一直線に書く。
要素に分解して、上から下に水が流れるように理由→原因と二元論で書く。単純化して、それに肉付けしていく。
一度まねしたら、もう一回壊してばらばらにして再度、組み立て直す。
こうすると、論証の順番が一致することはないので、まねしたと思われない。
⑰一通り書き終わったら、ワードファイルを作る。本文用のワードファイルと、フィギュアテーブル用のワードファイルを用意する。
そこにスクリベナーに書いた原稿をコピペする。EZR、エクセルで作ったFigure、Tableをコピペする。
全部コピペし終わると、論文としての流れ、全体像が見えてくる。Introduction→Method→Result→discussion→Conclusion→Abstract→Titleの二元論が上から下にうまく流れているか体裁と整える。
ここからは基本、Wordで編集することになる。
エクセルのTableはコピペしてワードにPNGファイルとして貼る。図として貼ることによってフォントや行間がずれない。基本、エクセルで編集して訂正や修正が入るたびに原本からコピペする。
同様にFigureもEZRからPNGファイルとして出力してワードに図として挿入する。
最終的に形にするときは、ぼくはPNGファイルをパワポに挿入して、その図を編集する。パワポは自由度が高いので生存曲線のx軸とかy軸の文字を編集しやすい。いらない文字や記号も消しやすいし。図形を作って、背景を白にして不透明にすれば修正液代わりになる。
最後は全部のオブジェクトをドラッグして選択し、右クリックで「図として保存」を選ぶと、画質を落とさずにワードにコピペできる。エクスポートでPNGファイルとして出力すると、グラフがボケるのでおすすめしません。
⑱原稿できたら、即、いろんな上司に意見をもらう。結局、他人に突っ込んでもらわないと、自分ではどこが悪いのか気づけない。
指摘されたところをさらに修正し続ける。
2.2.4.分類不可能系
①【最重要】Office 365をAMAZONで買う。
下記リンクをクリックしたあとに買ってください。
<iframe style="width:120px;height:240px;" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" src="https://rcm-fe.amazon-adsystem.com/e/cm?ref=tf_til&t=ndthikarucoco-22&m=amazon&o=9&p=8&l=as1&IS2=1&detail=1&asins=B00O2TXF8O&linkId=9d540da97767b91b47508aedb710fc5f&bc1=000000<1=_blank&fc1=333333&lc1=0066c0&bg1=ffffff&f=ifr">
</iframe>
ぼくはクラウドに思い出の動画データを大量に保存したいので、1TBのクラウドが必要なんです。
必要経費というか。HDDのバックアップも津波や火事がくれば意味ないし、絶対に失いたくないものはクラウドにバックアップする以外ない。クラウドは世界の数箇所にバックアップされるので、データ消失リスクが低い。
Office 365はそのクラウドサービスにプラスして、無料でSkypeの無料通話と最新のWord、Excel、パワポがダウンロードできます。
MACもWINDOWSもOFFICEソフト群が使い放題。
3.論文執筆関係の技術
3.1.先行論文のコピペは絶対禁止やで。
『ソースの二度漬け、禁止やで。』法
先行論文を1行まるまるコピペしたら、コピペ検索ソフトにひっかかり、即アウトです。
でも、ナンセンスといえばナンセンス。
だって、巨人の肩の上に乗ったうえで、論文書いているわけであって、イントロダクションが似たような文章になるのは当たり前なんですよ。
今までの歴史を振り返る文章なんだし。
大学院の授業では、コピペしたうえで、動詞や形容詞を入れ替えるだけの文章も盗用とみなされると説明があり、やはり禁止やで!法にひっかかります。
そこで必要になるのは、要約と引用です。出典論文は文末にくっつけつつ、要約か引用をする。
引用はクォーテーションマークをくっつけて、そっくりそのまま真似しなければならず、稚拙な印象があるので、ぼくは使いません。
要約は先行論文の長い文章を短くするってことで、割と簡単にできます。
先行論文のマネをするのではなくて、先行論文の引用した論文をさかのぼり、その文章を要約すれば、とくに問題のない文章になるはずです。
『要約には、経験と知識と智慧と叡智が必要じゃ』みたいな文章が盗用しないためのガイドラインブックにかいてありますが、辟易しますよね。
『コピーのコピーをすると歪むから、コピーするなら、原典からコピーしろ』っていえばいい。それだけなのに、要約に「慣れ」とかいう言語化できない方法論を持ち込んでいる時点で非科学的で根性論です。
3.2.メンター論文を見つける。
心の師匠であるメンターともいうべき論文を見つければ、ゴールは近い。
メンター論文を守破離して乗り越えていく。
まずは、真似する。
イントロやディスカッションで引用されているリファレンスの論文を全部ダウンロードする。
イントロをリファレンスごとに分析的にわけて要約する。
本当にリファレンス論文にそのことが書いてあるか調べる。
リファレンス論文がダサいものだったら、自分は引用しない。
本当に良いリファレンス論文はメンター論文を書くにいたった経緯、歴史が書いてある。
メンター論文は必ず、そのメンターメンター論文が入っている。
さらにリファレンス論文を要約する。
3.2.1 メンター論文の見つけ方
キーペーパーであるメンター論文は多くの人が引用していることが多い。
存在確率が高いのは、以下の通り。
3.2.1.1 ガイドラインの引用論文
3.2.1.2 最新のレビューの引用論文
ガイドラインは日本の医療で論文を出すなら、日本のガイドラインをまずは読み込む。
そのガイドラインが引用している論文はすべて検索して、PDFをダウンロードする。
ガイドラインで書いてある文章が論文のどの部分を抽出したのか、さかのぼって調べていく。
(某成書の中に、副作用について書かれた文章の引用をさかのぼって調べたら、副作用の記述すらない原著論文だったということがあった。その執筆者は学会でも、大学でも偉いひとなのに。そのひとの書いていること、言っていることはそれから全部疑ってしまうようになった。結局副作用の根拠はどこを探しても見つからない。根拠のない文章を成書に書くのはダサい。『どこを探しても見つからない』というのは実は難しい。As far as our knowledge goes, this result demonstrated for the first time……,という文章を書くのは勇気がいる。ないことを証明するほうが大変だから。検索方法が悪いだけかもしれないから。だから、ガイドラインでないと言ってくれるとすごく助かるわけ。ガイドラインを引用すれば、ないことが書けるから。一方、レビューはただの一意見であって、学会が多数決で決めた意見ではない。レビューは適当なことを書いている可能性があるので鵜呑みにできないし、引用もすべきじゃない。)
ガイドラインは数年に一回しか更新されないので、古い可能性があるが、専門の先生が集まって、多数決を取るので、保守的になりがちだがものすごい変な推奨をすることはない。
ガイドラインが出たらすぐにわかっていないことを探し出してそれを論文化すれば、次のガイドラインで引用してもらえる可能性がある。そういう意味ではガイドラインが出た直後が論文作成の良いタイミングと言える。
一方、レビューは個人が出しているものであり、ひとつの治療法に対して、何人もレビューしていることがある。ひとりの先生が書いているので考え方が偏っているかもしれないが、手っ取り早く最新の知見を知るには一番良い方法。レビューとガイドラインの一致点を探れば、かなり信頼性が高い知識を得ることができる。
3.3.スクリベナーのリサーチに論文をどんどんコピペする。
スプリットビューにしたりして、読んだらすぐに要約し始める。結局なにが書いてあるのかわからないと、ただダウンロードして満足しただけになる。
要約は直接PDFファイルにTEXTをADDするか、リファレンス一覧をコピペしてそこに書いていくか。
リファレンス論文は引用順に並べていく。
実際に、自分の論文で引用するかわからないので、ならべるしかない。論文の執筆が終わるときに、そのなかから抽出すればいい。
スクリベナーだとPDFからテキストをコピペできないので、PDFビューワーソフトを外部で開いてテキストコピーし、それをテキストエディターにコピペする。みぎクリック。open→in external editorでできます。
テキストエディターはリッチテキストにするとフォントまでコピペしてしまうので、.txtファイルにして文字情報だけコピペする。
リファレンス一覧の中で、古すぎてダウンロードできなかったり、施設でsubscriptionしてないジャーナルだからダウンロードできないものがあったりする。その場合、Abstractだけテキストファイルとしてコピペする。
重要だと思ったら自分で購入するか、MRさんに頼んで買ってもらうか、科研費で購入するか。
3.4.iPadにスクリベナーをアップストアで買ってインストールする
こうすると、論文を読むのだけは、iPadでできるので、読みやすい。パソコン画面だと、読みづらい。でも、iPadはテキスト入力にむかないので、論文の要点をメモするのに向かない(iOSそのものがテキスト入力に向かない。マウスがないから。Appleは本当にどうしてマウスを排除するのか理解できない。マウスとトラックパッドはテキスト編集において両方必要だが、画面をタッチするのは絵を描くときしか必要ない。)。アイパッドで読みながら、PCで論文のメモを書いていく。
3.5.スクリベナーの堅牢性がすごい。
スクリベナーは大量にテキストを書いたり、大量のPDFを一箇所にまとめるのが得意なソフトウェア。
しかも自動的にバックアップし続けてくれるので、原因不明のソフトウェアやハードウェアのクラッシュが起きてもたいてい復元できる。何ヶ月もかけて作ったデータやテキストが失われるのはこのソフトならありえません。
ぼくはスクリベナーだけはDropboxにいれて保存してます。Dropboxは仕事用でテキストファイル中心。OneDriveは私用、あるいは動画と使い分けてます。
3.6.引用のスタイル
投稿先にルールがあるからそれに従ってやるしかないけど、別に従って書かなくてもばれないこともある。
正直、なんでわかりにくくジャーナルの名前を省略して描くのか未だに理解できない。
そのせいでPubmedで一発で引っかからず、googleで検索したほうが早いことがある。
Pubmedはあいまいな検索ができないから、スペルミスするだけで検索できない。
Corresponding author et al. “Title”. Journal. 年、号、ページ数
結局、検索可能性があればいいので、多少、スタイルが違っててもいいと思う。普通Titleを全部コピペすれば、Googleなら一発で検索できる。Pubmedだと出ないことが多い。
3.7 投稿先を選ぶ
先行論文がどこからでてるかで、どこがいいか検討はつくけど、どうせなら合否がすぐにわかり、かつ、インパクトファクターの高いジャーナルがいい。
●https://journalfinder.elsevier.com/
●https://www.edanzediting.co.jp/journal_selector
この世の中、便利なものがあるもので、投稿先をTitleとAbstractを打つだけで教えてくれるAIがあります。
ただ、あんまり精度がよくないので、こんな雑誌もあるんだなぁくらいでいいと思う。
3.8 投稿先のフォーマットに合わせる。
投稿先ごとに微妙にフォーマットが違う。
単語数制限、Table、Figureの数の制限もある。
https://www.elsevier.com/authors/journal-authors/submit-your-paper#find
https://researcheracademy.elsevier.com/
エルゼビアをWIKIPEDIAから引用。
歴史
ロデヴァイク・エルゼフィア (Lodewijk Elzevir、1542? - 1617) が、1580年にオランダのライデンで創業し、エラスムス、ガリレイ、デカルト、グロティウスらの著作を出した。
出版社としてのエルゼビアは、1880年ロッテルダムで、ロデヴァイク・エルゼフィア(en)の名にちなんでElsevierの名で設立された。したがって、16世紀の著名な出版者のエルゼフィアと現在の学術出版社のエルゼビアの間には直接的なつながりはない。
現況
現在、The Lancet(医学)、Cell(生物学)、Tetrahedron Letters(化学)などの医薬・生理・科学・数学・工学の先端的な学術雑誌、Trends シリーズや、専門書を出版している欧州屈指の歴史ある学術専門出版社のひとつ。また、自社出版物の内容を収録したオンラインジャーナルのプラットフォーム・ScienceDirectや、有機化学データベースバイルシュタイン・データベース、無料の医学・科学技術文献データベースScirus を運営している。ただし近年は一部に、学術雑誌の購読料が高すぎる(年間5千ドルのものもある)という批判があり[1][2][3][4]、2012年にはエルゼビア社の論文誌への投稿をボイコットする運動(学界の春)が起こっている。
以上。
この出版社のせいで医学は発展しているわけだが、本当に購読料がバカ高い。
その購読料はresearcheracademy.elsevier.com/で有効利用されている。
フォーマットはほぼ二元論で書かれたこのWebsite
学ぶところは多いです。
3.9 できあがったら、英文校正を依頼する。
Nativeじゃないと必ず、Nativeにとって不自然な英語を書かざるを得ない。Fool-proof Englishでいいんだけど、文法があっていない文章はまずい。
「Grammarly」というアプリ chrome add-inがあり、とりあえずこれにチェックしてもらうと初歩的な文法のミスを勝手に教えてくれる。
Wordもスペルミスや簡単なミスなら波線で教えてくれるが、本当に進化がない。なんでマイクロソフトは大量の資本を持っているにもかかわらず、こんなにAIが進歩しているにもかかわらず、文法のミスを指摘する機能をWordに入れないんだろう。大企業病としかいいようがない。
ミスしているかどうかは基本的に自分では気づくことはほぼ不可能なので、まずはこのアプリAIにチェックしてもらう。
それが終わったら、Nativeに見てもらおう。いろいろ調べてみて、最安値でちゃんとしてそうなのがこれ。
Proof-reading -service.com
https://www.proof-reading-service.com/jp/
イギリス人でPh.Dをもっているレベルのひとが英語をチェックしてくれる。料金もペンスで提示しているところもイギリスらしい。
日本の業者さんにやってもらうと、1WORDが5-10円とかすごい値段をふっかけられる。
論文ってたいてい3500単語くらいだから、15000-30000円かかってしまう。
このサイトは1WORDが1.2円くらいで、下手な英語だろうが一定額でやってくれる。
ここなら、7000円くらいで最安値。消費税が20%かかるので、日本在住だとメールすれば、消費税なしの請求がかかる。ペイパルのシステム手数料に400円位余計にかかる。
ただし、メールで英語でやりとりしなければならないので、英語に劣等感を抱いていて、消極的なひとには向いていないかも。
3.10. 【DeepLを用いた論文読解と執筆】英語の障壁をなくす
https://www.deepl.com/translator
DeepLというのはDeep learningを用いた翻訳アプリです。
Google翻訳との違いは、圧倒的に自然な文章にしてくれるというところ。
論文を大量に英語で読むのは日本語とどっちが早いかっていうと、やっぱり日本語のほうが早く読めるんですよね。
英語で書かれた文章を日本語で大量に読みたいとき便利なのがディープ L です。
基本的に無料で使うことができます。
読みたい論文の文章をコピペして、5000文字まで無料で一気に翻訳してくれます。
僕はこの方法をやるようになってから論文のチェックするスピードがとても上がりました。 昔はこういう風に日本語に翻訳してしまうことをお恥ずかしい行為だと思って蔑んだ目で見ていました。英語に対して苦手意識を持っている弱者の発想だろうと。
でも実際にディープエールで行ってみると圧倒的にチェックする速度が上がります。英語の上達に関してある程度能力がプラトーになってきたら、 DEEP L を使って楽をするのは全く問題ないと思います。
DEEP L を使い続けていると今度は日本語から英語にするのもできるのではないかという発想に至りました。
日本語から英語にディープ L を用いて翻訳する場合日本語側を英語っぽくすることによってそれらしい英語になっていきます。
元々英語の作文能力がある程度あれば DEEP L が作った英語が怪しいものかどうか判別できるはずです。変な英語ではないと言う判断ができれば DEEP L を用いて自動翻訳させるのは危ういことではありません。
それよりも先行論文が書いた文章をコピペする方がよほど危ないです。
https://www.nhk.or.jp/covid19-shogen/theme/theme6/440572.html
より引用。
NHKスペシャル「パンデミック 激動の世界(6)「“科学立国” 再生への道」
2020年12月20日(日)[総合]夜9時~9時49分
早くも海外で始まったワクチン接種。日本もワクチン開発に挑むが、実用化のめどはまだ見えない。薬の開発でも、優れた成果を上げる国内の研究室が人材枯渇の危機に。数々ノーベル賞学者を輩出してきた日本の医学研究が、なぜコロナ禍で成果を示せないのか。
今月急逝した科学者出身の元文部大臣・有馬朗人氏の亡くなる直前の貴重なインタビューや知られざる研究現場のルポで、迷走する日本の科学政策とその解決の道を探っていく。
以上、引用でした。
このNスペで、日本の論文数が激減しているのを見て、GAFAMや中国企業の時代になってしまったと感じます。日本は明治後の文明開化のタイミングと戦後復興のタイミングで、ベンチャー企業が大量に生まれて、それが平成バブル時代で頂点を迎えて、凋落し、GAFAMや中国企業の時代に入っていきます。
コロナ復興のタイミングでベンチャー企業がまた大量に生まれてほしいです。
DeepLを使って、もっと気軽に論文書きましょうよ。
以上の文章をDeepLに翻訳させてると以下のとおりです。
DeepL is a translation application that uses Deep learning.
The difference between it and Google Translate is that it makes the text overwhelmingly more natural.
If you want to read a large number of papers in English, which is faster, Japanese or English, you can read them faster.
Deep L is useful when you want to read a lot of text written in English in Japanese.
You can use it basically for free.
You can copy and paste the text of the paper you want to read and it will translate up to 5000 characters at once for free.
Since I started using this method, I have been able to check papers much faster. In the past, I used to think that translating into Japanese like this was an embarrassing act and looked at it with contempt. I used to look at it with disdain, thinking it was a shameful act, the idea of a weak person with a weakness for English.
However, when I actually went to Deep Yell, I found that the speed of checking increased overwhelmingly. Once your ability has plateaued to some extent in terms of English improvement, I think it's perfectly fine to use DEEP L to make things easier.
As I continued to use DEEP L, I came up with the idea that I could also use it to convert Japanese to English.
When translating from Japanese to English using DEEP L, you can make the Japanese side look like English, and the English will look like that.
If you have some English writing ability, you should be able to tell if the English created by DEEP L is suspicious or not. If you can determine that it is not strange English, it is not dangerous to use DEEP L to automatically translate it.
It is much more dangerous to copy and paste text from a previous paper.
https://www.nhk.or.jp/covid19-shogen/theme/theme6/440572.html
Quotes from
NHK Special "Pandemic: The World in Turmoil (6) 'Science Nation' on the Road to Revival".
Sunday, December 20, 2020 [General] 9:00-9:49 p.m.
Vaccinations have already started overseas. Japan is also trying to develop vaccines, but there is still no sign of practical use. In the area of drug development, domestic laboratories that have produced outstanding results are in danger of running out of human resources. Why can't Japan's medical research, which has produced a number of Nobel laureates, produce results in the wake of the corona disaster?
Through a rare interview with the former Minister of Education, Culture, Sports, Science and Technology, Mr. Akito Arima, who passed away suddenly just before his death this month, as well as reports on unknown research sites, we will explore Japan's stranded science policy and the way to solve it.
The above was a quote.
Seeing the drastic decrease in the number of Japanese papers, I feel that we are in the era of GAFAM and Chinese companies. In Japan, at the timing of the opening of civilization after the Meiji era and the post-war reconstruction, a large number of venture companies were born, which reached their peak in the bubble era of the Heisei era, declined, and entered the era of GAFAM and Chinese companies.
I would like to see another large number of venture companies born at the timing of the Corona recovery.
Let's use DeepL to write papers more easily.
Translated with www.DeepL.com/Translator (free version)
というわけで、DeepLのCMでした。
COI 私はDeepLからお金をもらっていません。もらいたいくらいの気持ちです。
3.11 Scrivenerを利用して、知識を整理してアウトプットしよう。【新しいスタディデザインの作り方】
https://www.literatureandlatte.com/scrivener/overview
ぼくにとって、サイエンスライティングにおけるデファクトスタンダード。Scrivener。
エンドノートとか、ペーパーズとか、いろいろ試してみましたが、全然使い物になりませんでした。
さて、Scrivenerの使い方でアップデートしたことを追記しておきます。
まず、ある学問分野でわからないことを調べたいとします。
①一般のGoogle検索、Google scholarとPubmedの3つで調べてみる。
Google検索のいいところは、論文をキュレーションして良さそうなものをトップに持ってきてくれるところ。
弱点は網羅的ではない。
Google scholarのいいところは、Google検索とかぶらない、その他の良いものを古いものから最新のものまで、Pubmedにないものまで、柔軟に検索してくれるところ。
弱点は、Evidenceレベルの低いものまで出してくるので、開いてみないとわからないところ。
Pubmedのいいところは、キュレーションされ終わった、ハゲタカレスの論文しかでないところ。
メジャーな雑誌で絞れば、良さげなものを、人間が読める範囲で出してくれる。
これを読んだ人はこれも読んでます的な、アマゾン的なおすすめをしてくれるのも良い。
弱点は、検索ワードの柔軟性がないので、きっちりしたパワーワードを入れないと検索で引っかからない。
②検索するワードは、日本語→英語をDeeplにやってもらう。
ワードを間違えると、全然、目的とした論文にたどり着けない。
変なワードを検索しないためには、Deeplでこなれた英語になっているかチェックする必要がある。
③とりあえず、Reviewを検索する。
たいして研究する実力や発想力がないひとでも、Reviewsを書いてくれる人がいます。
キュレーションしてくれているので、その分野で有名な論文をそこそこ集めてくれるので、探す手間が省けます。
④ガイドライン、成書のまごびきをする。アイデアを持ってくるためには使えるけど、論文の引用には使わないほうがいい。
日本語で書かれたガイドラインは日本人による、日本人のための、レビューです。
査読されていないレビューは本当に適当な論文を引用している可能性があります。
成書はたいてい、査読されていませんので、その分野が専門性があればあるほど、適当な論文を引用している可能性があります。
日本語のガイドラインもそうで、担当した先生が引用しただけで、査読されていない可能性があります。
そういう意味で、日本語のガイドラインは専門性が高い分野ほどてきとーである可能性がありますので注意してください。
海外のひとにとっては、非常識である可能性がある。
日本のガイドラインを引用すると、たとえば、Plos oneのアメリカ人に査読されると、すごい低評価になる可能性が高くなるので隠したほうがいいです。
AMERICAN Reviewersは日本語で書かれたものは、Bull shitだとおもってますからね。
医学や生理学、生物学でおこる自然現象は、国境に関係なく起こるのですが、査読という文化は国境で歪められます。本当に辟易します。
もうMDアンダーソンだから正しいとか、中国の知らない大学だから怪しいとかやめましょうよ。
ファウチがどんなに優秀だろうが、論文をいっぱい出そうが、正確なデータをだそうが、アメリカはコロナをまったくコントロールできずに公衆衛生学もクソもない。
⑤そうやって、大量に論文を読むには、Deeplにコピペしてから読む。
日本人にとって、日本語で読むのがもっとも高速で正確なわけ。
英語論文の言葉の壁は、Deeplのおかげで綺麗になくなりました。
ちょっと一手間が必要ですが、PDFで論文を読まずに、HTMLで読んで、テキストをコピペして日本語に変換しましょう。
PDFでコピペすると、段落で改行されてしまうので翻訳がおかしくなります。
さっと読んで、これはキーペーパーだなと思ったら、
翻訳した内容をScrivenerにコピペしておきましょう。
あとで、読み返せるように。
⑥読んだら、タイトルとDOIをコピペして、その論文の内容を、日本語でざっっくり説明して変換しておく。
たいてい、ひとつの論文で発見してることなんて数行で書かれてる程度のことだけです。
日本語でコメントしておきましょう。
紹介したテクニックの「ざっくりさせる」です。
くだらない論文だったら、茶化してもいいですよ。
⑦ 以上の1-6のルーチンワークを繰り返す。
繰り返しているうちに、イントロダクションとメソッド、ディスカッションの骨格ができてきます。
あとは、調べているうちに思いついたスタディデザインでデータを収集して、リザルト出して終わり。
このスタディデザインが肝です。
おもしろい結果が出せるかどうか。
スタディデザインは天から降りてくるもの
シンプルなものほど、気づけない。
論文を出すために、研究するのは苦しくなるだけ。
楽しくスタディデザインを組んで、結果を出るワクワクを繰り返しているうちに、役立つことが、見いだせるっていうのを繰り返しているうちに、ノーベル賞みたいなものがいつのまにかとれてるっていうのが理想だと、2021年のノーベル化学賞をとったひとが言ってました。
3.12 MATLABとEZRの役割分担✨
大学の教員になりまして数年が経ち✨、科研費💰もとり、基礎研究から特定臨床研究への橋渡し研究💴もやり、統計学🦉についてちょっとDeep techになり始めました。
医者にしてはちょっとかじってる方になり始めましたので、小中高生のためにインストラクションを書いておきます。
【目次】
1.研究に必要な道具、というかアプリと知描説聴サイクル🚀
2.MATLABとEZRの役割分担
【本文】
1.研究に必要な道具、というかアプリと知描説聴サイクル
1.1.情報収集、インプット、知描説聴サイクルの知
いろいろ試した結果、以下の結果に落ち着いています。
まずは、ガイドライン、レビューをチェック
ガイドラインはGoogle
レビューは、Google scholar、Pubmedで検索
その中で、孫引き検索
レビューやガイドラインはもとになった論文を引用してるので、それを全部チェック
1.1.1 英語は日本語に変換する。
Deepl で翻訳。
英語よりも日本語のほうが高速に読めるので基本Deeplでコピペ。
Google 翻訳やMACの翻訳は未だにレベルが低い。Deep learningはどーなってん。
1.1.2 情報収集はエクセルで。
臨床データ、wet labのデータ→エクセルっていう流れ。
この情報収集の部分を自動化するツールがこれからの医療ビジネスを引っ張っていくだろうなぁ。
エクセル入力がいまだに手動っていうのがね。
1.2 理解した内容を描く。知描説聴サイクルの描
ノートに書くのはおとなになるとハードルが高くなります。
描くのはLaboノートくらい。
その代わりに使うのが、Scrivener
階層構造で大量に知識を整理し、コピペできます。
書いているうちに、アイデアを思いつきます。
いまだに、自分にもどうしてアイデアが湧いて出てくるのかよくわかりません。
「うーん」で唸ってるときに、イメージがたたたんと見えてきて、「きたぁー」ってなる。
先達が言っているように、電車の中、寝る前、お風呂の中、中途覚醒して眠れない真夜中が多い。
あんまり、話し合っている間にでてくるアイデアは良くないことが多いです。リアクティブシンキングだから。
リアクションしてるだけで、イノベーションではない。
1.3. 思いついたアイデアを誰かに話す。プレゼンする。パワポスライドを作る。知描説聴サイクルの説と聴
アクティブ・ラーニングをしてるので、聴で繰り返さなくてもたいていのことは自然に覚えてしまいます。
そういうわけで、テストがない限り、レコーディングと速聴はあんまりやる機会なくなってきます。
専門医試験ではやったんすけどね。
その代わり、資金獲得のためにプレゼンしまくるので、説明しているうちに内容を覚えてしまいます。
英語で論文を書くときは、全部Deeplで翻訳です。
ところどころ、Grammaryでチェックしてあとはネイティブチェックに任せます。
https://www.proof-reading-service.com/jp/
が最安。
2.統計処理におけるMATLABとEZRの役割分担
2.1 MATLABとEZRとは(Prismもね)
結論から書きますが、MATLABは普通の論文にでてくる医療統計解析をやるのに向いていません。汎用性が高い分、必要な統計をやるのに、すごい行数を書く必要がある。
EZRで3分でできることが、MATLABだと10分かかります。
EZRというのは、自治医大の血内の先生がRという統計言語をアプリっぽくして、クリックして選ぶだけで、必要な情報をだせるようにしてくれたアプリです。
生存曲線とかリスクファクターとか簡単に導出できます。
MATLABはなんでもできるスーパー統計ソフトです。(日本だとスバルの自動運転、アメリカだとAmazonの🚀ロケット打ち上げの制御に使われてるらしい)
Toolboxっていうの買って、課金をすればするほどできることが増えていきます。
EZRでやってることを、MATLABでやってみよーっと思ってやったら、p値を出すのでも大変なので諦めました。
結論としては、EZRでできることをMATLABでやる必要はまったくありません。
できないことだけをMATLABでやれば良い。
一般臨床で行うことはMATLABでやることはありません。
ちなみに、生物学の基礎研究ではEZRではできないことが多いので、GraphPad Prismを使います。
論文に投稿できるレベルのFigureが簡単につくれます。
GraphPad Prismでできることも、やはりMATLABでやる必要はまったくありません。
2.1 なぜMATLABがEZRの代替にならないのか?必須の関数が有料だから。
datetime値を引き算して、期間をduration関数から導いた値は、「●●ヶ月」で返してくれるのですが、これを生存曲線を書くために、数値に変換しなければなりません。
この関数でさえ有料。
MATLABでいろいろ面白いグラフを書いてやろうという気持ちが削がれました。
2.2 MATLABでやろうかなぁーと思ってる解析
①Deep learning Toolboxを利用して、アイデア商品を作る。
これでこどもの自由研究課題で内閣総理大臣賞をとってやろうかと思います。
②DICOM処理して、とある疾患の確率分布をマッピングする。
③疫学調査でホットスポットとコールドスポットの可視化
4.論文発売後の10万字インタビュー。
「PAPERS VIRUS 論文ウィルス」 in stores now!
Kuroyanagi Takeshi interview
Interview with Takahashi Yoshiaki
黒柳 あ、よろしくおねがいします(笑)。
―― こちらこそ、お願いします。まずは、『PAPERS VIRUS 論文ウィルス』の完成おめでとうございます(笑)。
黒柳 いやぁ、ありがとうございます。
―― ライティング、リサーチングはいかがでしたが?
黒柳 前作の論文のときの感覚が蘇りました。真っ暗な場所を手探りで歩いているという感じというか……。前作は、よくここまで踏み込んだなっていうことをいろいろやったはずだったんですけど、その前作でやった基盤をの中で、ひとつひとつのAIMRDCを書いていったということもあって、その感覚を忘れていて、Methodを書いていて、また次の段階に行こうとしたときに、最後までどうなるかわからない感じをそこで思い出したんです。どういうふうに論文ができるかわからない。 新しいをしているときのドキドキ感、気の抜けないない感じですね。
―― 黒柳さんのなかで今回の論文のことを考え始めたのはいつ頃なんですか?
黒柳 最初はこの治療法を初めて経験したしたとき、これは論文の軸になる治療だなと思って、そこから論文のことを考え始めました。
―― かなり前から構想は描いていたんですね。
黒柳 はい。実際に統計を取り始めるだいたい半年くらい前ですね。思い描いていたのは、この統計に、Logrank検定、Cox比例ハザード回帰、Propensity score matching、患者背景ごとのサブ解析を組み合わせられないかというアイデアでした。ノーベル医学生理学賞受賞者である本庶佑先生の哲学に影響を受けていることをずっと公言していたものの論文的なアプローチはちゃんとできていなかったから、自分なりのやり方でそれができたならなって、前回の論文でできた基盤からまたさらにそういうものを目指したいと思ったんです。
―― そして、時間の経過とともにがんに対する統計解析のみにとどまらない構想に拡大していったと。
黒柳 そうですね。結局やりたいことがいろいろ増えてしまって(笑)。そのアイデアも要素のひとつとして、やりたいこを好きにやるというシンプルなコンセプトになりました。やっぱり、新しい治療コンセプトをみつけたことがすごく大きかったです。あのMethodも制作衝動の中心は疑似RCT×患者背景因子の均一化ですけど、最終的にまったく違う場所に着地したので、あれほど好き勝手やった論文が世の中に浸透していく様を見て、同時に今ある論文のイメージがどんどん湧いてきて、「こんなことをやったら面白いな」とか「今はこれをやりたいな」とか、その都度「これだ!」とおもったことを論文にしていった感じですね。
―― 前回の論文の完成や反響が、黒柳さんに影響を与えているんですね。
黒柳 色んな人が喜んでくれて嬉しくて。これからやりたいと考えていたおぼろげなイメージを思う存分やって構わないんだって思えました。前回の論文を出すまではやりたいと思っていることが受け入れてもらえるかどうかわからなかったし、やる以上はいろいろなひとに楽しんで論文を読んでもらいたい、自分の医療に取り入れてもらいたいというのが絶対にあるから、新しい治療法がちゃんとうまくいくといいなって思っていたんです。どうやったら治療法を成立させられるかは、もう自分が論理的飛躍がないって感じるかどうかだけ、その感覚に任せようと思って、あとは自分のやりたいことをやろうという感じでした。そうやって手探りで作ったものが喜んでもらえそうだなって、今回の論文の半分くらいは前回の論文のあとで着想していますし。
―― 今回の論文のTitleは二元論を使っているとおっしゃっていました。二元論の陰と陽のトーンは、あらかじめ、意識していたものなのでしょうか?
黒柳 それは前回の論文がでてからですね。前回の論文は、Positive vs Negativeを描いたことが楽しくて、解放されたような気持ちになったんです。大学受験で培った二元論の原理を医学の世界でも使ってもいいんじゃないかって、それで自由に作っていった感じですね。
―― それは興味深いですね。
黒柳 もちろん、良い論文は必ず、二元論で書かれていますけど、みんなそれを無意識にやっている。今回は意識的に書いた分だけ、自分の論文ができたという感覚があります。前回の論文は教授のいうことに従って、書いていればいいや、自分のことはどうでもいいやっていう感じだったんです。でも気づいたら、自分の思いや感覚、二元論みたいなものを論文にするというようになっていたという感じですね。
―― 自分の二元論を信じて書くというところでは、Table3ではPropensity Score Matchingがでてきていますね。
黒柳 そうですね。Randomizeのコントロールスタディをやりたいところですが、まだまだ若輩者のぼくには、多くの共同研究者を募ることもできません。多くの医者が自分の施設では論文が出せないといって表現をやめることが多かったと思うんですけど、「もういいや!」って感じになって(笑)。単施設でレトロスペクティブに研究するには、Propensity Score Matchingが二元論を打ち出すということでもあると思うんですよね。あくまで日本で生活をしている医者として論文を出すというか。
―― イエローメディカルサイエンスとの向き合い方はどのように変わっていますか?
黒柳 イエローメディカルサイエンスってジャンルは大学受験のときに自分の中にぼんやり考えていたことに過ぎなかったんですけど、取材や論文制作、電子書籍出版をしていたら意外と浸透してきちゃって(笑)。嬉しいですね。もうイエローメディカルサイエンスはスタンダードになっているので、そこをめがけて作っていくというよりは、外れてしまったときに少し修正するくらいですね。今は、イエローメディカルサイエンスの感覚自体は変わっていなくて、その中に入るものをちょっとずつ増やしていってるという感じです。「WASP、欧米の白人が作ってきたサイエンスを日本人のフィルターを通して~」みたいなコンセプトでしたけど、別にWASPだけではなくて、世界でいいと思いますし、日本人は世界中のものを真似ではなく、”日本流”にしてしまうものすごい国民性がありますよね。これをうまく医療の世界でも置き換えられたらなと思います。
―― 黒柳さんの論文の制作にあたって、”生命”みたいなものがひとつのKEYWORDになっているようなところはありますか?
黒柳 その感覚はありつつ、どちらかというと”生活”という感じですかね。どの論文にも毎日、日常診療をしている医者と、病気になる患者を想定しており、治療法に困ったときになにをしたらいいのか、しっかり、過去の臨床結果から統計データを出したかった。自分が持っている遺伝子をつないできた人々の長い生活があって、今の医学、医療があるんですよね。その感覚をいつも意識しています。この論文もしかりで、過去と現在と未来を強く意識するようになりました。論文はぼくが死んだあとも文明が滅んだ後もまた読まれる可能性があるわけじゃないですか。それってすごいウィルスっぽいなって。たとえば一度文明がおわったとしても、そこから一千万年ぐらい経った後にまた生命が生まれて、そこから化石として、論文が掘り返されて「なんじゃこりゃ?」となって、なんの治療か試行錯誤していたら、治療法として使ってもらえるかもしれない。そう考えると、すごくすごく遠くの未来に思いを馳せてしまう。
―― ああ、なんだかいいですね。
黒柳 そのくらい普遍性のある人類の智慧が面白い文化だと思うんですよね。実際にぼくが生まれる前の医療にぼくらは支えられているわけで、それが医学の素晴らしい力で、それこそが医学の面白さであると思うんです。そう考えると、同時に、今回の論文の存在が結構はっきり見えてきますよね。
―― ウィルスという言葉からある種のしぶとさ、タフネスみたいなニュアンスも読み取れます。
黒柳 そうそう。途絶えさせないぞっていうね。だからこそ、日常診療から論文を書こうという感じですね。困ったぞっていうことから、論文を書くことになるという思いがすごくあります。
―― では、論文で通底しているテーマ、心がけていたことはありますか?
黒柳 二元論ですね。
―― 大学病院じゃなくても論文が出せるという発見は黒柳さんにとって非常に大きな意味があったようですね。
黒柳 そうですね。大きかったし、自分のやりたい医療がここにあるといったら大げさですけど、これは自分の医療がもっと面白くできるんじゃないかって思ったんです。やっぱり、最終的には人間なんだってことなんだと思います。テクニックとか名声とかじゃなくて、その人間自身というものをしっかり論文のなかで表現できる医者になりたいんだなって。
―― まだ、論文が完成したばかりでとても客観視できる状況ではないと思いますが、現時点での答えを効かせてください。この論文を作り上げたことによって得た最大の収穫はなんでしょう?
黒柳 論文に関してはひとりぼっちの研究をものすごい大きな規模で研究できるようになったことですかね。ひとりで電子カルテの前でカタカタとデータ分析していた、その感覚のまま、ものすごくど真ん中の場所でいろいろなひとたちに協力してもらって制作できるようになったことがすごく嬉しくて。だから、単純に色んな医療の楽しさがつまった論文だと思います。「医学とはこういうものなんだからこうしなくちゃいけない」とかではなくて、いろんな形があって、「これらすべてぼくの医療です」という感じの論文ですね。「治療法に決まった形はない。新しい発想に患者の予後を伸ばす新しい治療法がある」っていう、そういうシンプルなところに戻ってきた手応えがすごくありますね。
―― 今日はお疲れのところありがとうございました。
黒柳 ありがとうございました。そして、ここまで読んでくれた読者のみなさま、ありがとうございました。
以上、「星野源、Pop Virusのインタビュー」よりインスパイア。
原著論文を2つ目の完成に合わせて、論文書いている人も芸能人や星野源みたいにインタビューされてもいいじゃないという発想のもと、インタビューされてみました。
星野源さんがアルバムをリリースするように、ぼくらも、論文をリリースする。アナロジーです。妙にシンクロしたので書きたくなってしまいました。
ただ、ミュージシャンはスノビストで、すごくかっこいいインタビューの受け答えをする。ぼくら科学者は論文書いても、こんな歯が浮くようなことは絶対に言いません。言いませんが、言う人がいてくれたほうが、科学の世界がもっと面白くなることは確かです。
ユーモアのセンスのある教授やイケてる教授がもっと増えてくれたら、日本の学問の世界はもっと面白くなるのになぁ。
3.ポスター作成技術。
バイブル「伝わるデザインの基本」にみる二元論とその対象化
http://tsutawarudesign.web.fc2.com/
(電子書籍もどうぞ。)
まずは、上記リンクを御覧ください。
「伝わるデザインの基本 よい資料を作るためのレイアウトのルール」 高橋 佑磨 (著), 片山 なつ (著)
ほぼ、上記のホームページにエッセンスが乗っています。
二元論という言葉が一言も出てこないんですが、ぼくがノート作りで繰り返し強調していることが学会発表においても、大事であるということが、この本でもわかります。
受験勉強法の基本は、学会発表のプレゼンでも同じなんですね。
学会のポスター発表、口頭発表のパワポ、資料作りにも役に立ちます。これのとおりに、パワポやポスターが作れれば、『こやつ、できる!』と学会会場で思われます。
あまりにも、無意識的に二元論が使われているので、やはり、対象化したいと思います。尊敬の意を込めて、オマージュを捧げたいと思います。
それぞれ、ひたすら、高橋 佑磨先生の作られた上記サイトの見出しに対して、コメントをつけまくります。ぼくのアセスメントとプランです。
→マークのあとがぼくの中高生大学生、医者、研修医に向けたコメントです。→マークがついていない文章は基本、先生が書いた見出しです。見出しだけ真似させていただきます。見出しに著作権はありませんので。
みなさん、先生の本を買ってください。
このインターネットサイトには、どういう文献を頼りに、これらのデザインに至ったのかが参照されていません。それだけが唯一残念です。
一方、この本、あるいは、サイトの良い所は、絵が多いところです。よく作りましたよね。
改良前VS改良後
の二元論が絵で満載です。ぼくも見習いたいところです。
勉強していて思ったんですが、高橋 佑磨先生から勉強したテクニックを用いて、情報デザインのまったくなっていない魑魅魍魎が跋扈する診療ガイドラインを改定しまくりたいですね。
http://yumatakahashi.web.fc2.com/japanese.html#taka
↑高橋先生は大学で生物学の助教をやられているみたいです。教授レベルにまで上り詰めそうな才能をひしひしと感じます。
前置き終わりです。
以下、本題。

はじめに
受け手は視覚に頼っている。
→定性(視覚)VS定量(聴覚)ですね。
見やすい資料を作るのは発表のマナー。
→すごい頭が良いひと(研究)なのに、ポスターデザインやパワポが下手だとがっかりしますよね。二元論が使えていないだけで、努力が水の泡です。
情報デザイン
デザインのパワーで、情報は伝わりやすくなる
→(情報)かける(デザイン)イコール【伝わる!】
→「研究発表のユニバーサルデザイン」を順守することで、研究発表が標準化されます(二元論化ともいってよし)。それによって、聞き手は簡単に新しい情報を理解し、覚えることができる。
→だから受験勉強においても大切なんですね。
→情報デザインオリエンテッドなノートを作ることが大切。
見た目と中身のフィードバック
→発表者がうまく聴衆に伝える。聴衆は関心を示す。発表者が喜ぶ。発表者はさらに洗練した発表や研究をする。人類の叡智が発展する。
デザインにはルールがある:情報デザインの重要性
→ルールというのは、二元論のことです。
読みやすく
「読みやすさ」は、可読性、視認性、判読性という3つの要素
「可読性」とは文章が読みやすいか
「視認性」とはパッと見た瞬間の認識しやすさ
「判読性」とは誤読がないか
→自分のノートって、可読性ありますよね。
→視認性を上げるために、文字を小さく書いたらだめ。
→自分の字なので、誤読なし
まずは書体の基本知識
→これ以降、ゴシックか明朝体かという議論が続きます。受験勉強とは関係ないので、中高生のひとは読み飛ばしてもいいです。
→ぼくがこれまで見てきた学会発表の中で、あちゃーと思ったものが、「書体が汚い」パワポです。
→論文発表はジャーナルごとに、書体が指定してあるので、そういう失敗が起きないのですが、医者20年目くらいのベテランなのに、学会発表のパワポに残念な書体を使っていた人がいます
→おちゃめな書体が残念すぎて、発表が頭に入ってこないんですよね。ずっとイライラしながら読みにくい発表を聞き続けるのは苦痛です。だから、准教授どまりなんだよと心のなかで叫びました。そういうダサい書体を使っちゃうあたりが、センスが洗練されていない。
基準① 長文か短文か(=本文かタイトルか?)
長い日本語の文章には可読性の高い「細い明朝体」
長い英文には可読性の高い「細いセリフ体」
プレゼン資料には「ゴシック体、サンセリフ体」が基本
タイトルや見出しにはゴシック体、サンセリフ体
基準② 読みやすく、美しい文字か?
シンプルなゴシック体で判読性を高める
判読性の高い書体を選ぼう(和文)
Windowsユーザーはメイリオ、Macユーザーはヒラギノ角ゴなどを使用するべし。
判読性の高い書体を選ぼう(欧文書体)
基準③ 太字・斜体に対応しているか?
太字に対応した書体を選ぶ
斜体に対応した欧文書体を選ぶ
基準④ ユニバーサルデザイン書体か?
可能ならユニバーサルデザイン(に近い)書体を選ぼう!
書体の使い方

英文には等幅フォントを使わない
→いままで無意識だったのですが、英語を書いている時、どのワープロソフトでも文字の幅が毎回変わっていたんですね。
英文には和文フォントを使わない
和欧混植の文章ではアルファベットの書体に注意
→日本の学会なら、日本語で発表するわけですが、かならず、英語と混合します。日本語がゴシック体なら、その中の英単語はサンセリフ体のフォント(Segoe UI, Arial, Helvetica, Corbel etc.)、日本語が明朝体なら英単語はセリフ体のフォント(Times New Roman, Adobe Garamond etc.)を合わせる。ここらへんも、学会でフォントが決められているわけではないので、とても参考になります。
相性の良い和文フォントと欧文フォントを組みわせる
タイトルなどの大きな文字は字間を調整する
→ぼくの本もどのフォントにするか、どの字間にするか、ちょっとだけ気にしたことを思い出しました。
?や!は半角にすると良い(かも)
→これは比較することで、見た目の良さを対象化できました。
記号は字間を詰めたほうが良い
→括弧の使い方が特に悩みますよね。記号だけ半角にするというのが正解です。
文字は歪めないのが基本!
合字を使ってさらに読みやすく、さらに美しく
→合字なんてものがあるとは気づきませんでした。
文章の作り方
行間を調節して読みやすく
行間は0.7文字分がベスト
→キンドル本で嫌なところが、行間がすごく狭いところなんですよね。FC2ブログの行間はとても心地よい。
字間を調節して読みやすく
一行の文字数を多くしない
→心理学的にも、ひとつのSVOが短いほうが伝わりやすい。文章を適切に切りましょう。
アンバランスな改行は避ける。「最低でも4文字」
英文の両端揃えには要注意(使うなってことね)
箇条書き 段落

意味のある「揃え方」をして、意味のある「まとめ方」をして、「コントラスト」をつけること
→直感的に、なにが何個あるのかがわかりやすく。
→「空白は意味を醸し出す。」とぼくの本でも書いています。ノートを作る時も、揃えてください。階層構造を作ってください。樹形図を作る時も、揃ってないと何個場合の数があるのかわりませんよね。
→まるは・よりも、●のほうがいい(微笑)。コントラストがつく。
→(微笑)よりも【爆笑】のかっこほうが強調できる。
インデントは可読性を下げることも
→これも初めて知ったんですが、最初のパラグラフの1文字目はインデントするべからず。
短い文や箇条書きでは、改行箇所を注意する
→意味で文章を切れということ。
見やすく
レイアウト
揃えられるところはすべて揃える
→マイクロソフトのパワポはそろっているか線が入ってくれるので、すぐに改善できます。実際に、その空白で見た目がいいかどうかは、自分の審美眼によるところが大きいですね。空白がどれだけ大きい方がいいか(何%が黄金比なのか)はどの教科書にも書いていませんからね。
センタリングではなく「左揃え」
まとめる(グループ化)
関連のある項目同士を相対的に近づける
→これがぼくが本当に強調してきた、みなさんに実践してほしい二元論の本懐です。言葉と絵を一対一に対応させよと何度も行ってきました。
「グループ化」ではありません。「一対一化」と呼んでください。
長めの文章でもスペースを使ってグループ化
色を使ってグループ化
長めの文章でもスペースを使ってグループ化
余白をとる
重要! スライドの周囲、図の周囲には余白を取る!
→「余白は意味を醸す」でしたね。あるいは、「Deal space with time!」
余裕をもった配置でニアミスを避ける
美しい余白のために、枠と文字は別に作る
→このテクニックは重要です。枠に合わせて汚く配置されて、うまくいかないところ、解決できる。
コントラスト
重要性に応じてコントラストをつける
→言いたいことを最初に書く。前置きを作って、最後に結論を再度強調する。
重要なところは視認性の高い「太い文字」を駆使する
ジャンプ率を高めてコントラストをつける
→面白いブログやスポーツ新聞の表紙で使われている技術です。文字をデカく盛ることで、文章がジャンプする。
小見出しにもコントラスト
→太文字がスマートな気がします。みなさんのノートの場合は太文字よりも「蛍光ペンで塗る」が一番ラクだと思います。
ルールを守れば、読み手は「迷子」にならない
→自分のノートもルールを作りましょう。ぼくのミクロ論理ノートの記事でも紹介した方法ですが、ノートの上部に原因、その下にどんどん結果をつなげていく。左側には分析軸、右側には総合軸を用意する。
→どんなルールでもいいですが、レイアウトの基本は、上から下。左から右です。ぼくはあまり、Z型のジグザグ型は好きじゃありません。汚いからです。

色彩と配色
ごく簡単に色彩の基本知識
→みなさんのノートには、再度の低い蛍光ペンや色鉛筆をおすすめします。春色でポップなノートのほうが、ギトギトの濃い赤と緑しかないノートより見やすくて復習する気が起きます。
背景と文字の色にコントラストをつける
明度が近い色の組み合わせは避ける
必要以上に多くの色を使わない
→ぼくの基本の色は青、赤、緑です。そこに強調するための黄色、紫。

色覚バリアフリー
配色のときに気をつけること
→色覚異常の男性は予想以上に多い。医者にも多いです。
グラフの作成のときに気をつけること
→ひと目でわかるグラフにする。色だけでなく、塗り方のパターンを変えて、色以外の情報も加えることで、さらにどっちがどっちだかわかりやすくする。
背景と文字の明度にコントラストをつける
図と図解

絵や写真の上に文字を配置するときは「袋文字」
グラフは凡例をなくしてより直感的に
図解で複雑な情報をわかりやすく
PowerPointで絵を描く。「フリーフォーム」機能を使う。」

さらに見やすく
明朝体の文章での強調箇所にはゴシック体
コントラストを使って文章・箇条書きの階層をなくす
→太文字を使えば、インデントは必要ない。
タイトルより上に中身を書かない
タイトルや小見出しは左揃え!
背景はできるだけシンプルに

見栄え良く
文字と文章
フォントが印象を決める
数字は大きく、単位は小さく
→図においてのみ許される数字のルール。
1段落目にインデントは必要ない
和文にはなるべく全角の記号を使う
→和文は全角ルール。ぼくが大学生1年生の頃に書いた文章は半角が混じってたりして、かっこわるかったんですよね。コピペすると、その名残があったりして、逐一直すのが面倒です。
カッコはかっこ悪いことがある
→これは新しい技術です。縦棒、四角括弧を利用する。コロンはカッコ悪い。
エクセルのグラフは必ず編集してから使う。「色の変更」「影の除去」「回帰直線の変更」「フォントの種類/サイズの変更」「縦軸の範囲」「軸の色の変更」「マーカーの形の変更」
→勉強になります。こなれた感。シャレオツです。
ひと工夫すれば、表も見栄えよくなる
→よく論文に載っている図です。余計な縦線を消して、情報量を少なくします。読者の解読にかかる負担を減らす。
引き出し線は細く、規則正しく
→シェーマの引出線における「垂直+水平」というルール。初心者が陥りがちなのが、統一感のなさです。フリーハンドな斜め線は視線が泳ぐので、見にくいんですよね。
→これは、拙著のミクロ論理ノートの書き方でも指摘していますが、よくマインドマップで例示される古典的な脳のシナプスを模した全方向に放射した樹形図のような図はよくないということがわかります。
→理由は簡単で、汚いからです。どこになにがかいてあるか直感的にわからない。規則的にマインドマップを描かないと脳の中が整理されないし、直感的じゃないんです。
写真は歪めないで、同じ形にトリミング
→図は均等が良い。

図形と挿絵
重要! 塗りと線の両方に色を付けない!!
異なる種類の図形の併用をなるべく避ける
楕円はなるべく使わない
→ぼくの本で例示したマインドマップの図でもそうですが、言葉を囲うための基本図形は四角です。古典的マインドマップの例示で多用される円は使いません。理由は簡単で、そっちのほうがおさまりがいいからです。
角丸四角の「角」に注意(アールを統一)
角丸四角は下手に歪めない
矢印も下手に変形させるとカッコ悪い
→矢印は基本、細くした方がいいです。太いとカッコ悪い。これはマインドマップノートのところで例示したとおりですが、対象化していませんでした。
矢印をムダに目立たせない
→これも、対象化していませんでしたが、大量のマインドマップを書いているうちに、自然とこの法則通りになっています。矢印はシンプルで直線的がいいんです。無駄に斜めにしたり、強調したり、回転させたりしないほうがいい。煩雑な印象は、記憶にも残りにくい。

レイアウト
丸みをつけ過ぎない&スペースを均等に
文字やオブジェクトに枠を付け過ぎない
パターンを繰り返して統一感を出す

配色
使う色は4色まで。テーマ色を事前に決める。
→これはマインドマップノートにおいて、4色ルールが必要かどうかは謎です。基本、色彩は豊かなほうが印象に残りやすいですが、多すぎると煩瑣になります。いずれにせよ、パワポやポスターでは4色が限界ということです。
彩度の高すぎる標準色は避ける
→ぼくはマインドマップに4色ボールペンを使うので、彩度が高くなってしまいます。自分のノートに関しては、それでこまったことはありません。ボールペンの文字は細いので、彩度が強くないと強調感が足りなくて物足りない感じになるかもしれません。

その他
アイキャッチャーでさらに魅力的に!
→アイキャッチャーとしての漫画キャラクターの利用。マインドマップノートの中に、なぜか漫画のキャラクターを描くと、そのノートが思い出しやすくなります。
おさまりの悪いイラストやグラフは四角で囲う
→なぜか、シェーマは書こうとしっくり来ます。
文字を装飾し過ぎない!
フローチャートを美しく
→なぜかは理由はわかりませんが、フローチャートの矢印は中央につけたいんです。しっくりくるからという漠然とした理由です。
PowerPointのグラフィックをそのまま使わない
→パワポはマインドマップ作成試験ソフトとして全く役に立ちません。かろうじて使えるのは、すでに紹介しているScappleくらいです。
以上です。
他に、実践例として、ポスターとパワポ、レジュメがあります。
この例示に少しいちゃもんをつけます。
ぼくは左に文章、右側に図、グラフの一対一が一番、しっくりくるので、それが統一されていない例示はちょっと気に入りません。
その部分だけ、このページでのちのち、例示したいと思います。
4.科研費取得法
【科研費取得合格法】申請すれば必ず採択される唯一の方法。それはプレゼンに二元論を通底させること。
【科研費取得合格法】必ず申請すれば取得できる唯一の方法。それはプレゼンに二元論を通底させること。
科研費とは?→https://www.jsps.go.jp/j-grantsinaid/24_pamph/data/kakenhi2016.pdf
『全国の大学や研究機関においては、様々な研究活動が行われています。科研費(※)(科学研究費補助金/学術研究助成基金助成金)はこうした研究活動に必要な資金を研究者に助成するしくみの一つで、人文学、社会科学から自然科学までのすべての分野にわたり、基礎から応用までのあらゆる独創的・先駆的な「学術研究」を対象としています。
研究活動には、「研究者が比較的自由に行うもの」、「あらかじめ重点的に取り組む分野や目標を定めてプロジェクトとして行われるもの」 、「具体的な製品開発に結びつけるためのもの」など、様々な形態があります。こうしたすべての研究活動のはじまりは、研究者の自由な発想に基づいて行われる「学術研究」にあります。科研費はすべての研究活動の基盤となる「学術研究」を幅広く支えることにより、科学の発展の種をまき芽を育てる上で、大きな役割を有しています。
科研費制度では、研究者から応募された研究計画について厳正な審査を経て採択を決定し、研究費が助成されることになります。このような制度は「競争的資金制度」と呼ばれています。
科研費は、政府全体の競争的資金の5割以上を占める我が国最大規模の競争的資金制度です。(平成28年度予算額2,273億円)平成27年度には、約10万7千件の新たな応募があり、このうち約3万件が採択されています。すでに採択され、数年間継続している研究課題と含めて、約8万1千件の研究課題を支援しています。』
以上が引用です。
上記リンクを参照していただき研究種目の欄を御覧ください。
ぼくは若手研究Bという項目で初めての申請で合格できました。自分なりにどうしてこれから初めて論文を投稿しようとしている若手の医師が、つまりまったく実績がない若手の医師が研究費を500万のうち300万円もらえたのか、忘れないうちに分析したいと思います。(ぼくの方法論で合格できた二元論ユーザーの医学生のみなさんも、アイデア思いついたら、ぜひ、科研費とってくださいね。)
11万のうちの3万に入れたので、合格率は3割未満くらいですね。
若手研究は20,30代のうちしかチャンスありませんから。
では目次です。
1.科研費を知る。
2.ネタを見つけて、それを解決する方法を考え、それが大きな社会的波及効果があることを証明する。
3.二元論を使って、プレゼンをする。
以下、本文。
1.科研費を知る。
1.1 郡 健二郎教授の本を買う。
まずは、この本を買ってください。
これ以外の本をいくつか読んだのですが、これ以上の本はありませんでした。
郡 健二郎教授はマジリスペクトです。
無自覚でいらっしゃいますが、郡 健二郎教授もまた、強力な二元論マスターです。
ぼくはこれを真似して、そこに二元論を付加してブラッシュアップして書きました。3で改めて書きます。
この本に書いていないことを、ここで書こうと思います。
1.2. 科研費のメリット
まずはモチベーションをあげましょう。
科研費を貰えると、
●研究用の最高スペックパソコンが買える。本も好きなだけ買える。4Kディスプレイに、30万のカスタマイズオーダーパソコン♪
●国際学会、国内学会に自腹を切らずに行ける。
●自分のキャリアアップにつながる。
●ポストを自分で取りにいける。
1.3 若手研究は実績はそんなに関係ないと思う。
ぼくもいろんな上司からグチグチいわれたのですが、『なんの実績もないのに、若手Bは厳しい。どうせ取れない。記念受験だ。』と。(ぼくの職場では否定的なのが8割、中立1割、肯定的1割でした。おまえ、一度も、取ったことねーのに、なんで否定してくんだよ(怒)。)
大ドンデン返しでした。ジャイアントキリング。
なめられた分だけ、そらみたことかという気持ちです。
今までも、過去の申請をみてみると、なんの実績もないひとでも、科研費を取得しています。
申請を採択する先生も、『研究実行能力』を期待して、採択してくれるはずなので、論文を出したことがなかろうが関係ないと思います。
若手研究なんだから、みんなそんなに大した実績ありませんから。
1.4 研究実行能力の評価方法
研究内容(ジ・アイデア)とは別の話で、採択する先生はなにを評価しているか推察します。
●●●●●プレゼンの申請書の二元論性
●●●所属大学、医局の実力、教授の研究能力
●●私立か国立大学か
●論文投稿歴、学会発表実績
2.ネタを見つけて、それを解決する方法を考え、それが大きな社会的波及効果があることを証明する。
2.1.臨床の中で、クリニカルクエッションを編み出す。
得てして、患者さんの苦しみの訴えの中に、自分の中で答えが出ないときに、それを解決したいという大きなモチベーションが生まれるものです。
ぼくが取得したテーマも、患者さんの苦しみを、自分の医学の無力さのモヤモヤ、悔しい気持ちからでてきたものです。
具体的に書いちゃうとネタバレになるので書きません。
2.2 自分の研究が、どれだけ患者を助けるか、医療経済的にいかにベネフィットがあるのか証明する。
研究したいと思っても社会的波及効果がないものには価値がないと思われます。
直接役に立たなくても、間接的に役立つならいいんですけどね。
お金にならないことは、たいして予算はかけられません。
どんなに自分が興味があっても、波及効果がないことは諦めて、さっさと新しいアイデアがないか探すべきだと思います。
2.3 従来のアイデアと何が違うのか、今までの研究は表からばっかり攻めて、裏から攻めてないのではないかという戦略。
「新しさ」こそが、研究の醍醐味です。
誰もやったことがないことを切り拓くことに一番ときめく。
ウカる二元論は
「先行研究の行き詰まりvs行き詰まりの解決」
先行研究をpubemdで調べて読みまくる必要があります。
批判的に先行研究にケチを付けて、だめな研究ばっかりしやがってという気持ちを保つ必要があります。
そのうち、だめなやり方以外の方法を思いつきます。
それが
「表から入れないなら、vs裏から入る」です。
いろんな角度から表のドアを開けようとして失敗しているわけで、裏口を探しに行こうとするひとがいなければチャンスです。
どんな問題にも、かならず、表と裏があることを忘れないでください。
例:
とある立体の体積を調べたい。
表:レーザービームで大きさを測って、3Dモデルを作成し、積分する。力づくでいく。マッチョにいく。努力しまくる。地味にやり続ける。我慢して耐える。金と時間をたっぷりかける。(大企業病、甲子園高校野球的)
裏:水槽に水に入れて、立体を水槽にいれこぼれた水の重さを量る。マッチョなやつが嫌い。スマートにやりたい。なるべく、楽に、早く、効率的に、最速でやりたい。(シリコンバレーベンチャー的)
表から方法にこだわっちゃうひとは、仕事熱心で家に帰らずに、家庭を顧みず、滅私奉公するタイプの研究者が多いと思います。
3.二元論を使って、プレゼンをする。
以下、
郡 健二郎教授の本:
の44ページ以降を御覧いただきながら、読んでください。
3.1. 起承転結で書く。
B-1 研究目的① 概要
最高の論文はAbstractがきれい。
文章だけで、相手の興味を引き込むには二元論が連発されないと無理です。
起 これまで●であると知られていた。(新VS旧)
承 我々は●に着目し、●という発想にいたった。
転 ●を応用し、●が可能となる。
結 ●は通常●なところを、逆に●しており、画期的である。(表VS裏)よって、この方法が実証されれば、社会的波及効果は絶大である。