[本]The Science of Science 第1章
書誌情報
Wang, D., & Barabási, A.-L. (2021). The Science of Science. Cambridge University Press.
僕が知る中でScience of Science(科学計量学)が一番まとまった本です。今年、日本語訳がでるそうですが卒論で必要なので買いました。
https://note.com/scisci/n/na4e9c01fa8fe
Preprint版は以下から無料で読めます(今のところ、内容に差はなさそう)。
著者情報
WungはScinece of Scienceの第一人者でNatureやScienceにめっちゃ投稿してます(かっこいい)。実際、google scholar上で確認できる限り、彼の引用数が最も大きな論文のタイトルは"Science of Science"です。
以下のものを今後、読めたらと思っています。
https://www.science.org/doi/10.1126/science.abe3084
共著者のBarabasiはネットワーク科学の人です。こちらも大家です。
1節 Productivity of a Scientist
・論文数の指標としての問題:
e.g.)
・歴史は年2だが、化学は年10くらい
・CSは会議、人文は本、ほかはジャーナル投稿など分野間の成果の単位が異なる
・論文の出版数も著者数も指数関数的に伸びているが、(論文数)/(著者数)≒2くらいで停滞→共著が増えている
・論文数と著者の数は対数正規分布になる(Nが大きくないとΓ=〜2のべき分布に)→出版までのハードルが難易度のパラメーターになっていることで説明できる
*対数正規分布は以下の導出がわかりやすかった。
https://bme.sakura.ne.jp/sblo_files/worktips/image/20151004_LND.pdf
・生産力と知名度は対応する→院生や助成金にも影響(*逆の因果は?)
2節 h-index
・h-indexはtに関して単調増加
・自己引用でhを稼ぐ(IF稼ぎのジャーナルと似ている)
・h-indexは将来のh-indexや将来の引用数を予測できる
・firstかどうか(hα-index:共著者の中で一番hが多いもののみをカウント)、分野間の違い、などなどの限界
3節 Mathew effect
・Double blind(査読者も投稿者もお互いの情報をしらない) vs Single blind(査読者だけが相手の情報を知っている)で比較した結果、有名な(その学会に3本以上投稿したことある)人の方が採択されやすかった
・ランダマイズされた実験でも確認されたので、著者の実力とは関係ない
・ちなみにdoubleのみにすると査読が厳しくなるらしい
・boosting impact:引用数がある閾値を超えまでは、なかなか引用数が伸びないが、閾値を超えると線形で増えていく→preference attachment に切り替わる
・将来の引用数だけでなく、過去に投稿した論文の引用数も伸びる。しかも、分野関係なくても。*Youtuberとかと同じやん
↓
①受賞者と受賞候補者を特定
②受賞以前の論文の引用数の伸びを比較(受賞による資本の変化の影響を受けてない=質は変わってない)
③受賞者は受賞以前の論文の引用も伸びる
・wikipediaの編集者を利用して因果関係も同定済み
・厳密な統制をかけるとそこまで効果が見れれない
→地位がパフォーマンスに与える影響を推定するための標準的なアプローチは、その真の影響を過大評価している可能性が高いが、名誉ある科学者は自身の出力に対するより多くの認識を得ることができるというさらなるサポートが提供される。
4節 Age and scientific achievement
・どの分野でも大体30-40代が最盛期になりがち、-19はいない
→トレーニング期間が大事(e.g.戦争の影響があった世代)
(ノーベル賞と発明家がほとんど被ってないのに、分布は同じ)
・上昇は急で、下降はなだらか
→能力が衰えたわけではなく、社会的存在としてやることが増えた
・分野が原因ではない
・概念(理論)家か実験(実証)家か:前者の方が若くして受賞
・新語=新しいアイデアと見なして、若い研究者と年食った研究者を比較
→若い研究者の方が新しいことに挑戦
*Max Planckのパラダイム論的な話は面白いが、実証は不十分?=Goliath's shadow effect
5節 Random Impact Rule
・random impact rule:生産性が高いときに、インパクトの高い研究がランダムに生じる。not 若いときに創造性がある but 若いときは試行回数が多いから ”あたり”を引きやすい
→前節の若いほど~の主張と異なるように見えるが、要は「すべての仕事を同じ生産性でやっていたら年齢関係なく成功する」ってだけであって、その生産性が若いときは高いから前節の結果になっているってこと
・起業家は年取ってる方がいい
6節 The Q-Factor
・Random-model(r)では引用数の予測ができない
→研究遂行能力(Q)と出版数(N)をパラメーターに加えるといい感じにフィットする
・Qスコアが疑問:e**<logC10.i>だけど、被引用数の平均みたいなもので、研究遂行能力(Q)を測っていいのかと感じた。それだと、やっぱ初期にホームラン打った人と、コンスタントにヒット打っている人の差がでないんじゃね。logとっているからいい気もするけど。
・上位ジャーナルだけ vs 上位ジャーナル+下位ジャーナルのCVだと前者の方が評価が高い
→この現実は、平均を取るQが正確に反映できる(hも別に悪くない)
7節 Hot Stream
・hot stream:激アツ状態みたなもの
・同時確率/独立に起こる確率で連ちゃんで起こるか分かる→hot streamは存在
・80-90%ぐらいの人はみな経験するが、68%が一回だけだし、科学者は長続きしない(3-4年)