統計用語の栄枯盛衰
今回もまた,GoogleのNgram Viewerを使って遊んでみようと思います。本当にこのシステムを使うと,アイデアが尽きないですよね。
今回は統計用語です。次の4つの単語が,本の中にどのように登場してくるかについて,少し予想してみてください。
◎「統計的に有意な」statistically significant
◎「相関係数」correlation coefficient
◎「分散分析」analysis of variance
◎「因子分析」factor analysis
さて,それぞれの言い回しがいつごろ英語の本の中に登場してくると予想するでしょうか。また,どのフレーズが早く登場すると思いますか?
グラフを描いてみる
では実際に,4つのフレーズを入力してグラフを描いてみます。
結果は,下のような形になりました。どれも20世紀に入ってからグラフが上がってきている様子がよくわかります。
そして,20世紀前半は,どれも同じように上昇してきていますよね。この時期に統計的な手法が一気に発展してきた様子が想像されます。
でもよくグラフを見ると,相関係数(correlation coefficient)が少しだけ他の分析よりも先行しているように見えます。
それもそうで,相関係数のアイデアは19世紀終わり頃に生まれ,20世紀の初めに確立しました。まさにその様子が,Ngram Viewerのグラフに表れているということです。
グラフの頭打ちと低下
もうひとつ気になるのは,1970年代以降にどのグラフもピークを迎えてその後は低下しているように見えることですよね。
このグラフの変化については,いくつかのことが考えられるのですが,あくまでも検索している本のデータベースが「すべての英語の本」ですので,このような統計用語が書かれている本の割合が相対的に減少すれば,グラフも低下していきます。
もうひとつの考え方は,統計的な分析手法が多様化して,昔からある統計手法の用語が相対的に減少しているように見える,ということでしょうか。
もしかしたらその両方の要素が関与しているかもしれませんし,まったく別の要素が関係しているかもしれません。
ベイズ統計は?
少し気になったので「ベイジアン」(Bayesian)も重ねて表示してみました。すると……
おお,少しだけ,統計用語の栄枯盛衰の様子が見えたような気がしました。
グラフが重なると,そこに何かあるような気がして面白いですよね。
ここから先は
日々是好日・心理学ノート
【最初の月は無料です】毎日更新予定の有料記事を全て読むことができます。このマガジン購入者を対象に順次,過去の有料記事を読むことができるよう…
この記事が参加している募集
この記事が気に入ったらチップで応援してみませんか?