マガジンのカバー画像

Rによる二次的データの分析

51
社会的データについてRStudioを使ってグラフを作成したり統計学的分析をおこないます。
運営しているクリエイター

#カイ2乗検定

Rをつかう単純な計算のための備忘録

 Rを使い始めた頃に参照していたものの1つは『データ解析環境「R」』(工学社発行)という本であった。著者は、舟尾暢男・高浪洋平の2氏。本に書き込みをしながら読んだ。有意義な本であった。  まず、その本に書き込んだメモを見ながら、Rの使い方を復習してみようと思う。そうすることで、しばらく使わないでいたあとにまごつかないようにすることができるだろう。  別の本(注)も、昔真剣に取り組んだことがある。その本の巻末に「補遺 RとS-PLUSの備忘録」というものがあり、これも復習してみ

『データサイエンスのための統計学入門』と「say」

 「カイ二乗検定:リサンプリング方式」の項目を読んでみた。  訳書129ページに、リサンプリングのアルゴリズムの説明(注1)の中で、1から3までのステップがあり、4番目に「2から3のステップを1,000回繰り返す」とある。なぜ1,000回なのかと疑問に思った。その回数にどのような意味があるのかと思って英文を確認してみると、「say」という単語が省略されて訳されてることがわかった。  「2から3のステップを、たとえば、1,000回繰り返す」ということであった。  訳書の次の

中間桁における0から9までの数字の頻度が実験データ捏造の証拠となるか?

カイ2乗検定(chi-square test)

グラフのコードの出所: グラフのスクリプト imanishi$Digit <- factor(imanishi$Digit)graph <- ggplot(imanishi, aes(x=Digit, y=Frequency)) + geom_bar(stat='identity') + theme_bw()graph カイ2乗検定の結果: library(ggplot2)x <- seq(0, +180, 0.1)dens <- data.frame(x=x,