![見出し画像](https://assets.st-note.com/production/uploads/images/84756757/rectangle_large_type_2_b8c827fd72dcb931015de73e76be63e1.png?width=1200)
Photo by
masaru12
SQLで度数分布表を作るときのための階級数の目安を知るスタージェス公式を計算する方法(BigQuery編)
そもそも度数分布表って?
例えば学校のテストで
0-20点、20-40点、40-60点、60-80点、80-100点
の5つの階級に分けてその人数を集計したような表のことを言います
階級って?
0-20点、20-40点、40-60点、60-80点、80-100点
これが階級です。
今回適当に5つの階級に分けましたが、
では何かの売り上げ表に対してはどんな階級付けが望ましいのでしょうか?
適当につけるっていっても、そのテキトーのあたりさえつかないと悩んじゃいますよね。
そこで「スタージェスの公式」をつかって大体の明安階級を付けます。
1+log2n
スタージェスの公式は「1+log2n」で求められます。
logは対数を求める関数です。
ExcelにもGoogleスプレットシートにも存在する関数なので
まず表計算ソフトで理解してみたい方は
コチラのサイトを参考にしてみてください。
この公式に当てはめた場合
テストの点が60通りの点数があり、それをどの程度の階級に当てはめるのがいいかは、ExcelおよびGoogleスプレットシートだと
=1+LOG(50,2)
となります。答えは「6.64385619」6か7くらいで分けるといいってことですね。最終的な判断は人間が下すのであくまで「目安」とするといいともいます。
ここから先は
402字
¥ 100
期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる
Amazonギフトカード5,000円分が当たる
この記事が気に入ったらチップで応援してみませんか?