「ドットプロット」って、聞いたことありますか?
Cover Photo by Алекс Арцибашев on Unsplash
6年生D領域(1)再掲
ドットプロット
前回に続いて6年生のD領域(1)を見ていきます。知識・技能の(イ)に「度数分布を表す表やグラフ」とあります。統計学の教科書でほとんど必ず登場するのは、度数分布表、ヒストグラム、パレート図などですが、パレート図は指導要領には登場しません。そのかわりに、「ドットプロット」というグラフが扱われています。
「ドットプロット」って、聞いたことありますか? こんなのです。
Wikipediaには、「ドットプロット」の見出しがあり、日本語版には「書きかけ」と断りがあります。
日本語版の方では、ドットプロットは2種類あり、1つは「標本の個数(度数分布)を示すもの」、もう1つは「個数でなく各対象のデータを縦軸に示すもの。一種の散布図」とあります。
英語版でも、2つの異なるバージョンがあるとしていますが、日本語版とは内容がかなり異なります。1つは「手書きのグラフで使用されていたもの(used in hand-drawn (pre-computer era) graphs to depict distributions)」で、もう一つは「William S. Clevelandが棒グラフの代わりとして説明したもの(described by William S. Cleveland as an alternative to the bar chart)」だとしています。
指導要領「解説」での使い方は、簡易のヒストグラムといったもので、横軸は離散的な量的変数の各値をとる、といった理解のようにみえます。
いずれにしても、度数が大きいと実用に耐えませんし、横軸が連続変数の場合にも使えません。主に、統計初学者用のツールと捉えてよいように思います。当然のことながら、すべての●印は同じ大きさで、なおかつ、描画する高さがそろってないといけません。(描くのけっこう面倒な気がしますが…)
(「解説」の小学校1年生のところで、動物の数を比較するという活動の説明がありましたが、そこでは、動物の本来の大きさを無視して、すべてを、つまりゾウもネズミも同じ大きさにして、縦に積み上げた絵をかいて、その「高さ」を比べないといけない、というように書かれていました。そのことを思い出すと、どうしてここで●印を積み上げたグラフに回帰する?と思ってしまうのですが、ドットプロットを採用する何か深い理由が、ほかにあるのかもしれません。)
平均値と中央値と最頻値の関係
ドットプロットの例に戻ります。プロットの中に、平均値、中央値、最頻値がそれぞれどの値であるかが記されています。
教科書でどこまでつっこんで指導するかはわかりませんが、「解説」では、外れ値があるときは平均値を代表値とするのは望ましくない場合があることに触れていますし、中学校では分布の多峰性についても指導するようになっています。指導要領としては、6年生段階である程度教えておくべきだという考えがあるのでしょう。
演習問題
Excelの使い方の練習です。次の度数分布表を「ドットプロット」に描いてください。どんな描き方をしてもかまいませんが、データを変更したら、ドットプロットも自動的に変更されるようにしておくには、どうしたらよいかを考えてください。