![見出し画像](https://assets.st-note.com/production/uploads/images/3919163/rectangle_large_3e165e6b2b47596935325be287029ca5.jpg?width=1200)
LibreOfficeで箱ひげ図(5数要約)
ここでは、四分位範囲と中央値、および最大値・最小値を示す、いわゆる5数要約の箱ひげ図を描くことにします。
まず、データの記述統計量をPSPPで求めておきます。
・[分析]→[記述統計量]→[探索的]を選択。
・[統計]で[記述統計量][パーセンタイル]にチェック。
・[OK]をクリック。
ここで得られた値を、Calcに次のような表を作って入力します。四分位の数値は「テューキーのヒンジ」の25%、50%、75%の値を用います。
------------------------------------------------------------------------------
これはLibreOfficeにデータを入力しておいて、関数を用いて求めてもかまいません。ただし、「テューキーのヒンジ」とは数値が異なる場合があります。
最大値 =QUARTILE($data.B2:B100001,4)
第3四分位 =QUARTILE($data.B2:B100001,3)
中央値 =QUARTILE($data.B2:B100001,2)
第1四分位 =QUARTILE($data.B2:B100001,1)
最小値 =QUARTILE($data.B2:B100001,0)
------------------------------------------------------------------------------
そして、これを元に必要な値を求めます。
上から順番に「最大値-第3四分位」、「第3四分位-中央値」「中央値-第1四分位」「第1四分位」「第1四分位-最小値」です。
「第1四分位」だけがそのままの値で、後は差になっています。
「最大値-第3四分位」から「第1四分位」までを数値を含めて範囲指定し(赤枠の範囲)、[挿入]→[グラフ]で,[縦棒]の[積みあげ]を選択します(横向きの箱ひげ図を作るなら、[横棒]を選択)。
[次へ]で、データ範囲の設定に進み、[行内のデータ系列]にチェックをつけます。
[次へ]で、データ系列の設定に進みます。
この時点では、データ系列は上から「最大値-第3四分位」「第3四分位-中央値」「中央値-第1四分位」「第1四分位」の順に並んでいます。
データ系列を上下逆にします。
これで、棒グラフが逆様になり、箱ひげ図と同じならびになります。
ひげを付ける作業に移ります。
上から二番目の「第3四分位-中央値」のところを選び、右クリックのメニューから[Y誤差範囲を挿入]を選択します。
・[誤差の範囲]で[正]にチェックをつける。
・[誤差の種類]で[セル範囲]にチェックをつける。
・[パラメータ]で[正]のところに「最大値-第3四分位」の数値が入ったセル(ここでは[B11]セル)を指定。
・[OK]をクリック。
これで、上側の「ひげ」ができます。
次に、一番下の「第1四分位」のところを選び、右クリックのメニューから[Y誤差範囲を挿入]を選択します。
・[誤差の範囲]で[負]にチェックをつける。
・[誤差の種類]で[セル範囲]にチェックをつける。
・[パラメータ]で[負]のところに「第1四分位-最小値」の数値が入ったセル(ここでは[B15]セル)を指定。
・[OK]をクリック。
これで、下側の「ひげ」ができます。
次に、不要なところを消していく作業に入ります。
一番上の「最大値-第3四分位」のところを選び、右クリックのメニューから[データ系列の書式]を選択します。
そして「面」で[塗りつぶし]を「なし」にします。
同様に、一番下の「第1四分位」のところを選び、右クリックのメニューから[データ系列の書式]を選択します。
そして「表面」で[塗りつぶし]を「なし」にします。
ひげを付ける作業と、不要な「最大値-第3四分位」「第1四分位」を消す作業は逆でもいいのですが、先に消してしまうと選択しにくくなってしまうので、後から[塗りつぶし]を「なし」にする方が効率的です。
また、最初にグラフを作るときに「最大値-第3四分位」を範囲から省いても、同じグラフを作ることができます。その方が「最大値-第3四分位」を消す必要がないので工程は少ないのですが、含めて作業をすれば、少なくとも最大値のひげが正しい位置にあるかどうかは確認ができるので、ここではあえて含めて作図しています。
最後に、凡例を削除して、「第3四分位-中央値」「中央値-第1四分位」を好みの色にして完成です。ここではシンプルに黒枠と白での塗りつぶしにしています。
なお、「LibreOfficeで箱ひげ図(外れ値付き)」で紹介する散布図を用いた方法を、この5数要約の箱ひげ図に用いることも可能です。