四分位数の求め方/箱ひげ図の見方・書き方

四分位数と箱ひげ図データの分析
Photo by Sarah Hughes on Unsplash

今回は、四分位数と箱ひげ図についてまとめます。

こんな人に向けて書いてます!

  • 四分位数の求め方がわからない人
  • 四分位範囲や四分位偏差が何が調べている人
  • 箱ひげ図の見方や書き方がわからない人
スポンサーリンク

1. 四分位数

四分位数とは?

データを小さい順に並べて4等分する位置にある値四分位数といいます。


4等分する位置は3箇所あるので、小さい方から順に、第一四分位数第二四分位数第三四分位数と呼びます。

第一、第二、第三四分位数を、順に\(Q_1\)、\(Q_2\)、\(Q_3\)と表します。


ちなみに、第二四分位数\(Q_2\)は4等分した2番目なので、ちょうど真ん中にあります。

そのため、第二四分位数\(Q_2\)は中央値に等しいです。


また、中央値のときと同様に、四等分する境界が数と数の間にあるときは、それらの平均値を四分位数とします。


四分位数の求め方

例として、次のデータの四分位数を求めましょう。

例題1

次のデータの四分位数を求めよ。

83 , 69 , 54 , 76 , 95 , 73 , 93 , 78 , 84 , 54


 例題1の解説 

まずは、データを小さい順に並べましょう。

すると、次のようになります。

54 , 54 , 69 , 73 , 76 , 78 , 83 , 84 , 93 , 95


そしたら、最初に第二四分位数\(Q_2\)、すなわち中央値を求めます。

中央値がわからない人は、下の記事を読んでみてください。


今回は76と78の間が真ん中なので、中央値はこれらの平均をとって77となります。

よって、第二四分位数\(Q_2\)は77です。


そしたら、この中央値を境にして、上半分と下半分に分けます。

54 , 54 , 69 , 73 , 76 | 78 , 83 , 84 , 93 , 95

データの個数が奇数で、中央値が直接定まるときは、その中央値は上半分と下半分のどちらにも含めません。


第一四分位数\(Q_1\)は下半分の中央値になります。

つまり、下半分の中で中央値を求めれば、それが第一四分位数\(Q_1\)になります。


同様に、上半分の中で中央値を求めれば、それが第三四分位数\(Q_3\)になります。


今回の例だと、下半分は

54 , 54 , 69 , 73 , 76

なので、この中で中央値を求めると69です。

よって、第一四分位数\(Q_1\)は69になります。


同様に、下半分は

78 , 83 , 84 , 93 , 95

なので、第三四分位数\(Q_3\)は84になります。

(例題終わり)


四分位範囲と四分位偏差

第三四分位数\(Q_3\)と第一四分位数\(Q_1\)の差を四分位範囲といい、

四分位範囲を2で割ったものを四分位偏差と言います。


つまり、

四分位範囲:\(Q_3-Q_1\)
四分位偏差:\(\displaystyle\frac{Q_3-Q_1}{2}\)

となります。


先ほどの例題1では、\(Q_1=69\) , \(Q_3=84\)だったので、

四分位範囲は、

$$Q_3-Q_1=84-69=15$$

であり、四分位偏差は、

$$\frac{Q_3-Q_1}{2}=\frac{15}{2}=7.5$$

となります。


スポンサーリンク

2. 箱ひげ図

データの散らばりを直感的にわかりやすくするために、箱ひげ図と呼ばれる図を利用することがあります。


箱ひげ図では、最小値・最大値・四分位数を次のように表します。


箱髭図は、データがどのように散らばっているのかがわかりやすく、複数のデータの比較がしやすくなります。


例として、例題1のデータを箱ひげ図に表すと下のようになります。

54 , 54 , 69 , 73 , 76 , 78 , 83 , 84 , 93 , 95

データの分析数学Ⅰ
スポンサーリンク
OchibaAtsuoをフォローする
ますますmathが好きになる!魔法の数学ノート

コメント

タイトルとURLをコピーしました