分散・標準偏差の求め方/偏差値の算出方法

分散・標準偏差の求め方データの分析
Photo by Nick Rickert on Unsplash

今回は分散と標準偏差について解説します!

こんな人に向けて書いてます!

  • 分散や標準偏差の求め方がわからない人
  • 偏差値について詳しく知りたい人
スポンサーリンク

1. 分散と標準偏差

ある\(n\)個のデータ\(x_1,x_2,\cdots,x_n\)の平均を\(\overline{x}\)とします。


このとき、

$$s^2=\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2\}$$

で定まる\(s^2\)を分散といいます。



また、\(x_1-\overline{x}\) , \(x_2-\overline{x}\) , \(\cdots\) , \(x_n-\overline{x}\)のことを偏差といいます。


つまり、分散とは偏差の2乗の平均値ということができます。



さらに、分散\(s^2\)の正の平方根\(s\)を標準偏差といいます。


式で表すと、

$$s=\sqrt{\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2\}}$$

となります。


ちなみに、分散や標準偏差はデータの散らばりの度合いを表します。


分散や標準偏差が大きければ大きいほど、データの値が平均値から離れたところに多いことを表しています。

分散\(\displaystyle s^2\)\(\displaystyle=\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2\}\)

標準偏差\(\displaystyle s\)\(\displaystyle=\sqrt{\frac{1}{n}\{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\cdots+(x_n-\overline{x})^2\}}\)


例題1

次のデータは5人の数学の小テストの点数です。

このデータの分散を求めよ。

9 , 8 , 8 , 9 , 6


 例題1の解説 

分散を求めるためには、まず平均を求める必要があります。

平均の求め方は別の記事で解説しているので、そちらをご参照ください。


このデータの平均\(\overline{x}=8\)となります。

そしたら、各データ\(x\)に対して、\((x-\overline{x})^2\)を求めましょう。

\(x\)\(x-8\)\((x-8)^2\)
911
800
800
911
6-24

そしたら、\((x-8)^2\)の平均を求めましょう。

すると、

$$\frac{1+0+0+1+4}{5}=1.2$$

となるので、分散\(s^2=1.2\)となります。

(例題終わり)



また、分散は次の式でも求めることができます。


分散の公式

データ\(x\)の分散を\(s^2\)とすると、

$$s^2=\overline{x^2}-(\, \overline{x} \,)^2$$


この方法で例題1の分散を求めてみましょう。

\(x\)\(x^2\)
981
864
864
981
636


\(x\)の平均\(\overline{x}=8\)なので、\((\, \overline{x} \,)^2=64\)です。


また、\(x^2\)の平均\(\overline{x^2}\)は、

$$\frac{81+64+64+81+36}{5}=65.2$$

となります。


よって、分散は、

$$s^2=65.2-64=1.2$$

となり、ちゃんと答えが一致していますね。

スポンサーリンク

2. 偏差値とは

模試の成績でよく用いられているのが偏差値です。

では、偏差値とはなんなのでしょうか。


偏差値とは次のように定義されます。

偏差値

\(n\)個のデータ \(x_1,x_2,\cdots,x_n\)の平均を \(\overline{x}\) , 標準偏差を \(s\) とするとき、

\(\displaystyle z_i=50+10\times\frac{x_1-\overline{x}}{s}\)

(\(i=1,2,\cdots,n\))

を\(x_i\)の偏差値と呼ぶ。


このとき、偏差値\(z_1,z_2,\cdots,z_n\)の平均\(\overline{z}\)は、

$$\overline{z}=50$$

となります。


なので、偏差値が50ということは、得点がちょうど平均であることを表します。

偏差値が50より大きくなればなるほど、平均よりも上位にあることを表しています。


偏差値の目安として、55を超えると上位31%程度、60を超えると上位16%程度になります。


このように、偏差値は自分の大体の順位を知るための指標として使われます。

データの分析数学Ⅰ
スポンサーリンク
OchibaAtsuoをフォローする
ますますmathが好きになる!魔法の数学ノート

コメント

タイトルとURLをコピーしました