相関係数の公式を忘れた人はこちらへ!相関係数の公式と散布図について

相関係数の求め方データの分析
Photo by Sandy Millar on Unsplash

今回は相関係数について解説します!

こんな人に向けて書いてます!

  • 相関係数の公式を調べている人
  • 共分散について調べている人
スポンサーリンク

1. 相関係数の求め方

今回は、2つのデータを比較することを考えていきます。

2つのデータにどれくらい関係があるのかを測るときに使われるのが次の相関係数です。


相関係数 \(r\) は、

$$-1 \leq r \leq 1$$

を満たします。


\(r\)が1に近いとき、\(x\)と\(y\)には正の相関があるといいます。

これは、\(x\)が増加すると\(y\)も増加することを意味します。


逆に、\(r\)が-1に近いとき、\(x\)と\(y\)には負の相関があるといいます。

このときは、\(x\)が増加すると\(y\)が減少することを意味します。


また、\(r\)は0に近いときは\(x\)と\(y\)には相関がないことを表します。


例題1

次の表は、5人の国語と数学の小テストの点数である。

このとき、国語と数学の点数の相関係数を求めよ。


国語数学
26
77
1010
37
810


 例題1の解説 

わかりやすくするため、国語のデータを\(x\)、数学のデータを\(y\)で表すことにします。


まずは、\(x\)と\(y\)の平均を求めましょう。

すると、

$$\overline{x}=\frac{2+7+10+3+8}{5}=6$$

$$\overline{y}=\frac{6+7+10+7+10}{5}=8$$

となります。


そしたら、次は\(x\)と\(y\)の偏差の2乗\((x-\overline{x})^2,(y-\overline{y})^2\)を求めましょう。

すると、下の表のようになります。

\(x\)\(y\)\(x-6\)\((x-6)^2\)\(y-8\)\((y-8)^2\)
26-416-24
7711-11
101041624
37-39-11
8102424
4614

いちばん下の段は合計です。


そしたら、次は\(x\)と\(y\)の偏差の積\((x-\overline{x})(y-\overline{y})\)を求めましょう。

\(x\)\(y\)\(x-6\)\((x-6)^2\)\(y-8\)\((y-8)^2\)\((x-6)(y-8)\)
26-416-248
7711-11-1
1010416248
37-39-113
81024244
461422


これで必要な値は全て出ました。


あとは、公式に代入すると、相関係数\(r\)は、

$$r=\frac{22}{\sqrt{46}\sqrt{14}}=\frac{11}{\sqrt{161}}\approx 0.867$$

となります。


\(r=0.867\)より、正の相関が強いことがわかります。

(例題終わり)

スポンサーリンク

2. 散布図と相関係数

2つのデータ\(x\),\(y\)を \(x-y\)平面の点として表したものを散布図といいます。

散布図の例
散布図の例


散布図にすることで、2つのデータの相関関係が直感的にわかるようになります。


\(|r|\)が1に近いほど、散布図の点が直線に近くなり、相関関係が強いことがわかります。

3. 共分散と相関係数

2つのデータ\(x,y\)に対して、

$$s_{xy}=\frac{1}{n}\{(x_1-\overline{x})(y_1-\overline{y})+\cdots+(x_n-\overline{x})(y_n-\overline{y})\}$$

を\(x\)と\(y\)の共分散と言います。


この共分散\(s_{xy}\)を用いると、相関係数\(r\)は、

$$r=\frac{s_{xy}}{s_xs_y}$$

と表すことができます。

(\(s_x,s_y\)はそれぞれ\(x,y\)の分散)


共分散\(s_{xy}\)が正のときは、相関係数\(r\)も正となり、

共分散\(s_{xy}\)が負のときは、相関係数\(r\)も負となります。

データの分析数学Ⅰ
スポンサーリンク
OchibaAtsuoをフォローする
ますますmathが好きになる!魔法の数学ノート

コメント

タイトルとURLをコピーしました