【高校数学Ⅰ】4-1-4 相関関係|要点まとめ
このページでは、高校数学Ⅰの「相関関係」について解説しています。相関図の読み取り方、相関係数の定義と計算方法、さらに仮説検定の基本的な考え方を整理しました。基礎から応用まで段階的に学べる内容で、定期テスト対策や大学入試の統計分野の準備にも役立ちます。
相関図の見方と特徴
【相関図】
\(2\)つの変量の値の組を座標平面上の点で表したものを相関図という。
【相関関係】
\(2\)つの変量\(x,y\)について、一方の値が大きくなると他方の値も大きくなる傾向があるとき、正の相関関係があるという。
\(2\)つの変量\(x,y\)について、一方の値が大きくなると他方の値は小さくなる傾向があるとき、負の相関関係があるという。
\(2\)つの変量\(x,y\)について、正・負いずれの傾向が見られないとき、相関関係がないという。
【例題】次のような\(2\)つの変量\(x,y\)からなるデータがある。相関を答えなさい。
| \(x\) | 1 | 3 | 5 | 6 | 8 | 6 | 3 | 2 |
| \(y\) | 3 | 4 | 4 | 6 | 9 | 7 | 3 | 4 |
正の相関がある。
| \(x\) | 5 | 3 | 1 | 4 | 8 | 6 | 3 | 2 |
| \(y\) | 3 | 5 | 8 | 6 | 1 | 2 | 7 | 9 |
負の相関がある。
相関係数の定義と計算方法
【共分散】
偏差の積\((x-\bar{x})(y-\bar{y})\)の平均値を\(x\)と\(y\)の共分散といい、\(s_{xy}\)で表す。
共分散\(=\)偏差の積の平均値
【相関係数】
\(x\)の標準偏差\(s_x\)と\(y\)の標準偏差\(s_y\)の積\(s_xs_y\)で共分散\(s_{xy}\)を割った値を相関係数といい、\(r\)で表す。
相関係数\(\displaystyle =\frac{xとyの共分散}{(xの標準偏差)\times(yの標準偏差)}\)
\(\displaystyle r=\frac{s_{xy}}{s_xs_y}\)
相関係数\(r\)のとり得る値の範囲は\(-1\leqq r\leqq1\)であることが知られている。\(r\)の値から次のような相関関係があるといえる。
(1)\(r\)が\(1\)に近い値であるほど、正の相関関係が強い。
(2)\(r\)が\(-1\)に近い値であるほど、負の相関関係が強い。
(3)\(r\)が\(0\)に近い値であるほど、相関関係が弱い。
| \(x\) | 9 | 6 | 2 | 5 | 8 | 6 |
| \(y\) | 5 | 2 | 7 | 4 | 4 | 8 |
\(\displaystyle \bar{x^2}=\frac{1}{6}(9^2+6^2+2^2+5^2+8^2+6^2)\)
\(\displaystyle \ \ \ =\frac{246}{6}\)
\(\ \ \ =41\)
\(x\)の平均値は
\(\displaystyle \bar{x}=\frac{1}{6}(9+6+2+5+8+6)\)
\(\displaystyle \ \ =\frac{36}{6}\)
\(\ \ =6\)
標準偏差\(S_x\)は
\(\displaystyle S_x=\sqrt{41-6^2}\)
\(\ \ \ =\sqrt{5}\)
\(y^2\)の平均値は
\(\displaystyle \bar{y^2}=\frac{1}{6}(5^2+2^2+7^2+4^2+4^2+8^2)\)
\(\displaystyle \ \ \ =\frac{174}{6}\)
\(\ \ \ =29\)
\(y\)の平均値は
\(\displaystyle \bar{y}=\frac{1}{6}(5+2+7+4+4+8)\)
\(\displaystyle \ \ =\frac{30}{6}\)
\(\ \ =5\)
標準偏差\(S_y\)は
\(\displaystyle S_y=\sqrt{29-5^2}\)
\(\ \ \ =\sqrt{4}\)
\(\ \ \ =2\)
\(x\)の偏差は\(3,0,-4,-1,2,0\)
\(y\)の偏差は\(0,-3,2,-1,-1,3\)
偏差の積は\(0,0,-8,1,-2,0\)
共分散\(S_{xy}\)は
\(\displaystyle S_{xy}=\frac{0+0-8+1-2+0}{6}\)
\(\ \ \ \ \ =-1.5\)
よって、相関係数\(r\)は
\(\displaystyle r=\frac{-1.5}{2\sqrt{5}}\)
\(\displaystyle \ \ =\frac{-1.5\sqrt{5}}{10}\)
\(\ \ =-0.15\times2.23\)
\(\ \ =-0.34\)
仮説検定の基本的な考え方
【仮説検定】
得られたデータをもとにある仮説を立て、それが正しいかどうかを判断する手法を仮説検定という。
・仮説検定の手順
(1)正しいかどうか判断したい主張に対して、その主張に反する仮説を立てる。
(2)基準となる確率を定める。また、得られたデータが仮説のもとでどの程度の確率で起こるか求め、それらを比較する。
(3-1)基準となる確率より得られたデータが起こる確率の方が小さくなるとき、仮説が正しくなかったと判断する。
(3-2)基準となる確率より得られたデータが起こる確率の方が大きくなるとき、仮説は正しいとも正しくないとも判断できない。
【例題】同じ位の速さで走るAさん、Bさんがいる。この\(2\)人が競争すると、いつも接線になり勝敗も五分五分だった。あるときAさんはシューズを変え、それから\(15\)回の競争は\(12\)勝\(3\)敗である。
このことからAさんはシューズによって速くなったと判断してよいか仮説検定の考え方を用い基準となる確率を\(0.05\)として考察しなさい。
ただし、コイン\(15\)枚を投げ表が出た枚数を記録する実験を\(1000\)回繰り返した所、以下のようになった。考察にはこの結果を用いなさい。
| 表の枚数 | 度数 |
|---|---|
| 0 | 0 |
| 1 | 1 |
| 2 | 1 |
| 3 | 21 |
| 4 | 40 |
| 5 | 96 |
| 6 | 167 |
| 7 | 205 |
| 8 | 186 |
| 9 | 142 |
| 10 | 83 |
| 11 | 40 |
| 12 | 13 |
| 13 | 4 |
| 14 | 0 |
| 15 | 1 |
| 合計 | 1000 |
\(\displaystyle \frac{13+4+0+1}{1000}=0.018\)
と考えられる。これは0.05より小さいことから、仮説は正しくなかったと考えられる。
よって、Aさんはシューズによって速くなったと判断してよい。