相関図
【相関関係】
\(2\)つの変量\(x,y\)について、一方の値が大きくなると他方の値も大きくなる傾向があるとき、正の相関関係があるという。
【例題】次のような\(2\)つの変量\(x,y\)からなるデータがある。相関を答えなさい。
(1)
\(x\) | 1 | 3 | 5 | 6 | 8 | 6 | 3 | 2 |
\(y\) | 3 | 4 | 4 | 6 | 9 | 7 | 3 | 4 |
正の相関がある。
(2)
\(x\) | 5 | 3 | 1 | 4 | 8 | 6 | 3 | 2 |
\(y\) | 3 | 5 | 8 | 6 | 1 | 2 | 7 | 9 |
負の相関がある。
相関係数
【共分散】
【相関係数】
\(x\)の標準偏差\(s_x\)と\(y\)の標準偏差\(s_y\)の積\(s_xs_y\)で共分散\(s_{xy}\)を割った値を相関係数といい、\(r\)で表す。
標準偏差\(\displaystyle =\frac{xとyの共分散}{(xの標準偏差)\times(yの標準偏差)}\)
\(\displaystyle r=\frac{s_{xy}}{s_xs_y}\)
相関係数\(r\)のとり得る値の範囲は\(-1\leqq r\leqq1\)であることが知られている。\(r\)の値から次のような相関関係があるといえる。
(1)\(r\)が\(1\)に近い値であるほど、正の相関関係が強い。
(2)\(r\)が\(-1\)に近い値であるほど、負の相関関係が強い。
(3)\(r\)が\(0\)に近い値であるほど、相関関係が弱い。
【例題】次のデータの相関係数を求めなさい。
\(x\) | 9 | 6 | 2 | 5 | 8 | 6 |
\(y\) | 5 | 2 | 7 | 4 | 4 | 8 |
\(x^2\)の平均値は
\(\displaystyle \bar{x^2}=\frac{1}{6}(9^2+6^2+2^2+5^2+8^2+6^2)\)
\(\displaystyle \ \ \ =\frac{246}{6}\)
\(\ \ \ =41\)
\(x\)の平均値は
\(\displaystyle \bar{x}=\frac{1}{6}(9+6+2+5+8+6)\)
\(\displaystyle \ \ =\frac{36}{6}\)
\(\ \ =6\)
標準偏差\(S_x\)は
\(\displaystyle S_x=\sqrt{41-6^2}\)
\(\ \ \ =\sqrt{5}\)
\(y^2\)の平均値は
\(\displaystyle \bar{y^2}=\frac{1}{6}(5^2+2^2+7^2+4^2+4^2+8^2)\)
\(\displaystyle \ \ \ =\frac{174}{6}\)
\(\ \ \ =29\)
\(y\)の平均値は
\(\displaystyle \bar{y}=\frac{1}{6}(5+2+7+4+4+8)\)
\(\displaystyle \ \ =\frac{30}{6}\)
\(\ \ =5\)
標準偏差\(S_y\)は
\(\displaystyle S_y=\sqrt{29-5^2}\)
\(\ \ \ =\sqrt{4}\)
\(\ \ \ =2\)
\(x\)の偏差は\(3,0,-4,-1,2,0\)
\(y\)の偏差は\(0,-3,2,-1,-1,3\)
偏差の積は\(0,0,-8,1,-2,0\)
共分散\(S_{xy}\)は
\(\displaystyle S_{xy}=\frac{0+0-8+1-2+0}{6}\)
\(\ \ \ \ \ =-1.5\)
よって、相関係数\(r\)は
\(\displaystyle r=\frac{-1.5}{2\sqrt{5}}\)
\(\displaystyle \ \ =\frac{-1.5\sqrt{5}}{10}\)
\(\ \ =-0.15\times2.23\)
\(\ \ =-0.34\)
仮説検定の考え方
【仮説検定】
得られたデータをもとにある仮説を立て、それが正しいかどうかを判断する手法を仮説検定という。
・仮説検定の手順
(1)正しいかどうか判断したい主張に対して、その主張に反する仮説を立てる。
(2)基準となる確率を定める。また、得られたデータが仮説のもとでどの程度の確率で起こるか求め、それらを比較する。
(3-1)基準となる確率より得られたデータが起こる確率の方が小さくなるとき、仮説が正しくなかったと判断する。
(3-2)基準となる確率より得られたデータが起こる確率の方が大きくなるとき、仮説は正しいとも正しくないとも判断できない。
【例題】同じ位の速さで走るAさん、Bさんがいる。この2人が競争すると、いつも接線になる勝敗も五分五分だった。あるときAさんはシューズを変え、それから15回の競争は12勝3敗である。
このことからAさんはシューズによって速くなったと判断してよいか仮説検定の考え方を用い基準となる確率を\(0.05\)として考察しなさい。
ただし、コイン\(15\)枚を投げ表が出た枚数を記録する実験を\(1000\)回繰り返した所、以下のようになった。考察にはこの結果を用いなさい。
表の枚数 | 度数 |
0 | 0 |
1 | 1 |
2 | 1 |
3 | 21 |
4 | 40 |
5 | 96 |
6 | 167 |
7 | 205 |
8 | 186 |
9 | 142 |
10 | 83 |
11 | 40 |
12 | 13 |
13 | 4 |
14 | 0 |
15 | 1 |
合計 | 1000 |
正しいかどうか判断したい主張を「Aさんはシューズによって速くなった。」とし、その主張に反する仮説を「シューズを変えた後も勝敗は五分五分である」とする。
コイン投げの結果から1000回中12枚以上出た確率は
\(\displaystyle \frac{13+4+0+1}{1000}=0.018\)
と考えられる。これは0.05より小さいことから、仮説は正しくなかったと考えられる。
よって、Aさんはシューズによって速くなったと判断してよい。