「社会調査の基礎」が苦手な人の中には,統計の知識がないと答えられない,と思っている人もいるのではないでしょうか。
しかし,決してそんなことはありません。
統計の知識ゼロでも何とかなります。
国家試験が積み重なるたびに,出題ポイントは明確になります。
もし,とんでもなく難しい問題が出題されたら,ほとんどの受験生は解けないので,恐れることはありません。
今回は,ピアソンの積率相関係数を取り上げます。
ピアソンという文字を見るだけでいやになる人もいるではないでしょうか。
ピアソン以外にも相関を調べるものはありますが,国家試験で出題されているのは,ピアソンだけです。
これは何をするものかと言えば,2つの変数に関連があるかを調べるものです。
例えば,勉強時間と国家試験の得点に関連があるかを調べる際に用います。
勉強時間が長くなるにつれて,国家試験の得点が上がるのは,「正の相関」
勉強時間が長くなるにつれて,国家試験の得点が下がるのは,「負の相関」
正の相関を示すとき,最も強い相関がある場合の相関係数は「1」
負の相関を示すとき,最も強い相関がある場合の相関係数は「-1」
つまり,相関係数の範囲は「-1から1」ということになります。
分布をグラフ(散布図)に表した場合,相関が強いほうが直線的になります。
相関が弱くなるにつれて,直線があいまいとなり,相関がなくなるとバラバラに分布します。
これを「円を描く」と表現されることがあります。
相関がありそうだからといって,それをもって因果関係があるとは言えません。
ピアソンの積率相関係数が示すのは,あくまでも相関の強さ弱さです。
勉強時間が長くなるにつれて,国家試験の得点が上がることの要素の中には,大学のサポート体制,使用する参考書,はたまたこの「学習部屋」に訪れる頻度も影響しているかもしれません。
それはさておき・・・ピアソンの積率相関係数が出題されるときは,
測定単位が変わっても係数は変わらない
ということが必ず出題されています。
測定単位が変わるとは,例えば,「時間」ではなく「分」にするといったことです。
このように書けば,「当たり前だ」と思うでしょう。
国試の難易度は,こんなものです。
仕組みを理解していれば,決して難しくありません。
それでは,今日の問題です。
第28回・問題87 ピアソンの積率相関係数に関する次の記述のうち,正しいものを1つ選びなさい。
1 値は0から1の範囲の間で変動する。
2 2つの変数の因果関係を表すものである。
3 年齢と所得の相関係数は,所得が円単位でもドル単位でも同じ値になる。
4 2つの変数の間に完全な相関がある場合,散布図は円形になる。
5 2つの順序変数の関連の強さを測る指標である。
正解はすぐわかりますね。
3 年齢と所得の相関係数は,所得が円単位でもドル単位でも同じ値になる。
測定単位が変わっても,係数の値は変わりません。
それでは,ほかの選択肢も見てみます。
1 値は0から1の範囲の間で変動する。
相関係数の範囲は,-1から1です。
なぜこのようになるかといえば,その範囲になるように,ピアソンが工夫したからです。
2 2つの変数の因果関係を表すものである。
ピアソンの積率相関係数が示すのは,2つの変数の相関の強さ弱さです。
相関がありそうだから,因果関係があるとは単純には言えるものではありません。
4 2つの変数の間に完全な相関がある場合,散布図は円形になる。
2つの変数の間に完全な相関がある場合,グラフは直線を描きます。
円形,つまりバラバラになるのは,相関が認められない場合です。
5 2つの順序変数の関連の強さを測る指標である。
ピアソンの積率相関係数は,連続したデータである間隔尺度,あるいは比例尺度で得られたデータ(定量的データ)の関連を調べるものです。
名義尺度や順序尺度で得られた定性的データの関連を調べる場合は,カイ二乗検定などが用いられます。
<今日の一言>
クロス集計表の関連を見るのに,ピアソンの積率相関係数は使えません。
なぜなら,クロス集計表は,データをカテゴリー化した定性的データを集計したものだからです。
定性的データ(代表はクロス集計表)の関連を調べるには,カイ二乗検定を用いる
定量的データの関連を調べるのは,ピアソンの積率相関係数を用いる
と覚えましょう。