クロス集計表とは,縦軸と横軸でクロスする表でデータを集計したものです。
アンケートなどで得られたデータをまとめるときに用います。
例えば,「あなたは旅行が好きですか?」という質問に対するクロス集計です。
調べたいのは,どの年代が旅行好きの人が多いかです。
表頭 |
|||||
表側 |
年齢 |
はい |
いいえ |
どちら でもない |
合計 |
20~29 |
25 |
12 |
5 |
42 |
|
59.5% |
28.6% |
11.9% |
|||
30~39 |
30 |
7 |
3 |
40 |
|
75.0% |
17.5% |
7.5% |
|||
40~49 |
42 |
12 |
15 |
69 |
|
60.9% |
17.4% |
21.7% |
|||
50~59 |
23 |
45 |
3 |
71 |
|
32.4% |
63.4% |
4.2% |
|||
60~ |
32 |
32 |
12 |
76 |
|
42.1% |
42.1% |
15.8% |
横列のパーセントは,行パーセント
縦列のパーセントは,列パーセント
「年齢」の部分は,表側頭
といいます。
横と縦の呼び方は,エクセルと同じですね。
調査の目的の「どの年代が旅行好きの人が多いか」は,この表をざっと見た感じでは,30~39歳が最も多そうに見えます。
しかし,実際にはそうではないかもしれないので,χ(かい)二乗検定といった方法を用いて調べなければなりません。
それでは,今日の問題です。
第29回・問題88 量的調査におけるデータの集計方法に関する次の記述のうち,正しいものを1つ選びなさい。
1 クロス集計表において,セルの度数の比が全ての行で等しい場合,そのクロス集計表の2変数間には関連がない。
2 クロス集計表において,2変数間の関連をみる場合,行パーセント,列パーセントのどちらを示しても,得られる情報に変わりはない。
3 クロス集計表では,2変数間の関連をみることができるが,3変数以上の関連についてみることはできない。
4 度数分布表における相対度数とは,度数を合計した値を各カテゴリーの値で割って算出したものである。
5 連続変数では,値が連続的に変化するため,度数分布表を作成することができない。
この問題は,
否定形が4つ
肯定形が1つ
の問題です。
こういったばらつきのあるものは,ばらついたものの中に答えがあることが多い傾向にありますが,この問題はそうはなっていません。
ちゃんと問題文を読まなければ答えられない問題ですね。手抜きはできません。
まずは,唯一の肯定形の選択肢です。
4 度数分布表における相対度数とは,度数を合計した値を各カテゴリーの値で割って算出したものである。
「相対度数」という言葉で焦ってはいけません。
簡単に言えば割合です。
落ち着いて読めば,「度数を合計した値を各カテゴリーの値で割って」ではなく,「各カテゴリーの値を度数を合計した値で割って」です。
上の表で言えば
60~ |
32 |
32 |
12 |
76 |
42.1% |
42.1% |
15.8% |
下のパーセントは,32を76で割ったものとなっています。
合計した値を度数で割ると,2.375というおかしな数字が出てきてしまいます。
それでは解説です。
1 クロス集計表において,セルの度数の比が全ての行で等しい場合,そのクロス集計表の2変数間には関連がない。
これが正解です。
上の表ではいろいろな数値が得られましたが,すべて同じ数値でそろった場合は,「あなたは旅行が好きですか?」という仮説は成り立たないことになります。
2 クロス集計表において,2変数間の関連をみる場合,行パーセント,列パーセントのどちらを示しても,得られる情報に変わりはない。
上の費用では,行パーセントは,答えの割合を示しています。
列パーセントは,年代同士で比較しています。
見ているものが異なります。
3 クロス集計表では,2変数間の関連をみることができるが,3変数以上の関連についてみることはできない。
上の表では2変数しかありませんが,3変数以上の関連もみることができます。
例えば,性別,旅行先などです。
5 連続変数では,値が連続的に変化するため,度数分布表を作成することができない。
上の表では,名義尺度の度数を表にまとめています。
値が連続的に変化する間隔尺度や比例尺度では,データを区切って度数を表にまとめます。
例えば,間隔尺度では,0~9℃,10~19℃,20~29℃,30~39℃といった感じです。
比例尺度では,60~69点,70~79点,80~89点,90~99点といった感じです。
このように区切ることをカテゴリー化といいます。
名義尺度と順序尺度は,実はもともとカテゴリー化されているデータです。
上の表では,10歳ごとに区切っていますが,それを1歳ごとにしてもやっぱりカテゴリー化されたデータです。
30歳と言っても30歳1か月,30歳2か月,など様々な30歳がありますが,それを30歳としてまとめています。