2020年8月24日月曜日

クロス集計表の作り方

  

クロス集計表とは,縦軸と横軸でクロスする表でデータを集計したものです。

 

アンケートなどで得られたデータをまとめるときに用います。

 

例えば,「あなたは旅行が好きですか?」という質問に対するクロス集計です。

 

調べたいのは,どの年代が旅行好きの人が多いかです。

表頭

表側

年齢

はい

いいえ

どちら

でもない

合計

2029

25

12

5

42

59.5%

28.6%

11.9%

3039

30

7

3

40

75.0%

17.5%

7.5%

4049

42

12

15

69

60.9%

17.4%

21.7%

5059

23

45

3

71

32.4%

63.4%

4.2%

60

32

32

12

76

42.1%

42.1%

15.8%


横列のパーセントは,行パーセント

縦列のパーセントは,列パーセント

「年齢」の部分は,表側頭

 

といいます。

 

横と縦の呼び方は,エクセルと同じですね。

 

調査の目的の「どの年代が旅行好きの人が多いか」は,この表をざっと見た感じでは,3039歳が最も多そうに見えます。

 

しかし,実際にはそうではないかもしれないので,χ(かい)二乗検定といった方法を用いて調べなければなりません。

 

それでは,今日の問題です。

 

29回・問題88 量的調査におけるデータの集計方法に関する次の記述のうち,正しいものを1つ選びなさい。

1 クロス集計表において,セルの度数の比が全ての行で等しい場合,そのクロス集計表の2変数間には関連がない。

2 クロス集計表において,2変数間の関連をみる場合,行パーセント,列パーセントのどちらを示しても,得られる情報に変わりはない。

3 クロス集計表では,2変数間の関連をみることができるが,3変数以上の関連についてみることはできない。

4 度数分布表における相対度数とは,度数を合計した値を各カテゴリーの値で割って算出したものである。

5 連続変数では,値が連続的に変化するため,度数分布表を作成することができない。

 

この問題は,

否定形が4つ

肯定形が1つ

の問題です。

 

こういったばらつきのあるものは,ばらついたものの中に答えがあることが多い傾向にありますが,この問題はそうはなっていません。

 

ちゃんと問題文を読まなければ答えられない問題ですね。手抜きはできません。

 

まずは,唯一の肯定形の選択肢です。

4 度数分布表における相対度数とは,度数を合計した値を各カテゴリーの値で割って算出したものである。

 

「相対度数」という言葉で焦ってはいけません。

簡単に言えば割合です。

 

落ち着いて読めば,「度数を合計した値を各カテゴリーの値で割って」ではなく,「各カテゴリーの値を度数を合計した値で割って」です。

 

上の表で言えば


60

32

32

12

76

42.1%

42.1%

15.8%


下のパーセントは,3276で割ったものとなっています。

合計した値を度数で割ると,2.375というおかしな数字が出てきてしまいます。

 

それでは解説です。

 

1 クロス集計表において,セルの度数の比が全ての行で等しい場合,そのクロス集計表の2変数間には関連がない。

 

これが正解です。

上の表ではいろいろな数値が得られましたが,すべて同じ数値でそろった場合は,「あなたは旅行が好きですか?」という仮説は成り立たないことになります。

 

2 クロス集計表において,2変数間の関連をみる場合,行パーセント,列パーセントのどちらを示しても,得られる情報に変わりはない。

 

上の費用では,行パーセントは,答えの割合を示しています。

列パーセントは,年代同士で比較しています。

 

見ているものが異なります。

 

3 クロス集計表では,2変数間の関連をみることができるが,3変数以上の関連についてみることはできない。

 

上の表では2変数しかありませんが,3変数以上の関連もみることができます。

 

例えば,性別,旅行先などです。

 

5 連続変数では,値が連続的に変化するため,度数分布表を作成することができない。

 

上の表では,名義尺度の度数を表にまとめています。

 

値が連続的に変化する間隔尺度や比例尺度では,データを区切って度数を表にまとめます。

 

例えば,間隔尺度では,09℃,1019℃,2029℃,3039℃といった感じです。

比例尺度では,6069点,7079点,8089点,9099点といった感じです。

 

このように区切ることをカテゴリー化といいます。

 

名義尺度と順序尺度は,実はもともとカテゴリー化されているデータです。

 

上の表では,10歳ごとに区切っていますが,それを1歳ごとにしてもやっぱりカテゴリー化されたデータです。

30歳と言っても30歳1か月,30歳2か月,など様々な30歳がありますが,それを30歳としてまとめています。

最新の記事

子ども・子育て支援法

  子ども・子育て支援法は,これまでにも出題されてきましたが,正式に出題基準に含まれたのは,第37回国家試験です。 子ども・子育て支援制度は,市町村が実施主体になっています。 支給申請は,市町村に対して行います。 児童福祉法には,入所系があるので都道府県の役割がありますが,子ども...

過去一週間でよく読まれている記事