2020年8月24日月曜日

クロス集計表の作り方

  

クロス集計表とは,縦軸と横軸でクロスする表でデータを集計したものです。

 

アンケートなどで得られたデータをまとめるときに用います。

 

例えば,「あなたは旅行が好きですか?」という質問に対するクロス集計です。

 

調べたいのは,どの年代が旅行好きの人が多いかです。

表頭

表側

年齢

はい

いいえ

どちら

でもない

合計

2029

25

12

5

42

59.5%

28.6%

11.9%

3039

30

7

3

40

75.0%

17.5%

7.5%

4049

42

12

15

69

60.9%

17.4%

21.7%

5059

23

45

3

71

32.4%

63.4%

4.2%

60

32

32

12

76

42.1%

42.1%

15.8%


横列のパーセントは,行パーセント

縦列のパーセントは,列パーセント

「年齢」の部分は,表側頭

 

といいます。

 

横と縦の呼び方は,エクセルと同じですね。

 

調査の目的の「どの年代が旅行好きの人が多いか」は,この表をざっと見た感じでは,3039歳が最も多そうに見えます。

 

しかし,実際にはそうではないかもしれないので,χ(かい)二乗検定といった方法を用いて調べなければなりません。

 

それでは,今日の問題です。

 

29回・問題88 量的調査におけるデータの集計方法に関する次の記述のうち,正しいものを1つ選びなさい。

1 クロス集計表において,セルの度数の比が全ての行で等しい場合,そのクロス集計表の2変数間には関連がない。

2 クロス集計表において,2変数間の関連をみる場合,行パーセント,列パーセントのどちらを示しても,得られる情報に変わりはない。

3 クロス集計表では,2変数間の関連をみることができるが,3変数以上の関連についてみることはできない。

4 度数分布表における相対度数とは,度数を合計した値を各カテゴリーの値で割って算出したものである。

5 連続変数では,値が連続的に変化するため,度数分布表を作成することができない。

 

この問題は,

否定形が4つ

肯定形が1つ

の問題です。

 

こういったばらつきのあるものは,ばらついたものの中に答えがあることが多い傾向にありますが,この問題はそうはなっていません。

 

ちゃんと問題文を読まなければ答えられない問題ですね。手抜きはできません。

 

まずは,唯一の肯定形の選択肢です。

4 度数分布表における相対度数とは,度数を合計した値を各カテゴリーの値で割って算出したものである。

 

「相対度数」という言葉で焦ってはいけません。

簡単に言えば割合です。

 

落ち着いて読めば,「度数を合計した値を各カテゴリーの値で割って」ではなく,「各カテゴリーの値を度数を合計した値で割って」です。

 

上の表で言えば


60

32

32

12

76

42.1%

42.1%

15.8%


下のパーセントは,3276で割ったものとなっています。

合計した値を度数で割ると,2.375というおかしな数字が出てきてしまいます。

 

それでは解説です。

 

1 クロス集計表において,セルの度数の比が全ての行で等しい場合,そのクロス集計表の2変数間には関連がない。

 

これが正解です。

上の表ではいろいろな数値が得られましたが,すべて同じ数値でそろった場合は,「あなたは旅行が好きですか?」という仮説は成り立たないことになります。

 

2 クロス集計表において,2変数間の関連をみる場合,行パーセント,列パーセントのどちらを示しても,得られる情報に変わりはない。

 

上の費用では,行パーセントは,答えの割合を示しています。

列パーセントは,年代同士で比較しています。

 

見ているものが異なります。

 

3 クロス集計表では,2変数間の関連をみることができるが,3変数以上の関連についてみることはできない。

 

上の表では2変数しかありませんが,3変数以上の関連もみることができます。

 

例えば,性別,旅行先などです。

 

5 連続変数では,値が連続的に変化するため,度数分布表を作成することができない。

 

上の表では,名義尺度の度数を表にまとめています。

 

値が連続的に変化する間隔尺度や比例尺度では,データを区切って度数を表にまとめます。

 

例えば,間隔尺度では,09℃,1019℃,2029℃,3039℃といった感じです。

比例尺度では,6069点,7079点,8089点,9099点といった感じです。

 

このように区切ることをカテゴリー化といいます。

 

名義尺度と順序尺度は,実はもともとカテゴリー化されているデータです。

 

上の表では,10歳ごとに区切っていますが,それを1歳ごとにしてもやっぱりカテゴリー化されたデータです。

30歳と言っても30歳1か月,30歳2か月,など様々な30歳がありますが,それを30歳としてまとめています。

最新の記事

ノーマライゼーションの国家試験問題

 今回は,ノーマライゼーションに取り組みます。 前説なしで,今日の問題です。 第26回・問題93 ノーマライゼーションの理念に関する次の記述のうち,正しいものを1つ選びなさい。 1 すべての人間とすべての国とが達成すべき共通の基準を宣言した世界人権宣言の理念として採用された。 2...

過去一週間でよく読まれている記事