自社でアンケートや調査を行った場合、どのような集計方法を選択するかによってデータの見え方は変わってきます。

データを集計する際、主に「単純集計」と「クロス集計」の2つの手法が使われます。
数値をカウントするだけの「単純集計」だけでなく、複数のデータを掛け合わせて分析する「クロス集計」も理解しておけば、データをより有効活用できるでしょう。

今回は、データ分析に使える「クロス集計」について解説します。

単純集計とクロス集計

単純集計とは

例えば、アンケートに4つの項目を設置した場合、項目ごとの回答数を集計することを「単純集計」と呼びます。GT(Grand Total)とも呼ばれます。
アンケートや調査を行ったことで得られたデータ数を明らかにするためのもので、どのような分析をするにしろ必ず最初に行われます。

クロス集計とは

クロス集計は、複数のデータをかけ合わせて集計する方法です。

例えば、自社ユーザーに向けて開発中の新商品に関するアンケートを行い、興味の度合いを調査したとします。
そのデータに対し、「どの年代が一番興味を持っているのか」を調べたい場合は以下のように集計します。

興味がある どちらでもない 興味がない
10代 70% 15% 15%
20代 50% 30% 20%
30代 30% 40% 30%

「年代」と「年代別の回答割合」を見ると、「興味がある」と回答した割合が最も高いのが10代であり、年代が上がるにつれて「興味がある」割合が低くなっていることがわかります。
ここから、「新商品は若年層に受け入れられる可能性が高い」ことがわかります。
ターゲットが明確になったため、発売までによりターゲットに適した状態に改善することができるでしょう。

ちなみに、上記のような表を「クロス集計表」と呼びます。

10代の中でも男性と女性どちらかの関心が高いのか、小学生・中学生・高校生・大学生でわけるとどうかなど、さらに項目をかけ合わせて集計するとよりターゲット像が明確になります。
3つ以上のデータを掛け合わせた集計は「多重クロス」と呼ばれます。

3項目を掛け合わせるものを「三重クロス」、4項目を掛け合わせたものを「四重クロス」といいます。

クロス集計表を作るには?

では、実際にクロス集計表を作る場合はどのような手順を踏めばいいのでしょうか。

クロス集計には、ExcelやGoogleスプレッドシートの機能である「ピボットテーブル」を利用します。

Excelでクロス集計を行う場合

Excelでクロス集計を行う際には、まずはデータとして使いたい表を「表のタイトルも含めて」範囲選択を行います。

その後、挿入のタブから「ピボットテーブル」を選択します。

ピボットテーブルの作成ウィンドウが表示されますので、選択した表の範囲が間違っていないかを確認しつつ、どこにピボットテーブルを作成するかを選択します。
なお、新規のワークシートに作成する場合は、何も変更しなくて問題ありません。

すると側(エクセルでいう行)と頭(エクセルでいう列)にどの項目(データ区分)を当てはめていくかを選択する状態になります。

ここまでくれば当てはめたい項目をマウスでドラッグするだけでクロス集計表が完成していきます。

以上のような手順で表が出来るのですが、作成をする際にはどのような点に注意すべきなのでしょうか。

Googleスプレッドシートでクロス集計を行う場合

Googleスプレッドシートで作成する場合も、Excelとほぼ同じ手順で行えます。
Googleのアンケート作成ツールである「Googleフォーム」を使うと自動的にスプレッドシートに回答結果が反映されるので、そのままピボットテーブルを組めばクロス集計を行えます。