株式会社ロックオンマーケティングメトリックス研究所の松本です。

前回は、「散布図」について説明しました。頻繁に使うグラフではありませんが、直感的に「繋がり」を把握することのできる良いグラフです。今回は、「ヒストグラム」の使い方を開設します。

ヒストグラムの使い方は?

ヒストグラムは、ある項目の「散らばり」を表すのに用います。項目の分布を感覚的に把握することができる非常に優れたグラフですが、今まで紹介した「棒グラフ」「円グラフ」「折れ線グラフ」「散布図」と比べると、あまり普及していないので、ピンときていない方も多いのではないでしょうか。

ヒストグラムを見れば、異常値の発見や、データの集中度合いがわかります。
例えば、あるネットショップで商品を購入したユーザーのうち、年齢の分布にどのような傾向が現れているかを把握したいときはヒストグラムを使います。

1.jpg
30代後半にユーザーが集中していること、60代以上は殆ど無いことがわかります。

このヒストグラムは見る人によっては「棒グラフじゃない?」と思われるかもしれませんので、試しに上のヒストグラムを棒グラフで作成してみました。

2.jpg

棒グラフの場合は棒同士が離れていますが、ヒストグラムの場合は棒同士がくっついています。
たったそれだけの違いに見えますが、これが大きな違いになります。

おさらいになりますが、棒グラフは複数の項目を比較するために用いています。
上のグラフの場合、30代後半とその他の項目を比較することで、30代後半が購入者の多くを占めていることがわかります。

つまり「独立」した項目同士を比較するのが棒グラフになります。
複数ある項目の中で、1つの棒グラフだけ表示しても、逆に複数の棒グラフを表示しなくても意味があります。

いっぽうで独立しておらず、「連続」しているのがヒストグラムになります。
ある1つの項目の内訳を任意の区間で区切っているだけですから、特定の区間だけ表示しても、逆に複数の区間を表示しなくても意味がありません。

つまりヒストグラムは、ある項目の内訳を横(階級)と縦(度数)の長方形の面積で表現しているのです。棒の横幅がデータを区切る区間、縦幅は区間内に含まれる数を表します。このように表現することで、どの年齢層に人数が集中しているか、どの年齢層は人数が少ないか、人数の散らばり具合がわかりやすのです。

慣れれば、ヒストグラムを使って全体の傾向を一瞬で把握できます。例えば、以下の図を見比べてください。散らばりの大きさ小ささ、左右の偏りを瞬時に判断できます。

3.jpg

ヒストグラムの使い方は、順を追えばそんなに難しいことでもありません。ある項目の「散らばりを表現」するならヒストグラム、と覚えてください。