ヒストグラムは形によって正常に計測されているかを判断できる

ヒストグラムはその形によって、データの計測に異常がある場合すぐにわかるという特徴があります。それぞれグラフの形には名前も付けられているので、ここで紹介しておきましょう。

1.左右対称型

01.jpg

計測数のピークを中心に左右へと下降していく山なりのグラフができていれば、計測が正常に行われている証拠です。

たとえば30代をターゲットにしたサービスを展開したとして、ピークは30代。その前後の年代はそれより少し下がり、30代から離れていくほど下がっていくのが普通です。40代で需要が下がったのに50代には需要があるということは、あまり考えられないでしょう。こういった理由から、ヒストグラムはピークを中心にした左右対称型が一番正常だといえます。

2.離れ小島型

02.jpg

ピークとは別の少し離れた位置にもうひとつ盛り上がりがある形が、離れ小島型です。

ヒストグラムがこの形になっている場合、統計時になにか別のデータが混入していることがあります。製品の製造過程の記録などでこの形が出た場合は、データの誤りではなく、何かしらの原因で特定のミスが繰り返されている可能性もあるでしょう。

3.ふたつ山型

03.jpg

左右にピークが別れ、ふたつの山を形成するようなヒストグラムをふたつ山型といいます。この形になった場合、グラフ作成時に2種類のデータが混入してしまっていることが考えられます。本来は別々でカウントする項目だということに担当者が気付いていないこともあるでしょう。

4.くし歯型

04.jpg

くし歯型は隣り合った区間の縦幅がバラバラで、ちぐはぐになったヒストグラムのことを表します。こういった形状になる場合は、区間の設定が狭すぎるか、データの絶対数が少なすぎることが多いです。

区間を設定し直すか、データを集め直すことで正常な統計を出すことができます。

5.絶壁型

05.jpg

絶壁型は左右のどちらかにピークがあり、ピークから右、もしくは左に低い値がずっと続くのが特徴です。絶壁型なる場合、数値が低い区間になんらかの制限が設けられている可能性があります。

Excel(エクセル)を使って解りやすい「ヒストグラム」を作る

今まで散々、エクセルで作成するグラフの仕上がりを指摘してきましたが、ヒストグラムはそもそもエクセルのグラフ作成機能では作成できません。
分析ツールで作成する必要がありますが、ツール自体が有効になっていない人も多いと思われるので、まずは設定しましょう。

[ファイル]メニューの[オプション]をクリックし、表示されたウィンドウの[アドイン]を選択します。

[管理]の中で[Excel アドイン]を選択し、[設定]を選択します。

4.jpg

有効なアドインを選択する画面が表示されるので、[分析ツール]のチェックボックスを有効にして、[OK]を選択します。

あとは、[データ]タブに[データ分析]という項目が表示されていれば問題ありません。

それででは、ヒストグラムを実際に作ってみましょう。
さきほどのネットショップのデータを参考にします。

まずは横軸の区間を決めます。さきほどと同じく5歳区切りにしましょう。
まず、年齢の横に、区間を記載します。

5.jpg

次に、[データ分析]を選択して、複数ある項目の中から[ヒストグラム]を選択します。

すると以下の画面が表示されるので、入力範囲は[age列]、データ区間は作成した5歳区切りを選択します。

6.jpg

最後に、[グラフ作成]にチェックを入れて[OK]を選択すれば、グラフの完成です。

7.jpg

分布表と、グラフが表示されましたが、このままだと棒グラフです。(現在開発中のWindowsではヒストグラムが表示されるという話も聞きます)

このままではヒストグラムとは言えませんので、不要な部分は削除、改めるべき部分は修正してしまいましょう。

削除しよう

1 :補助線は不要
2 :グラフを囲う枠線は不要
3 :グラデーションや影などは不要(3Dは「論外」です)
4 :タイトル、軸タイトルは不要
5 :「次の級」は不要

変更しよう

1 :棒の感覚を「0%」にしましょう。棒グラフ同士をくっつける意味があります(棒を右クリックして[データ系列の書式設定]を選択し、[要素の間隔]を0%にします)
2 :階級幅は、1点でなく2点間を表現するようにしましょう(”24”ではなく、”20~24”と追記する)
3 :項目名のフォントは「メイリオ」+「UI」を使いましょう(※このフォントが一番見やすいです)
4 :項目名のフォントサイズは大きくしましょう(12~14が理想です)
5 :グラフの色も解りやすくしましょう

このような修正を施すことで、以下のような、見やすい「ヒストグラム」に変身しました。

8.jpg

データの理解を助ける要素以外は全て排除することで、グラフは最も伝わりやすくなります。