株式会社ロックオン、マーケティングメトリックス研究所の松本です。

これまでにもferretにて、"誰が見ても一瞬で伝わるレポート資料の作り方"をテーマにした折れ線グラフや散布図、ヒストグラム、円グラフについて説明しました。

直感的にデータを把握することができるグラフを活用することで、資料は見違えるように良質に生まれ変わります。今回はあまり聞きなれないものかもしれませんが、ヒストグラム同様にデータのばらつき具合を示すのに用いられる「箱ひげ図」の使い方を紹介します。

参考:
誰が見ても一瞬で伝わるレポート資料の作り方|ferret
誰が見ても一瞬で伝わるレポート資料の作り方折れ線グラフの使い方をマスターする編|ferret
円グラフの使い方をマスターしよう〜誰が見ても一瞬で伝わるレポート資料の作り方|ferret
ヒストグラムを使って誰が見ても一瞬で伝わるレポート資料を作る方法|ferret
  

箱ひげ図とは何を最も伝えたい時に使うのか

箱ひげ図は、ヒストグラムと同じくデータの"散らばり"を表すのに用います。データが満遍なく散らばっているのか、一定範囲に集中しているのか、その偏り具合を表現するのに適しています。

箱ひげ図と言われても、聞き馴染みがないかもしれません。もしかしたら「株価を表すグラフのことですか?」と思い浮かべる方もおられるでしょう。あれはローソク足といって、姿形は似ていますが厳密に言えば違います。

箱ひげ図は、2012年に改訂された新学習指導要領に基づいて、高校数学Ⅰにも登場するようになりました。このコンテンツを読まれている皆さんは習ったことがないかもしれませんが、いずれ社会人として皆さんの勤める会社に入社する新入社員は知っているグラフです。

このコンテンツをキッカケに知って貰えれば幸いです。
  

箱ひげ図の見方について

箱ひげ図は、長方形の箱と、箱からニョキッと伸びる棒(これが”ひげ”です)で構成されています。それぞれに意味と役割を持っています。

8234_001.jpg

長方形の箱の真ん中の線は「中央値」です。データを小さい順(大きい順)に並べた時に、個数で見て真ん中に位置する値を中央値といいます。これが、データの集まりの「中心」を表しています。

箱の両端である「第1四分位」と「第3四分位」は、データを小さい順(大きい順)に並べた時に、個数で見てちょうど4分の1(3)に位置する値を第1(3)四分位といいます。25%目、75%目が「第1四分位」と「第3四分位」なのです。この理屈で、中央値は第2四分位(50%)ともいえます。

最後の「ひげ」の部分、これはデータを小さい順(大きい順)に並べた時に、一番小さい(大きい)データを表しています。「ひげ」の部分からデータが始まり、「ひげ」の部分でデータが終わります。つまり、箱ひげ図とは、データを順番に並べて、始まり、全体の4分の1、4分の2、4分の3、終わりに達した地点にマークをしているだけのグラフなのです。

そして、データの真ん中を表す中央値(4分の2)を中心に、上下にどれくらい「散らばっている」か確認することができます。第1四分位と第3四分位の間(25%〜75%の間)を「四分位範囲」と呼び、この範囲が狭ければ真ん中にデータが集まっていますし、範囲が広ければデータが散らばっていると言えます。

箱ひげ図は、まず中央値と四分位範囲を見ることから始まると言ってもいいでしょう。

ちなみに、箱ひげ図はoffice2016から作成できるようになりました。これまでは直ぐに作れないので世間になかなか浸透しませんでしたが、いよいよ誰もが直ぐに簡単に作れるようになります。