株式会社ロックオン、マーケティングメトリックス研究所の松本です。

以前に「ヒストグラムを使って誰が見ても一瞬で伝わるレポート資料を作る方法」というコンテンツで、ヒストグラムについて紹介をさせていただきました。その結果、多くの方から「こんなグラフがあったのか!」「今まで知らなかった」という反響を聞きました。

そこで今回は、そもそもヒストグラムってどういう経緯で誕生したのか、について解説します。
  

誰が「ヒストグラム」を考え出したのか?

ヒストグラムをいったい誰が考え出したのでしょうか。それは1人のベルギー生まれの天文学者によって生み出されました。アドルフ・ケトレー(1796年〜1874年)といいます。

ケトレーは「ヒストグラム」を生み出した功績よりも、社会学に統計を用いて「平均人」なる概念を創り出したことで知られています。彼はそれ以外を含む様々な功績により「近代統計学の父」とまで呼ばれています。

例えば、ダイエットをしている皆様はBMIという指数をご存じでしょう。体重と身長からヒトの肥満度を表す指数のことで、日本人平均であれば18.5〜25が普通体重と言われています。この指数を生み出したのはケトレーです。このBMI指数は別名でケトレー指数とも呼ばれるくらいです。

ケトレーとはどのような人物だったのでしょうか。なぜヒストグラムは誕生したのでしょうか。調べてみました。
  

近代統計学の父・ケトレーが発見した「社会の中の規則性」

1796年に生まれたケトレーは、1819年に円錐曲線理論に関する数学の研究の功績により博士号を授与され、1820年には王立科学アカデミーのメンバーに選ばれました。

当時、数学の応用分野として、天文学は「王道」の選択でした。ケトレーも学者として天文学を選択するのですが、研究分野を充実させるために、1823年には政府に天文台の創設を提案しています。

それが認められ、世界最古の天文台があることで知られるパリへの視察を命じられます。当時ケトレーは27歳で、数学の領域で流行っていた「確率論」を知り、その応用としての統計学にも手を広げる機会を得ます。

天文台自体は1828年にブリュッセルに完成します(実際には1832年まで建設が遅れたそうですが)。この天文台がかの有名なベルギー王立天文台です。

当時の政府から天文台が完成するまでの間、政府統計の調査を手伝えと言われたこともあり、様々な統計事業に取り組みました。この仕事が、ケトレーを「近代統計学の父」とまで言わしめるキッカケとなりました。

ケトレーは政府の期待に応え幾つかの成果を上げると、それらをまとめて「人間とその能力の発展について」という本を刊行しました。この本に「平均人」が登場します。ちなみに原著は下記で紹介されています。

参考:
Sur l'homme et le développement de ses facultés : ou, Essai de physique sociale

ケトレーが「平均人」を考えるようになったのは、天文学がキッカケでした。政府の仕事を手伝うようになって多くの政府統計のデータに触れたケトレーは、天文学の世界における観測に起因する「誤差」を、人間にも当てはめることができるのではないか、と考えるようになります。

当時、天文測定には空気の状態や観測する人間のミスなどで若干の誤差が含まれていました。そうした誤差の調整に統計学が用いられていましたが、同じように人の行動(特徴)にも、そうした多少の誤差が現れるのではないか。もし、その誤差を取り除くと、あらゆる行動の中心を司る人間が現れるのではないか?という大胆な仮説でした。

ケトレーは本の中で、それまでの政府統計のデータ(フランスにおける犯罪統計、イギリスにおけるセーヌ川での自殺の手段別死亡表、オランダにおけるアムステルダムでの死産・出生数表など)を用いて「規則性」「法則」を発見しようと挑戦します。

その結果、例えば身長などのデータをヒストグラムで作成すると、左右対称の釣り鐘型の正規分布になることを発見し、中央の値に注目するようになったのです。この「中心」に位置する(正規分布の中央に当該する)人間を「平均人」と表しました。そして、そこから結婚、犯罪、自殺など社会における人間の行動の規則性を説明しようとしたのです。

いわばヒストグラムは、その事実を表すために開発されたわかりやすく表現するための手段でした。

001.jpg
図:「人間とその能力の発展について」の巻末に掲載されたヒストグラムの原型
  

自らの意志で行動しているのに、皆と同じ結果になってしまう

1人ひとりは自ら意志を持って行動しているけれども、統計データで見てみると規則性が見られる。誰だって"何か社会的な背景があるのではないか"と考えるでしょう。一歩間違えれば「人間は自分の意志で行動しているようでいて、何者かに操られている」という言説にすり替わりかねない「人間とその能力の発展について」は、大反響を呼びました。

ビッグデータとも呼べるデータが無い時代、集計してみると人間の行動には傾向があるとわかったこと自体が大発見でした。ケトレーのすごいところは、それを「神の意志」で片付けずに、数学的に研究を続けたことにあります。

1844年には、10万人分のフランス軍の徴兵検査のデータを手に入れ、徴兵のための最低身長ギリギリ手前を申告している人間が大勢いて、約2,000人は虚偽申告していることを発見しています。

002.jpg

2年後の1846年には、「エジンバラ・メディカル・ジャーナル」に掲載された論文から「5732人のスコットランド兵の胸囲」のデータをもってきて、そのデータが40インチ弱を中心に正規分布していることを論文に記しています。

003.jpg

ケトレーは社会における「法則」や「規則」を見付けるのに躍起になる一方で、各国を跨る統計データの不備や、そもそものメトリクスの違いに気付きます。

そこで1853年にはブリュッセルにて、ケトレー自身の発案による第1回国際統計会議が開催され、初代会長に就任します。ケトレーはその場で、統計データの利用頻度を上げるために、データの処理手順の国際共通化や長さや重さなどの単位の統一化が重要であると説きました。

今の時代にも言える話ですよね。データの取得方法が違えば、精度も信頼性も大きく影響します。データは大事ですが、どうやって精度の高いデータを取得するかも同じくらい大事です。

ちなみに、彼の姿勢に感銘を受けた1人のイギリス人統計学者がいます。ナイチンゲールです。彼女は衛生データの統一基準に心を砕いており、言うことを全く聞かないイギリス当局に嫌気がさしてすらいました。ケトレーの登場は彼女にとって「よくぞ言ってくれました!」という百人力を得たような心境でしょう。

彼女はこれをキッカケに反転攻勢に出て、その成果を第4回国際統計会議で発表するのですが、それはまた別のお話。
  

誰がヒストグラムと命名したのか?

ケトレー自身はヒストグラムに、ついぞ「ヒストグラム」という名前を付けることはありませんでした。命名者は別にいます。カール・ピアソン(1857年〜1936年)です。

彼自身は数学者、統計学者としての顔よりも、社会主義者、および人種差別主義者としての顔のほうが有名かもしれません。優生学という「生物の遺伝構造を改良することで社会をもっとよくする」というトンデモ学問です。ナチスの反ユダヤ人政策も、この優生学をベースにしています。

ただしピアソンは死の直前、「ユダヤ人ー異邦人関係について(On Jewish-Gentile Relationship)」という論文を発表しています。その中で、世界中のユダヤ人の身体測定データを分析して、ナチスの唱える人種理論は全くのお門違いだし、アーリア人種が優れているという説もトンデモだと強く非難していることは殆ど知られていません…。
  

まとめ - ヒストグラムの語源と誕生の経緯 -

ピアソンが名付けたヒストグラムの語源は「histos gramma」と言われています。直訳すると、「全て直立に描いたもの」にでもなるでしょうか。

ピアソンが受け持っていた「Maps and Chartograms(地図と図表)」という授業の中で「common form of graphical representation(一般的な形式のグラフィック表現)」として用いられるとして紹介されたという記録が残っています。

それまで名前は無かったものの、正規分布とセットで用いられるグラフだったので、やはり「呼び名」は必要だったのでしょう。

今回のように「グラフの考案者と命名者が違う」という事例は多くあります。散布図やヒートマップなども、考案者と命名者が違うグラフとして有名ですが、それはまた別のお話になります。

●ヒストグラムはこうして生まれた

ヒストグラムは「近代統計学の父」とも評され、「平均人」なる概念を考案したアドルフ・ケトレーによって生み出された。

ケトレーは正規分布の中央に位置する人間を「平均人」と表現して、結婚、犯罪、自殺など社会における人間の行動の規則性を説明した。ヒストグラムは、その事実を表すために開発された、分かりやすく表現するための手段だった。

開発当初は名前も無かったが、後にカール・ピアソンがヒストグラムと命名した。