「近年の犯罪者はみんなゲームをやっている。だから犯罪の原因はゲームにある」

こんな論説をニュースや新聞で見たことはありませんか?
この論説では「ゲームをやる人の割合が社会的に増えている」という現象を見逃しています。
つまり、ゲームが犯罪の原因になっているのではなく、ゲームが普及したことで犯罪者の中でもゲームをやったことのある人の割合が増えていると言えるでしょう。

こういったデータの読み間違いは「相関関係」と「因果関係」を混同してしまっていることが原因です。
今回は、相関関係・因果関係の違いと混同しがちな事例を解説します。
間違ったデータ分析を行わないためにも、この機会に2つの違いをおさえておきましょう。

相関関係とは

相関関係の意味は、広辞苑で以下のように解説されています。

一方が他方との関係を離れては意味をなさないようなものの間の関係。

例えば「父と子」「右と左」「上と下」は片方を軸として説明されている概念であり、相関関係があるでしょう。
また、数学の世界では相関関係とは「一方が増加する時、他方が増加もしくは現象する傾向が認められるという二つの量の関係」とされています。

つまり相関関係とは、AとBの事柄になんらかの関連性があるものを表しているでしょう。

例えば「時間の経過」と「空に浮かぶ太陽の位置」には相関関係があります。
朝には東の低い空にあった太陽は、時間の経過と共に南から西へと移動していくでしょう。
しかし、この2つの事柄に因果関係はありません。

因果関係とは

では、因果関係とはなんでしょうか。
広辞苑において因果関係とは「原因とそれによって生ずる結果との関係」とされています。

わかりやすいものでいうと、仏教の教えにある「因果応報」という言葉があるでしょう。
これは、過去に行った所業によって現在の身にあらゆる事柄が起こるという考え方です。

つまり、因果関係とは、Aを原因としてBが変動することを指します。
先ほどの例を出して言うと「時間の経過」と「空に浮かぶ太陽の位置」に因果関係はありません。

なぜなら、時間を原因として太陽が動いているわけではないからです。
もし地球が自転を止めて、時間がいくら経過しても空に浮かぶ太陽の位置が変わることはありません。

スクリーンショット_2017-03-17_13.52.23.png

「相関関係」の中でも、原因と結果を表しているものだけが「因果関係」として表記されます。つまり、相関関係は必ずしも因果関係とはなりません。

参考:
[「相関関係」と「因果関係」の違いを理解すれば根拠のない通説にだまされなくなる!]
(http://diamond.jp/articles/-/102692)
小学館『精選版日本国語大辞典』
岩波書店『広辞苑第六版』

相関関係を因果関係と誤読してしまう理由

相関関係と因果関係を誤読してしまうのは、データ上では同様のものとして表示されてしまうからです。
例えば、ネットショップの利用回数と利用額の関係性を例に考えてみましょう。

スクリーンショット_2017-03-17_14.21.55.png

上記は、ネットショップで商品を購入した顧客それぞれの「利用回数」と「利用額」をグラフにしたものです。
このグラフをみると*「利用回数が多い顧客ほど、利用額が多い」という相関関係が見えます。
ですが、この結果から
「利用回数が多くなるほど、利用額が高くなっていく」*という因果関係を導き出していいのでしょうか。

その考察には検討の余地がありそうです。
なぜなら「利用額が高い=そのネットショップで気に入った商品が多い」顧客が、何度も利用している可能性があるからです。
つまり、最初から利用額の少ない=気に入った商品が少ない顧客は1、2回で利用をやめてしまい、最初から利用額が高い顧客が何度も利用しているだけかもしれません。

そのため「利用回数が多いほど利用額が多くなるんだったら、利用回数を増やす施策を打てば利用額を増やせるだろう」と考えるのは誤りです。
そこで1回利用した顧客に対してクーポンを発券して、再度の利用を促しても、2回目にやってきた時に気にいる商品がなければ利用額は上がりません。

このように、一見原因と結果に見えるようなことであっても、因果関係があるとは限りません。

参考:
[「相関関係」と「因果関係」の違いを理解すれば根拠のない通説にだまされなくなる!]
(http://diamond.jp/articles/-/102692)
[散布図|なるほど統計学園高等部]
(http://www.stat.go.jp/koukou/howto/process/graph/graph6.htm)

「因果関係がある」と見誤らないためのポイント

では、正しい因果関係を見つけ出すには、どういった点がポイントとなるのでしょうか。
それには大きく分けて2つのポイントがあります。

1.データの裏にある背景を考える

例えば、渋谷駅前のスクランブル交差点で交通量と年齢層の調査を行ったとします。
その時「交通量が増加するのに伴って、交差点を通過する人の平均年齢が下がった」としましょう。

そのことから「交通量が増えるから、交差点を通る人の平均年齢が下がる」と言っていいのでしょうか。

こんな時はデータのもとであるサンプルにはどんな背景があるのかを考えるようにしましょう。

渋谷駅前のスクランブル交差点は、昼頃には周辺にあるオフィス街のサラリーマンも利用します。
しかし、夜には高校生や大学生など多くの若者が繁華街であるセンター街に向かうでしょう。

その結果「交通量の少ない昼の平均年齢は高くなり、交通量の増える夜には平均年齢が低くなる」ことになります。
このことから、交通量そのものが平均年齢を引きげているわけではないことがわかるでしょう。

また、サンプルの量が少ない場合、相関関係が偶然発生しているだけの可能性もあるので気を付けましょう。

2.相関関係にある2つの要素以外にも関わる要素がないか考える。

例えば、100人に対して血圧と所得額の調査を行ったとします。
その時「血圧が高い人ほど、給与が高かった」という相関関係が生じた場合、「血圧が高い人ほど給与が高くなる」という因果関係を導くことはできません。

それは、年齢という3つめの要素を見逃しているからです。
通常、年齢が高い人ほど血圧が高くなり、年齢が高い人は給与が高くなる傾向にあります。
そのため、データ上では年齢が高い人ほど血圧が高くなるように見えてしまうのです。

このように2つの要素以外に根本的な原因がある場合があります。
何か因果関係があると思ったら、他にも関わる要素がないかどうか考えてみるようにしましょう。

3.周辺のデータも合わせて確認する

因果関係を見つけ出した時には、もとにしたデータ以外にも根拠を強化する別データも探すようにしましょう。
例えば、複数の地域に対して電灯の数と犯罪発生件数の調査を行ったとき「電灯の数が多いほど、犯罪の発生件数は少なかった」とします。

この時、他の地域・国での調査結果や、犯罪を行っている人のヒアリング調査など周辺にあるデータをもとにして、根拠の裏付けを行うようにしましょう。

まとめ

AとBの事柄に関係があるものを「相関関係」と言い、その中でも、Aを原因としてBが変動するものを「因果関係」と言います。
相関関係があるからと言って、必ずしも因果関係があるわけではありません。
しかし、データだけをみると関係性があるので「因果関係がある」と判断してしまうこともあるでしょう。

その際は「本当にこの2つの事柄に関係性はあるのか?」と疑って見ることが大切です。
複数のデータを検証するだけでなく、データの裏にある人間心理や環境を考えるようにしましょう。

こちらも合わせてチェック

MECEって?ロジカルシンキングの基本的考え方を理解して思考の抜け漏れを防ごう

MECEって?ロジカルシンキングの基本的考え方を理解して思考の抜け漏れを防ごう

ロジカルシンキングの基本と言われる概念の1つに「MECE」があります。今回は、「MECE」の基本を具体例を交えて解説します。

論理的思考とは?〜基礎知識からトレーニング方法まで解説

論理的思考とは?〜基礎知識からトレーニング方法まで解説

ビジネスを行う上では、論理的に考える力が求められます。論理的思考ができれば、会議やプレゼンで、筋道を立ててわかりやすく相手に説明することができます。今回は論理的思考の概要を解説し、オススメ書籍も併せて紹介します。