「囚人のジレンマ」とは、各人が自分にとって一番魅力的な選択肢を選んだ結果、協力した時よりも悪い結果を招いてしまうことです。ゲーム理論もモデルの一つでもあります。今回は、ゲーム理論の基本的な概念と代表的なモデルを解説します。

ゲーム理論とは最も良い選択をするための思考法

ゲーム理論とは「利害関係を持つ相手がいる状況で、自分と相手の利益を考え、最適な行動を決める」ための思考法です。

例えば交渉の場で、自分が得をする提案をしても、相手に利益がなければ成立する可能性は低いでしょう。
逆に、相手だけが得をするような内容も、こちらは容認できません。関係者全員にとって最も良い選択は何かを数学的に導き出すのが「ゲーム理論」です。元々は経済学の分野で使われていましたが、最近は経営、政治、軍事などあらゆる分野で応用されています。

ゲーム理論の基礎を築いたのは、「ジョン・フォン・ノイマン」というアメリカの数学者で、彼は数学だけではなく経済・物理学・気象学・計算機科学など様々な分野で成果を上げています。ノイマンが発表した「ゲーム理論」の論文により、今まで不可能と思われていた「人間の意思決定が相互に影響をあたえることを数学的に展開できる形」にすることに成功しました。

その後、経済学者のオスカー・モルゲンンシュテルンと共同で『ゲームの理論と経済行動』を1944年に出版しました。この書籍をきっかけにゲーム理論が確立、普及していきます。

ゲーム理論の代表例「囚人のジレンマ」とは

ゲーム理論の代表的なモデルとしてよく挙げられるのが「囚人のジレンマ」です。

ある犯罪に関する容疑で捕まった2人の容疑者が、意思疎通の出来ない別々の部屋で尋問を受けています。
この2人が取る選択肢は「自白する」「自白しない」のいずれかですが、自白の状況によって受ける刑罰の重さが異なります。

・1人が自白し、もう一方が自白しない場合、自白した方は無罪・自白しない方は懲役10年
・2人共自白しない場合は懲役2年
・2人共自白した場合は懲役5年

この場合、それぞれの容疑者がどの選択肢を取るでしょうか。

お互い「相手が自白せずに、自分が自白する」という選択肢が一番魅力的であることは間違いないでしょう。しかし、相手も自白した場合は無罪にはならないというリスクもあります。お互いが「自白しない」という選択肢をとった場合、懲役年数は最も短い2年となります。

Untitled(3)_(9).png

A、B2人がお互いの利益を考えて協力したら「自白しない」選択肢をとり、懲役が最も軽くなります。しかし、お互いが自分自身の利益だけを追求して「自白する」ことを選択したら、「自白しない」を選択したよりも長い「懲役5年」の刑が科せられます。

このように、*各人が自分にとって一番魅力的な選択肢を選んだ結果、協力した時よりも悪い結果を招いてしまうことを「囚人のジレンマ」*と呼びます。「囚人のジレンマ」の構造を理解する上で覚えておきたいのが「パレート最適」と「ナッシュ均衡」です。

「パレート最適」と「ナッシュ均衡」

「パレート最適」とは、*誰も不利益を被ることなく、全体の利益が最大化された状態(それ以上利益を出すためには誰かを犠牲にしなければいけない状態)*のことです。

一方「ナッシュ均衡」とは、自分の選択を変えると利益が得られない状態=互いに現状から変わる必要のない安定した状態を指しています。

全体の利益を優先する「パレート最適」と個人にとって合理的な判断となる「ナッシュ均衡」の矛盾

囚人のジレンマの場合、「お互い自白せずに懲役2年の刑罰を受ける」のがパレート最適と言えます。しかし、相手が裏切って自白した場合、自分は懲役10年になってしまいます。そのリスクを回避するためには自白するしかありません。この状態では2人とも「自白する」という選択しかできず、そこから変える必要性はありません。

つまり囚人のジレンマにおけるナッシュ均衡は「お互いが自白する」こととなります。しかしそれは「パレート最適」な状態ではありません。

Untitled(3)_(10).png

個々人にとっての合理的な判断(リスクの少ない判断)である「ナッシュ均衡」と、全体の利益が最大化される「パレート最適」は必ずしも一致しません。この矛盾を表現しているのが「囚人のジレンマ」です。