囚人のジレンマ

登録日 :2009/09/06(日) 12:19:38
更新日 : 2017/09/22 Fri 20:12:46
所要時間 :約 4 分で読めます




共犯で捕まった二人の容疑者A・Bが別々に尋問を受けていることとする。彼らには自白と黙秘の二つの選択肢がある。
共に黙秘した場合共に1年の懲役、共に自白した場合共に5年の懲役、一方だけが自白した場合、自白したほうは捜査に協力したとして釈放。
自白しなかったほうは捜査に協力しなかったとして8年の懲役となる。


ここでAの視点から考えてみる。自分にとっての最適の選択とはどちらか? それはBの選択にかかわらず自白をするほうである。

Aが黙秘したときと比べるとBが自白した場合では懲役8年から5年に減り、Bが黙秘した場合も懲役1年から釈放に変わる。Bの視点から見た場合も同じである。


ここで二人(全体)にとって最適の選択を考えてみる。それは共に黙秘することである。二人の合計2年の懲役で済む。
また、二人にとっての最悪の選択は共に自白することである。この場合二人の合計は10年の懲役になる。

各々の最適の選択は全体の最悪の選択になるのである。このように囚人のジレンマとは、
個々の最適な選択が全体として最適な選択とはならない状況の例としてよく挙げられる問題である。


これは二人以上になっても同じである。
例えば、十人の容疑者がいたとする。十人がある程度信用できる人間だとしても、一人が裏切れば残りの九人は馬鹿を見る。
しかし、自分が裏切れば得をできる。なら自分が裏切ったほうが得だ。

と、なり裏切りのほうに流れる。また、周りが信用できない人間だとしたらなおさら裏切りのほうに流れる。
誰かが裏切るということは自分が裏切らなかった場合、一方的に自分が損をすることになるからである。


このように書いてあると囚人のジレンマに陥った場合、人は全体もしくは広義の利益の取れないように見えるが、そんなことはない。
例えば、容疑者A・Bのバックにマフィアがいたとする。
個人の利益を取り裏切ったほうは ここは修正されました となるため、結果として容疑者二人は二人にとって最善の選択をすることができる。

マフィア様々である。別にマフィアじゃなくても、機関とかそういうのでもいいから裏切った者に制裁を与える何かがあればいいって、ばっちゃんが言ってた。
一般社会では法と執行機関が当てはまるが、 国際社会にはそれに該当する存在が無い。

強いて言えば、辛うじて米国及び米軍を主とした国連(国際世論)が極めて僅かに該当するかどうかと言うところ。


ちなみにこれは一回だけの場合を仮定している。詐欺師がなぜ人を騙すかといえば、この理論に通じるものがある。
付き合いが一回限りで騙す相手が赤の他人ならば、自分が得をでき報復される心配がないから平気で騙すのである。

ところが、何回か繰り返すタイプの囚人のジレンマになると話は違ってくる。でも、話が長くなりそうだから自分で調べてくれ。


繰り返し型の囚人のジレンマで利得の多くなる戦略を調べるため、様々な分野の研究者から戦略を集めて実験を行った結果、
全対戦(全体)の利得の合計が最も高かったのは、「しっぺ返し戦略(tit for tat)」であった。

「しっぺ返し戦略」とは、
基本的には「協調」し、相手が裏切ったら次の一回だけ裏切り、また協調を繰り返す戦略である。

また、ノイズあり「繰り返し型の囚人のジレンマゲーム」というものが、考えられる。
ここでノイズとは、「相手が協調しているにも関わらず、なんらかの理由で、裏切ったと解釈されてしまう」
(あるいは逆に、裏切っているにも関わらず協調していると思い込む)というものである。

ノイズあり「繰り返し囚人のジレンマゲーム」では、しっぺ返し戦略はもはや最強ではなく、パブロフ戦略が強くなる。
これは、前回うまくいったら今回も同じ行動を、前回失敗したら今回はその反対の行動をとるという戦略である。

現実問題としては核開発、環境問題、価格破壊競争とかそういうので問題になっている。うん。


そもそも裏切ったほうが得をする囚人のジレンマってなんかおかしいよね。
冤罪で共犯に仕立てられた場合、無実の方が懲役8年になり真犯人は無罪放免になる等問題もある。


こういうこと人に話すと「悲観的な人ね」って引かれるって、教授が言ってたから注意しよう。


追記・修正うっ……ふう……。

この項目が面白かったなら……\ポチッと/