ゲーム理論-均衡概念とは

ナッシュ均衡(Nash equilibrium)

ナッシュ均衡とは

ナッシュ均衡とは、ゲームに参加する全てのプレイヤ−が相互に他者の戦略を考慮に入れつつ、自己の利益を最大化するような戦略を実行したときに成立する均衡状態です。

多数のプレイヤ−が参加する非協力ゲームでは、あるプレイヤ−が戦略を変えても、その他のプレイヤ−が戦略を変えない限り、それ以上には結果がよくならない混合戦略の組み合わせ(均衡点)が少なくとも1つ存在します。

この均衡点では、個々のプレイヤ−が相互に合理的判断から最適戦略を取り合っている状況であり、全てのプレイヤ−が自分だけ戦略を変えても得にならないため、常に安定的な結果が得られる均衡状態となります。

米国の数学者 ジョン・F・ナッシュ(John Forbes Nash Jr.)が証明した均衡定理です。


均衡選択

均衡選択とは、複数のナッシュ均衡を持つゲームにおいて、どのナッシュ均衡を選ぶかについての考察することです。

その時点での最適な均衡点を予想して、戦略を決定するための行動と言えます。

ただし、ナッシュ均衡はその状況における最適ではあっても、各プレイヤーにとって必ずしも最善な戦略、すなわち最大利得を保証するものではありません。


囚人のジレンマ

囚人のジレンマとは、個々の最適な選択(ナッシュ均衡)が全体として最適な選択とはならない状況の例としてよく挙げられるゲーム理論の一つです。

  1. 囚人Aと囚人Bはある軽犯罪を犯したかどで収監された。しかし彼らにはより重大な殺人事件の容疑がかかっている。
  2. 取調官はそれぞれ独立した取調室でAB両者間に一切のコミュニケーション手段を与えず別々に取り調べを行う。
  3. 取調官はそれぞれ「相方の罪を告白すれば刑期を短くする」と提案する。
    1. 二人とも黙秘すれば軽犯罪のみで刑期は2年ずつである。
    2. 二人とも自白すれば殺人事件の共犯で刑期は5年ずつである。
    3. 片方が自白して片方が黙秘すれば、自白したほうは司法取引により刑期は1年、黙秘したほうは刑期が10年となる。

この状況下ではAとBは共に「自白か黙秘」という2つの選択肢が与えられており、全体で合計4通りの結果が与えられる。

相方の行動を予想して自分にとって最大の利益を得るためには、AとBはそれぞれ以下のように考えます。

  • 相方が自白した場合、自分は黙秘したら10年の刑を受け、自分も自白すれば5年の刑で済む。
  • 相方が黙秘した場合、自分も黙秘したら2年の刑を受け、自分が自白すれば1年の刑で済む。

結果、どちらにしても自分が証言したほうが得なので、AとBは共に「証言する」という結論を導き出す。

しかし、実はこの問題では「二人とも証言」よりも「二人とも黙秘」のほうが明らかに望ましい利益となります。

囚人のジレンマとは、このような自分にとって最適な答えをだすと全体を見たとき不利となるというものです。



関連ページ