Trembling-hand-perfektes Gleichgewicht

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Das trembling-hand-perfekte Gleichgewicht bzw. perfekte Gleichgewicht der zitternden Hand[1] stellt in der Spieltheorie eine Möglichkeit der Selektion von Nash-Gleichgewichten dar. Entwickelt wurde es von Reinhard Selten, der die Idee 1975 unter dem Namen „A Model of Slight Mistakes“ im „International Journal of Game Theory“ veröffentlichte. Hierbei geht es darum festzustellen, wie anfällig ein Gleichgewicht gegenüber Fehlern eines Spielers ist. Nach Selten gibt es keine Fehler, wenn die Spieler absolut rational handeln. In der Realität muss man allerdings mit falschen Entscheidungen des Gegenspielers rechnen. Um dies spieltheoretisch darzustellen, wurde das Trembling-hand-perfekte Gleichgewicht entwickelt.[2]

Einfache Darstellung des Ansatzes

[Bearbeiten | Quelltext bearbeiten]
Reinhard Selten (2001)

Einfach ausgedrückt bedeutet die Idee des trembling-hand-perfekten Gleichgewichts: Angenommen Spieler A geht davon aus, dass Spieler B immer die Strategie spielt und die beste Antwort von Spieler A auf ist seine Strategie . Ist dann immer Strategie zu spielen auch dann noch die optimale Wahl, wenn Spieler B aus Versehen, sprich mit einer geringen Fehlerwahrscheinlichkeit von , spielt? Wenn unter diesen Umständen noch immer die beste Strategie von Spieler A ist, so handelt es sich um eine Trembling-hand-perfekte Strategie.

Trembling-hand-perfektes Gleichgewicht in Normalformspielen

[Bearbeiten | Quelltext bearbeiten]

Durch das folgende Normalformspiel, wird der Ansatz des Trembling-hand-perfekten Gleichgewichts anhand folgender Auszahlungsmatrix sehr einfach verdeutlicht:

Spieler A/Spieler B () ()
() (3, 3) (5, 0)
() (-2, -2) (5, 0)

Die beiden Nash-Gleichgewichte sind in diesem Beispiel bei und . Nun soll ermittelt werden, ob eines der beiden Gleichgewichte (oder auch beide), Trembling-hand-perfekte Gleichgewichte sind. Angenommen Spieler A möchte seine Strategie spielen und geht davon aus, dass Spieler B seine Strategie spielen wird, da beide dann eine Auszahlung von 3 bekämen. Spieler A ist sich allerdings nicht vollkommen sicher, ob Spieler B nicht doch mit einer geringen Fehlerwahrscheinlichkeit seine Strategie spielt. Um herauszufinden, ob trotz dieser Fehlerwahrscheinlichkeit von Spieler B noch immer die beste Wahl von Spieler A und somit Trembling-hand-perfekt ist, muss folgendes überprüft werden: Die erwartete Auszahlung von Spieler A wenn er wählt muss mindestens so groß sein, wie die erwartete Auszahlung für die Wahl von .

sei die Fehlerwahrscheinlichkeit von Spieler B, die als sehr klein angenommen wird. Das heißt, ist die damit verbundene Gegenwahrscheinlichkeit. Mit

Die erwartete Auszahlung von Spieler A für die Wahl von ist also:

= +

Im Vergleich dazu die erwartete Auszahlung der Strategie :

= +

Es ist unschwer zu erkennen, dass:

+ > +

Auch wenn Spieler B mit einer geringen Fehlerwahrscheinlichkeit spielt, ist für Spieler A die bestmögliche Wahl. Also ist die Strategie Trembling-hand-perfekt. Ein Trembling-hand-perfektes Gleichgewicht besteht allerdings aus einer Kombination zweier Trembling-hand-perfekten Strategien. Um also zu prüfen, ob es sich bei der Strategiekombination um ein solches handelt, muss auch von Spieler B getestet werden. Analog zur Strategie sieht dies folgendermaßen aus:

Die erwartete Auszahlung von Spieler B für die Wahl von beträgt:

= +

Im Vergleich dazu die erwartete Auszahlung der Strategie :

= +

Und wiederum ist eindeutig zu erkennen, dass:

Damit ist auch die Strategie Trembling-hand-perfekt und es handelt sich beim Nash-Gleichgewicht um ein Trembling-hand-perfektes Gleichgewicht.[3]

Formale Definition mithilfe eines perturbierten Spiels

[Bearbeiten | Quelltext bearbeiten]

Einfache Definition eines perturbierten Spiels

[Bearbeiten | Quelltext bearbeiten]

Ein perturbiertes Spiel, ist eine Kopie des zugrundeliegenden Spiels, mit der Einschränkung, dass jeder Spieler alle reinen Strategien mit einer positiven Wahrscheinlichkeit spielen muss. Das heißt, im normalen Spiel ist es Spieler A möglich seine Strategien zu spielen. Im perturbierten Spiel muss sein.

Formale Definition

[Bearbeiten | Quelltext bearbeiten]

Ausgangspunkt sei ein Spiel in strategischer Form:

, und

Wobei die Menge der Spieler darstellt, das Set an gemischten Strategien ist, welches auf der möglichen Verteilung der reinen Strategien basiert und es sich bei um die erwartete Auszahlung von Spieler handelt. Die Zentrale Idee, um mögliche Fehler der Spieler abzubilden, ist es anzunehmen, dass keine reine Strategie mit einer Wahrscheinlichkeit von null gespielt werden kann. In einem solchen perturbierten Spiel gilt:

Für jeden Spieler mit reinen Strategien, ist die Menge an positiven Wahrscheinlichkeiten, für die gilt:
und .

Die Menge an gemischten Strategien im perturbierten Spiel ist also:

, für .

Das heißt, dass Spieler , , jede seiner reinen Strategien der Anzahl , mindestens mit der Wahrscheinlichkeit spielen muss. Daraus folgt das perturbierte Spiel:

, und

Ein Nash-Gleichgewicht im perturbierten Spiel sei und ein Nash-Gleichgewicht im Ausgangsspiel sei: . Wenn man die Fehlerwahrscheinlichkeit im perturbierten Spiel gegen null gehen lässt und dadurch das Gleichgewicht des perturbierten Spiels zum Gleichen wird wie im normalen Spiel, spricht man von einem trembling-hand-perfekten Gleichgewicht. Formal ausgedrückt heißt das, wenn

,

handelt es sich um ein trembling-hand-perfektes Gleichgewicht.[4]

Als Ausgangsspiel wird ein Normalformspiel mit folgender Auszahlungsmatrix betrachtet:

Spieler A/Spieler B () ()
() (3, 3) (0, 0)
() (0, 0) (0, 0)

Im normalen Spiel gibt es zwei Nash-Gleichgewichte, die sich aus den Strategiekombinationen und ergeben. Es kommt für die beiden Spieler bei der Wahl ihrer jeweils besten Antwort darauf an, welche Strategie der jeweilige Gegenspieler wählt.

Im perturbierten Spiel ist dies nicht der Fall. Denn wenn es auch nur eine winzige Wahrscheinlichkeit gibt, dass Spieler B seine Strategie wählt, dann ist die beste Antwort von Spieler A darauf zu spielen. Da diese Wahrscheinlichkeit im perturbierten Spiel per Definition existiert, würde Spieler A immer spielen. Aber auch Spieler A muss im perturbierten Spiel seine Strategie mit einer positiven Wahrscheinlichkeit spielen. Deshalb ist seine beste Antwort, die gemischte Strategie zu spielen – also die kleinstmögliche Wahrscheinlichkeit für .

Aufgrund der Symmetrie des Spiels ist die beste Strategie für Spieler B dementsprechend:

Das Gleichgewicht im perturbierten Spiel ist also:

Wenn man jetzt und gegen gehen lässt, dann wird aus dem perturbierten Spiel fast wieder das Normale, denn:

Wenn man die Fehlerwahrscheinlichkeit gegen Null gehen lässt und sich das Gleichgewicht des perturbierten Spiels dadurch auf ein Nash-Gleichgewicht des zugrundeliegenden Spiels zubewegt, dann handelt es sich bei diesem Gleichgewicht um ein Trembling-hand-perfektes.

In diesem Beispiel bewegt sich das perturbierte Spiel gegen das Gleichgewicht und ist somit Trembling-hand-perfekt.

[5]

Trembling-hand-perfektes Gleichgewicht in Sequentiellen Spielen

[Bearbeiten | Quelltext bearbeiten]

Auch für Sequentielle Spiele ist das Konzept des Trembling-hand-perfekten Gleichgewichtes anwendbar. Ähnlich wie bei den Normalformspielen, ist es hierbei für die Selektion von Teilspielperfekten Gleichgewichten von Nutzen, um festzustellen, ob ein solches Gleichgewicht auch bei einer geringen Fehlerwahrscheinlichkeit bestehen bleibt.

Spielbaum eines Extensivformspiels zweier Spieler

Im auf der rechten Seite gibt es vier Teilspielperfekte Gleichgewichte:

, also Spieler 1 spielt seine Strategie und Spieler 2 spielt , für den Fall, dass Spieler 1 gewählt hat und auch für den Fall, dass Spieler 1 gewählt hat. sind die anderen drei Teilspielperfekten Gleichgewichte.
Allerdings sind nur die beiden Gleichgewichte, in denen Spieler 1 seine Strategie wählt Trembling-hand-perfekt. Denn auch wenn es nur eine winzige Wahrscheinlichkeit gibt, dass Spieler 2 seine Strategie spielt, ist es für Spieler 1 besser immer zu spielen, da er hier immer eine Auszahlung von 2 bekommt und er sich durch die Strategie nie besser stellen kann, als durch die Strategie .
Die beiden Trembling-hand-perfekten Gleichgewichte sind also: .[6]

Trembling-hand-perfektes Gleichgewicht in extensiven Spielen mit der Agentennormalform

[Bearbeiten | Quelltext bearbeiten]
Elon Kohlbergs Dalekspiel in extensiver Form

Das vom Spieltheoretiker Elon Kohlberg entwickelte, und hier leicht abgewandelte Dalekspiel, ist ein Beispiel für eine weitere Anwendung des Trembling-hand-perfekten Gleichgewichtes. Die 1953 von Harold W. Kuhn entwickelte Agentennormalform wird angewendet, um den Informationsverlust bei einer Reduktion eines Extensivspiels auf die Normalform, auszugleichen. Wie im Dalekspiel auf der rechten Seite zu sehen, wird Spieler 1 in zwei Agenten aufgeteilt, um an jedem Entscheidungsknoten unkorrelierte Entscheidungen mathematisch abbilden zu können.[7]

Spieler 1/Spieler 2 (L) (R)
(gl) (2, 5) (2, 5)
(gr) (2, 5) (2, 5)
(ul) (4, 1) (0, 0)
(ur) (0, 0) (1, 4)

In der Normalform kann man sehr leicht erkennen, dass es drei Nash-Gleichgewichte in reinen Strategien gibt: . Um diese Gleichgewichte nun auf ihre Trembling-hand-Perfektheit zu untersuchen, muss man sicherstellen, dass die Fehlerwahrscheinlichkeiten, die Spieler 1 an seinen beiden Entscheidungsknoten hat, nicht miteinander korrelieren. Das heißt, dass ein Fehler am ersten Entscheidungsknoten nicht dazu führen darf, dass die Wahrscheinlichkeit für einen weiteren Fehler steigt oder sinkt. Um dies sicherzustellen, wird Spieler 1 wie bereits oben beschrieben in zwei Agenten aufgeteilt, die unabhängig voneinander ihre Entscheidungen treffen.

Nun nehmen wir an, dass der erste Agent (Sp1A) mit einer geringen Wahrscheinlichkeit von einen Fehler begeht und anstatt von spielt.
Dementsprechend begeht der zweite Agent (Sp1B) mit der Wahrscheinlichkeit von einen Fehler und spielt anstatt von .
Spieler 2 begeht schließlich mit einer Wahrscheinlichkeit von einen Fehler und spielt anstatt von .

Mit den Eingetragenen Wahrscheinlichkeiten sieht die Normalform von oben wie folgt aus:

Spieler 1/Spieler 2 (L) (R) Wahrscheinlichkeit
(gl) (2, 5) (2, 5)
(gr) (2, 5) (2, 5)
(ul) (4, 1) (0, 0)
(ur) (0, 0) (1, 4)
Wahrscheinlichkeit

Nun kann man leicht erkennen, dass die Strategien und für Spieler 1 für kleine Trembling-hand-perfekte Strategien sind. Denn er erhält eine sichere Auszahlung von 2 egal wie sich Spieler 2 entscheidet. Bei der einzigen besseren Auszahlung von 4 bei der Wahl von erhält er aufgrund der Wahrscheinlichkeiten im Erwartungswert die Auszahlung:

und für ist dieser Erwartungswert schlechter als bei und .
Auch für Spieler 2 ist die Strategie Trembling-hand-perfekt, weil die einzige Strategiekombination, bei der Spieler 2 eine größere Auszahlung für als für bekommt ist im Gegensatz zu . Da aber nur eintritt, wenn beide Agenten von Spieler 1 einen Fehler machen, hat die geringste Wahrscheinlichkeit ().
Damit sind die beiden Gleichgewichte und Trembling-hand-perfekt. Das Gleichgewicht ist es nicht, weil die Strategie , wie gerade gezeigt keine Trembling-hand-perfekte Strategie ist.[8][9]
  • Reinhard Selten: A reexamination of the perfectness concept for equilibrium points in extensive games, in: International Journal of Game Theorie. Physica-Verlag, Vienna 1975, S. 25–55.
  • Harold William Kuhn: Extensive Games and the Problem of Informations. In: Contribution to the Theorie of Games. Vol. 2. Princeton Univ. Press, Princeton 1953, S. 193–216.
  • Elon Kohlberg, Jean-Francois Mertens: On the Strategic Stability of Equilibria. Econometrica, 1986, S. 1003–1037.
  • Robert Gibbons: A Primer in Game Theory. Financial Times, Harlow 1992.
  • Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010.
  • Christian Rieck: Spieltheorie. 8. Auflage. Rieck, Eschborn 2008.
  • Alexander Mehlmann: Strategische Spiele für Einsteiger. Friedr. Vieweg & Sohn Verlag, Wiesbaden 2007.
  • Ken Binmore: Fun and Games. 1. Auflage. Heath, Lexington 1992.
  • Jürgen Eichberger: Game Theorie for Economists. 1. Auflage. Emerald, Bingley 2007.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Walter Schlee: Einführung in die Spieltheorie: Mit Beispielen und Aufgaben. Springer, 2013, ISBN 978-3-528-03214-2, S. 86, „Perfektes Gleichgewicht“ (google.de).
  2. Reinhard Selten: A reexamination of the perfectness concept for equilibrium points in extensive games, in: International Journal of Game Theorie. Physica-Verlag, Vienna 1975, S. 25–55, hier S. 35.
  3. Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010, S. 38–40.
  4. Jürgen Eichberger: Game Theorie for Economists. 1. Auflage. Emerald, Bingley 2007, S. 111–113.
  5. Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010, S. 94–95.
  6. Thomas Riechmann: Spieltheorie. 3. Auflage. Vahlen, München 2010, S. 53.
  7. Harold William Kuhn: Extensive Games and the Problem of Informations, in: Contribution to the Theorie of Games, Vol. 2. Princeton Univ. Press, Princeton 1953, S. 193 - 216.
  8. Alexander Mehlmann: Strategische Spiele für Einsteiger. Friedr. Vieweg & Sohn Verlag, Wiesbaden 2007, S. 88–92.
  9. Ken Binmore: Fun and Games. 1. Auflage. Heath, Lexington 1992, S. 454–462.