Equilibrio bayesiano perfecto - Perfect Bayesian equilibrium

Equilibrio bayesiano perfecto
Un concepto de solución en la teoría de juegos
Relación
Subconjunto de Equilibrio bayesiano de Nash
Significado
Propuesto por Cho y Kreps
Usado para Juegos dinámicos bayesianos
Ejemplo juego de señalización

En teoría de juegos , un equilibrio bayesiano perfecto (PBE) es un concepto de equilibrio relevante para juegos dinámicos con información incompleta ( juegos bayesianos secuenciales ). Es un refinamiento del equilibrio bayesiano de Nash (BNE). Un equilibrio bayesiano perfecto tiene dos componentes: estrategias y creencias :

  • La estrategia de un jugador en un conjunto de información dado especifica su elección de acción en ese conjunto de información, que puede depender del historial (de las acciones tomadas previamente en el juego). Esto es similar a un juego secuencial .
  • La creencia de un jugador en un conjunto de información determinado determina qué nodo de ese conjunto de información cree que ha alcanzado el juego. La creencia puede ser una distribución de probabilidad sobre los nodos del conjunto de información, y típicamente es una distribución de probabilidad sobre los posibles tipos de otros jugadores. Formalmente, un sistema de creencias es una asignación de probabilidades a cada nodo del juego, de manera que la suma de probabilidades en cualquier conjunto de información es 1.

Las estrategias y creencias deben satisfacer las siguientes condiciones:

  • Racionalidad secuencial : cada estrategia debe ser óptima en expectativa, dadas las creencias.
  • Consistencia : cada creencia debe actualizarse de acuerdo con las estrategias de equilibrio, las acciones observadas y la regla de Bayes en cada camino alcanzado en equilibrio con probabilidad positiva. En caminos de probabilidad cero, conocidos como caminos fuera de equilibrio , las creencias deben especificarse pero pueden ser arbitrarias.

Un equilibrio bayesiano perfecto es siempre un equilibrio de Nash.

Ejemplos de equilibrios bayesianos perfectos

Juego de regalo 1

Considere el siguiente juego:

  • El remitente tiene dos tipos posibles: un "amigo" (con probabilidad ) o un "enemigo" (con probabilidad ). Cada tipo tiene dos estrategias: dar un regalo o no dar.
  • El receptor tiene un solo tipo y dos estrategias: aceptar el regalo o rechazarlo.
  • La utilidad del remitente es 1 si se acepta su obsequio, -1 si se rechaza su obsequio y 0 si no da ningún obsequio.
  • La utilidad del receptor depende de quién da el regalo:
    • Si el remitente es un amigo, entonces la utilidad del receptor es 1 (si acepta) o 0 (si rechaza).
    • Si el remitente es un enemigo, entonces la utilidad del receptor es -1 (si acepta) o 0 (si rechaza).

Para cualquier valor de Equilibrio 1, existe un equilibrio de agrupación en el que ambos tipos de emisores eligen la misma acción:

Equilibrium 1. Remitente: No se da , ya sea del tipo amigo o enemigo. Receptor: no aceptan , con las creencias que Prob (amigo | No Dar) = p y Prob (amigo | Give) = x, la elección de un valor

El remitente prefiere la recompensa de 0 de no dar a la recompensa de -1 de enviar y no ser aceptado. Por lo tanto, Give tiene probabilidad cero en equilibrio y la regla de Bayes no restringe la creencia Prob (Friend | Give) en absoluto. Esa creencia debe ser lo suficientemente pesimista como para que el receptor prefiera la recompensa de 0 al rechazar un regalo a la recompensa esperada de aceptar, por lo que el requisito de que la estrategia del receptor maximice su recompensa esperada dadas sus creencias requiere que Prob (Amigo | Dar) En el Por otro lado, Prob (Amigo | No dar) = p es requerido por la Regla de Bayes, ya que ambos tipos realizan esa acción y no es informativo sobre el tipo del remitente.

Si , existe un segundo equilibrio de agrupación además del Equilibrio 1, basado en diferentes creencias:

Equilibrium 2. Remitente: No dar , ya sea del tipo amigo o enemigo. Receptor: Aceptar, con las creencias que Prob (amigo | Give) = p y Prob (amigo | No dan) = x , eligiendo cualquier valor de

El remitente prefiere la recompensa de 1 de dar a la recompensa de 0 de no dar, esperando que su obsequio sea aceptado. En equilibrio, la regla de Bayes requiere que el receptor tenga la creencia Prob (Amigo | Dar) = p , ya que ambos tipos realizan esa acción y no informa sobre el tipo de emisor en este equilibrio. La creencia fuera de equilibrio no importa, ya que el remitente no querría desviarse para No dar, sin importar la respuesta que tuviera el receptor.

Equilibrium 1 es perverso si el juego podría haberlo hecho, por lo que es muy probable que el remitente sea un amigo, pero el receptor aún rechazaría cualquier regalo porque cree que los enemigos son mucho más propensos que los amigos a dar regalos. Esto muestra cómo las creencias pesimistas pueden resultar en un equilibrio malo para ambos jugadores, uno que no es Pareto eficiente . Sin embargo, estas creencias parecen poco realistas y los teóricos de los juegos a menudo están dispuestos a rechazar algunos equilibrios bayesianos perfectos como inverosímiles.

Los equilibrios 1 y 2 son los únicos equilibrios que podrían existir, pero también podemos verificar los dos equilibrios de separación potenciales , en los que los dos tipos de emisores eligen acciones diferentes, y ver por qué no existen como equilibrios bayesianos perfectos:

  1. Supongamos que la estrategia del remitente es: Dar si es un amigo, No dar si es un enemigo. Las creencias del receptor se actualizan en consecuencia: si recibe un regalo, cree que el remitente es un amigo; de lo contrario, cree que el remitente es un enemigo. Por lo tanto, el receptor responderá con Aceptar . Sin embargo, si el receptor elige Aceptar , el remitente enemigo se desviará a   Dar , para aumentar su pago de 0 a 1, por lo que esto no puede ser un equilibrio.
  2. Supongamos que la estrategia del remitente es: no dar si es un amigo, dar si es un enemigo. Las creencias del receptor se actualizan en consecuencia: si recibe un regalo, cree que el remitente es un enemigo; de lo contrario, cree que el remitente es un amigo. La mejor estrategia de respuesta del receptor es Rechazar. Sin embargo, si el receptor elige Rechazar , el remitente enemigo se desviará a   No dar , para aumentar su pago de -1 a 0, por lo que esto no puede ser un equilibrio.

Concluimos que en este juego, no hay equilibrio separador.

Juego de regalo 2

En el siguiente ejemplo, el conjunto de PBE es estrictamente más pequeño que el conjunto de SPE y BNE. Es una variante del juego de regalos anterior, con el siguiente cambio en la utilidad del receptor:

  • Si el remitente es un amigo, entonces la utilidad del receptor es 1 (si acepta) o 0 (si rechaza).
  • Si el remitente es un enemigo, entonces la utilidad del receptor es 0 (si acepta) o -1 (si rechaza).

Tenga en cuenta que en esta variante, aceptar es una estrategia débilmente dominante para el receptor.

De manera similar al ejemplo 1, no hay equilibrio separador. Veamos los siguientes equilibrios potenciales de agrupación:

  1. La estrategia del remitente es: dar siempre. Las creencias del receptor no se actualizan: todavía creen en la probabilidad a priori, que el emisor es un amigo con probabilidad y un enemigo con probabilidad . Su recompensa por aceptar es siempre mayor que por rechazar, por lo que aceptan (independientemente del valor de ). Este es un PBE: es la mejor respuesta tanto para el emisor como para el receptor.
  2. La estrategia del remitente es: nunca dar. Supongamos que la creencia del receptor cuando recibe un regalo es que el remitente es un amigo con probabilidad , donde está cualquier número en . Independientemente de , la estrategia óptima del receptor es: aceptar. Esto NO es un PBE, ya que el remitente puede mejorar su pago de 0 a 1 dando un regalo.
  3. La estrategia del remitente es: nunca dar, y la estrategia del receptor es: rechazar. Esto NO es un PBE, ya que para cualquier creencia del receptor, rechazar no es la mejor respuesta.

Tenga en cuenta que la opción 3 es un equilibrio de Nash. Si ignoramos las creencias, el rechazo puede considerarse una mejor respuesta para el receptor, ya que no afecta su recompensa (ya que de todos modos no hay regalo). Además, la opción 3 es incluso un SPE, ¡ya que el único subjuego aquí es el juego completo! Estos equilibrios inverosímiles también pueden surgir en juegos con información completa, pero pueden eliminarse aplicando el equilibrio de Nash perfecto en subjuegos . Sin embargo, los juegos bayesianos a menudo contienen conjuntos de información que no son únicos y, dado que los subjuegos deben contener conjuntos de información completos, a veces sólo hay un subjuego, el juego completo, por lo que cada equilibrio de Nash es trivialmente perfecto en subjuegos. Incluso si un juego tiene más de un subjuego, la incapacidad de la perfección del subjuego para cortar conjuntos de información puede resultar en que no se eliminen equilibrios inverosímiles.

En resumen: en esta variante del juego de regalos, hay dos SPEs: o el remitente siempre da y el receptor siempre acepta, o el remitente siempre no da y el receptor siempre rechaza. De estos, solo el primero es un PBE; el otro no es un PBE ya que no puede ser apoyado por ningún sistema de creencias.

Más ejemplos

Para obtener más ejemplos, consulte el juego de señalización # Examples . Consulte también para obtener más ejemplos.

PBE en juegos de varias etapas

Un juego de varias etapas es una secuencia de juegos simultáneos que se juegan uno tras otro. Estos juegos pueden ser idénticos (como en juegos repetidos ) o diferentes.

Juego de bien público repetido

Construir No
Construir 1-C1, 1-C2 1-C1, 1
No 1, 1-C2 0,0
Buen juego público

El siguiente juego es una simple representación del problema del free-rider . Hay dos jugadores, cada uno de los cuales puede construir un bien público o no construir. Cada jugador gana 1 si se construye el bien público y 0 si no; Además, si el jugador construye el bien público, tiene que pagar un costo de . Los costos son información privada : cada jugador conoce su propio costo, pero no el costo del otro. Solo se sabe que cada costo se extrae independientemente al azar de alguna distribución de probabilidad. Esto hace que este juego sea un juego bayesiano .

En el juego de una etapa, cada jugador construye si, y solo si, su costo es menor que la ganancia esperada de la construcción. La ganancia esperada de la construcción es exactamente 1 veces la probabilidad de que el otro jugador NO construya. En equilibrio, para cada jugador , hay un costo umbral , de modo que el jugador contribuye si, y solo si, su costo es menor que . Este costo umbral se puede calcular en función de la distribución de probabilidad de los costos de los jugadores. Por ejemplo, si los costos se distribuyen uniformemente , entonces existe un equilibrio simétrico en el que el costo umbral de ambos jugadores es 2/3. Esto significa que un jugador cuyo costo esté entre 2/3 y 1 no contribuirá, aunque su costo esté por debajo del beneficio, debido a la posibilidad de que el otro jugador contribuya.

Ahora, suponga que este juego se repite dos veces. Las dos jugadas son independientes, es decir, cada día los jugadores deciden simultáneamente si construir un bien público ese día, obtener una recompensa de 1 si el bien se construye ese día y pagar su costo si lo construyeron ese día. La única conexión entre los juegos es que, al jugar el primer día, los jugadores pueden revelar alguna información sobre sus costos, y esta información puede afectar el juego en el segundo día.

Buscamos un PBE simétrico. Denote por el costo de umbral de ambos jugadores en el día 1 (por lo tanto, en el día 1, cada jugador construye si y solo si su costo es como máximo ). Para calcular , trabajamos hacia atrás y analizamos las acciones de los jugadores en el día 2. Sus acciones dependen del historial (= las dos acciones en el día 1), y hay tres opciones:

  1. En el día 1, no se construyó ningún jugador. Así que ahora ambos jugadores saben que el costo de su oponente está por encima . Actualizan su creencia en consecuencia y concluyen que hay una menor posibilidad de que su oponente construya en el día 2. Por lo tanto, aumentan su costo de umbral, y el costo de umbral en el día 2 es .
  2. En el día 1, ambos jugadores construyeron. Así que ahora ambos jugadores saben que el costo de su oponente está por debajo . Actualizan su creencia en consecuencia y concluyen que hay una mayor probabilidad de que su oponente construya en el día 2. Por lo tanto, disminuyen su costo de umbral, y el costo de umbral en el día 2 es .
  3. En el día 1, se construyó exactamente un jugador; supongamos que es el jugador 1. Así que ahora, se sabe que el costo del jugador 1 está por debajo y el costo del jugador 2 está por encima . Existe un equilibrio en el que las acciones del día 2 son idénticas a las acciones del día 1: el jugador 1 construye y el jugador 2 no construye.

Es posible calcular la recompensa esperada del "jugador de umbral" (un jugador con costo exactamente ) en cada una de estas situaciones. Dado que el jugador de umbral debería ser indiferente entre contribuir y no contribuir, es posible calcular el costo de umbral del día 1 . Resulta que este umbral es más bajo que el umbral en el juego de una etapa. Esto significa que, en un juego de dos etapas, los jugadores están menos dispuestos a construir que en el juego de una etapa. Intuitivamente, la razón es que, cuando un jugador no contribuye en el primer día, hace que el otro jugador crea que su costo es alto, y esto hace que el otro jugador esté más dispuesto a contribuir en el segundo día.

Subasta rápida

En una subasta abierta en inglés , los postores pueden aumentar el precio actual en pequeños pasos (por ejemplo, en $ 1 cada vez). Sin embargo, a menudo hay subasta de saltos : algunos postores aumentan el precio actual mucho más que el incremento mínimo. Una explicación a esto es que sirve como señal para los demás postores. Hay un PBE en el que cada postor salta si-y-solo-si su valor está por encima de cierto umbral. Consulte Señalización de # de oferta de salto .

Ver también

Referencias