Concepto de solución - Solution concept

Refinamientos de equilibrio seleccionados en la teoría de juegos. Las flechas apuntan desde un refinamiento al concepto más general (es decir, ESS Proper).

En teoría de juegos , un concepto de solución es una regla formal para predecir cómo se jugará un juego. Estas predicciones se denominan "soluciones" y describen qué estrategias adoptarán los jugadores y, por tanto, el resultado del juego. Los conceptos de solución más utilizados son los conceptos de equilibrio , el más famoso es el equilibrio de Nash .

Muchos conceptos de solución, para muchos juegos, darán como resultado más de una solución. Esto pone en duda cualquiera de las soluciones, por lo que un teórico de juegos puede aplicar un refinamiento para delimitar las soluciones. Cada concepto de solución sucesiva presentado a continuación mejora su predecesor al eliminar equilibrios inverosímiles en juegos más ricos.

Definicion formal

Sea la clase de todos los juegos y, para cada juego , sea ​​el conjunto de perfiles de estrategia de . Un concepto de solución es un elemento del producto directo, es decir , una función tal que para todos

Racionalización y dominio iterado

En este concepto de solución, se supone que los jugadores son racionales y, por lo tanto, las estrategias estrictamente dominadas se eliminan del conjunto de estrategias que podrían jugarse de manera factible. Una estrategia está estrictamente dominada cuando hay alguna otra estrategia disponible para el jugador que siempre tiene una recompensa más alta, independientemente de las estrategias que elijan los otros jugadores. (Las estrategias estrictamente dominadas también son importantes en la búsqueda del árbol de juego minimax .) Por ejemplo, en el dilema de los prisioneros (de un solo período) (que se muestra a continuación), cooperar está estrictamente dominado por el defecto para ambos jugadores porque cualquiera de los jugadores siempre está mejor jugando con defecto. , independientemente de lo que haga su oponente.

Prisoner 2 Cooperate Defecto del prisionero 2
Prisionero 1 Cooperar −0,5, −0,5 −10, 0
Defecto del prisionero 1 0, −10 −2, −2

equilibrio de Nash

Un equilibrio de Nash es un perfil de estrategia (un perfil de estrategia especifica una estrategia para cada jugador, por ejemplo, en el juego de dilema de los prisioneros anterior ( cooperar , desertar ) especifica que el prisionero 1 juega cooperar y el prisionero 2 juega defecto ) en el que cada estrategia es la mejor respuesta a todas las demás estrategias jugadas. Una estrategia de un jugador es la mejor respuesta a la estrategia de otro jugador si no hay otra estrategia que se pueda jugar que produzca una recompensa más alta en cualquier situación en la que se juegue la estrategia del otro jugador.

Inducción hacia atrás

Hay juegos que tienen múltiples equilibrios de Nash, algunos de los cuales no son realistas. En el caso de los juegos dinámicos, los equilibrios de Nash poco realistas podrían eliminarse aplicando inducción hacia atrás, que supone que el juego futuro será racional. Por lo tanto, elimina las amenazas no creíbles porque sería irracional llevarlas a cabo si un jugador fuera llamado a hacerlo.

Por ejemplo, considere un juego dinámico en el que los jugadores son una empresa establecida en una industria y un participante potencial en esa industria. En su forma actual, el operador predominante tiene el monopolio de la industria y no quiere perder parte de su participación de mercado ante el participante. Si el participante elige no participar, la recompensa para el titular es alta (mantiene su monopolio) y el participante no pierde ni gana (su recompensa es cero). Si el participante ingresa, el titular puede pelear o acomodar al participante. Luchará bajando su precio, haciendo que el participante se quede sin negocio (e incurriendo en costos de salida, una recompensa negativa) y dañando sus propias ganancias. Si acomoda al participante, perderá parte de sus ventas, pero se mantendrá un precio alto y obtendrá mayores ganancias que al bajar su precio (pero menores que las ganancias del monopolio).

Si el participante entra, la mejor respuesta del titular es acomodarse. Si el titular se acomoda, la mejor respuesta del participante es ingresar (y obtener ganancias). Por lo tanto, el perfil de estrategia en el que el operador establecido se acomoda si el participante ingresa y el participante ingresa si el operador establecido se acomoda es un equilibrio de Nash. Sin embargo, si el titular va a jugar a pelear, la mejor respuesta del participante es no entrar. Si el participante no ingresa, no importa lo que el titular elija hacer (ya que no hay otra empresa para hacerlo, tenga en cuenta que si el participante no ingresa, luchar y acomodarse produce los mismos beneficios para ambos jugadores; el el titular no bajará sus precios si el participante no entra). Por lo tanto, la pelea puede considerarse como la mejor respuesta del titular si el participante no ingresa. Por lo tanto, el perfil de estrategia en el que el titular lucha si el participante no entra y el participante no entra si el titular lucha es un equilibrio de Nash. Dado que el juego es dinámico, cualquier afirmación del titular de que peleará es una amenaza no creíble porque para el momento en que se alcanza el nodo de decisión donde puede decidir pelear (es decir, el participante ha entrado), sería irracional hacerlo. asi que. Por tanto, este equilibrio de Nash puede eliminarse mediante inducción hacia atrás.

Ver también:

Equilibrio de Nash perfecto en subjuegos

Una generalización de la inducción hacia atrás es la perfección en subjuegos. La inducción hacia atrás asume que todo juego futuro será racional. En los equilibrios perfectos en subjuegos, el juego en cada subjuego es racional (específicamente un equilibrio de Nash). La inducción hacia atrás solo se puede usar en juegos finales (finitos) de duración definida y no se puede aplicar a juegos con información imperfecta . En estos casos, se puede utilizar la perfección en subjuegos. El equilibrio de Nash eliminado descrito anteriormente es imperfecto en subjuegos porque no es un equilibrio de Nash del subjuego que comienza en el nodo alcanzado una vez que el participante ha entrado.

Equilibrio bayesiano perfecto

A veces, la perfección en subjuegos no impone una restricción lo suficientemente grande sobre los resultados irrazonables. Por ejemplo, dado que los subjuegos no pueden atravesar conjuntos de información , un juego de información imperfecta puede tener solo un subjuego, en sí mismo, y por lo tanto la perfección de subjuegos no puede usarse para eliminar ningún equilibrio de Nash. Un equilibrio bayesiano perfecto (PBE) es una especificación de las estrategias y creencias de los jugadores sobre qué nodo del conjunto de información ha sido alcanzado por el juego. Una creencia sobre un nodo de decisión es la probabilidad de que un jugador en particular piense que ese nodo está o estará en juego (en la ruta de equilibrio ). En particular, la intuición de PBE es que especifica estrategias de jugador que son racionales dadas las creencias de jugador que especifica y las creencias que especifica son consistentes con las estrategias que especifica.

En un juego bayesiano, una estrategia determina lo que juega un jugador en cada conjunto de información controlado por ese jugador. El requisito de que las creencias sean coherentes con las estrategias es algo que no se especifica en la perfección en subjuegos. Por lo tanto, PBE es una condición de coherencia en las creencias de los jugadores. Al igual que en un equilibrio de Nash, la estrategia de ningún jugador está estrictamente dominada, en un PBE, para cualquier conjunto de información, la estrategia de ningún jugador está estrictamente dominada a partir de ese conjunto de información. Es decir, por cada creencia que el jugador pueda mantener en ese conjunto de información, no existe una estrategia que produzca una mayor recompensa esperada para ese jugador. A diferencia de los conceptos de solución anteriores, la estrategia de ningún jugador está estrictamente dominada a partir de cualquier conjunto de información, incluso si está fuera del camino del equilibrio. Por lo tanto, en PBE, los jugadores no pueden amenazar con jugar estrategias estrictamente dominadas a partir de cualquier información que se salga del camino del equilibrio.

El concepto bayesiano en el nombre de este concepto de solución alude al hecho de que los jugadores actualizan sus creencias de acuerdo con el teorema de Bayes . Calculan probabilidades teniendo en cuenta lo que ya ha ocurrido en el juego.

Inducción hacia adelante

La inducción hacia adelante se llama así porque así como la inducción hacia atrás asume que el juego futuro será racional, la inducción hacia adelante asume que el juego pasado fue racional. Cuando un jugador no sabe qué tipo es otro jugador (es decir, hay información imperfecta y asimétrica), ese jugador puede formarse una creencia de qué tipo es ese jugador observando las acciones pasadas de ese jugador. Por lo tanto, la creencia formada por ese jugador de cuál es la probabilidad de que el oponente sea de cierto tipo se basa en que el juego pasado de ese oponente sea racional. Un jugador puede elegir señalar su tipo a través de sus acciones.

Kohlberg y Mertens (1986) introdujeron el concepto de solución de equilibrio estable, un refinamiento que satisface la inducción hacia adelante. Se encontró un contraejemplo en el que tal equilibrio estable no satisfacía la inducción hacia atrás. Para resolver el problema, Jean-François Mertens introdujo lo que los teóricos de los juegos ahora llaman concepto de equilibrio estable de Mertens , probablemente el primer concepto de solución que satisface tanto la inducción hacia adelante como hacia atrás.

Ver también

Referencias