Concepto de solución - Solution concept
En teoría de juegos , un concepto de solución es una regla formal para predecir cómo se jugará un juego. Estas predicciones se denominan "soluciones" y describen qué estrategias adoptarán los jugadores y, por tanto, el resultado del juego. Los conceptos de solución más utilizados son los conceptos de equilibrio , el más famoso es el equilibrio de Nash .
Muchos conceptos de solución, para muchos juegos, darán como resultado más de una solución. Esto pone en duda cualquiera de las soluciones, por lo que un teórico de juegos puede aplicar un refinamiento para delimitar las soluciones. Cada concepto de solución sucesiva presentado a continuación mejora su predecesor al eliminar equilibrios inverosímiles en juegos más ricos.
Definicion formal
Sea la clase de todos los juegos y, para cada juego , sea el conjunto de perfiles de estrategia de . Un concepto de solución es un elemento del producto directo, es decir , una función tal que para todos
Racionalización y dominio iterado
En este concepto de solución, se supone que los jugadores son racionales y, por lo tanto, las estrategias estrictamente dominadas se eliminan del conjunto de estrategias que podrían jugarse de manera factible. Una estrategia está estrictamente dominada cuando hay alguna otra estrategia disponible para el jugador que siempre tiene una recompensa más alta, independientemente de las estrategias que elijan los otros jugadores. (Las estrategias estrictamente dominadas también son importantes en la búsqueda del árbol de juego minimax .) Por ejemplo, en el dilema de los prisioneros (de un solo período) (que se muestra a continuación), cooperar está estrictamente dominado por el defecto para ambos jugadores porque cualquiera de los jugadores siempre está mejor jugando con defecto. , independientemente de lo que haga su oponente.
Prisoner 2 Cooperate | Defecto del prisionero 2 | |
---|---|---|
Prisionero 1 Cooperar | −0,5, −0,5 | −10, 0 |
Defecto del prisionero 1 | 0, −10 | −2, −2 |
equilibrio de Nash
Un equilibrio de Nash es un perfil de estrategia (un perfil de estrategia especifica una estrategia para cada jugador, por ejemplo, en el juego de dilema de los prisioneros anterior ( cooperar , desertar ) especifica que el prisionero 1 juega cooperar y el prisionero 2 juega defecto ) en el que cada estrategia es la mejor respuesta a todas las demás estrategias jugadas. Una estrategia de un jugador es la mejor respuesta a la estrategia de otro jugador si no hay otra estrategia que se pueda jugar que produzca una recompensa más alta en cualquier situación en la que se juegue la estrategia del otro jugador.
Inducción hacia atrás
Hay juegos que tienen múltiples equilibrios de Nash, algunos de los cuales no son realistas. En el caso de los juegos dinámicos, los equilibrios de Nash poco realistas podrían eliminarse aplicando inducción hacia atrás, que supone que el juego futuro será racional. Por lo tanto, elimina las amenazas no creíbles porque sería irracional llevarlas a cabo si un jugador fuera llamado a hacerlo.
Por ejemplo, considere un juego dinámico en el que los jugadores son una empresa establecida en una industria y un participante potencial en esa industria. En su forma actual, el operador predominante tiene el monopolio de la industria y no quiere perder parte de su participación de mercado ante el participante. Si el participante elige no participar, la recompensa para el titular es alta (mantiene su monopolio) y el participante no pierde ni gana (su recompensa es cero). Si el participante ingresa, el titular puede pelear o acomodar al participante. Luchará bajando su precio, haciendo que el participante se quede sin negocio (e incurriendo en costos de salida, una recompensa negativa) y dañando sus propias ganancias. Si acomoda al participante, perderá parte de sus ventas, pero se mantendrá un precio alto y obtendrá mayores ganancias que al bajar su precio (pero menores que las ganancias del monopolio).
Si el participante entra, la mejor respuesta del titular es acomodarse. Si el titular se acomoda, la mejor respuesta del participante es ingresar (y obtener ganancias). Por lo tanto, el perfil de estrategia en el que el operador establecido se acomoda si el participante ingresa y el participante ingresa si el operador establecido se acomoda es un equilibrio de Nash. Sin embargo, si el titular va a jugar a pelear, la mejor respuesta del participante es no entrar. Si el participante no ingresa, no importa lo que el titular elija hacer (ya que no hay otra empresa para hacerlo, tenga en cuenta que si el participante no ingresa, luchar y acomodarse produce los mismos beneficios para ambos jugadores; el el titular no bajará sus precios si el participante no entra). Por lo tanto, la pelea puede considerarse como la mejor respuesta del titular si el participante no ingresa. Por lo tanto, el perfil de estrategia en el que el titular lucha si el participante no entra y el participante no entra si el titular lucha es un equilibrio de Nash. Dado que el juego es dinámico, cualquier afirmación del titular de que peleará es una amenaza no creíble porque para el momento en que se alcanza el nodo de decisión donde puede decidir pelear (es decir, el participante ha entrado), sería irracional hacerlo. asi que. Por tanto, este equilibrio de Nash puede eliminarse mediante inducción hacia atrás.
Ver también:
Equilibrio de Nash perfecto en subjuegos
Una generalización de la inducción hacia atrás es la perfección en subjuegos. La inducción hacia atrás asume que todo juego futuro será racional. En los equilibrios perfectos en subjuegos, el juego en cada subjuego es racional (específicamente un equilibrio de Nash). La inducción hacia atrás solo se puede usar en juegos finales (finitos) de duración definida y no se puede aplicar a juegos con información imperfecta . En estos casos, se puede utilizar la perfección en subjuegos. El equilibrio de Nash eliminado descrito anteriormente es imperfecto en subjuegos porque no es un equilibrio de Nash del subjuego que comienza en el nodo alcanzado una vez que el participante ha entrado.
Equilibrio bayesiano perfecto
A veces, la perfección en subjuegos no impone una restricción lo suficientemente grande sobre los resultados irrazonables. Por ejemplo, dado que los subjuegos no pueden atravesar conjuntos de información , un juego de información imperfecta puede tener solo un subjuego, en sí mismo, y por lo tanto la perfección de subjuegos no puede usarse para eliminar ningún equilibrio de Nash. Un equilibrio bayesiano perfecto (PBE) es una especificación de las estrategias y creencias de los jugadores sobre qué nodo del conjunto de información ha sido alcanzado por el juego. Una creencia sobre un nodo de decisión es la probabilidad de que un jugador en particular piense que ese nodo está o estará en juego (en la ruta de equilibrio ). En particular, la intuición de PBE es que especifica estrategias de jugador que son racionales dadas las creencias de jugador que especifica y las creencias que especifica son consistentes con las estrategias que especifica.
En un juego bayesiano, una estrategia determina lo que juega un jugador en cada conjunto de información controlado por ese jugador. El requisito de que las creencias sean coherentes con las estrategias es algo que no se especifica en la perfección en subjuegos. Por lo tanto, PBE es una condición de coherencia en las creencias de los jugadores. Al igual que en un equilibrio de Nash, la estrategia de ningún jugador está estrictamente dominada, en un PBE, para cualquier conjunto de información, la estrategia de ningún jugador está estrictamente dominada a partir de ese conjunto de información. Es decir, por cada creencia que el jugador pueda mantener en ese conjunto de información, no existe una estrategia que produzca una mayor recompensa esperada para ese jugador. A diferencia de los conceptos de solución anteriores, la estrategia de ningún jugador está estrictamente dominada a partir de cualquier conjunto de información, incluso si está fuera del camino del equilibrio. Por lo tanto, en PBE, los jugadores no pueden amenazar con jugar estrategias estrictamente dominadas a partir de cualquier información que se salga del camino del equilibrio.
El concepto bayesiano en el nombre de este concepto de solución alude al hecho de que los jugadores actualizan sus creencias de acuerdo con el teorema de Bayes . Calculan probabilidades teniendo en cuenta lo que ya ha ocurrido en el juego.
Inducción hacia adelante
La inducción hacia adelante se llama así porque así como la inducción hacia atrás asume que el juego futuro será racional, la inducción hacia adelante asume que el juego pasado fue racional. Cuando un jugador no sabe qué tipo es otro jugador (es decir, hay información imperfecta y asimétrica), ese jugador puede formarse una creencia de qué tipo es ese jugador observando las acciones pasadas de ese jugador. Por lo tanto, la creencia formada por ese jugador de cuál es la probabilidad de que el oponente sea de cierto tipo se basa en que el juego pasado de ese oponente sea racional. Un jugador puede elegir señalar su tipo a través de sus acciones.
Kohlberg y Mertens (1986) introdujeron el concepto de solución de equilibrio estable, un refinamiento que satisface la inducción hacia adelante. Se encontró un contraejemplo en el que tal equilibrio estable no satisfacía la inducción hacia atrás. Para resolver el problema, Jean-François Mertens introdujo lo que los teóricos de los juegos ahora llaman concepto de equilibrio estable de Mertens , probablemente el primer concepto de solución que satisface tanto la inducción hacia adelante como hacia atrás.
Ver también
- Juego de forma extensa
- Equilibrio de manos temblorosas
- " El criterio intuitivo " ( Cho & Kreps 1987 )
Referencias
- Cho, IK .; Kreps, DM (1987). "Juegos de señalización y equilibrios estables". Revista Trimestral de Economía . 102 (2): 179–221. CiteSeerX 10.1.1.407.5013 . doi : 10.2307 / 1885060 . JSTOR 1885060 .
- Fudenberg, Drew ; Tirole, Jean (1991). Teoría de juegos . Cambridge, Massachusetts: MIT Press . ISBN 9780262061414. Vista previa del libro.
- Harsanyi, J. (1973) La rareza del número de puntos de equilibrio: una nueva demostración . Revista internacional de teoría de juegos 2: 235–250.
- Govindan, Srihari y Robert Wilson, 2008. "Refinamientos del equilibrio de Nash", The New Palgrave Dictionary of Economics, 2ª edición. [1]
- Hines, WGS (1987) Estrategias evolutivas estables: una revisión de la teoría básica . Biología teórica de poblaciones 31: 195-272.
- Kohlberg, Elon y Jean-François Mertens, 1986. " Sobre la estabilidad estratégica de los equilibrios ", Econometrica, Econometric Society, vol. 54 (5), páginas 1003-37, septiembre.
- Leyton-Brown, Kevin; Shoham, Yoav (2008). Fundamentos de la teoría de juegos: una introducción concisa y multidisciplinaria . San Rafael, CA: Morgan & Claypool Publishers. ISBN 978-1-59829-593-1.
- Mertens, Jean-François, 1989. "Equilibrios estables - Una reformulación. Parte 1 Definiciones y propiedades básicas", Matemáticas de la investigación de operaciones, vol. 14, núm. 4, noviembre [2]
- Noldeke, G. y Samuelson, L. (1993) Un análisis evolutivo de la inducción hacia atrás y hacia adelante . Juegos y comportamiento económico 5: 425–454.
- Maynard Smith, J. (1982) Evolución y teoría de los juegos . ISBN 0-521-28884-3
- Osborne, Martin J .; Rubinstein, Ariel (1994). Un curso de teoría de juegos . Prensa del MIT . ISBN 978-0-262-65040-3..
- Selten, R. (1983) Estabilidad evolutiva en juegos extensos de dos personas . Matemáticas. Soc. Sci. 5: 269–363.
- Selten, R. (1988) Estabilidad evolutiva en juegos extensos de dos personas: corrección y desarrollo posterior . Matemáticas. Soc. Sci. 16: 223–266
- Shoham, Yoav; Leyton-Brown, Kevin (2009). Sistemas multiagente: fundamentos algorítmicos, teóricos de juegos y lógicos . Nueva York: Cambridge University Press . ISBN 978-0-521-89943-7.
- Thomas, B. (1985a) Sobre conjuntos evolutivos estables. J. Math. Biol. 22: 105-115.
- Thomas, B. (1985b) Conjuntos estables evolutivos en modelos de estratega mixto . Theor. Música pop. Biol. 28: 332–341