Juego de ciempiés - Centipede game

En teoría de juegos , el juego de ciempiés , introducido por primera vez por Robert Rosenthal en 1981, es un juego de forma extensa en el que dos jugadores se turnan para elegir entre tomar una parte ligeramente mayor de un bote creciente o pasar el bote al otro jugador. Los pagos se organizan de modo que si uno pasa el bote al oponente y el oponente se lleva el bote en la siguiente ronda, uno recibe un poco menos que si hubiera tomado el bote en esta ronda, pero después de un cambio adicional, la recompensa potencial será más alto. Por lo tanto, aunque en cada ronda un jugador tiene un incentivo para llevarse el bote, sería mejor que esperara. Aunque el juego de ciempiés tradicional tenía un límite de 100 rondas (de ahí el nombre), cualquier juego con esta estructura pero con un número diferente de rondas se llama juego de ciempiés.

El equilibrio perfecto único en subjuegos (y cada equilibrio de Nash ) de estos juegos da como resultado que el primer jugador se lleve el bote en la primera ronda del juego; sin embargo, en las pruebas empíricas , relativamente pocos jugadores lo hacen y, como resultado, obtienen una recompensa más alta que en los equilibrios perfectos en subjuegos y de Nash. Estos resultados se toman para mostrar que los equilibrios perfectos en subjuegos y los equilibrios de Nash no predicen el juego humano en algunas circunstancias. El juego Centipede se usa comúnmente en cursos y textos de introducción a la teoría de juegos para resaltar el concepto de inducción hacia atrás y la eliminación iterativa de estrategias dominadas , que muestran una forma estándar de proporcionar una solución al juego.

Jugar

Una posible versión de un juego de ciempiés se podría jugar de la siguiente manera:

Considere dos jugadores: Alice y Bob . Alice se mueve primero. Al comienzo del juego, Alice tiene dos pilas de monedas frente a ella: una pila contiene 4 monedas y la otra pila contiene 1 moneda. Cada jugador tiene dos movimientos disponibles: "tomar" la pila más grande de monedas y darle la pila más pequeña al otro jugador o "empujar" ambas pilas a través de la mesa hacia el otro jugador. Cada vez que las pilas de monedas pasan por la mesa, la cantidad de monedas en cada pila se duplica. Por ejemplo, suponga que Alice elige "empujar" las pilas en su primer movimiento, entregando las pilas de 1 y 4 monedas a Bob, duplicándolas a 2 y 8. Bob ahora podría usar su primer movimiento para "tomar" el pila de 8 monedas y dale 2 monedas a Alice, o él puede "empujar" las dos pilas de nuevo a través de la mesa hacia Alice, aumentando nuevamente el tamaño de las pilas a 4 y 16 monedas. El juego continúa durante un número fijo de rondas o hasta que un jugador decide terminar el juego embolsándose una pila de monedas.

La adición de monedas se considera una externalidad , ya que ninguno de los jugadores contribuye.

Definicion formal

El juego del ciempiés puede escribirse como dónde y . Jugadores y suplentes, comenzando por el jugador , y pueden en cada turno jugar un movimiento con un máximo de rondas. El juego termina cuando se juega por primera vez; de lo contrario, en los movimientos, si nunca se juega.

Suponga que el juego termina en la ronda y el jugador hace el movimiento final. Entonces, el resultado del juego se define de la siguiente manera:

  • Si se juega , gana monedas y gana .
  • Si se juega , gana monedas y gana .

Aquí, denota al otro jugador.

Análisis de equilibrio e inducción hacia atrás

Una representación de forma extensa de un juego de ciempiés de cuatro etapas, que termina después de cuatro rondas con el dinero dividido. Pasar las monedas a través de la mesa está representado por un movimiento de R (atravesando la fila del enrejado, a veces también representado por A para cruzar) y guardar las monedas es un movimiento D (hacia abajo del enrejado). Los números 1 y 2 a lo largo de la parte superior del diagrama muestran el tomador de decisiones alterno entre dos jugadores indicados aquí como 1 y 2, y los números en la parte inferior de cada rama muestran la recompensa para los jugadores 1 y 2 respectivamente.

Las herramientas estándar de la teoría del juego predicen que el primer jugador desertará en la primera ronda, llevándose la pila de monedas para sí mismo. En el juego del ciempiés, una estrategia pura consiste en un conjunto de acciones (una para cada punto de elección en el juego, aunque algunos de estos puntos de elección nunca se alcancen) y una estrategia mixta es una distribución de probabilidad sobre las posibles estrategias puras. Hay varios equilibrios de Nash de estrategia pura del juego del ciempiés e infinitos equilibrios de Nash de estrategia mixta. Sin embargo, solo hay un equilibrio perfecto en subjuegos (un refinamiento popular del concepto de equilibrio de Nash).

En el único equilibrio perfecto en subjuegos, cada jugador elige desertar en cada oportunidad. Esto, por supuesto, significa deserción en la primera etapa. En los equilibrios de Nash, sin embargo, las acciones que se tomarían después de las oportunidades de elección iniciales (aunque nunca se alcancen ya que el primer jugador deserta inmediatamente) pueden ser cooperativas.

La deserción del primer jugador es el único equilibrio perfecto en subjuegos y, requerido por cualquier equilibrio de Nash , puede establecerse por inducción hacia atrás . Supongamos que dos jugadores llegan a la ronda final del juego; al segundo jugador le irá mejor desertando y llevándose una parte ligeramente mayor del bote. Dado que suponemos que el segundo jugador desertará, el primer jugador lo hace mejor al desertar en la segunda a la última ronda, obteniendo una recompensa un poco más alta que la que habría recibido al permitir que el segundo jugador desertara en la última ronda. Pero sabiendo esto, el segundo jugador debería desertar de la tercera a la última ronda, obteniendo una recompensa un poco más alta de la que habría recibido al permitir que el primer jugador desertara en la segunda a la última ronda. Este razonamiento avanza hacia atrás a través del árbol del juego hasta que se llega a la conclusión de que la mejor acción es que el primer jugador desertar en la primera ronda. El mismo razonamiento se puede aplicar a cualquier nodo del árbol del juego.

Para un juego que termina después de cuatro rondas, este razonamiento procede de la siguiente manera. Si llegáramos a la última ronda del juego, el jugador 2 lo haría mejor eligiendo d en lugar de r , recibiendo 4 monedas en lugar de 3. Sin embargo, dado que 2 elegirá d , 1 debería elegir D en la penúltima ronda. , recibiendo 3 en lugar de 2. Dado que 1 elegiría D en la segunda a la última ronda, 2 debería elegir d en la tercera a la última ronda, recibiendo 2 en lugar de 1. Pero dado esto, el jugador 1 debería elegir D en la primera ronda , recibiendo 1 en lugar de 0.

Hay una gran cantidad de equilibrios de Nash en un juego de ciempiés, pero en cada uno, el primer jugador deserta en la primera ronda y el segundo jugador deserta en la siguiente ronda con la frecuencia suficiente para disuadir al primer jugador de pasar. Estar en un equilibrio de Nash no requiere que las estrategias sean racionales en todos los puntos del juego como en el equilibrio perfecto en subjuegos. Esto significa que las estrategias que son cooperativas en las rondas posteriores nunca alcanzadas del juego aún podrían estar en un equilibrio de Nash. En el ejemplo anterior, un equilibrio de Nash es que ambos jugadores deserten en cada ronda (incluso en las rondas posteriores que nunca se alcanzan). Otro equilibrio de Nash es que el jugador 1 desertar en la primera ronda, pero pasar en la tercera ronda y que el jugador 2 desertar en cualquier oportunidad.

Resultados empíricos

Varios estudios han demostrado que rara vez se observa el juego de equilibrio de Nash (y del mismo modo, el equilibrio perfecto en subjuegos). En cambio, los sujetos muestran regularmente una cooperación parcial, jugando "R" (o "r") durante varios movimientos antes de elegir "D" (o "d"). También es raro que los sujetos cooperen durante todo el juego. Véanse ejemplos en McKelvey y Palfrey (1992) y Nagel y Tang (1998). Como en muchos otros experimentos de teoría de juegos, los académicos han investigado el efecto de aumentar las apuestas. Al igual que con otros juegos, por ejemplo el juego del ultimátum , a medida que las apuestas aumentan, el juego se acerca (pero no alcanza) al juego de equilibrio de Nash.

Explicaciones

Dado que los estudios empíricos han arrojado resultados que son incompatibles con el análisis de equilibrio tradicional, se han ofrecido varias explicaciones de este comportamiento. Rosenthal (1981) sugirió que si uno tiene razones para creer que su oponente se desviará del comportamiento de Nash, entonces puede ser ventajoso no desertar en la primera ronda.

Una razón para suponer que las personas pueden desviarse del comportamiento de equilibrio es si algunas son altruistas . La idea básica es que si juegas contra un altruista, esa persona siempre cooperará y, por lo tanto, para maximizar tu recompensa debes desertar en la última ronda en lugar de en la primera. Si suficientes personas son altruistas, vale la pena sacrificar la recompensa de la deserción en la primera ronda para determinar si su oponente es o no altruista. Nagel y Tang (1998) sugieren esta explicación.

Otra posibilidad implica error. Si existe una posibilidad significativa de error en la acción, tal vez porque su oponente no ha razonado completamente a través de la inducción hacia atrás, puede ser ventajoso (y racional) cooperar en las rondas iniciales.

Sin embargo, Parco, Rapoport y Stein (2002) ilustraron que el nivel de incentivos financieros puede tener un efecto profundo en el resultado en un juego de tres jugadores: cuanto mayores son los incentivos para la desviación, mayor es la propensión a aprender comportamientos en un solo juego repetido. -Juega al diseño experimental para avanzar hacia el equilibrio de Nash.

Palacios-Huerta y Volij (2009) encuentran que los ajedrecistas expertos juegan de manera diferente a los estudiantes universitarios. Con un Elo en aumento , la probabilidad de continuar el juego disminuye; todos los Grandes Maestros del experimento se detuvieron a la primera oportunidad. Concluyen que los jugadores de ajedrez están familiarizados con el uso del razonamiento de inducción hacia atrás y, por lo tanto, necesitan menos aprendizaje para alcanzar el equilibrio. Sin embargo, en un intento de replicar estos hallazgos, Levitt, List y Sadoff (2010) encuentran resultados fuertemente contradictorios, con cero de dieciséis Grandes Maestros parando el juego en el primer nodo.

Significado

Al igual que el dilema del prisionero , este juego presenta un conflicto entre el interés propio y el beneficio mutuo. Si pudiera hacerse cumplir, ambos jugadores preferirían que ambos cooperaran durante todo el juego. Sin embargo, el interés propio o la desconfianza de un jugador pueden interferir y crear una situación en la que a ambos les vaya peor que si hubieran cooperado a ciegas. Aunque el Dilema del Prisionero ha recibido una atención sustancial por este hecho, el Juego del Ciempiés ha recibido relativamente menos.

Además, Binmore (2005) ha argumentado que el juego Centipede puede describir algunas situaciones del mundo real. Un ejemplo que presenta es el intercambio de bienes entre partes que desconfían entre sí. Otro ejemplo que Binmore (2005) compara con el juego del ciempiés es el comportamiento de apareamiento de una lubina hermafrodita que se turna para intercambiar huevos para fertilizar. En estos casos, encontramos que la cooperación es abundante.

Dado que los beneficios de cierta cantidad de cooperación en el juego del Ciempiés son mucho mayores que la deserción inmediata, las soluciones "racionales" dadas por la inducción hacia atrás pueden parecer paradójicas. Esto, junto con el hecho de que los sujetos experimentales cooperan regularmente en el juego del Ciempiés, ha provocado un debate sobre la utilidad de las idealizaciones involucradas en las soluciones de inducción hacia atrás, ver Aumann (1995, 1996) y Binmore (1996).

Ver también

Referencias

  • Aumann, R. (1995). "Inducción hacia atrás y conocimiento común de la racionalidad". Juegos y comportamiento económico . 8 (1): 6–19. doi : 10.1016 / S0899-8256 (05) 80015-6 .
  • ——— (1996). "Una respuesta a Binmore". Juegos y comportamiento económico . 17 (1): 138-146. doi : 10.1006 / juego.1996.0099 .
  • Binmore, K. (2005). Justicia natural . Nueva York: Oxford University Press. ISBN 978-0-19-517811-1.
  • ——— (1996). "Una nota sobre la inducción hacia atrás". Juegos y comportamiento económico . 17 (1): 135-137. doi : 10.1006 / juego.1996.0098 .
  • Levitt, SD; List, JA y Sadoff, SE (2010). "Jaque mate: exploración de la inducción hacia atrás entre los jugadores de ajedrez" (PDF) . American Economic Review . 101 (2): 975–990. doi : 10.1257 / aer.101.2.975 .
  • McKelvey, R. y Palfrey, T. (1992). "Un estudio experimental del juego del ciempiés". Econometrica . 60 (4): 803–836. CiteSeerX  10.1.1.295.2774 . doi : 10.2307 / 2951567 . JSTOR  2951567 .
  • Nagel, R. y Tang, FF (1998). "Un estudio experimental sobre el juego del ciempiés en forma normal: una investigación sobre el aprendizaje". Revista de Psicología Matemática . 42 (2–3): 356–384. doi : 10.1006 / jmps.1998.1225 .
  • Palacios-Huerta, I. y Volij, O. (2009). "Ciempiés de campo". American Economic Review . 99 (4): 1619–1635. doi : 10.1257 / aer.99.4.1619 .
  • Parco, JE; Rapoport, A. y Stein, WE (2002). "Efectos de los incentivos económicos sobre la ruptura de la confianza mutua". Ciencia psicológica . 13 (3): 292-297. CiteSeerX  10.1.1.612.8407 . doi : 10.1111 / 1467-9280.00454 . PMID  12009054 .
  • Rapoport, A .; Stein, WE; Parco, JE y Nicholas, TE (2003). "Juego de equilibrio y aprendizaje adaptativo en un juego de ciempiés de tres personas". Juegos y comportamiento económico . 43 (2): 239-265. doi : 10.1016 / S0899-8256 (03) 00009-5 .
  • Rosenthal, R. (1981). "Juegos de información perfecta, precios predatorios y la cadena de tiendas". Revista de teoría económica . 25 (1): 92–100. CiteSeerX  10.1.1.482.8534 . doi : 10.1016 / 0022-0531 (81) 90018-1 .

enlaces externos