Teoría de juego - Game theory

La teoría de juegos es el estudio de modelos matemáticos de interacciones estratégicas entre tomadores de decisiones racionales . Tiene aplicaciones en todos los campos de las ciencias sociales , así como en lógica , ciencia de sistemas e informática . Originalmente, se refería a los juegos de suma cero , en los que las ganancias o pérdidas de cada participante se equilibran exactamente con las de los demás participantes. En el siglo XXI, la teoría de juegos se aplica a una amplia gama de relaciones de comportamiento y ahora es un término general para la ciencia de la toma de decisiones lógicas en humanos, animales y computadoras.

La teoría de juegos moderna comenzó con la idea de equilibrios de estrategia mixta en un juego de suma cero de dos personas y su demostración por John von Neumann . La demostración original de Von Neumann utilizó el teorema de punto fijo de Brouwer en mapeos continuos en conjuntos convexos compactos , que se convirtió en un método estándar en teoría de juegos y economía matemática . Su artículo fue seguido por el libro de 1944 Theory of Games and Economic Behavior , coescrito con Oskar Morgenstern , que consideraba los juegos cooperativos de varios jugadores. La segunda edición de este libro proporcionó una teoría axiomática de la utilidad esperada, que permitió a los estadísticos matemáticos y economistas tratar la toma de decisiones en condiciones de incertidumbre.

La teoría de juegos fue desarrollada ampliamente en la década de 1950 por muchos estudiosos. Se aplicó explícitamente a la evolución en la década de 1970, aunque desarrollos similares se remontan al menos hasta la década de 1930. La teoría de juegos ha sido ampliamente reconocida como una herramienta importante en muchos campos. A partir de 2014, con el Premio Nobel de Ciencias Económicas para el teórico de juegos Jean Tirole , once teóricos de juegos han ganado el Premio Nobel de Economía. John Maynard Smith recibió el premio Crafoord por su aplicación de la teoría de juegos evolutivos .

Historia

Precursores

Las discusiones sobre las matemáticas de los juegos comenzaron mucho antes del surgimiento de la teoría de juegos matemática moderna. El trabajo de Cardano sobre juegos de azar en Liber de ludo aleae ( Libro sobre juegos de azar ), que fue escrito alrededor de 1564 pero publicado póstumamente en 1663, formuló algunas de las ideas básicas del campo. En la década de 1650, Pascal y Huygens desarrollaron el concepto de expectativa sobre el razonamiento sobre la estructura de los juegos de azar, y Huygens publicó su cálculo del juego en De ratiociniis in ludo aleæ ( Sobre el razonamiento en los juegos de azar ) en 1657.

En 1713, una carta atribuida a Charles Waldegrave analizaba un juego llamado "le Her". Era un jacobita activo y tío de James Waldegrave , un diplomático británico. En esta carta, Waldegrave proporciona una solución de estrategia mixta minimax para una versión de dos personas del juego de cartas le Her , y el problema ahora se conoce como problema de Waldegrave . En sus Recherches sur les principes mathématiques de la théorie des richesses ( Investigaciones sobre los principios matemáticos de la teoría de la riqueza ) de 1838 , Antoine Augustin Cournot consideró un duopolio y presenta una solución que es el equilibrio de Nash del juego.

En 1913, Ernst Zermelo publicó Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels ( Sobre una aplicación de la teoría de conjuntos a la teoría del juego de ajedrez ), que demostró que la estrategia de ajedrez óptima está estrictamente determinada . Esto allanó el camino para teoremas más generales.

En 1938, el economista matemático danés Frederik Zeuthen demostró que el modelo matemático tenía una estrategia ganadora utilizando el teorema del punto fijo de Brouwer . En su libro de 1938 Applications aux Jeux de Hasard y notas anteriores, Émile Borel demostró un teorema minimax para juegos matriciales de suma cero de dos personas solo cuando la matriz de pago era simétrica y proporciona una solución a un juego infinito no trivial (conocido en inglés como juego Blotto ). Borel conjeturó la inexistencia de equilibrios de estrategia mixta en juegos finitos de dos personas de suma cero , una conjetura que von Neumann demostró falsa.

Nacimiento y desarrollos tempranos

La teoría de juegos no existía realmente como un campo único hasta que John von Neumann publicó el artículo Sobre la teoría de los juegos de estrategia en 1928. La demostración original de Von Neumann utilizaba el teorema del punto fijo de Brouwer sobre asignaciones continuas en conjuntos convexos compactos , que se convirtió en un método estándar en teoría de juegos y economía matemática . Su artículo fue seguido por su libro de 1944 Theory of Games and Economic Behavior , en coautoría con Oskar Morgenstern . La segunda edición de este libro proporcionó una teoría axiomática de la utilidad , que reencarnó la vieja teoría de la utilidad (del dinero) de Daniel Bernoulli como una disciplina independiente. El trabajo de Von Neumann en teoría de juegos culminó en este libro de 1944. Este trabajo fundamental contiene el método para encontrar soluciones mutuamente consistentes para juegos de suma cero de dos personas. El trabajo posterior se centró principalmente en la teoría de juegos cooperativos , que analiza las estrategias óptimas para grupos de individuos, asumiendo que pueden hacer cumplir los acuerdos entre ellos sobre las estrategias adecuadas.

En 1950, apareció la primera discusión matemática sobre el dilema del prisionero , y los notables matemáticos Merrill M. Flood y Melvin Dresher emprendieron un experimento , como parte de las investigaciones de la RAND Corporation sobre la teoría de juegos. RAND prosiguió con los estudios debido a posibles aplicaciones a la estrategia nuclear global . Por esta misma época, John Nash desarrolló un criterio de consistencia mutua de las estrategias de los jugadores conocido como equilibrio de Nash , aplicable a una variedad más amplia de juegos que el criterio propuesto por von Neumann y Morgenstern. Nash demostró que cada juego no cooperativo finito de n jugadores, de suma distinta de cero (no solo de dos jugadores de suma cero) tiene lo que ahora se conoce como un equilibrio de Nash en estrategias mixtas.

La teoría de juegos experimentó una intensa actividad en la década de 1950, durante el cual los conceptos del núcleo , la forma extensiva del juego , juego ficticio , juegos repetidos , y el valor de Shapley fueron desarrollados. La década de 1950 también vio las primeras aplicaciones de la teoría de juegos a la filosofía y las ciencias políticas .

Logros premiados

En 1965, Reinhard Selten introdujo su concepto de solución de equilibrios perfectos en subjuegos , que refinó aún más el equilibrio de Nash. Más tarde también introduciría la perfección de manos temblorosas . En 1994, Nash, Selten y Harsanyi se convirtieron en premios Nobel de Economía por sus contribuciones a la teoría de los juegos económicos.

En la década de 1970, la teoría de juegos se aplicó ampliamente en biología , en gran parte como resultado del trabajo de John Maynard Smith y su estrategia evolutivamente estable . Además, se introdujeron y analizaron los conceptos de equilibrio correlacionado , perfección de manos temblorosas y conocimiento común .

En 2005, los teóricos de los juegos Thomas Schelling y Robert Aumann siguieron a Nash, Selten y Harsanyi como premios Nobel. Schelling trabajó en modelos dinámicos, primeros ejemplos de teoría de juegos evolutiva . Aumann contribuyó más a la escuela del equilibrio, introduciendo el endurecimiento del equilibrio y los equilibrios correlacionados, y desarrollando un análisis formal extenso del supuesto del conocimiento común y de sus consecuencias.

En 2007, Leonid Hurwicz , Eric Maskin y Roger Myerson recibieron el Premio Nobel de Economía "por haber sentado las bases de la teoría del diseño de mecanismos ". Las contribuciones de Myerson incluyen la noción de equilibrio adecuado y un importante texto de posgrado: Teoría de juegos, Análisis del conflicto . Hurwicz introdujo y formalizó el concepto de compatibilidad de incentivos .

En 2012, Alvin E. Roth y Lloyd S. Shapley recibieron el Premio Nobel de Economía "por la teoría de las asignaciones estables y la práctica del diseño de mercado". En 2014, el Nobel fue para el teórico de juegos Jean Tirole .

Tipos de juegos

Cooperativa / no cooperativa

Un juego es cooperativo si los jugadores son capaces de contraer compromisos vinculantes aplicados externamente (por ejemplo, a través de la ley de contratos ). Un juego no es cooperativo si los jugadores no pueden formar alianzas o si todos los acuerdos deben ser autoaplicables (por ejemplo, a través de amenazas creíbles ).

Los juegos cooperativos a menudo se analizan a través del marco de la teoría de juegos cooperativos , que se centra en predecir qué coaliciones se formarán, las acciones conjuntas que emprenden los grupos y los beneficios colectivos resultantes. Se opone a la teoría tradicional de juegos no cooperativos, que se centra en predecir las acciones y beneficios de los jugadores individuales y analizar los equilibrios de Nash . El enfoque en la recompensa individual puede resultar en un fenómeno conocido como Tragedia de los Comunes , donde los recursos se utilizan a un nivel colectivamente ineficiente. La falta de negociación formal conduce al deterioro de los bienes públicos por el uso excesivo y la falta de provisión que se deriva de los incentivos privados.

La teoría de los juegos cooperativos proporciona un enfoque de alto nivel, ya que describe solo la estructura, las estrategias y los beneficios de las coaliciones, mientras que la teoría de los juegos no cooperativos también analiza cómo los procedimientos de negociación afectarán la distribución de los beneficios dentro de cada coalición. Como la teoría de juegos no cooperativos es más general, los juegos cooperativos pueden analizarse a través del enfoque de la teoría de juegos no cooperativos (lo contrario no es válido) siempre que se hagan suposiciones suficientes para abarcar todas las estrategias posibles disponibles para los jugadores debido a la posibilidad de aplicación externa de la cooperación. Si bien el uso de una sola teoría puede ser deseable, en muchos casos se dispone de información insuficiente para modelar con precisión los procedimientos formales disponibles durante el proceso de negociación estratégica, o el modelo resultante sería demasiado complejo para ofrecer una herramienta práctica en el mundo real. En tales casos, la teoría de juegos cooperativos proporciona un enfoque simplificado que permite el análisis del juego en general sin tener que hacer ninguna suposición sobre los poderes de negociación.

Simétrico / asimétrico

mi F
mi 1, 2 0, 0
F 0, 0 1, 2
Un juego asimétrico

Un juego simétrico es un juego en el que los beneficios de jugar una estrategia en particular dependen solo de las otras estrategias empleadas, no de quién las está jugando. Es decir, si las identidades de los jugadores se pueden cambiar sin cambiar la recompensa de las estrategias, entonces un juego es simétrico. Muchos de los juegos 2 × 2 comúnmente estudiados son simétricos. Las representaciones estándar del pollo , el dilema del prisionero y la caza del ciervo son todos juegos simétricos. Algunos estudiosos también considerarían ciertos juegos asimétricos como ejemplos de estos juegos. Sin embargo, las recompensas más comunes para cada uno de estos juegos son simétricas.

Los juegos asimétricos más comúnmente estudiados son los juegos en los que no hay conjuntos de estrategias idénticos para ambos jugadores. Por ejemplo, el juego del ultimátum y de manera similar el juego del dictador tienen estrategias diferentes para cada jugador. Sin embargo, es posible que un juego tenga estrategias idénticas para ambos jugadores, pero que sea asimétrico. Por ejemplo, el juego que se muestra en el gráfico de esta sección es asimétrico a pesar de tener conjuntos de estrategias idénticos para ambos jugadores.

Suma cero / suma distinta de cero

A B
A –1, 1 3, –3
B 0, 0 –2, 2
Un juego de suma cero

Los juegos de suma cero son un caso especial de juegos de suma constante en los que las elecciones de los jugadores no pueden aumentar ni disminuir los recursos disponibles. En los juegos de suma cero, el beneficio total va para todos los jugadores en un juego, por cada combinación de estrategias, siempre se suma a cero (más informalmente, un jugador se beneficia solo a costa de los demás). El póquer ejemplifica un juego de suma cero (ignorando la posibilidad del corte de la casa), porque uno gana exactamente la cantidad que pierden sus oponentes. Otros juegos de suma cero incluyen monedas de un centavo y la mayoría de los juegos de mesa clásicos, como el Go y el ajedrez .

Muchos juegos estudiados por los teóricos de los juegos (incluido el famoso dilema del prisionero ) son juegos de suma distinta de cero, porque el resultado tiene resultados netos mayores o menores que cero. De manera informal, en los juegos de suma distinta de cero, la ganancia de un jugador no se corresponde necesariamente con la pérdida de otro.

Los juegos de suma constante corresponden a actividades como el robo y los juegos de azar, pero no a la situación económica fundamental en la que hay ganancias potenciales del comercio . Es posible transformar cualquier juego en un juego de suma cero (posiblemente asimétrico) agregando un jugador ficticio (a menudo llamado "el tablero") cuyas pérdidas compensan las ganancias netas de los jugadores.

Simultáneo / secuencial

Los juegos simultáneos son juegos en los que ambos jugadores se mueven simultáneamente o, en cambio, los jugadores posteriores desconocen las acciones de los jugadores anteriores (lo que los hace efectivamente simultáneos). Los juegos secuenciales (o juegos dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento sobre acciones anteriores. No es necesario que sea información perfecta sobre todas las acciones de los jugadores anteriores; puede ser muy poco conocimiento. Por ejemplo, un jugador puede saber que un jugador anterior no realizó una acción en particular, mientras que no sabe cuál de las otras acciones disponibles realizó realmente el primer jugador.

La diferencia entre juegos simultáneos y secuenciales se captura en las diferentes representaciones discutidas anteriormente. A menudo, la forma normal se usa para representar juegos simultáneos, mientras que la forma extensa se usa para representar los secuenciales. La transformación de forma extensiva a normal es una vía, lo que significa que múltiples juegos de forma extensiva corresponden a la misma forma normal. En consecuencia, las nociones de equilibrio para juegos simultáneos son insuficientes para razonar sobre juegos secuenciales; ver la perfección en subjuegos .

En resumen, las diferencias entre juegos secuenciales y simultáneos son las siguientes:

Secuencial Simultáneo
Normalmente denotado por Árboles de decisión Matrices de pagos
¿Conocimiento previo
del movimiento del oponente?
No
¿Eje de tiempo? No
También conocido como
Juego
extenso Juego extenso

Concurso de Cournot

El modelo de competencia de Cournot implica que los jugadores eligen la cantidad de un producto homogéneo para producir de forma independiente y simultánea, donde el costo marginal puede ser diferente para cada empresa y la recompensa de la empresa es la ganancia. Los costos de producción son información pública y la empresa apunta a encontrar su cantidad maximizadora de ganancias en base a lo que creen que la otra empresa producirá y se comportará como monopolios. En este juego, las empresas quieren producir a la cantidad de monopolio, pero hay un alto incentivo para desviarse y producir más, lo que reduce el precio de compensación del mercado. Por ejemplo, las empresas pueden verse tentadas a desviarse de la cantidad de monopolio si hay una cantidad de monopolio baja y un precio alto, con el objetivo de aumentar la producción para maximizar las ganancias. Sin embargo, esta opción no ofrece la mayor recompensa, ya que la capacidad de una empresa para maximizar las ganancias depende de su participación de mercado y de la elasticidad de la demanda del mercado. El equilibrio de Cournot se alcanza cuando cada empresa opera en su función de reacción sin incentivos para desviarse, ya que tienen la mejor respuesta basada en la producción de las otras empresas. Dentro del juego, las empresas alcanzan el equilibrio de Nash cuando se logra el equilibrio de Cournot.

Equilibrio para la competencia cuantitativa de Cournot

Competencia Bertrand

La competencia de Bertrand , asume productos homogéneos y un costo marginal constante y los jugadores eligen los precios. El equilibrio de la competencia de precios es donde el precio es igual a los costos marginales, asumiendo información completa sobre los costos de los competidores. Por lo tanto, las empresas tienen un incentivo para desviarse del equilibrio porque un producto homogéneo con un precio más bajo ganará toda la participación de mercado, lo que se conoce como ventaja de costos.

Información perfecta e información imperfecta

Un juego de información imperfecta (la línea de puntos representa la ignorancia por parte del jugador 2, formalmente llamado conjunto de información )

Un subconjunto importante de juegos secuenciales consiste en juegos de información perfecta . Un juego es uno de información perfecta si todos los jugadores, en cada movimiento del juego, conocen los movimientos realizados previamente por todos los demás jugadores. En realidad, esto se puede aplicar a empresas y consumidores que tienen información sobre el precio y la calidad de todos los bienes disponibles en un mercado. Se juega un juego de información imperfecta cuando los jugadores no conocen todos los movimientos ya realizados por el oponente, como un juego de movimientos simultáneos. La mayoría de los juegos estudiados en teoría de juegos son juegos de información imperfecta. Ejemplos de juegos de información perfecta incluyen tic-tac-toe , damas , ajedrez infinito y Go .

Muchos juegos de cartas son juegos de información imperfecta, como el póquer y el bridge . La información perfecta a menudo se confunde con la información completa , que es un concepto similar. La información completa requiere que cada jugador conozca las estrategias y los beneficios disponibles para los otros jugadores, pero no necesariamente las acciones tomadas, mientras que la información perfecta es el conocimiento de todos los aspectos del juego y de los jugadores. Juegos de información incompleta pueden reducirse, sin embargo, a los juegos de información imperfecta mediante la introducción " se mueve por la naturaleza ".

Juego bayesiano

Para uno de los supuestos detrás del concepto de equilibrio de Nash, cada jugador tiene creencias correctas sobre las acciones de los otros jugadores. En la teoría de juegos, hay muchas situaciones en las que los participantes no comprenden completamente las características de sus oponentes. Los negociadores pueden desconocer la valoración de su oponente del objeto de negociación, las empresas pueden desconocer las funciones de costos de su oponente, los combatientes pueden desconocer las fortalezas de su oponente y los jurados pueden desconocer la interpretación de sus colegas de la evidencia en el juicio. En algunos casos, los participantes pueden conocer bien el carácter de su oponente, pero pueden no saber qué tan bien su oponente conoce su propio carácter.

El juego bayesiano significa un juego estratégico con información incompleta. Para un juego estratégico, los que toman las decisiones son los jugadores y cada jugador tiene un grupo de acciones. Una parte fundamental de la especificación de información imperfecta es el conjunto de estados. Cada estado describe completamente una colección de características relevantes para el jugador, como sus preferencias y detalles sobre ellos. Debe haber un estado para cada conjunto de características que algún jugador crea que pueden existir.

ejemplo de juego bayesiano

Por ejemplo, cuando el jugador 1 no está seguro de si el jugador 2 preferiría salir con ella o alejarse de ella, mientras que el jugador 2 entiende las preferencias del jugador 1 como antes. Para ser específico, supongamos que el jugador 1 cree que el jugador 2 quiere salir con ella con una probabilidad de 1/2 y alejarse de ella con una probabilidad de 1/2 (esta evaluación proviene probablemente de la experiencia del jugador 1: se enfrenta a jugadores que quieren para salir con ella la mitad del tiempo en tal caso y jugadores que quieren evitarla la mitad del tiempo). Debido a la probabilidad involucrada, el análisis de esta situación requiere comprender la preferencia del jugador por el sorteo, aunque a las personas solo les interesa el equilibrio estratégico puro.

Juegos combinatorios

Los juegos en los que la dificultad de encontrar una estrategia óptima proviene de la multiplicidad de movimientos posibles se denominan juegos combinatorios. Los ejemplos incluyen ajedrez y listo. Los juegos que involucran información imperfecta también pueden tener un fuerte carácter combinatorio, por ejemplo, el backgammon . No existe una teoría unificada que aborde los elementos combinatorios en los juegos. Sin embargo, existen herramientas matemáticas que pueden resolver problemas particulares y responder preguntas generales.

Los juegos de información perfecta se han estudiado en la teoría de juegos combinatorios , que ha desarrollado representaciones novedosas, por ejemplo, números surrealistas , así como métodos de prueba combinatorios y algebraicos (y a veces no constructivos ) para resolver juegos de ciertos tipos, incluidos los juegos "loopy" que puede resultar en secuencias de movimientos infinitamente largas. Estos métodos abordan juegos con una mayor complejidad combinatoria que los que se suelen considerar en la teoría de juegos tradicional (o "económica"). Un juego típico que se ha resuelto de esta manera es Hex . Un campo de estudio relacionado, que se basa en la teoría de la complejidad computacional , es la complejidad del juego , que se ocupa de estimar la dificultad computacional de encontrar estrategias óptimas.

La investigación en inteligencia artificial ha abordado tanto los juegos de información perfectos como los imperfectos que tienen estructuras combinatorias muy complejas (como el ajedrez, el go o el backgammon) para los que no se han encontrado estrategias óptimas demostrables. Las soluciones prácticas involucran heurística computacional, como la poda alfa-beta o el uso de redes neuronales artificiales entrenadas por aprendizaje reforzado , que hacen que los juegos sean más manejables en la práctica informática.

Juegos infinitamente largos

Los juegos, tal como los estudian los economistas y los jugadores del mundo real, generalmente se terminan en un número finito de movimientos. Matemáticos puros no están tan restringidos, y establecen los teóricos en particular juegos de estudio que tienen una duración de un número infinito de movimientos, con el ganador (u otra recompensa) no se conoce hasta después de todos esos movimientos se han completado.

Por lo general, el foco de atención no se centra tanto en la mejor manera de jugar un juego de este tipo, sino en si un jugador tiene una estrategia ganadora . (Se puede probar, utilizando el axioma de elección , que hay juegos, incluso con información perfecta y donde los únicos resultados son "ganar" o "perder", para los que ningún jugador tiene una estrategia ganadora). La existencia de tales estrategias , para juegos inteligentemente diseñados, tiene importantes consecuencias en la teoría descriptiva de conjuntos .

Juegos discretos y continuos

Gran parte de la teoría de juegos se ocupa de juegos finitos y discretos que tienen un número finito de jugadores, movimientos, eventos, resultados, etc. Sin embargo, muchos conceptos se pueden ampliar. Los juegos continuos permiten a los jugadores elegir una estrategia de un conjunto de estrategias continuas. Por ejemplo, la competencia de Cournot generalmente se modela con las estrategias de los jugadores como cantidades no negativas, incluidas las cantidades fraccionarias.

Juegos diferenciales

Los juegos diferenciales como el de persecución continua y el juego de evasión son juegos continuos donde la evolución de las variables de estado de los jugadores se rige por ecuaciones diferenciales . El problema de encontrar una estrategia óptima en un juego diferencial está estrechamente relacionado con la teoría del control óptimo . En particular, hay dos tipos de estrategias: las estrategias de ciclo abierto se encuentran utilizando el principio máximo de Pontryagin, mientras que las estrategias de ciclo cerrado se encuentran utilizando el método de programación dinámica de Bellman .

Un caso particular de juegos diferenciales son los juegos con horizonte temporal aleatorio . En tales juegos, el tiempo terminal es una variable aleatoria con una función de distribución de probabilidad dada . Por lo tanto, los jugadores maximizan la expectativa matemática de la función de costo. Se demostró que el problema de optimización modificado puede reformularse como un juego diferencial con descuento durante un intervalo de tiempo infinito.

Teoría de juegos evolutivos

La teoría de juegos evolutivos estudia a los jugadores que ajustan sus estrategias a lo largo del tiempo de acuerdo con reglas que no son necesariamente racionales o previsoras. En general, la evolución de las estrategias a lo largo del tiempo de acuerdo con tales reglas se modela como una cadena de Markov con una variable de estado como el perfil de la estrategia actual o cómo se ha jugado el juego en el pasado reciente. Tales reglas pueden incluir imitación, optimización o supervivencia del más apto.

En biología, tales modelos pueden representar la evolución , en la que la descendencia adopta las estrategias de sus padres y los padres que juegan con estrategias más exitosas (es decir, correspondientes a mayores ganancias) tienen un mayor número de descendencia. En las ciencias sociales, estos modelos típicamente representan un ajuste estratégico por parte de los jugadores que juegan un juego muchas veces durante su vida y, consciente o inconscientemente, ocasionalmente ajustan sus estrategias.

Resultados estocásticos (y relación con otros campos)

Los problemas de decisión individuales con resultados estocásticos a veces se consideran "juegos de un jugador". Algunos autores no consideran estas situaciones como teóricas del juego. Pueden modelarse utilizando herramientas similares dentro de las disciplinas relacionadas de la teoría de la decisión , la investigación de operaciones y las áreas de inteligencia artificial , en particular la planificación de la IA (con incertidumbre) y el sistema de múltiples agentes . Aunque estos campos pueden tener diferentes motivadores, las matemáticas involucradas son sustancialmente las mismas, por ejemplo, usando procesos de decisión de Markov (MDP).

Los resultados estocásticos también se pueden modelar en términos de teoría de juegos agregando un jugador que actúa aleatoriamente y que hace "movimientos al azar" (" movimientos por naturaleza "). Este jugador normalmente no se considera un tercer jugador en lo que de otra manera sería un juego de dos jugadores, sino que simplemente sirve para proporcionar una tirada de dados cuando lo requiera el juego.

Para algunos problemas, diferentes enfoques para modelar resultados estocásticos pueden conducir a diferentes soluciones. Por ejemplo, la diferencia de enfoque entre los MDP y la solución minimax es que esta última considera el peor de los casos sobre un conjunto de movimientos adversarios, en lugar de razonar con expectativa sobre estos movimientos dada una distribución de probabilidad fija. El enfoque minimax puede ser ventajoso cuando no se dispone de modelos estocásticos de incertidumbre, pero también puede estar sobrestimando eventos extremadamente improbables (pero costosos), influyendo drásticamente en la estrategia en tales escenarios si se supone que un adversario puede forzar que ocurra tal evento. (Consulte la teoría del cisne negro para obtener más información sobre este tipo de problemas de modelado, especialmente en lo que se refiere a predecir y limitar pérdidas en la banca de inversión).

También se han estudiado modelos generales que incluyen todos los elementos de resultados estocásticos, adversarios y observabilidad parcial o ruidosa (de movimientos de otros jugadores). El " patrón oro " se considera un juego estocástico parcialmente observable (POSG), pero pocos problemas realistas son computacionalmente factibles en la representación POSG.

Metajuegos

Estos son juegos cuyo juego es el desarrollo de las reglas para otro juego, el objetivo o el juego sujeto. Los metajuegos buscan maximizar el valor de utilidad del conjunto de reglas desarrollado. La teoría de los metajuegos está relacionada con la teoría del diseño de mecanismos .

El término análisis de metajuegos también se utiliza para referirse a un enfoque práctico desarrollado por Nigel Howard. en el que una situación se enmarca como un juego estratégico en el que los interesados ​​intentan realizar sus objetivos a través de las opciones que tienen a su disposición. Los acontecimientos posteriores han llevado a la formulación de análisis de confrontación .

Juegos de agrupación

Estos son juegos que prevalecen sobre todas las formas de sociedad. Los juegos de agrupación son jugadas repetidas con cambios en la tabla de pagos en general a lo largo de un camino experimentado, y sus estrategias de equilibrio generalmente toman una forma de convención social evolutiva y convención económica. La teoría de los juegos de agrupación surge para reconocer formalmente la interacción entre la elección óptima en una jugada y la aparición de la próxima ruta de actualización de la tabla de pagos, identificar la existencia de invariancia y la solidez y predecir la variación a lo largo del tiempo. La teoría se basa en la clasificación de transformación topológica de la actualización de la tabla de pagos a lo largo del tiempo para predecir la varianza y la invarianza, y también está dentro de la jurisdicción de la ley computacional de la optimización alcanzable para el sistema ordenado.

Teoría del juego de campo medio

La teoría de los juegos de campo medio es el estudio de la toma de decisiones estratégicas en poblaciones muy grandes de pequeños agentes que interactúan. Esta clase de problemas fue considerada en la literatura económica por Boyan Jovanovic y Robert W. Rosenthal , en la literatura de ingeniería por Peter E. Caines y por el matemático Pierre-Louis Lions y Jean-Michel Lasry.

Representación de juegos

Los juegos estudiados en teoría de juegos son objetos matemáticos bien definidos. Para estar completamente definido, un juego debe especificar los siguientes elementos: los jugadores del juego , la información y las acciones disponibles para cada jugador en cada punto de decisión y las recompensas por cada resultado. (Eric Rasmusen se refiere a estos cuatro "elementos esenciales" con el acrónimo "PAPI".) Un teórico de juegos normalmente usa estos elementos, junto con un concepto de solución de su elección, para deducir un conjunto de estrategias de equilibrio para cada jugador de manera que, cuando Si se emplean estas estrategias, ningún jugador puede beneficiarse desviándose unilateralmente de su estrategia. Estas estrategias de equilibrio determinan un equilibrio del juego: un estado estable en el que se produce un resultado o un conjunto de resultados con probabilidad conocida.

La mayoría de los juegos cooperativos se presentan en la forma de función característica, mientras que las formas extensiva y normal se utilizan para definir los juegos no cooperativos.

Forma extensa

Un juego de formas extenso

La forma extensa se puede utilizar para formalizar juegos con una secuencia temporal de movimientos. Los juegos aquí se juegan en árboles (como se muestra aquí). Aquí cada vértice (o nodo) representa un punto de elección para un jugador. El jugador está especificado por un número listado por el vértice. Las líneas fuera del vértice representan una posible acción para ese jugador. Las recompensas se especifican en la parte inferior del árbol. La forma extensa se puede ver como una generalización de un árbol de decisiones para varios jugadores . Para resolver cualquier juego de forma extensiva, se debe utilizar la inducción hacia atrás . Implica trabajar hacia atrás en el árbol del juego para determinar qué haría un jugador racional en el último vértice del árbol, qué haría el jugador con el movimiento anterior dado que el jugador con el último movimiento es racional, y así sucesivamente hasta el primer se alcanza el vértice del árbol.

El juego de la foto consta de dos jugadores. La forma en que este juego en particular está estructurado (es decir, con toma de decisiones secuencial e información perfecta), el jugador 1 "se mueve" primero eligiendo F o U (justo o injusto). A continuación en la secuencia, el jugador 2 , que ahora ha visto Jugador 1 ' movimiento s, elige jugar ya sea una o R . Una vez que el jugador 2 ha hecho su elección, el juego se considera terminado y cada jugador obtiene su respectiva recompensa. Supongamos que el jugador 1 elige U y luego el jugador 2 elige A : el jugador 1 obtiene una recompensa de "ocho" (que en términos del mundo real se puede interpretar de muchas maneras, la más simple de las cuales es en términos de dinero, pero podría significar cosas como ocho días de vacaciones u ocho países conquistados o incluso ocho oportunidades más de jugar el mismo juego contra otros jugadores) y el jugador 2 obtiene una recompensa de "dos".

La forma extensa también puede capturar juegos de movimientos simultáneos y juegos con información imperfecta. Para representarlo, una línea de puntos conecta diferentes vértices para representarlos como parte del mismo conjunto de información (es decir, los jugadores no saben en qué punto se encuentran), o se dibuja una línea cerrada alrededor de ellos. (Vea el ejemplo en la sección de información imperfecta ).

Forma normal

El jugador 2
elige Izquierda
El jugador 2
elige Derecha
El jugador 1
elige Up
4 , 3 –1 , –1
El jugador 1
elige  Abajo
0 , 0 3 , 4
Forma normal o matriz de pagos de un juego de 2 jugadores y 2 estrategias

El juego normal (o de forma estratégica) suele estar representado por una matriz que muestra los jugadores, las estrategias y las recompensas (consulte el ejemplo de la derecha). De manera más general, puede representarse mediante cualquier función que asocie una recompensa para cada jugador con cada combinación posible de acciones. En el ejemplo adjunto hay dos jugadores; uno elige la fila y el otro elige la columna. Cada jugador tiene dos estrategias, que se especifican por el número de filas y el número de columnas. Las recompensas se proporcionan en el interior. El primer número es el pago recibido por el jugador de la fila (Jugador 1 en nuestro ejemplo); el segundo es la recompensa para el jugador de la columna (Jugador 2 en nuestro ejemplo). Supongamos que el jugador 1 juega arriba y que el jugador 2 juega izquierda . Luego, el jugador 1 obtiene una recompensa de 4 y el jugador 2 obtiene 3.

Cuando un juego se presenta en forma normal, se presume que cada jugador actúa simultáneamente o, al menos, sin conocer las acciones del otro. Si los jugadores tienen alguna información sobre las opciones de otros jugadores, el juego generalmente se presenta en forma extensa.

Cada juego de forma extensiva tiene un juego de forma normal equivalente, sin embargo, la transformación a la forma normal puede resultar en una explosión exponencial en el tamaño de la representación, haciéndolo computacionalmente impráctico.

Forma de función característica

En los juegos que poseen una utilidad extraíble, no se otorgan recompensas por separado; más bien, la función característica decide el pago de cada unidad. La idea es que la unidad que está "vacía", por así decirlo, no recibe ninguna recompensa.

El origen de esta forma se encuentra en el libro de John von Neumann y Oskar Morgenstern; Al observar estos casos, adivinaron que cuando aparece una unión , funciona contra la fracción como si dos individuos estuvieran jugando un juego normal. El pago equilibrado de C es una función básica. Aunque hay diferentes ejemplos que ayudan a determinar las cantidades de coalición de los juegos normales, no todos parecen que en su forma de función puedan derivarse de los mismos.

Formalmente, una función característica se ve como: (N, v), donde N representa el grupo de personas y es una utilidad normal.

Estas funciones características se han expandido para describir juegos en los que no existe una utilidad extraíble.

Representaciones de juegos alternativos

Existen formas alternativas de representación de juegos que se utilizan para algunas subclases de juegos o se ajustan a las necesidades de la investigación interdisciplinaria. Además de las representaciones clásicas de juegos, algunas de las representaciones alternativas también codifican aspectos relacionados con el tiempo.

Nombre Año Medio Tipo de juegos Tiempo
Juego de congestión 1973 funciones subconjunto de juegos de n personas, movimientos simultáneos No
Forma secuencial 1994 matrices Juegos de 2 personas con información imperfecta No
Juegos cronometrados 1994 funciones Juegos de 2 personas
Gala 1997 lógica juegos de n-personas de información imperfecta No
Juegos de efectos locales 2003 funciones subconjunto de juegos de n personas, movimientos simultáneos No
GDL 2005 lógica juegos deterministas de n personas, movimientos simultáneos No
Juego Petri-nets 2006 Red de Petri juegos deterministas de n personas, movimientos simultáneos No
Juegos continuos 2007 funciones subconjunto de juegos de 2 personas con información imperfecta
PNSI 2008 Red de Petri juegos de n-personas de información imperfecta
Juegos de gráficos de acción 2012 gráficos, funciones juegos de n personas, movimientos simultáneos No
Juegos graficos 2015 gráficos, funciones juegos de n personas, movimientos simultáneos No

Usos generales y aplicados

Como método de matemáticas aplicadas , la teoría de juegos se ha utilizado para estudiar una amplia variedad de comportamientos humanos y animales. Inicialmente se desarrolló en economía para comprender una gran colección de comportamientos económicos, incluidos los comportamientos de empresas, mercados y consumidores. El primer uso del análisis de la teoría de juegos fue por Antoine Augustin Cournot en 1838 con su solución del duopolio de Cournot . El uso de la teoría de juegos en las ciencias sociales se ha expandido y la teoría de juegos se ha aplicado también a comportamientos políticos, sociológicos y psicológicos.

Aunque los naturalistas anteriores al siglo XX , como Charles Darwin, hicieron declaraciones de tipo teórico de juegos, el uso del análisis de la teoría de juegos en biología comenzó con los estudios de Ronald Fisher sobre el comportamiento animal durante la década de 1930. Este trabajo es anterior al nombre de "teoría de juegos", pero comparte muchas características importantes con este campo. Los desarrollos en economía fueron posteriormente aplicados a la biología en gran parte por John Maynard Smith en su libro de 1982 Evolution and the Theory of Games .

Además de utilizarse para describir, predecir y explicar el comportamiento, la teoría de juegos también se ha utilizado para desarrollar teorías de comportamiento ético o normativo y para prescribir dicho comportamiento. En economía y filosofía , los académicos han aplicado la teoría de juegos para ayudar a comprender el comportamiento bueno o adecuado. Los argumentos de la teoría de juegos de este tipo se remontan a Platón . Una versión alternativa de la teoría de juegos, llamada teoría química de juegos , representa las elecciones del jugador como moléculas reactivas químicas metafóricas llamadas "knowlecules". La teoría de juegos químicos luego calcula los resultados como soluciones de equilibrio para un sistema de reacciones químicas.

Descripción y modelado

Un juego de ciempiés de cuatro etapas.

El uso principal de la teoría de juegos es describir y modelar cómo se comportan las poblaciones humanas. Algunos estudiosos creen que al encontrar los equilibrios de los juegos pueden predecir cómo se comportarán las poblaciones humanas reales cuando se enfrenten a situaciones análogas al juego que se está estudiando. Esta visión particular de la teoría de juegos ha sido criticada. Se argumenta que las suposiciones hechas por los teóricos de los juegos a menudo se violan cuando se aplican a situaciones del mundo real. Los teóricos de los juegos generalmente asumen que los jugadores actúan de manera racional, pero en la práctica, el comportamiento humano a menudo se desvía de este modelo. Los teóricos de los juegos responden comparando sus suposiciones con las que se utilizan en física . Por lo tanto, aunque sus supuestos no siempre se cumplen, pueden tratar la teoría de juegos como un ideal científico razonable similar a los modelos utilizados por los físicos . Sin embargo, el trabajo empírico ha demostrado que en algunos juegos clásicos, como el juego del ciempiés , adivina 2/3 del juego promedio y el juego del dictador , la gente normalmente no juega los equilibrios de Nash. Existe un debate en curso sobre la importancia de estos experimentos y si el análisis de los experimentos captura completamente todos los aspectos de la situación relevante.

Algunos teóricos de juegos, siguiendo el trabajo de John Maynard Smith y George R. Price , han recurrido a la teoría de juegos evolutivos para resolver estos problemas. Estos modelos suponen que no hay racionalidad o una racionalidad limitada por parte de los jugadores. A pesar del nombre, la teoría de juegos evolutivos no presupone necesariamente la selección natural en el sentido biológico. La teoría de juegos evolutivos incluye tanto la evolución biológica como la cultural y también modelos de aprendizaje individual (por ejemplo, dinámicas de juego ficticias ).

Análisis prescriptivo o normativo

Cooperar Defecto
Cooperar -1, -1 -10, 0
Defecto 0, -10 -5, -5
El dilema del prisionero

Algunos estudiosos ven la teoría de juegos no como una herramienta de predicción del comportamiento de los seres humanos, sino como una sugerencia de cómo deben comportarse las personas. Dado que una estrategia, que corresponde a un equilibrio de Nash de un juego, constituye la mejor respuesta a las acciones de los otros jugadores, siempre que estén en (el mismo) equilibrio de Nash, jugar una estrategia que es parte de un equilibrio de Nash parece apropiado. Este uso normativo de la teoría de juegos también ha sido objeto de críticas.

Economía y empresa

La teoría de juegos es un método importante utilizado en economía y negocios matemáticos para modelar comportamientos competitivos de agentes que interactúan . Las aplicaciones incluyen una amplia gama de fenómenos y enfoques económicos, como subastas , negociación , fijación de precios de fusiones y adquisiciones , división justa , duopolios , oligopolios , formación de redes sociales , economía computacional basada en agentes , equilibrio general , diseño de mecanismos y sistemas de votación ; y en áreas tan amplias como la economía experimental , la economía del comportamiento , economía de la información , la organización industrial y economía política .

Esta investigación generalmente se enfoca en conjuntos particulares de estrategias conocidas como "conceptos de solución" o "equilibrios" . Una suposición común es que los jugadores actúan de manera racional. En los juegos no cooperativos, el más famoso de ellos es el equilibrio de Nash . Un conjunto de estrategias es un equilibrio de Nash si cada una representa una mejor respuesta a las otras estrategias. Si todos los jugadores están jugando las estrategias en un equilibrio de Nash, no tienen ningún incentivo unilateral para desviarse, ya que su estrategia es lo mejor que pueden hacer dado lo que otros están haciendo.

Los beneficios del juego generalmente se toman para representar la utilidad de los jugadores individuales.

Un artículo prototípico sobre teoría de juegos en economía comienza presentando un juego que es una abstracción de una situación económica particular. Se eligen uno o más conceptos de solución y el autor demuestra qué conjuntos de estrategias en el juego presentado son equilibrios del tipo apropiado. Los economistas y profesores de negocios sugieren dos usos principales (mencionados anteriormente): descriptivo y prescriptivo .

El Chartered Institute of Procurement & Supply (CIPS) promueve el conocimiento y el uso de la teoría de juegos en el contexto de la contratación empresarial . Los socios de CIPS y TWS han realizado una serie de encuestas diseñadas para explorar la comprensión, el conocimiento y la aplicación de la teoría de juegos entre los profesionales de adquisiciones . Algunos de los principales hallazgos de su tercera encuesta anual (2019) incluyen:

  • La aplicación de la teoría de juegos a la actividad de adquisiciones ha aumentado, en ese momento era del 19% entre todos los encuestados.
  • El 65% de los participantes predice que aumentará el uso de las aplicaciones de la teoría de juegos.
  • El 70% de los encuestados dice que tiene "solo una comprensión básica o inferior a la básica" de la teoría de juegos.
  • El 20% de los participantes había recibido capacitación en el trabajo en teoría de juegos.
  • El 50% de los encuestados dijo que las soluciones de software nuevas o mejoradas eran deseables.
  • El 90% de los encuestados dijo que no tiene el software que necesita para su trabajo.

Gestión de proyectos

La toma de decisiones sensata es fundamental para el éxito de los proyectos. En la gestión de proyectos, la teoría de juegos se utiliza para modelar el proceso de toma de decisiones de los jugadores, como inversores, directores de proyectos, contratistas, subcontratistas, gobiernos y clientes. Muy a menudo, estos jugadores tienen intereses en competencia y, a veces, sus intereses son directamente perjudiciales para otros jugadores, lo que hace que los escenarios de gestión de proyectos sean adecuados para ser modelados por la teoría de juegos.

Piraveenan (2019) en su revisión proporciona varios ejemplos en los que la teoría de juegos se utiliza para modelar escenarios de gestión de proyectos. Por ejemplo, un inversor normalmente tiene varias opciones de inversión, y cada opción probablemente resultará en un proyecto diferente y, por lo tanto, se debe elegir una de las opciones de inversión antes de que se pueda producir la carta del proyecto. De manera similar, cualquier proyecto grande que involucre a subcontratistas, por ejemplo, un proyecto de construcción, tiene una interacción compleja entre el contratista principal (el gerente del proyecto) y los subcontratistas, o entre los propios subcontratistas, que típicamente tiene varios puntos de decisión. Por ejemplo, si existe una ambigüedad en el contrato entre el contratista y el subcontratista, cada uno debe decidir qué tan duro impulsar su caso sin poner en peligro todo el proyecto y, por lo tanto, su propia participación en él. De manera similar, cuando se lanzan proyectos de organizaciones competidoras, el personal de marketing tiene que decidir cuál es el mejor momento y estrategia para comercializar el proyecto, o su producto o servicio resultante, de modo que pueda ganar la máxima tracción frente a la competencia. En cada uno de estos escenarios, las decisiones requeridas dependen de las decisiones de otros jugadores que, de alguna manera, tienen intereses en competencia con los intereses del tomador de decisiones y, por lo tanto, idealmente pueden modelarse utilizando la teoría de juegos.

Piraveenan resume que los juegos de dos jugadores se utilizan predominantemente para modelar escenarios de gestión de proyectos y, según la identidad de estos jugadores, se utilizan cinco tipos distintos de juegos en la gestión de proyectos.

  • Juegos del sector gubernamental al sector privado (juegos que modelan asociaciones público-privadas )
  • Juegos de contratista-contratista
  • Juegos de contratistas y subcontratistas
  • Juegos de subcontratista-subcontratista
  • Juegos que involucran a otros jugadores

En términos de tipos de juegos, tanto cooperativos como no cooperativos, tanto de forma normal como extensiva, de suma cero y de suma distinta de cero se utilizan para modelar varios escenarios de gestión de proyectos.

Ciencias Políticas

La aplicación de la teoría de juegos a la ciencia política se centra en las áreas superpuestas de división justa , economía política , elección pública , negociación de guerra , teoría política positiva y teoría de la elección social . En cada una de estas áreas, los investigadores han desarrollado modelos de teoría de juegos en los que los jugadores suelen ser votantes, estados, grupos de intereses especiales y políticos.

Anthony Downs proporciona los primeros ejemplos de teoría de juegos aplicada a las ciencias políticas . En su libro de 1957 Una teoría económica de la democracia , aplica el modelo de ubicación de la empresa de Hotelling al proceso político. En el modelo de Downs, los candidatos políticos se comprometen con las ideologías en un espacio político unidimensional. Downs primero muestra cómo los candidatos políticos convergerán hacia la ideología preferida por el votante medio si los votantes están completamente informados, pero luego argumenta que los votantes eligen permanecer racionalmente ignorantes, lo que permite la divergencia de candidatos. La teoría de juegos se aplicó en 1962 a la crisis de los misiles cubanos durante la presidencia de John F. Kennedy.

También se ha propuesto que la teoría de juegos explica la estabilidad de cualquier forma de gobierno político. Tomando el caso más simple de una monarquía, por ejemplo, el rey, al ser una sola persona, no puede mantener su autoridad ejerciendo personalmente el control físico sobre todos o incluso sobre un número significativo de sus súbditos. En cambio, el control soberano se explica por el reconocimiento por parte de cada ciudadano de que todos los demás ciudadanos esperan que los demás vean al rey (u otro gobierno establecido) como la persona cuyas órdenes se seguirán. La coordinación de la comunicación entre ciudadanos para reemplazar al soberano está efectivamente prohibida, ya que la conspiración para reemplazar al soberano generalmente se castiga como delito. Así, en un proceso que puede ser modelado por variantes del dilema del prisionero , durante los períodos de estabilidad ningún ciudadano encontrará racional moverse para reemplazar al soberano, incluso si todos los ciudadanos saben que estarían mejor si todos actuaran. colectivamente.

Una explicación de la teoría del juego para la paz democrática es que el debate público y abierto en las democracias envía información clara y confiable sobre sus intenciones a otros estados. Por el contrario, es difícil conocer las intenciones de los líderes no democráticos, qué efecto tendrán las concesiones y si se cumplirán las promesas. Por lo tanto, habrá desconfianza y falta de voluntad para hacer concesiones si al menos una de las partes en una disputa no es democrática.

Sin embargo, la teoría de juegos predice que dos países aún pueden ir a la guerra incluso si sus líderes son conscientes de los costos de la lucha. La guerra puede resultar de información asimétrica; dos países pueden tener incentivos para representar erróneamente la cantidad de recursos militares que tienen a mano, lo que los hace incapaces de resolver disputas de manera agradable sin recurrir a la lucha. Además, la guerra puede surgir debido a problemas de compromiso: si dos países desean resolver una disputa por medios pacíficos, pero cada uno desea volver a los términos de ese arreglo, es posible que no tengan más remedio que recurrir a la guerra. Por último, la guerra puede resultar de las indivisibilidades del problema.

La teoría de juegos también podría ayudar a predecir las respuestas de una nación cuando hay una nueva regla o ley que se aplicará a esa nación. Un ejemplo es la investigación de Peter John Wood (2013) que analiza lo que las naciones podrían hacer para ayudar a reducir el cambio climático. Wood pensó que esto podría lograrse haciendo tratados con otras naciones para reducir las emisiones de gases de efecto invernadero . Sin embargo, concluyó que esta idea no podría funcionar porque crearía un dilema de prisioneros para las naciones.

Biología

Halcón Paloma
Halcón 20, 20 80, 40
Paloma 40, 80 60, 60
El juego de la paloma y el halcón

A diferencia de los de economía, los beneficios de los juegos en biología a menudo se interpretan como correspondientes a la aptitud . Además, la atención se ha centrado menos en los equilibrios que corresponden a una noción de racionalidad y más en los que serían mantenidos por las fuerzas evolutivas . El equilibrio más conocido en biología se conoce como la estrategia evolutivamente estable (ESS), introducida por primera vez en ( Maynard Smith y Price 1973 ). Aunque su motivación inicial no involucró ninguno de los requisitos mentales del equilibrio de Nash , cada ESS es un equilibrio de Nash.

En biología, la teoría de juegos se ha utilizado como modelo para comprender muchos fenómenos diferentes. Se utilizó por primera vez para explicar la evolución (y estabilidad) de las proporciones de sexos aproximadas de 1: 1 . ( Fisher 1930 ) sugirió que las proporciones de sexos 1: 1 son el resultado de fuerzas evolutivas que actúan sobre individuos que podrían verse como tratando de maximizar su número de nietos.

Además, los biólogos han utilizado la teoría de juegos evolutivos y la ESS para explicar el surgimiento de la comunicación animal . El análisis de los juegos de señalización y otros juegos de comunicación ha proporcionado información sobre la evolución de la comunicación entre los animales. Por ejemplo, el comportamiento de acoso de muchas especies, en el que un gran número de animales de presa ataca a un depredador más grande, parece ser un ejemplo de organización emergente espontánea. Las hormigas también se ha demostrado que el comportamiento de alimentación hacia adelante exhibición similar a la moda (véase Paul Ormerod 's Economía de la mariposa ).

Los biólogos han utilizado el juego del pollo para analizar el comportamiento de lucha y la territorialidad.

Según Maynard Smith, en el prefacio de Evolution and the Theory of Games , "paradójicamente, ha resultado que la teoría de juegos se aplica más fácilmente a la biología que al campo del comportamiento económico para el que fue diseñada originalmente". La teoría de juegos evolutivos se ha utilizado para explicar muchos fenómenos aparentemente incongruentes en la naturaleza.

Uno de esos fenómenos se conoce como altruismo biológico . Esta es una situación en la que un organismo parece actuar de una manera que beneficia a otros organismos y es perjudicial para sí mismo. Esto es distinto de las nociones tradicionales de altruismo porque tales acciones no son conscientes, pero parecen ser adaptaciones evolutivas para aumentar la aptitud general. Se pueden encontrar ejemplos en especies que van desde murciélagos vampiros que regurgitan sangre que han obtenido de una cacería nocturna y se la dan a miembros del grupo que no se han alimentado, a abejas obreras que cuidan de la abeja reina durante toda su vida y nunca se aparean, a monos verdes que advierten a los miembros del grupo sobre el enfoque de un depredador, incluso cuando pone en peligro la posibilidad de supervivencia de ese individuo. Todas estas acciones aumentan la aptitud general de un grupo, pero tienen un costo para el individuo.

La teoría de juegos evolutivos explica este altruismo con la idea de selección de parentesco . Los altruistas discriminan entre las personas a las que ayudan y favorecen a los familiares. La regla de Hamilton explica el fundamento evolutivo detrás de esta selección con la ecuación c <b × r , donde el costo c para el altruista debe ser menor que el beneficio b para el receptor multiplicado por el coeficiente de relación r . Los dos organismos más estrechamente relacionados hacen que aumente la incidencia de altruismo porque comparten muchos de los mismos alelos. Esto significa que el individuo altruista, al asegurarse de que los alelos de su pariente cercano se transmitan a través de la supervivencia de su descendencia, puede renunciar a la opción de tener descendencia porque se transmite el mismo número de alelos. Por ejemplo, ayudar a un hermano (en animales diploides) tiene un coeficiente de 12 , porque (en promedio) un individuo comparte la mitad de los alelos en la descendencia de su hermano. Asegurarse de que una cantidad suficiente de la descendencia de un hermano sobreviva hasta la edad adulta excluye la necesidad de que el individuo altruista produzca descendencia. Los valores de los coeficientes dependen en gran medida del alcance del campo de juego; Por ejemplo, si la elección de a quién favorecer incluye a todos los seres vivos genéticos, no solo a todos los parientes, asumimos que la discrepancia entre todos los humanos solo representa aproximadamente el 1% de la diversidad en el campo de juego, un coeficiente que era 12 en el campo de juego. un campo más pequeño se convierte en 0.995. De manera similar, si se considera que la información que no sea de naturaleza genética (por ejemplo, epigenética, religión, ciencia, etc.) persistió a lo largo del tiempo, el campo de juego se vuelve aún más grande y las discrepancias más pequeñas.

Ciencias de la computación y lógica

La teoría de juegos ha llegado a desempeñar un papel cada vez más importante en la lógica y la informática . Varias teorías lógicas tienen una base en la semántica de los juegos . Además, los científicos informáticos han utilizado juegos para modelar cálculos interactivos . Además, la teoría de juegos proporciona una base teórica al campo de los sistemas multiagente .

Por otra parte, la teoría de juegos ha jugado un papel en los algoritmos en línea ; en particular, el problema del servidor k , que en el pasado se ha denominado juegos con costes de mudanza y juegos de solicitud-respuesta . El principio de Yao es una técnica de teoría de juegos para demostrar límites inferiores en la complejidad computacional de los algoritmos aleatorios , especialmente los algoritmos en línea.

La aparición de Internet ha motivado el desarrollo de algoritmos para encontrar equilibrios en juegos, mercados, subastas computacionales, sistemas peer-to-peer y mercados de seguridad e información. La teoría de juegos algorítmicos y dentro de ella el diseño de mecanismos algorítmicos combinan el diseño de algoritmos computacionales y el análisis de sistemas complejos con la teoría económica.

Filosofía

Ciervo liebre
Ciervo 3, 3 0, 2
liebre 2, 0 2, 2
Caza del ciervo

La teoría de juegos ha tenido varios usos en filosofía . En respuesta a dos artículos de WVO Quine  ( 1960 , 1967 ), Lewis (1969) utilizó la teoría de juegos para desarrollar una explicación filosófica de la convención . Al hacerlo, proporcionó el primer análisis del conocimiento común y lo empleó para analizar el juego en los juegos de coordinación . Además, primero sugirió que se puede entender el significado en términos de juegos de señalización . Esta última sugerencia ha sido seguida por varios filósofos desde Lewis. Siguiendo la explicación de las convenciones de la teoría de juegos de Lewis (1969) , Edna Ullmann-Margalit (1977) y Bicchieri (2006) han desarrollado teorías de las normas sociales que las definen como equilibrios de Nash que resultan de la transformación de un juego de motivos mixtos en un juego de coordinación.

La teoría de juegos también ha desafiado a los filósofos a pensar en términos de epistemología interactiva : qué significa para un colectivo tener creencias o conocimientos comunes, y cuáles son las consecuencias de este conocimiento para los resultados sociales que resultan de las interacciones de los agentes. Los filósofos que han trabajado en esta área incluyen Bicchieri (1989, 1993), Skyrms (1990) y Stalnaker (1999).

En ética , algunos autores (sobre todo David Gauthier, Gregory Kavka y Jean Hampton) han intentado seguir el proyecto de Thomas Hobbes de derivar la moralidad del interés propio. Dado que juegos como el dilema del prisionero presentan un aparente conflicto entre la moralidad y el interés propio, explicar por qué el interés propio requiere la cooperación es un componente importante de este proyecto. Esta estrategia general es un componente de la visión general del contrato social en la filosofía política (por ejemplo, ver Gauthier (1986) y Kavka (1986) ).

Otros autores han intentado utilizar la teoría de juegos evolutivos para explicar el surgimiento de las actitudes humanas sobre la moralidad y los correspondientes comportamientos animales. Estos autores consideran varios juegos, incluidos el dilema del prisionero, la caza del ciervo y el juego de negociación de Nash, como una explicación del surgimiento de actitudes sobre la moralidad (ver, por ejemplo, Skyrms ( 1996 , 2004 ) y Sober y Wilson ( 1998 )).

Precios de productos de consumo y minoristas

Las aplicaciones de la teoría de juegos se utilizan mucho en las estrategias de precios de los mercados minoristas y de consumo, en particular para la venta de bienes inelásticos . Dado que los minoristas compiten constantemente entre sí por la participación en el mercado de los consumidores, se ha convertido en una práctica bastante común para los minoristas descontar ciertos productos, de manera intermitente, con la esperanza de aumentar el tráfico peatonal en ubicaciones físicas (visitas a sitios web para minoristas de comercio electrónico ) o incrementar las ventas de productos complementarios o complementarios.

El Black Friday , una popular fiesta de compras en los EE. UU., Es cuando muchos minoristas se enfocan en estrategias de precios óptimas para capturar el mercado de compras navideñas. En el escenario del Black Friday, los minoristas que utilizan aplicaciones de teoría de juegos suelen preguntar "¿cuál es la reacción del competidor dominante hacia mí?" En tal escenario, el juego tiene dos jugadores: el minorista y el consumidor. El minorista se centra en una estrategia de precios óptima, mientras que el consumidor se centra en la mejor oferta. En este sistema cerrado, a menudo no existe una estrategia dominante, ya que ambos jugadores tienen opciones alternativas. Es decir, los minoristas pueden encontrar un cliente diferente y los consumidores pueden comprar en un minorista diferente. Sin embargo, dada la competencia del mercado ese día, la estrategia dominante para los minoristas radica en superar a los competidores. El sistema abierto asume que varios minoristas venden productos similares y un número finito de consumidores que exigen los productos a un precio óptimo. Un blog de un profesor de la Universidad de Cornell proporcionó un ejemplo de tal estrategia, cuando Amazon puso un precio a un televisor Samsung $ 100 por debajo del valor minorista, lo que efectivamente socavó a los competidores. Amazon compensó parte de la diferencia al aumentar el precio de los cables HDMI, ya que se descubrió que los consumidores discriminan menos los precios cuando se trata de la venta de artículos secundarios.

Los mercados minoristas continúan desarrollando estrategias y aplicaciones de la teoría de juegos cuando se trata de fijar precios a los bienes de consumo. Los conocimientos clave que se encuentran entre las simulaciones en un entorno controlado y las experiencias minoristas del mundo real muestran que las aplicaciones de tales estrategias son más complejas, ya que cada minorista debe encontrar un equilibrio óptimo entre precios , relaciones con los proveedores , imagen de marca y el potencial de canibalizar. la venta de artículos más rentables.

Epidemiología

Dado que la decisión de vacunarse para una enfermedad en particular a menudo la toman los individuos, quienes pueden considerar una variedad de factores y parámetros al tomar esta decisión (como la incidencia y prevalencia de la enfermedad, los riesgos percibidos y reales asociados con contraer la enfermedad). , tasa de mortalidad, riesgos percibidos y reales asociados con la vacunación y costo financiero de la vacunación), la teoría de juegos se ha utilizado para modelar y predecir la aceptación de la vacunación en una sociedad.

En la cultura popular

  • Basado en el libro de 1998 de Sylvia Nasar , la historia de vida del teórico de juegos y matemático John Nash se convirtió en la película biográfica de 2001 A Beautiful Mind , protagonizada por Russell Crowe como Nash.
  • La novela de ciencia ficción militar de 1959 Starship Troopers de Robert A. Heinlein mencionó "teoría de juegos" y "teoría de juegos". En la película de 1997 del mismo nombre , el personaje Carl Jenkins se refirió a su asignación de inteligencia militar como asignada a "juegos y teoría".
  • La película de 1964 Dr. Strangelove satiriza las ideas de la teoría de juegos sobre la teoría de la disuasión . Por ejemplo, la disuasión nuclear depende de la amenaza de tomar represalias catastróficas si se detecta un ataque nuclear. Un teórico de juegos podría argumentar que tales amenazas pueden dejar de ser creíbles , en el sentido de que pueden conducir a equilibrios imperfectos en subjuegos . La película lleva esta idea un paso más allá, y la Unión Soviética se compromete irrevocablemente con una respuesta nuclear catastrófica sin hacer pública la amenaza.
  • La banda de power pop de la década de 1980 , Game Theory, fue fundada por el cantante y compositor Scott Miller , quien describió el nombre de la banda como aludiendo al "estudio de calcular la acción más apropiada dada a un adversario  ... para obtener la mínima cantidad de fallas".
  • Liar Game , un manga japonés de 2005y una serie de televisión de 2007, presenta a los personajes principales de cada episodio con un juego o problema que se extrae típicamente de la teoría de juegos, como lo demuestran las estrategias aplicadas por los personajes.
  • La novela de 1974 Spy Story de Len Deighton explora elementos de la teoría de juegos con respecto a los ejercicios del ejército de la guerra fría.
  • La novela de 2008 The Dark Forest de Liu Cixin explora la relación entre la vida extraterrestre, la humanidad y la teoría de juegos.
  • El principal antagonista Joker en la película The Dark Knight presenta conceptos de teoría de juegos, en particular el dilema del prisionero en una escena en la que pide a los pasajeros de dos ferries diferentes que bombardeen el otro para salvar el suyo.

Ver también

Liza

Notas

Referencias y lecturas adicionales

Libros de texto y referencias generales

Textos de importancia histórica

  • edición reimpresa: R. Duncan Luce; Howard Raiffa (1989), Juegos y decisiones: introducción y estudio crítico , Nueva York: Dover Publications , ISBN 978-0-486-65943-5CS1 maint: varios nombres: lista de autores ( enlace )

Otras referencias impresas

enlaces externos