Conjunto de información (teoría de juegos) - Information set (game theory)

En la teoría de juegos , un conjunto de información es un conjunto que, para un jugador en particular, dado lo que ese jugador ha observado, muestra los vértices de decisión disponibles para el jugador que son indistinguibles para él en el punto actual del juego. Para una mejor idea de los vértices de decisión, consulte la Figura 1. Si el juego tiene información perfecta , cada conjunto de información contiene solo un miembro, es decir, el punto realmente alcanzado en esa etapa del juego, ya que cada jugador conoce la combinación exacta de movimientos de azar y estrategias de jugador hasta el punto actual del juego. De lo contrario, es posible que algunos jugadores no puedan estar seguros de qué ha sucedido hasta ahora en el juego y cuál es su posición.

Figura 1: Un árbol de juego que describe el conjunto de información posible de cada jugador mostrando las opciones en cada vértice (A y B para el jugador 1 y 2 respectivamente)

Los conjuntos de información se utilizan en juegos de forma extensiva y, a menudo, se representan en árboles de juegos . Los árboles de juego muestran el camino desde el inicio de un juego y los caminos subsiguientes que se pueden hacer dependiendo del próximo movimiento de cada jugador. Los conjuntos de información se pueden representar fácilmente en los árboles del juego para mostrar los posibles movimientos de cada jugador, por lo general utilizando líneas de puntos, círculos o incluso simplemente etiquetando los vértices que muestran las opciones de un jugador en particular en la etapa actual del juego, como se muestra en la Figura 1.

Más específicamente, en la forma extensiva , un conjunto de información es un conjunto de nodos de decisión tales que:

Cada nodo del conjunto pertenece a un jugador.
Cuando el juego alcanza el conjunto de información, el jugador con el movimiento no puede diferenciar entre nodos dentro del conjunto de información, es decir, si el conjunto de información contiene más de un nodo, el jugador al que pertenece ese conjunto no sabe qué nodo del conjunto ha sido alcanzado.

Los juegos en forma extensiva a menudo implican que cada jugador pueda jugar múltiples movimientos, lo que da como resultado la formación de múltiples conjuntos de información también. Un jugador debe tomar decisiones en cada uno de estos vértices basándose en las opciones del conjunto de información. Esto se conoce como la estrategia del jugador y puede proporcionar el camino del jugador desde el inicio del juego hasta el final, lo que también se conoce como el juego del juego. A partir del juego, el resultado siempre se conocerá en función de la estrategia de cada jugador, a menos que se involucren movimientos fortuitos, entonces no siempre habrá un resultado singular. No todos los juegos se basan en estrategias , ya que también pueden implicar movimientos aleatorios. Cuando se trata de movimientos de azar, un vector de estrategias puede dar como resultado la distribución de probabilidad de los múltiples resultados de los juegos que podrían ocurrir. Se pueden crear múltiples resultados de los juegos cuando está involucrado el azar, ya que es probable que los movimientos sean diferentes cada vez. Sin embargo, según la solidez de la estrategia , algunos resultados podrían tener mayores probabilidades que otros.

La noción de conjunto de información fue introducida por John von Neumann , motivado por estudiar el juego del póquer .

Ejemplo

A la derecha hay dos versiones del juego de la batalla de los sexos , que se muestran en forma extensa . A continuación, también se muestra la forma normal para ambos juegos.

El primer juego es simplemente secuencial: cuando el jugador 2 tiene la oportunidad de moverse, sabe si el jugador 1 ha elegido O (pera) o F (ootball).

El segundo juego también es secuencial, pero la línea de puntos muestra el conjunto de información del jugador 2 . Esta es la forma común de demostrar que cuando el jugador 2 se mueve, no sabe lo que hizo el jugador 1.

Esta diferencia también conduce a diferentes predicciones para los dos juegos. En el primer juego, el jugador 1 tiene la ventaja. Saben que pueden elegir O (pera) con seguridad porque una vez que el jugador 2 sabe que el jugador 1 ha elegido la ópera, el jugador 2 prefiere seguir adelante con o (pera) y obtener 2 que elegir f (ootball) y obtener 0 . Formalmente, eso es aplicar la perfección en subjuegos para resolver el juego.

En el segundo juego, el jugador 2 no puede observar lo que hizo el jugador 1, por lo que bien podría ser un juego simultáneo . Entonces, la perfección en subjuegos no nos da nada que el equilibrio de Nash no pueda obtener, y tenemos los 3 posibles equilibrios estándar:

Ambos eligen la ópera
ambos eligen el fútbol
o ambos usan una estrategia mixta , con el jugador 1 eligiendo O (pera) 3/5 de las veces, y el jugador 2 eligiendo f (ootball) 3/5 de las veces

*Forma normal con el jugador 2 consciente del movimiento del jugador 1*
Jugador 2 Jugador 1	Oo, Fo	Oo, Ff	De, Fo	De, Ff
O	2 3	2 3	0 0	0 0
F	0 0	3 2	0 0	3 2

*Forma normal con el jugador 2 inconsciente del movimiento del jugador 1*
Jugador 2 Jugador 1	o	F
O	2 3	0 0
F	0 0	3 2

Ver también

Equilibrio autoconfirmante

Referencias

Binmore, Ken (2007). Teoría de juegos: una introducción muy breve . Prensa de la Universidad de Oxford. págs. 88–89. ISBN 0-19-921846-3.

Languages

In other projects

Conjunto de información (teoría de juegos) - Information set (game theory)

Ejemplo

Ver también

Referencias