apun204

29
La Teoría de Juegos, 2 Roberto A. Molina Cruz Guatemala, septiembre de 2014 Este documento constituye la segunda parte de los apuntes de un curso sobre Teoría de Juegos que imparto en varias universidades del pais. En los apuntos presento los fundamentos de la Teoría de Juegos y su aplicación en el estudio de los fenómenos sociales. Agradeceremos al lector cualquier observación o sugerencia, las cuales pueden ser dirigidas a la dirección de correo elctrónico que aparece seguido. R. Molina / [email protected] 1 La forma normal En esta sección presentamos la representación normal –matricial o estratégica– de los juegos, así como los métodos usados para analizar los juegos cuando los representamos de esta forma. Aunque en estos apuntes tratamos en secciones diferentes las formas normal y extensa de representación de los juegos, en la práctica resulta muy conveniente representar cada juego de ambas formas, ya que con ambas podemos analizar mejor los aspectos del juego. Iniciamos la sección presentando la forma normal de los juegos, para luego estudiar la relación de dominación de las estrategias de cada jugador, y el criterio de las estrategias maximales para resolver un juego. Aunque en estos apuntes discutimos principalmente los juegos 2 × 2 –con 2 jugadores y 2 estrategias– en esta sección presentamos el método de eliminación de estrategias, basado en 1

Upload: amigos-al-cougar

Post on 28-Jan-2016

215 views

Category:

Documents


0 download

DESCRIPTION

teoría de juegos

TRANSCRIPT

Page 1: apun204

La Teoría de Juegos, 2

Roberto A. Molina Cruz

Guatemala, septiembre de 2014

Este documento constituye la segunda parte de los apuntes de un curso sobre Teoría de Juegosque imparto en varias universidades del pais. En los apuntos presento los fundamentos de laTeoría de Juegos y su aplicación en el estudio de los fenómenos sociales.

Agradeceremos al lector cualquier observación o sugerencia, las cuales pueden ser dirigidasa la dirección de correo elctrónico que aparece seguido.

R. Molina / [email protected]

1 La forma normal

En esta sección presentamos la representación normal –matricial o estratégica– de los juegos,así como los métodos usados para analizar los juegos cuando los representamos de esta forma.

Aunque en estos apuntes tratamos en secciones diferentes las formas normal y extensa derepresentación de los juegos, en la práctica resulta muy conveniente representar cada juegode ambas formas, ya que con ambas podemos analizar mejor los aspectos del juego.

Iniciamos la sección presentando la forma normal de los juegos, para luego estudiar larelación de dominación de las estrategias de cada jugador, y el criterio de las estrategiasmaximales para resolver un juego.

Aunque en estos apuntes discutimos principalmente los juegos 2× 2 –con 2 jugadores y 2estrategias– en esta sección presentamos el método de eliminación de estrategias, basado en

1

Page 2: apun204

la relación de dominación de estrategias, el cual usamos para simplificar los juegos en quelos jugadores cuentan con más de 2 estrategias.

Después de estudiar el concepto de dominación de estrategias, debemos estudiar el conceptode nivel de seguridad de los jugadores. Para lo cual es conveniente revisar primero los juegosde suma cero –estrictamente competitivos– y el método maximin –o minimax– que utilizamospara resolverlos.

1.1 La forma normal

La representación en forma normal de un juego consiste en una tabla como la que aparecemás adelante, en la cual son representados los aspectos del juego en la forma siguiente.

Los jugadores

A quienes llamaremos simplemente 1 y 2, y que corresponden respectivamente a las filas ycolumnas de la tabla.

Las estrategias

Cada jugador tiene a su disposición un número determinado de estrategias puras, así el ju-gador 1 puede contar con m estrategias y el jugador 2 con n estrategias. Las cuales represen-tamos como sigue.

E11 , E1

2 , · · · , E1m

E21 , E2

2 , · · · , E2n

Los resultados

La decisión que toma cada uno de los jugadores, seleccionando la estrategia pura a utilizar,determina el resultado del juego. Representamos los posibles resultados del juego por

Ri,k

Este es el resultado que se obtiene si el primer jugador selecciona la estrategia i, es decir: E1i ,

y el segundo jugador emplea la estrategia k, esta es: E2k .

2

Page 3: apun204

Las utilidades

Al asignar un valor numérico –ordinal o cuantitativo– a cada uno de los posibles resulta-dos del juego y correspondiente a cada uno de los jugadores, podemos construir una matriznumérica de utilidades, cuyos valores representamos como sigue, respectivamente para eljugador 1 y el jugador 2.

U1i,k

U2i,k

Estos son los valores de utilidad que los jugadores asignan al resultado Ri,k. El cual ocurrecuando el jugador 1 utiliza la estrategia i y el jugador 2 usa la estrategia k.

Los valores de utilidad de cada jugador componen lo que llamamos la matriz de utilidadesdel jugador. Sin embargo, es común presentar los valores de utilidad de ambos jugadores enuna sola tabla, escribiendo los valores de utilidad como una pareja ordenada. Con el valor deutilidad del jugador 1 en la primera componente (x), y el valor de utilidad del jugador 2 en lasegunda componente (y). Esto es una tabla como la siguiente.

Jugador 2E2

1 E22 · · · E2

n

Jugador 1 E11

(U1

1,1,U21,1

) (U1

1,2,U21,2

)· · ·

(U1

1,n,U21,n

)E1

2

(U1

2,1,U22,1

) (U1

2,2,U22,2

)· · ·

(U1

2,n,U22,n

)...

...... · · · ...

E1m

(U1

m,1,U2m,1

) (U1

m,2,U2m,2

)· · ·

(U1

m,n,U2m,n)

En estos apuntes estudiamos principalmente los juegos en que cada jugador tienen solo 2posibles estrategías puras a tomar. Estos juegos son llamados juegos 2×2, por ser juegos dedos jugadores con dos estrategias cada uno. Así, en adelante estaremos estudiando solamentetablas como la siguiente, la cual representa el famoso dilema del prisionero.

Prisionero 2Confesar no si

Prisionero 1 no (−2,−2) (−5,−1)si (−1,−5) (−4,−4)

3

Page 4: apun204

1.2 La dominación de estrategias

Al representar un juego en forma nomal, las utilidades de los jugadores quedan representadaspor matrices cuyas filas y columnas corresponden a las estrategias de los jugadores.

El orden natural de los números nos permite definir una relación de orden entre las filas ycolumnas de estas matrices de utilidades, lo que corresponde a una relación de orden entrelas estrategias de los jugadores.

Esta relación de orden entre las estrategias de los jugadores, permite utilizar el criterio de laestrategia maximal para resolver algunos tipos especiales de juegos. Por otro lado, esta mismarelación permite simplificar los juegos en que los jugadores cuentan con muchas estrategias.

1.2.1 La relación de dominación

Notemos que las preferencias de un jugador por los posibles resultados de un juego, deter-minan totalmente el conjunto de utilidades ordinales que ese jugador debe asignar a cadaresultado. Y que estas mismas preferencias solo pueden determinar en forma parcial un con-junto de utilidades cuantitativas.

Sin embargo, habiendo el jugador asignado un valor de utilidad a cada posible resultado deljuego, ya sean utilidades ordinales o cuantitativas, la relación de orden de los números –yasean naturales o reales– induce una relación de orden en el conjunto de posibles resultadosdel juego. Específicamente la relación siguiente.

Decimos que el jugador j prefiere el resultado Ri,k al resultado Rg,h, y escribimos Rg,h ≤ Ri,k,si ese mismo jugador asigna una utilidad mayor o igual al primer resultado, es decir si U j

g,h ≤U j

i,k.

Ejemplo 1.Jugador 2

E21 E2

2

Jugador 1 E11 (1,−2) (3,3)

E12 (−4,−1) (−2,−1)

Los valores de utilidades cuantitativas asignados determinan el siguiente orden en los posiblesresultados y para cada uno de los jugadores.

4

Page 5: apun204

Jugador 1

Utilidades : −4≤−2≤ 1≤ 3

Resultados : R2,1 ≤ R2,2 ≤ R1,1 ≤ R1,2

Jugador 2

Utilidades : −2≤−1≤−1≤ 3

Resultados : R1,1 ≤ R2,1 ≤ R2,2 ≤ R1,2

Aunque recién describimos cómo determinar para un jugador la relación de orden de losposibles resultados del juego, esto a partir del orden de sus utilidades, debemos notar que enla práctica queda primero definida la relación de orden de los posibles resultados del juego,y a partir de esta se determinan sus posibles valores de utilidad.

Notemos además que la relación de orden del conjunto de las utilidades de un jugador –o larelación inducida en el conjunto de los resultados– induce también una relación de orden enel conjunto de las estrategias del mismo jugador. A esta relación la llamamos dominación deestrategias y es definida como sigue.

Para el jugador 1 –y en forma similar para el jugador 2– decimos que su estrategia i: E1i , dom-

ina a su estrategia g: E1g , y escribimos E1

g ≤ E1i , si usando su estrategia E1

i no puede obtenerun valor de utilidad menor al que obtendría usando su estrategia E1

g , independientemente dela estrategia que decida usar el jugador 2. En forma más precisa podemos escribir que

E1g ≤ E1

i si U1g,k ≤U1

i,k para toda posible estrategia E2k del jugador 2

Esta misma relación de dominación puede ser definida en forma simétrica diciendo que suestrategia E1

g es dominada por su estrategia E1i , si usando la estrategia E1

g no puede obtenerun valor de utilidad mayor al que obtendría usando que su estrategia E1

i , independientementede la estrategia que decida usar el jugador 2.

Además decimos que para el mismo jugador 1, la estrategia E1i domina estrictamente a la

estrategia E1g , si usando la estrategía E1

i puede obtener una utilidad estrictamente mayor a la

5

Page 6: apun204

que puede obtener usando la estrategia E1g , independientemente de la estrategia que decida

usar el jugador 2. En forma precisa, escribimos que

E1g < E1

i si U1g,k <U1

g,k para toda posible estrategia E2k del jugador 2

Así en el ejemplo 1 presentado antes, la estrategia 1: E11 , del jugador 1 domina estrictamente

a la estrategia 2: E12 , ya que

U12,1 = −4 < 1 =U1

1,1

U12,2 = −2 < 3 =U1

1,2

Mientras que para el jugador 2, la estrategia 2: E22 , domina –pero no estrictamente– a la

estrategia 1: E21 , ya que

U21,1 =−2 < 3 =U2

1,2

U22,1 = −1 =−1 =U2

2,2

Debemos notar que esta relación de dominación de estrategias no es una relación de ordentotal, como lo es la relación menor o igual (≤) definida en los números. Notemos que paracualquier par de números reales es posible decir si uno es menor o igual al otro, mientras queen un juego un jugador puede tener dos estrategias que ninguna domine a la otra. Por esto losnúmeros pueden graficase en una recta, pero las estrategias de un jugador en general debengraficarse como un árbol.

Ejemplo 2.Jugador 2

E21 E2

2

Jugador 1 E11 (1,−2) (3,3)

E12 (4,−1) (−2,−1)

En el ejemplo 2, el jugador 1 no tiene una estrategia dominante, pero para el jugador 2 suestrategia 2 es dominante, ya que tenemos E2

2 ≥ E21 .

6

Page 7: apun204

1.2.2 Las estrategias maximales

Es natural pensar que cada jugador debe seleccionar una estrategia que domine a sus demásestrategias. Así, el jugador 1 debería seleccionar la estrategia i0: E1

i0 , tal que

E1i ≤ E1

i0 para todas sus demás estrategias E1i

Podemos interpretar esta estrategia como una estrategia máxima. Sin embargo, como larelación de dominación no es total, pueden existir varias de estas estrategias máximas enun mismo juego. Por lo que es más conveniente emplear el concepto matemático de valormáximal para interpretar estas estrategias.

Entonces, para cada jugador decimos que una estrategia es maximal si no existe otra estrategiaque la domine. En particular, para el jugador 1 la estategia E1

i0 es maximal si no existe otraestrategia E1

i tal que E1i0 ≤ E1

i .

Esto constituye un criterio para que los jugadores seleccionen una estrategia en forma racional.Notemos que la solución de un juego podría estar compuesta por varias estrategias maximalespara un mismo jugador, entre las cuales el jugador debe seleccionar una.

Debemos notar que en base al concepto de estrategia maximal, podemos clasificar todos losjuegos en los 3 tipos siguientes.

a) Cada jugador tiene una estrategia maximal.

b) Solo un jugador tiene una estrategia maximal.

c) Ningún jugador tiene una estrategia maximal.

Notemos que en el ejemplo 1 antes presentado, E11 es una estrategia maximal del jugador 1 y

E22 es una estrategia maximal del jugador 2. Por lo que al seleccionar ambos jugadores estas

estrategias, el juego debería resolverse en el resultado con los valores de utilidades (3,3).

En el ejemplo 2, el jugador 1 no tiene una estrategia maximal, aunque para el jugador 2 laestrategia E2

2 es maximal. En este caso es claro que el jugador 2 debe seleccionar su estrategiamaximal, mientras que el jugador 1 solo puede minimizar sus pérdidas seleccionando laestrategia E1

1 . Por lo que el resultado del juego debe tener los valores de utilidad (3,3).

Por último, en el siguiente ejemplo, ninguno de los dos jugadores tiene una estrategia maxi-mal estricta, por lo que el criterio descrito no nos ayuda. Debemos notar que este es un juegode suma cero, el cual resolveremos después empleando el criterio maximin o minimax.

7

Page 8: apun204

Ejemplo 3.

Jugador 2E2

1 E22

Jugador 1 E11 (1,−1) (3,−3)

E12 (4,−4) (−2,2)

1.2.3 El método de eliminación de estrategias

En la práctica es muy común que analicemos juegos con jugadores que tienene más de dosestrategias, y que incluso pueden tener un número muy grande de posibles estrategias. Paraanalizar estos juegos es muy conveniente simplificarlos por medio del método de la elimi-nación de estrategias, el cual se basa en la relación de dominación de estrategias para eliminarlas estrategias que son estrictamente dominadas.

Este método consiste en que cada jugador simplifique la representación normal del juego,eliminando por turnos una estrategia propia y del otro jugador que estén estrictamente domi-nadas por otra estrategia. Ilustramos el método en el ejemplo siguiente.

Ejemplo 4.

Jugador 2E2

1 E22 E2

3 E24 E2

5

Jugador 1 E11 (0,100) (0,100) (0,100) (0,100) (0,100)

E12 (81,19) (20,80) (20,80) (20,80) (20,80)

E13 (81,19) (49,51) (40,60) (40,60) (40,60)

E14 (81,19) (49,51) (25,75) (60,40) (60,40)

E15 (81,19) (49,51) (25,75) (9,91) (80,20)

E16 (81,19) (49,51) (25,75) (9,91) (1,99)

8

Page 9: apun204

Jugador 2E2

1 E22 E2

3 E24 E2

5

Jugador 1 E12 (81,19) (20,80) (20,80) (20,80) (20,80)

E13 (81,19) (49,51) (40,60) (40,60) (40,60)

E14 (81,19) (49,51) (25,75) (60,40) (60,40)

E15 (81,19) (49,51) (25,75) (9,91) (80,20)

E16 (81,19) (49,51) (25,75) (9,91) (1,99)

Jugador 2E2

2 E23 E2

4 E25

Jugador 1 E12 (20,80) (20,80) (20,80) (20,80)

E13 (49,51) (40,60) (40,60) (40,60)

E14 (49,51) (25,75) (60,40) (60,40)

E15 (49,51) (25,75) (9,91) (80,20)

E16 (49,51) (25,75) (9,91) (1,99)

Jugador 2E2

2 E23 E2

4 E25

Jugador 1 E13 (49,51) (40,60) (40,60) (40,60)

E14 (49,51) (25,75) (60,40) (60,40)

E15 (49,51) (25,75) (9,91) (80,20)

E16 (49,51) (25,75) (9,91) (1,99)

Jugador 2E2

3 E24 E2

5

Jugador 1 E13 (40,60) (40,60) (40,60)

E14 (25,75) (60,40) (60,40)

E15 (25,75) (9,91) (80,20)

E16 (25,75) (9,91) (1,99)

Jugador 2E2

3 E24 E2

5

Jugador 1 E13 (40,60) (40,60) (40,60)

E14 (25,75) (60,40) (60,40)

E15 (25,75) (9,91) (80,20)

9

Page 10: apun204

Jugador 2E2

3 E24 E2

5

Jugador 1 E13 (40,60) (40,60) (40,60)

E14 (25,75) (60,40) (60,40)

E15 (25,75) (9,91) (80,20)

El método de eliminación de estrategias puede también aplicarse empleando el concepto dedominación –es decir, no estricta– pero esto debe hacerse con precaución, ya que al realizareste tipo de eliminación pueden eliminarse estrategias que llevan a un equilibrio.

Para ilustrar esto describimos a continuación cómo el juego del ejemplo 4 puede seguirsesimplificando hasta alcanzar un solo resultado del juego. El cual corresponde a que cadajugador seleccione su tercera estrategía, es decir las estrategias E1

3 y E23 .

Ejemplo 4. (Continuación)

Jugador 2E2

3 E24

Jugador 1 E13 (40,60) (40,60)

E14 (25,75) (60,40)

E15 (25,75) (9,91)

Jugador 2E2

3 E24

Jugador 1 E13 (40,60) (40,60)

E14 (25,75) (60,40)

Jugador 2E2

3

Jugador 1 E13 (40,60)

E14 (25,75)

Jugador 2E2

3

Jugador 1 E13 (40,60)

Debemos notar que en el juego simplificado con 3 estrategias por cada jugador, ningún ju-gador tiene una estrategia maximal.

10

Page 11: apun204

1.3 Los juegos de suma cero

Decimos que un juego con dos jugadores es estrictamente competitivo o de suma cero (eninglés: zero-sum games), cuando los valores de utilidad de los jugadores suman cero en cadauno de los posibles resultados del juego.

Esto significa que los jugadores tienen patrones de preferencia totalmente opuestos. Es decir,el resultado que es apreciado en alguna medida por uno de los jugadores, es aborrecido enesa misma medida por el otro jugador. O bien, cada ganancia de un jugador es una pérdidadel otro, en la misma medida.

En forma más precisa, un juego es de suma cero si

U1i,k +U2

i,k = 0

o equivalentemente siU1

i,k =−U2i,k

para cada uno de los posibles resultados del juego: Ri,k.

Esto implica que todos los juegos 2× 2 de suma cero pueden ser representados en formanormal con una tabla como la siguiente, en la cual las letras a, b, c y d, representan valoresnuméricos de utilidad.

Jugador 2E2

1 E22

Jugador 1 E11 (a,−a) (d,−d)

E12 (b,−b) (c,−c)

Notemos entonces que una matriz numérica 2× 2 puede ser usada para definir este mismojuego 2×2. Específicamente la matriz [

a d

b c

]

En particular, la matriz [1 3−4 −2

]

11

Page 12: apun204

define el juego de suma cero cuya representación normal es la siguiente.

Jugador 2E2

1 E22

Jugador 1 E11 (1,−1) (3,−3)

E12 (−4,4) (−2,2)

Desde luego, la representación matricial de un juego de suma cero depende de nuestro puntode vista, ya sea este del jugador 1 o del jugador 2. Para facilitar nuestra discusión, en ade-lante consideraremos que toda matriz 2× 2 de un juego de suma cero, contiene los valoresnuméricos de utilidad del jugador 1. Por supuesto, los valores de utilidad del jugador 2 sonentonces los valores negativos de esta misma matriz.

1.3.1 El nivel de seguridad y los valores maximin y minimax

Uno de los resultados fundamentales de la teoría de juegos es el famoso Teorema del Minimaxde von Neumann. Este teorema hace referencia a los valores minimax y maximin que tieneasociado todo juego de suma cero, y los cuales definimos a continuación.

Dada la siguiente matriz de utilidades de un juego de suma cero,[a d

b c

]

sus valores minimax y maximin son calculados a través de sus valores máximos y mínimosmarginales, tal como aparece en la tabla siguiente.

a d min{a,d}b c min{b,c}

max{min{a,d} ,min{b,c}}max{a,b} max{c,d} min{max{a,b} ,max{c,d}}

Donde desde luego, el valor minimax es

min{max{a,b} ,max{c,d}}

12

Page 13: apun204

que representa el menor de los mayores valores de cada columna; y el valor maximin es

max{min{a,d} ,min{b,c}}

que representa el mayor de los menores valores de cada fila.

Ejemplo 3. (Continuación) La matriz de utilidades[1 34 −2

]

tiene un mismo valor minimax y maximin igual a 1, el cual es calculado tal como se muestraa continuación.

1 3 min{1,3}= 14 −2 min{4,−2}=−2

max{1,−2}= 1max{1,4}= 4 max{3,−2}= 3 min{4,3}= 3

Ejemplo 5. La matriz de utilidades [1 3−4 −2

]

la cual difiere de la matriz anterior por solamente el signo de una de sus componentes, tienediferentes valores minimax y maximin, siendo ambos 1. Como se muestra en la tabla sigu-iente.

1 3 min{1,3}= 1−4 −2 min{−4,−2}=−4

max{1,−4}= 1max{1,−4}= 1 max{3,−2}= 3 min{1,3}= 1

Claramente, los valores minimax y maximin pueden ser calculados para toda matriz de utili-dades. Y considerando los dos ejemplos anteriores, notamos que estos valores coinciden paraalgunas matrices, mientras que para otras matrices estos valores difieren. Seguido debemosdiscutir el significado de estos valores en un juego.

13

Page 14: apun204

La teoría de los juegos de suma cero se basa en el concepto de nivel de seguridad de un juego,el cual resulta ser un concepto similar al nivel de significancia de la prueba de una hipótesis.Cada uno de estos dos conceptos nos ayudan a tomar una decisión, ya sea seleccionando lamejor estrategia a utilizar o bien rechazando o no una hipótesis nula.

Definimos el nivel de seguridad de un jugador como el mayor valor de utilidad que puedeobtener independientemente de la estrategia que utilice del otro jugador. En otras palabras,este es la mayor utilidad que el jugador puede asegurar con la selección de su propia estrate-gia, sin importar la estrategia que seleccione el otro jugador.

Por lo que en cualquier juego de suma cero, el nivel de seguridad del jugador 1 es igual alvalor maximin de la matriz de utilidades del juego, y que el nivel de seguridad del jugador 2es igual al valor minimax.

El nivel de seguridad puede servirle a un jugador como criterio para seleccionar la estrategia aseguir para optimizar sus utilidades. Notemos que como toda ganacia del jugador 1 es pérdidadel jugador 2, el jugador 1 debe considerar que el jugador 2 buscará la mayor utilidad posible,lo que significa para el jugador 1 la menor utilidad. Por lo que el jugador 1 debe asegurarla mayor utilidad posible, entre aquellos resultados en que el jugador 2 obtiene también lamayor utilidad posible.

Ejemplo 3. (Continuación) En este juego el jugador 1 tienen un nivel de seguridad igual a1 mientras que el nivel de seguridad del jugador 2 es igual a 3. Así que el jugador 1 deberíaseleccionar la estrategia 1 y el jugador 2 la estrategia 2, lo que corresponde al resultado conutilidades (3,-3). Así que el jugador 1 de hecho obtuvo una utilidad mayor a su nivel deseguridad (3>1), y el jugador 2 obtuvo exactamente su nivel de seguridad (-3).

Ejemplo 5. (Continuación) En este juego los dos jugadores tienen un mismo nivel de seguri-dad igual a 1. Por lo que el jugador 1 debe seleccionar la estrategia 1 y el jugador 2 tambiénsu estrategia 1, las que corresponden al resutado con valores de utilidad (1,-1). Así que ambosjugadores obtienen exactamente sus niveles de seguridad.

El juego del ejemplo 5 tiene un resultado que es un punto de equilibro estable, ya que ningunode los jugadores debe tener interés en seleccionar otra estrategia que la indicada. Mientrasque el resultado del juego del ejemplo 3 es un punto de equilibro inestable. Notemos que porejemplo en base al análisis realizado, el jugador 2 podría anticipar la acción del jugador 1 yescoger entonces su estrategia 1: E2

1 , buscando obtener el resultado con utilidades (1,-1), elcual es mejor para el jugador 2 (-1>-3) e igual para el jugador 1. Pero el jugador 1 también

14

Page 15: apun204

anticipando esto, podría escoger su estrategia 2: E12 , para obtener el resultado con utilidades

(4,-4), el cual es mejor para el jugador 1 pero peor para el jugador 2 (-3>-4).

Los juegos de suma cero con un punto de equilibrio inestable, son mejor resueltos por mediode las estrategias mixtas del juego, las cuales decribiremos en una sección posterior. Estemétodo de estrategias mixtas también es muy conveniente cuando el juego se juega repetida-mente.

1.3.2 Los juegos de suma constante

Aunque es común caracterizar los juegos estrictamente competitivos –en que la ganancia deun jugador es una pérdida del otro– como los juegos de suma cero –en que las utilidades delos jugadores en cada resultado del juego suman cero– los juegos estrictamente competitivoscomprenden el tipo más general de los juegos de suma constante –en que las utilidades de losjugadores en cada resultado del juego suman un mismo valor, no necesariamente cero.

En forma más precisa, un juego es de suma constante C si

U1i,k +U2

i,k =C

o equivalentemente siU1

i,k =C−U2i,k

para cada uno de los posibles resultados del juego: Ri,k.

A diferencia de los juegos de suma cero –cuando C = 0– los juegos de suma constante nopueden ser representados con la matriz de utilidades de solamente uno de los jugadores.En cambio deben utilizarse las matrices de utilidades de ambos jugadores. Y en particularel nivel de seguridad de cada jugador, debe calcularse por medio del valor maximin de lasutilidades del jugador.

Ejemplo 6.Jugador 2

E21 E2

2

Jugador 1 E11 (6,4) (8,2)

E12 (1,9) (3,7)

15

Page 16: apun204

Notemos que en este ejemplo las utilidades de los jugadores en cada resultado suman el valorconstante C = 10, el cual puede ser interpretado como la utilidad total disponible para losjugadores. Así, esta utilidad total podría representar el número total de votantes del país porcuyos votos compiten dos candidatos, o la demanda total de un producto que es producidopor 2 empresas competidoras.

El nivel de seguridad de cada jugador puede ser calculado por medio del valor maximin desu matriz de utilidades. Esto es como sigue.

Jugador 16 8 min{6,8}= 61 3 min{1,3}= 1

max{6,1}= 6

Jugador 24 29 7

min{4,9}= 4 min{2,7}= 2 max{4,2}= 4

Por lo que en este juego los dos jugadores debe seleccionar su estrategia 1, las que correspon-den al resutado con valores de utilidad (6,4). En que ambos jugadores obtienen sus nivelesde seguridad.

Todo juego de suma constante puede ser transformado a un juego de suma cero, restando lacantidad C

2 a las utilidades de cada jugador. Así en el ejemplo anterior tenemos lo siguiente.

Ejemplo 6. (Continuación)

Jugador 2E2

1 E22

Jugador 1 E11 (6−5,4−5) (8−5,2−5)

E12 (1−5,9−5) (3−5,7−5)

Jugador 2E2

1 E22

Jugador 1 E11 (1,−1) (3,−3)

E12 (−4,4) (−2,2)

16

Page 17: apun204

Notemos que el juego trasformado es de suma cero, y de hecho es el juego ya estudiado en elejemplo 5. Donde vimos que el resultado con utilidades (1,-1) es la solución correspondienteal nivel de seguridad de cada jugador, el cual es un punto de equilibrio estable del juego.

1.3.3 Los juegos estrictamente competitivos

Aunque regularmente los juegos estrictamente competitivos son vistos como los juegos desuma cero, debemos notar que estos comprenden una colección más amplia de juegos. Enparticular comprenden también a los juegos de suma constante, como vimos en la subsecciónanterior, y en forma general comprenden los juegos en que sus jugadores tienen preferenciasopuestas.

Así el juego de la tabla siguiente,

Jugador 2E2

1 E22

Jugador 1 E11 R1,1 R1,2

E12 R2,1 R2,2

es estrictamente competitivo si sus jugadores ordenan los resultados, de mayor a menor pref-erencia, en forma totalmente opuesta. Esto es por ejemplo como sigue.

Jugador 1: R2,1 , R1,2, R1,1, R2,2

Jugador 2: R2,2 , R1,1, R1,2, R2,1

Lo que en términos de las utilidades de cada jugador significa lo siguiente.

Jugador 1: U12,1 ≥U1

1,2 ≥U11,1 ≥U1

2,2

Jugador 1: U22,2 ≥U2

1,1 ≥U21,2 ≥U2

2,1

Por lo que en estos juegos, los jugadores deben escoger la estrategia a aplicar buscandoobtener su nivel de seguridad, por medio del valor maximin.

17

Page 18: apun204

1.4 Los juegos gana-gana

En el otro extremo del espectro de los juegos tenemos los estrictamente no competitivos ojuegos gana-gana. Así, si en un juego de suma cero los valores de utilidades de los jugadoresson totalmente opuestos, en un juego estrictamente no competitivo sus valores de utilidadestán en total acuerdo.

En forma más precisa, un juego es estrictamente no competitivo si

U1i,k =U2

i,k

para cada uno de los posibles resultados del juego: Ri,k.

Lo cual implica que todos los juegos 2×2 estrictamente no competitivos, pueden ser repre-sentados en forma normal con una tabla como la siguiente, en la cual las letras a, b, c y d,representan valores numéricos de utilidad.

Jugador 2E2

1 E22

Jugador 1 E11 (a,a) (d,d)

E12 (b,b) (c,c)

Notemos que en forma similar a los juegos de suma cero, cada matriz numérica 2×2 puedeser usada para definir cualquier juego 2×2 estrictamente no competitivos, pero a diferenciade los juegos de suma cero, esta matriz describe tanto las utilidades del jugador 1 como lasdel jugador 2.

Así, ahora la matriz [a d

b c

]

define totalmente el juego descrito en la tabla anterior. En particular, la matriz[1 3−4 −2

]

18

Page 19: apun204

define el juego estrictamente no competitivo cuya representación normal es como sigue.

Jugador 2E2

1 E22

Jugador 1 E11 (1,1) (3,3)

E12 (−4,−4) (−2,−2)

Considerando que los dos jugadores tienen exactamente el mismo patrón de preferenciashacia los resultados del juego, es claro que el juego terminará en el resultado que convengamás a los dos jugadores. El cual corresponde al resultado con el mayor valor de utilidad, esdecir el resultado con utilidad igual a max(i,k)

{U1

i,k

}.

1.4.1 El valor maximax

Notemos entonces que en este tipo especial de juegos, es razonable que ambos jugadoressigan un criterio maxmax para determinar la estrategia más adecuada, y no el criterio maximino minimax descrito en la sección anterior. Dada la matriz de utilidades de cualquier juegocon utilidades iguales, digamos la matriz numérica[

a d

b c

]

su valor maximax es calculado a través de sus valores máximos marginales, tal como apareceen la tabla siguiente.

a d max{a,d}b c max{b,c}

max{max{a,d} ,max{b,c}}max{a,b} max{c,d} max{max{a,b} ,max{c,d}}

El valor maxmax es desde luego el valor numérico que obtenemos calculando

max{max{a,b} ,max{c,d}}

el cual de hecho podemos calcular simplemente tomando el valor máximo de todos los valores

19

Page 20: apun204

de la matriz, este esmax{a,b,c,d}

Ejemplo 7. La misma matriz de utilidades que hemos considerado anteriormente[1 3−4 −2

]

pero que ahora representa las utilidades iguales de un juego estrictamente no competitivo,tiene un valor maximax igual a 3 para ambos jugadores, el cual es calculado como sigue.

1 3 max{1,3}= 3−4 −2 max{−4,−2}=−2

max{3,−2}= 3max{1,−4}= 1 max{−2,3}= 3 max{1,3}= 3

Claramente, para toda matriz de utilidades de un juego estrictamente no competitivo puedeser calculado su valor maximax, el cual siempre es igual para ambos jugadores. Este valorindicará a cada jugador la mejor estrategia a tomar, las cuales determinan un resultado deequilibrio del juego en que ambos jugadores optimizan sus utilidades. Por esto, todo juegocon iguales valores de utilidad tienen una solución y que esta solución es óptima para ambosjugadores.

1.4.2 Lo juegos estrictamente no competitivos

Los juegos estrictamente no competitivos comprenden los juegos en que sus jugadores tienenpreferencias iguales. Así el juego de la tabla siguiente,

Jugador 2E2

1 E22

Jugador 1 E11 R1,1 R1,2

E12 R2,1 R2,2

es estrictamente no competitivo si sus jugadores ordenan igual los resultados, de mayor amenor preferencia. Esto es por ejemplo como sigue.

20

Page 21: apun204

Jugador 1: R2,1 , R1,2, R1,1, R2,2

Jugador 2: R2,1 , R1,2, R1,1, R2,2

Lo que en términos de las utilidades de cada jugador significa lo siguiente.

Jugador 1: U12,1 ≥U1

1,2 ≥U11,1 ≥U1

2,2

Jugador 1: U12,1 ≥U1

1,2 ≥U11,1 ≥U1

2,2

Por lo que en estos juegos, los jugadores deben escoger la estrategia a aplicar buscandoobtener su mayor utilidad, por medio del valor maximax.

2 La forma extensa

En la teoría de juegos resulta conveniente representar un juego en varias formas diferentes–inclusive un mismo juego. Aunque por razones prácticas en este documento no presentamosninguna representación extensa o gráfica, debemos notar que también es muy importante verlos juegos a través de su forma extensa.

Dada la dificultad que presenta la elaboración de gráficas en un procesador de palabras, nosparece conveniente solamente describir las gráficas –las representaciones extensas– de losjuegos que discutimos en estos apuntes, y elaborar a mano todas estas gráficas para presen-tarlas a los alumnos en el pizarrón o algún documento complementario.

Debemos notar que la forma extensa de representar un juego –a diferencia de la foma normal–permite representar más aspectos de cualquier situación en estudio. Específicamente, con estaforma de representación podemos hacer lo siguiente.

a) Representar un mayor número de jugadores. Con esto desde luego cada gráfica se hace másextensa, pero esta resultan ser más convenientes que las múltiples tablas que deben elaborarseen la representación normal.

b) Detallar cada estrategia de un jugador en términos de las acciones que la componen. Locual es imposible hacer en la representación normal del juego, donde debemos trabajar conlas estrategias más generales que podamos definir.

c) Cada juego puede ser visto en forma dinámica. Esto es de acuerdo a la secuencia en quelos jugadores pueden tomar las acciones o estrategias que tienen disponibles. Lo cual es muy

21

Page 22: apun204

importante cuando en la realidad cada jugador debe responder a las acciones tomadas por losdemás jugadores.

d) Describir en forma más precisa la información con que cuenta cada jugador en cada turnodel juego. Lo que nos permite modelar en una forma intuitiva la incertidumbre que podríahaber en una situación de conflicto. Esta ya sea por el resultado impredecible de algún evento–como podría ser una guerra– o la falta de información sobre algún aspecto de la situaciónen estudio.

Por esto y dada la complejidad que usualmente tienen las situaciones de conflicto que de-seamos estudiar, las representanciones extensas son regularmente más adecuadas que las rep-resentaciones normales para estudiar estas situaciones.

Sin embargo, esta también mayor complejidad de las representaciones extensas, hace que laelaboración del modelo y su análisis sea más laboriosa que la elaboración y análisis de lasrepresentaciones normales. Por lo que siempre las representaciones normales son de utilidad,en especial para determinar el posible resultado de cada juego.

En esta sección iniciamos describiendo las componentes de las representaciones extensas ográficas de los juegos. Las cuales ejemplificamos presentando una nueva situación de con-flicto prototipo, conocida como el modelo de disuasión (en inglés, deterrence).

Describimos el método de indución hacia atrás (backward induction), que hace uso del cri-terio de mejor respuesta (best reply), el cual podemos usar para analizar o resolver cualquierjuego representado en forma extensa.

Aplicamos este criterio en los juegos de suma cero y gana-gana, y comprobamos que sus solu-ciones coinciden con las obtenidas usando los criterios minimax –o del nivel de seguridad– ymaximax. Por lo que el nivel de seguridad de cada jugador puede ser obtenido en todos losjuegos –no solo los juegos de suma cero– por medio del método de inducción hacia atrás.

2.1 La forma extensa

Representamos un juego en forma extensa por medio de una gráfica de árbol con los elemen-tos siguientes.

Los nodos

22

Page 23: apun204

Cada uno representa ya sea un punto de decisión –una jugada– para alguno de los jugadores,la ocurrencia de un evento con un resultado impredecible, un posible estado o condición dela situación en estudio, o bien el final del juego –como es un nodo terminal.

Indicamos a cual jugador le corresponde mover en un nodo escribiendo junto al nodo sunombre, número o el símbolo que lo representa. Debemos notar que el nodo correspondea un jugador y no a un turno del juego. Así cuando dos o más jugadores deben hacer susmovimientos en forma simultánea, ese turno quedará representado por varios nodos, uno porcada uno de los jugadores que deben mover.

Si el nodo representa un evento con un resultado indeterminado –como podría ser una guerra–debemos indicar el evento junto al nodo. Este tipo de nodo podría ser considerado –porlo menos en forma inicial– como un nodo terminal, por lo que el juego modelado podríaterminar en simplemente la ocurrencia de evento. Sin embargo, podemos usar la teoría lasprobabilidades para continuar la gráfica –hasta llegar a algunos otros posibles resultados deljuego– y analizarla.

En el estudio de alguna situación podríamos carecer de alguna información, por lo que po-dríamos no ser capaces de determinar en forma exacta el estado del juego en algún mo-mento. Entonces es conveniente considerar la definición de dos o más escenarios del juego–básicamente dos juegos diferentes– los cuales pueden componer un solo modelo medianteun nodo que represente esta misma incertidumbre. En este caso también podemos usar lateoría de las probabilidades para elaborar el modelo y analizarlo.

Por úlitmo, los nodos terminales representan los diferentes estados en puede terminar eljuego, por lo que cada uno de estos nodos tiene asociado uno de los posibles resultadosdel juego. Regularmente indicamos junto a cada nodo terminal los correspondientes valoresde utilidad de todos los jugadores participantes.

Las aristas

Estas representan las posibles estrategias o acciones que puede seleccionar el jugador delnodo. Las aristas nos llevan del nodo de un jugador a otro nodo, el cual puede representar unajugada de otro jugador, un evento, un punto de incertidumbre o un nodo terminal. Resultaconveniente dar un nombre –o representar por medio de un símbolo– a cada estrategia oacción, y escribirla junto a la arista correspondiente.

Los conjuntos de información

23

Page 24: apun204

Empleamos figuras que encierran –o líneas que unen– a dos o más nodos, para representar elnivel de información –o incertidumbre– de un jugador en un momento determinado del juego.En cada juego los conjuntos de información deben satisfacer las siguientes tres condinciones.

i. Todos los nodos contenidos en un mismo conjunto de información deben pertencer almismo jugador. De lo contrario el conjunto indicaría que cada jugador incluido cuenta coninformación de la jugada que realizará el otro jugador.

ii. Cada nodo contenido en el conjunto de información debe contar con aristas similares. Deotra forma, debe ser posible simplificar este conjunto reduciendo el número de nodos.

iii. Los nodos contenidos en el conjunto deben corresponder a una misma jugada del jugador.Es decir, cualquier conjunto de información de un jugador no puede contener nodos de dos omás jugadas. Ya que lo contrario significa que el jugador conoce de antemano el resultado deuna de las jugadas.

2.2 El modelo de disuasión

Lamentablemente por la limitaciones del procesador de palabras usado en la redacción de estedocumento, no podemos presentar aquí la representaciones en forma gráfica de los juegos queestudiamos. Lo que deberemos hacer en clase usando el pizarrón o posiblemente con el apoyode otro documento.

Así que en esta sección solo describiremos el modelo de disuasión y su representación enforma extensa, y el alumno debe tratar de elaborar las gráficas.

El modelo de disuasión busca describir todas las situaciones que podríamos ver como sim-ilares a la crisis de los misiles, dada en los años 60s entre los Estados Unidos (EEUU) yla anterior Unión Sovietica (USSR). En todas estas situaciones consideramos los siguientesaspectos generales.

Los jugadores

Reconocemos a dos jugadores, a uno de los cuales vemos como un retador (R) (challenger)y un defensor (D) (defender). Por ejemplo, en la crisis de los misiles, la USSR debe ser vistacomo el retador y los EEUU como el defensor.

Las primeras posibles acciones

24

Page 25: apun204

Al retador le asociamos las dos siguientes posibles acciones o estrategias.

Actuar (A). Esto es retar. En el caso de los misiles el reto consistió en que la USSR es-tableciera –o terminara de establecer– los misiles en Cuba.

No actuar (NA). Es decir, no retar y dejar las cosas como están, el status quo. Lo que en lacrisis de los misiles sería que la USSR no estableciera los misiles.

Por el otro lado, asociamos al defensor las dos posibles acciones o estrategias siguientes.

Actuar (A). Esto es en respuesta al reto puesto por el retador. En el caso de los misiles laacción de los EEUU era atacar y ocupar Cuba.

No actuar (NA). Es decir no responder al reto. Lo que sería en la crisis de los misiles que losEEUU no actuara ante la instalación de los misiles en Cuba.

Los posibles resultados

En este modelo es usual considerar que las acciones son tomadas por los jugadores por turnos–esto es en forma secuencial– y que la primera acción debe ser tomada por el retador.

Entonces, si el retador decide no actuar, esperamos que permanezca el statuos quo (SQ), y eljuego –por lo menos temporalmente– termine allí.

Pero si el retador actúa, debemos considerar el turno del defensor quien podría no actuar, porlo que esperaríamos que el juego terminara con el retador recibiendo algunas concesiones(C).

Pero si el defensor también actúa, entonces debemos considerar un segundo turno para elretador, quien podría de nuevo decidir actuar o no actuar en esta nueva situación.

Regularmente asumimos que la acción del retador en este punto debe llevar la situación a unaguerra (G) entre los jugadores, lo que vemos como un evento cuyo resultado no podemosprecedir con certeza.

Mientras que la no acción del retador en este punto debe implicar el retiro del reto (RR), y elregreso a condiciones similares a las iniciales aunque seguramente con algunas pérdidas delretador y ganacias del defensor.

Las preferencias

25

Page 26: apun204

En el caso del retador, lo más natural es asumir que debe ordenar los resultados de mayor amenor grado de preferencia como sigue.

Recibir concesiones (C) ≥ El status quo inicial (SQ) ≥ El retiro del reto (RR)

Por el otro lado, esperamos que el defensor ordene los resultados de mayor a menor grado depreferencia como sigue.

El retiro del reto (RR) ≥ El status quo inicial (SQ) ≥ Dar concesiones (C)

Es difícil determinar la preferencia de los jugadores con respecto la guerra, esto es sin con-siderar su posible resultado. Estaremos analizando esto más adelante cuando discutamos laincertidumbre en los juegos.

La representación gráfica (una primera descripción)

La representación en forma extensa de este juego la constituye una gráfica de árbol con entotal 7 nodos, 3 nodos de decisión y 4 nodos terminales –de resultados.

En esta gráfica no hay conjuntos de información conteniendo más de un solo nodo. Es decir,todos los conjuntos de información son simples. Esto por que las acciones de los jugadoresse van dando en forma secuencial, y cada jugador en su turno conoce las acciones tomadaspor el otro jugador.

El primer nodo corresponde al primer turno del retador (R), del cual deben salir las 2 aristasque representan sus posibles acciones: no actuar (NA) y actuar (A). La primera arista nosdebe llevar al nodo terminal del resultado corresponidente al status quo (SQ).

Mientras que la segunda arista nos debe llevar al único nodo de decisión del defensor. Delcual deben salir también 2 aristas, una para cada una de las acciones: no actuar (NA) y actuar(A).

La primera de estas aristas nos debe llevar al segundo nodo terminal, correspondiente a laentrega de concesiones al retador (C).

Mientras que la segunda arista nos debe llevar al segundo nodo de decisión del retador. Delcual deben salir las aristas correspondientesa a las acciones: actuar (A) y no actuar (NA).

Esta primera arista nos debe llevar al resultado de guerra (G), mientras que la segunda aristanos debe llevar al retiro del reto (RR).

26

Page 27: apun204

Más adelante estaremos extendiendo este juego –elaborando un juego un poco más complejo–considerando la incertidumbre en estas situaciones de disuasión. Esto en los dos siguientesaspectos.

a) Al momento de darse una guerra esperamos que el más capacitado bélicamente tenga unamayor probabilidad de ganar. Si cada jugador conoce la probabilidad de ganar la guerra,entonces podría calcular el resultado esperado del juego.

b) El resultado de la guerra depende en buena medida de la capacidad bélica de cada jugador,y podría ser que uno de los jugadores desconoce la capacidad exacta del otro jugador. Así, elprimer jugador podría definir dos escenarios, correspondientes a diferentes niveles –digamosalto y bajo– de la capacidad bélica del otro jugador.

La representación gráfica (una segunda descripción)

Nodo Arista Nodo Arista Nodo Arista Nodo

R NA SQ

A D NA C

A R NA RR

A G

2.3 El dilema del prisionero

Desde luego podemos representar en forma gráfica los juegos estudiados hasta ahora. Porejemplo el dielma del prisionero, el cual representamos en forma normal como sigue

P 2Confesar no si

P 1 no (−2,−2) (−5,−1)si (−1,−5) (−4,−4)

Su representación extensa debe elaborarse a partir de la descripción siguiente.

Nodo Arista Nodo Arista Nodo

P1 no P2 no (−2,−2)si (−5,−1)

si P2 no (−1,−5)si (−4,−4)

27

Page 28: apun204

Donde tenemos un solo conjunto de información no simple, conteniendo a los dos nodos delprisionero 2. Esto por que al momento de actuar este prisionero no conoce la acción tomadapor el prisionero 1.

Notemos que una gráfica similar puede ser elaborada asignando el primer nodo al prisionero2. Pero dado que ambos prisioneros deben actuar en forma simultánea –o sin conocer la ac-ción del otro– tenemos que cualquiera de las dos gráficas pueden ser usadas para representareste mismo juego.

2.4 La inducción hacia atrás

Dada una representación extensa de un juego, podemos aplicar el método de inducción haciaatrás –en ingles, backward induction– para resolver el juego. El cual se basa en el criterio dela mejor respuesta –best reply– para determinar la mejor estrategia a tomar.

El criterio de la mejor respuesta se aplica en forma local, esto es en cada uno de los nodosde los jugadores. Por lo que para su descripción necesitamos considerar solamente el nodo eljugador que le toca actuar (el nodo actual), el nodo del jugador y su arista que lleva al nodoactual (el nodo anterior), y todas las aristas del nodo actual.

La gráfica de esta pequeña fracción del juego puede elaborarse a partir de la siguiente de-scripción. Donde asumimos que el nodo anterior corresponde al jugador 2 (J2), quien de-cidió actuar con su estrategia j, que es el turno del jugador 1 (J1), quien debe escoger unaentre digamos n estrategias.

Nodo Arista Nodo Arista

J2 E2j J1 E1

1

E12

...E1

n

Entonces decimos que la estrategia E1r del jugador 1, es la mejor respuesta a la estrategia E2

j

del jugador 2, que podemos escribir como E2j MR E1

r , si

U1r, j ≥U1

i, j para cualquier otra estrategia E1i del jugador 1

El procedimiento de inducción hacia atrás para resolver un juego representado en forma ex-tensa, consiste entonces en el siguiente algoritmo.

28

Page 29: apun204

1. Identifique el último nodo de alguno de los jugadores. A partir del cual la acción de esejugador debe llevar a un punto nodo terminal.

2. En ese nodo aplique el criterio de la mejor respuesta para identificar la estrategia que debetomar ese jugador y el resultado esperado del juego.

3. Lea el valor de utilidad del jugador del nodo anterior en ese resultado y escríbalo junto aese nodo anterior.

4. Realice los pasos 1, 2 y 3 en todos los últimos nodo de los jugadores.

5. Realice el paso 4 en todos los penúltimos nodos de los jugadores, y así sucesivamentehasta llegar al primer nodo del juego.

6. Entonces, la solución del juego puede ser vista como una trayectoria, conteniendo losnodos y las aristas identificadas anteriormente.

Ejemplo 1.

Consideremos la representación gráfica descrita por esta tabla, en la cual asumimos que todoslos conjuntos de información son simples.

Nodo Arista Nodo Arista Nodo Arista Nodo

J1 U J2 u (2,4)d J1 L (−1,5)

R (0,2)D J2 l (−2,6)

r (4,4)

Solución: (2, 4). En que el jugador 1 debe actuar U, y luego el jugador 2 debe actuar u.

3 Referencias

R. Molina / 15-9-2014

29