tema 3: juegos secuenciales o dinámicos con información...

12
Tema 3: Juegos secuenciales o dinámicos con información completa 1. Introducción (Pérez et al. (2004), cap. 4) 1.1. ¿Qué es un juego secuencial o dinámico? 1.1.1. Juego con etapas o decisiones sucesivas 1.1.2. Tienen información completa (la estructura o reglas y los pagos son de dominio público) y su información puede ser perfecta e imperfecta 1.1.3. Representación extensiva y representación estratégica: relación entre ambas representaciones (toda representación extensiva tiene una única representación estratégica, pero una estratégica puede ser de dos o más extensivas). 1.2. Ejemplos 1.2.1. Juegos con y sin información perfecta 1.2.2.El juego del ciempiés 1.2.3. Dilema del prisionero repetido dos veces con el juego simple definido por ND D ND 4,4 0,5 D 5,0 1,1

Upload: others

Post on 17-Mar-2020

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

Tema 3: Juegos secuenciales o dinámicos con información completa

1. Introducción (Pérez et al. (2004), cap. 4) 1.1. ¿Qué es un juego secuencial o dinámico?

1.1.1. Juego con etapas o decisiones sucesivas 1.1.2. Tienen información completa (la estructura o reglas y los pagos son de dominio

público) y su información puede ser perfecta e imperfecta 1.1.3. Representación extensiva y representación estratégica: relación entre ambas

representaciones (toda representación extensiva tiene una única representación estratégica, pero una estratégica puede ser de dos o más extensivas).

1.2. Ejemplos 1.2.1. Juegos con y sin información perfecta

1.2.2. El juego del ciempiés

1.2.3. Dilema del prisionero repetido dos veces con el juego simple definido por

ND D

ND 4,4 0,5

D 5,0 1,1

Page 2: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

1.2.4. Juego con azar pero con información perfecta

2. Una alternativa al concepto anterior de EN. Solución por inducción hacia atrás. Perfección de los juegos. (Pérez et al. (2004), cap. 4) 2.1. Límites del concepto de equilibrio Nash: pérdida información y soluciones no

aceptables en juegos estratégicos (ver los juegos de disuasión a la entrada de la introducción)

2.2. Perfección de un juego (Selten, 1965)

2.2.1. Concepto de subjuego en un juego en forma extensiva: 2.2.1.1. El nodo origen es unitario (puede ser un nodo de azar) 2.2.1.2. Contiene a todos los nodos que le siguen y sólo a ellos 2.2.1.3. No rompe ningún conjunto de información

2.2.2. Ver los subjuegos de los juegos del ciempiés, dilema del prisionero repetido dos veces y juego con azar de la introducción

2.2.3. Definición de Equilibrio de Nash perfecto en subjuegos (ENPS) 2.3. Teorema de existencia de ENPS en juegos dinámicos finitos

2.3.1. Demostración y resolución por inducción hacia atrás (puede haber ENPS que no se obtengan por este método)

2.3.1.1. En juegos con información completa, perfecta y sin azar 2.3.1.2. En juegos con información completa, perfecta y con azar 2.3.1.3. En juegos con información completa pero imperfecta (papel de las

estrategias mixtas)

Competir

duro Competir

suave

Entrar 0,0 5,5

No entrar 3,7 3,7

Page 3: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

2.3.1.4. Ejemplos de ENPS en grafos, el inferior no se obtiene por inducción hacia atrás

2.3.2. Aplicación

2.3.2.1. Al ciempiés, dilema del prisionero repetido dos veces y juego con azar de la introducción

2.3.2.2. Al ajedrez, existe una estrategia óptima pero se desconoce cuál es y a quién favorece

2.3.2.3. Oligopolio de tres jugadores, el primero es el líder y los jugadores 2 y 3 eligen simultáneamente, con: U1 = (x2+x3)

2/2+x1(x2+x3); U2 = (12-x1-x2-x3)x2; U3 = (12-x1-x2-x3)x3 . [Solución: x1=3, x2=3, x3=3]

I D

A 4,4 1,1

B 3,2 1,2

I D

A 4,4 1,1

B 3,2 1,2

Tabla final

I D

A 5,6 2,3

B 7,6 2,4

Page 4: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

3. Credibilidad. Soluciones creíbles de Stackelberg al oligopolio (Gardner cap. 6) 3.1. Credibilidad

3.1.1. Promesas y amenazas 3.1.2. Aplicación al caso del ciempiés 3.1.3. Aplicación al juego que sigue (2 amenaza con guerra si 1 entra, o 2 promete que

nunca hará guerra)

3.2. Duopolio en cantidades (Cournot-Stackelberg)

3.2.1. Resolver para p = 130 - q = 130 - x1 – x2, con c = 10, para el caso discreto.

(Comentar las diferencias entre los dos casos y las estrategias existentes en cada caso)

3.2.2. Probar que tiene ventaja el líder frente a la situación de Cournot pura

30 40 60

30 18,18 15,20 9,18

40 20,15 16,16 8,12

60 18,9 12,8 0,0

Page 5: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

3.3. Duopolio en precios (Bertrand-Stackelberg)

3.3.1. Sin diferenciación 3.3.1.1. Resolver para q = 130 - p, con c = 10, competencia ruinosa 3.3.1.2. Observar que el primer jugador (el líder) no tiene ventaja

3.3.2. Con diferenciación 3.3.2.1. Resolver para x

1 = 180 - 1'5p

1 + 0'5p

2; x

2 = 180 - 1'5p

2 + 0'5p

1; c = 20

3.3.2.2. El líder tiene ventaja 4. Juegos repetidos (Gardner cap. 7, Pérez et al. cap. 7)

4.1. Introducción 4.1.1. Caracterización de un juego repetido,

4.1.1.1. Repetición y cobro agregado al final de los cobros de cada etapa. Repetición finita o infinita

4.1.1.2. Conducta estratégica, promesas y amenazas 4.1.1.3. Ejemplos: dilema del prisionero repetido dos veces y el ciempiés de una

etapa repetido, que se representa a continuación

4.2. Valor del juego 4.2.1. Factor de descuento: δ=β/(1+α). Preferencia por la liquidez de tasa α e

incertidumbre con probabilidad β sobre el futuro [δ= β/(1+α)]. Experiencia empírica de su cambio temporal, el tiempo lejano influye cada vez menos.

4.2.2. Valor presente descontado y pago medio. Recordar que:

1

01

0 0 0

; = 1 1

1

i ni

nii n i n i ni i ii

i in

i i i

aa a

a a a a

Page 6: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

4.2.3. Ver, por ejemplo, la tabla siguiente de valores presentes y medios

Factor de descuento

Secuencia de pagos

Valor presente Pago medio

δ<1 {qt}t=0,1,….,T

0

tt

t

t

T

q 1

0

1

1

tt

t

t

T

Tq

δ<1 {qt}t=0,1,….,T, con qt = q*

1* *

0

1

1

tt

t

TT

q q *q

δ=1 {qt}t=0,1,….,T 0

t

t

t

T

q 0

1

1

t

t

t

T

qT

δ=0 {qt}t=0,1,….,T 0q 0q

δ<1 {qt}t=0,1,…., 1

0

tt

t

t

q 0

1t

t

t

t

q

δ<1 {qt}t=0,1,…., , con qt = q*

* *

0

1

1

tt

t

T

q q *q

δ=1 {qt}t=0,1,…., 0

t

t

t

q 0

1lim

t

t

t

T

Tq

T +1

δ=0 {qt}t=0,1,…., 1q 1q

4.3. Vectores de pagos factibles de un juego. Obtenerlos para

ND D Cine Futbol

Dilema del prisionero: ND 4,4 0,5 Batalla de los sexos: Cine 1,2 0,0

D 5,0 1,1 Futbol 0,0 2,1

5. ENPS en los juegos repetidos (Gardner cap. 7, Pérez et al. cap. 7)

5.1. En los juegos repetidos también deberemos buscar la credibilidad y perfección del juego, por ello nos preguntamos las siguientes cuestiones

5.1.1. ¿En cada una de las etapas de un ENPS, siempre se juega un equilibrio Nash? [Resp.: No]

5.1.2. ¿Depende la respuesta anterior de la longitud T del juego (finita o infinita) o de

la tasa de descuento ? [Resp.: Ambos factores son importantes] 5.1.3. ¿Hay ENPS que permitan jugar las estrategias Pareto-óptimas aunque no sean

equilibrios de Nash? [Resp.: Hay juegos en que si es posible]

5.2. Juegos repetidos en un número finito de etapas 5.2.1. Condición necesaria y suficiente de ENSP cuando el juego tiene un único EN o

varios con pagos iguales [cualesquiera que sean el periodo T finito y la tasa de descuento δ]. Ejemplo: dilema del prisionero repetido

Page 7: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

5.2.2. Condición necesaria y condición suficiente para que un equilibrio sea ENSP

cuando el juego tiene varios EN no equivalentes. Dependencia periodo T y la tasa de descuento δ. Aplicarlo a la batalla de los sexos repetida y al juego siguiente

5.2.3. Existencia de ENPS, en juegos con varios EN no equivalentes, que no son sucesión de EN pero que acaban con un EN. Aplicarlo en el ejemplo anterior

I D

A 4,4 1,1

B 3,2 1,2

I D

A 4,4 1,1

B 3,2 1,2

Tabla final

I D

A 5,6 2,3

B 7,6 2,4

Page 8: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

5.3. Juegos repetidos en un número infinito de etapas 5.3.1. Caracterización de un juego repetido indefinidamente. Las amenazas como

fundamento de la cooperación entre los jugadores 5.3.2. Estudio del dilema del prisionero repetido indefinidamente

ND D

Dilema del prisionero: ND 4,4 0,5

D 5,0 1,1

5.3.2.1. El perfil no cooperativo (D,D) siempre es ENPS 5.3.2.2. El perfil cooperativo (ND,ND) repetido indefinidamente no es EN, y por

tanto tampoco es ENPS, cualquiera que sea la tasa δ 5.3.2.3. Ojo por ojo: Ambos actúan igual, primero ND y si el otro cambia, se hace

lo que ha hecho el otro en la jugada anterior. Este perfil no es EN si δ <1/4, pero si lo es EN si δ ≥1/4. No obstante, ni en este caso es ENPS porque perdonar es positivo

5.3.2.4. El perfil del Disparador: Ambos actúan igual, ND en la primera etapa y cambiar a D permanentemente si el otro hace D una vez, es EN y ENPS si δ ≥1/4

5.3.3. Folk theorems 5.3.3.1. Teorema de Friedman ( 1971) 5.3.3.2. Aplicarlo al dilema del prisionero 5.3.3.3. Aplicación a un modelo de Cournot repetido infinitamente. Hacerlo

con p= 130 - x1 – x2, y c = 10

6. Repetición y racionalidad limitada

6.1. Criterios de racionalidad 6.1.1. Introducción. El solitario de Schelling 6.1.2. Papel del azar y de la incertidumbre 6.1.3. Dos criterios económicos tradicionales: Mano invisible de Adam Smith y la

insaciabilidad del beneficio (utilidad) 6.1.4. Asunción de la racionalidad limitada (se actúa por rutinas) y se confía en las

dinámicas repetitivas. 6.2. Aplicación al oligopolio de Cournot

6.2.1. Caso estable: p= M - x1 – x2, coste = c R1x2 = M-c-2 x1, R2x1 = M-c-2 x2

6.2.2. Caso inestable: p= M/2 - x1 – x

2, c

i(x

i) = (1/2)c x

i-(3/4) x

i2 R1x1 = M-c-2 x2,

R2x2 = M-c-2 x1 6.3. Aplicación a la biología

6.3.1. Evidencia empírica: es difícil hablar de racionalidad en las conductas 6.3.2. La ecuación del replicador

6.3.2.1. Caracterización formal 6.3.2.2. Obtención para un caso particular

6.3.3. Estrategias evolutivamente estables

7. Ejercicios propuestos 7.1. Resolución por inducción hacia atrás

7.1.1. Resuelva el Juego del reclutamiento cuyo gráfico puede verse debajo.La prima de alistamiento es b = $300 y el coste del servicio es c = $400. ¿Cómo cambia esta solución si b = $500? , ¿Qué amenazas y promesas son posibles? Interprete su respuesta en términos de un ejército de voluntarios

Page 9: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

7.1.2. Resolver el juego Fuga y evasión que muestra la figura. El jugador 1, el fugitivo, a

cada de escaparse de prisión y puede ir hacia arriba o hacia abajo. El jugador 2, el carcelero, también puede ir hacia arriba o hacia abajo, pero no sabe hacia dónde ha ido el fugitivo. Si el carcelero va en el mismo sentido que el fugitivo, lo atrapará, con lo que gana. Si el carcelero va en sentido contrario al fugitivo, éste se escapa y gana

7.1.3. La empresa Duflot desea diversificar sus actividades en el mercado de material

de la construcción. Tradicionalmente trabaja el plástico y desea entrar en el mercado de planchas onduladas. En ese mercado hay una empresa dominante que fabrica planchas onduladas de fibrocemento. El éxito de la operación de entrar depende de las reservas financieras de la empresa establecida. El juego en forma extensiva es:

donde la empresa establecida es 2 y la entrante 1. Resolver el problema en dos casos: la probabilidad de reservas altas es del 80% y la probabilidad es del 20%

Page 10: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

7.1.4. Resolver el siguiente juego y comentar brevemente el resultado

7.1.5. Resolver el juego Destrucción mutuamente asegurada (DMA) dado por el gráfico

siguiente donde DT representa la destrucción total de la tierra

7.2. Ejemplos de duopolios 7.2.1. En la competencia a la Cournot-Stackelberg cada empresa se enfrenta a la

demanda de mercado p = 90 - q. Cada empresa tiene un coste unitario de $30 por cada unidad que envía al mercado. Demuestre que la empresa 1 tiene la ventaja del que decide primero, puesta en evidencia por sus ganancias. Comprobar que la empresa 1 está mejor que en el equilibrio de Cournot. [Resp.: x1=30, x2=15, B1=450, B1=225;en C-C: x1=20, x2=20, B1=400]

7.2.2. En un mercado que se rige por competencia al estilo Cournot-Stackelberg y que tiene como curva de demanda p = 130 - q, y coste unitario c = 10, el jugador 2 ofrece producir 25 si el 1 produce 35. Explicar la posible fundamentación de la oferta-promesa y decir si es creíble la promesa. [Resp.: x1=60, x2=30, B1=1800, B1=900;en la promesa: B1=2100, B2=1500]

Page 11: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

7.2.3. En la competencia a la Bertrand-Stackelberg de dos empresas sus demandas de de mercado están dadas por: x

1 = 90 -(3/2)p

1+(1/2)p

2 y x

2 = 90 -(3/2)p

2+(1/2)p

1

respectivamente. Cada empresa tiene un coste unitario constante de 10€ por cada unidad. La empresa 1 decide en primer lugar. Hallar el equilibrio de Bertrand-Stackelberg. Comparar con el equilibrio de Bertrand y comentar los resultados. [Resp.: p1=1460/34=42,94, p2=42,65, B1=1545, B1=1550; en B-B: p1= p2=42, B1=B2=1536]

7.2.4. Sea una economía con dos empresas que compiten en cantidades. La función de demanda es p = 100 - x

1 - x

2, los costes unitarios de ambas empresas son

constantes y de valor c1 y c2 respectivamente. 7.2.4.1. Hallar en función de c1 y c2 la solución de equilibrio Cournot-Stackelberg

(cantidades y precio) 7.2.4.2. Hallar en función de c1 y c2 la solución de equilibrio de Cournot

(cantidades y precio) 7.2.4.3. Si tenemos que c1 = 20 y c2 = 60, obtener las producciones y precio de

equilibrio de ambos casos. ¿Son aceptables los resultados? 7.2.4.4. Asumiendo que la empresa 1 es líder por tener costes unitarios menores y

la 2 seguidor, ¿qué equilibrio se producirá entre las dos empresas si los costes son c1 = 20 y c2 = 60?.

7.3. Sobre juegos repetidos

7.3.1. Sea un duopolio de Cournot definido por las siguientes especificaciones: p = 90 - x1 - x2, y coste unitario constante = 30,

7.3.1.1. Demostrar que si se juega dos veces, tiene un único ENSP. 7.3.1.2. ¿Cambia el resultado si se juega 3 o 4 veces en lugar de dos? 7.3.1.3. ¿Qué debería hacer una empresa si se juega indefinidamente y la otra

empresa siempre mantiene las condiciones del equilibrio de Cournot? 7.3.1.4. ¿Qué estrategia competitiva permite obtener (y repartirse) a los dos

empresas el beneficio de la situación monopolista? [Resp.: lanzar x1= x2= 15 con la amenaza de cambiar permanentemente a xi=20 si el otro no cumple]

7.3.2. En el juego Oportunidades de mercado descrito por

A B

A 3,3 1,4

B 4,1 0,0

7.3.2.1. Si se juega dos veces y el factor de descuento es δ =1, encontrar dos ENSP

que tengan pagos medios de (2’5,2’5). ¿Hay algún otro ENPS? ¿Hay más de uno? [Resp.: recordar el EN con estrategias mixtas con cobros de (2,2)]

7.3.2.2. ¿Cómo afectaría a los ENPS un factor de descuento δ<1? 7.3.2.3. ¿Es un EN del juego si cada jugador sigue la estrategia {A,A,N3}, siendo N3

el equilibrio mixto del juego? 7.3.3. Si el juego base es el mismo del problema anterior y se juega cuatro veces,

siendo N1=(A,B) y N2=(B,A). 7.3.3.1. ¿Son los {Ni1, Ni2, Ni3, Ni4} ENPS, con i1, i2, i3 e i4 = 1 ó 2? [Resp.: Si] 7.3.3.2. ¿Es {(A,A), (A,A), N1, N1} un EN si ambos jugadores amenazan con jugar al

equilibrio de estrategias puras que menos interese al que no respete los (A,A) a partir del no cumplimiento? [Resp.: No]

7.3.3.3. ¿Son {(A,A), (A,A), N1, N2} y {(A,A), (A,A), N2, N1} ENSP si δ=1 y ambos jugadores amenazan con jugar al equilibrio de estrategias puras que

Page 12: Tema 3: Juegos secuenciales o dinámicos con información ...personal.unizar.es/jsanchez/documentos/Guion usado... · Ver los subjuegos de los juegos del ciempiés, dilema del prisionero

menos interese al que no respete los (A,A) a partir del no cumplimiento? [Resp.: Si]

7.3.3.4. ¿Cambia el resultado anterior si es δ<1?,¿depende del jugador? [Resp.: Depende de δ y depende del jugador]

7.3.3.5. Obtener para qué valores de δ existe una estrategia ENPS que asegure un pago medio de (3,3) en el juego repetido indefinidamente. [Resp.: δ>1/3]

7.3.4. En el juego de la batalla de los sexos, obtener el ENPS que permite obtener un pago medio a cada jugador de 1’5. [Recordar que pagos medios de (1'5,1'5) pueden obtenerse con una lotería al 50% de cada uno de los EN simples ]