teoría de juegos - pavelgomez.com · pagos o payoffs: el primer número de cada celda indica lo...
TRANSCRIPT
1
Teoría de Juegos:Una herramienta de pensamiento estratégico
para el emprendedor
Profesor: Pavel Gó[email protected]
Nov. 2019
MBA
1
Contenido – Sesión1
§ Introducción: Teoría de juegos y estrategia§ Conceptos preliminares§ Los Juegos simultáneos y la “forma normal”§ Equilibrio de Nash§ Dilemas sociales§ Desafíos de coordinación§ Riesgo y Estrategia Maximín§ Estrategias contínuas y mixtas en juegos simultáneos
2
© 2019 Pavel Gómez
TeoríadeJuegos
3
© 2019 Pavel Gómez
La teoría de juegos es una aproximación alcomportamiento humano que estudia laelección racional de estrategias, y trata lainteracción entre personas, organizaciones opaíses como si fueran juegos, con reglas ypagos conocidos, en los cuales cada jugadortrata de “ganar”.
EstrategiayTeoríadeJuegos
4
© 2019 Pavel Gómez
La teoría de juegos ha incorporado una visión clave a laestrategia de negocios:
La idea de que el éxito de la estrategia de una empresadepende de la estrategia de otros jugadores relevantes.
Ha innovado en medicamentos para reducir el colesterol
Su capacidad de sostener beneficios depende de los movimientos de sus
competidores, que producen medicamentos similares basados en
marcas o genéricos
EstrategiayTeoríadeJuegos
5
© 2019 Pavel Gómez
yCompiten en la industria de aviones de pasajeros
Las decisiones de cada una, sobre qué aviones desarrollar, dependen de lo que haga la otra
CONCEPTOSPRELIMINARES 6
7
Elementos deunjuego
§ Jugadores: participantes del juego
§ Acciones: alternativas disponibles para cada jugador
§ Estrategias: plan de acciones
§ Información: descripción de la información disponible
§ Pagos: lo que recibe cada jugador en cada confluenciade estrategias
§ Reglas de juego
© 2019 Pavel Gómez
8
Tipos dejuegos
§ Simultáneos: los jugadores juegan al mismotiempo o no conocen lo que hacen otrosjugadores
§ Consecutivos o secuenciales: un jugador juegatras otro y ambos conocen la jugada anterior
© 2019 Pavel Gómez
9
Juegos simultáneos
§ Los jugadores toman sus respectivas decisiones almismo tiempo, o no saben cómo han jugado losdemás jugadores
§ Cuando existe información completa, los jugadoresconocen las estrategias de los demás, así como lospagos que cada jugador recibiría en cada escenario
§ Cada jugador decide su estrategia, orientándose porlos pagos condicionados por las estrategias de losdemás
© 2019 Pavel Gómez
10
Formanormal
§ En los juegos simultáneos las acciones y pagos serepresentan en una matriz
§ Cada jugador debe tener un número finito deacciones, también llamadas estrategias en el casode los juegos simultáneos
§ Cada combinación de estrategias se denomina un“resultado”
§ Los resultados estables se denominan “equilibrios”
© 2019 Pavel Gómez
Dos tiendasdeunmalldecideninvertironoenpublicidad
11
© 2019 Pavel Gómez
Tienda B
Tien
da A
Invierte No invierte
Invierte 7, 7 -10, 3
No invierte 3, -10 1, 1
12
Conceptosfundamentales
§ Estrategias
§ Payoffs
§ Resultados
§ Estrategias dominantes
§ Equilibrio de estrategias dominantes
§ Equilibrio de Nash
© 2019 Pavel Gómez
Estrategias
13
© 2019 Pavel Gómez
Tienda B
Tien
da A
Invierte No invierte
Invierte 7, 7 -10, 3
No invierte 3, -10 1, 1
Estrategias del jugador B
Estrategias del jugador A
PagosoPayoffs
14
© 2019 Pavel Gómez
Tienda B
Tien
da A
Invierte No invierte
Invierte 7, 7 -10, 3
No invierte 3, -10 1, 1
Pagos o Payoffs: El primer número de cada celda indica lo recibido por el jugador de la izquierda,y el segundo número lo recibido por el jugador de arriba en cada combinación de estrategias.Signos positivos indican ganancias (o utilidad) y los negativos indican pérdidas (o desutilidad).
Ejemplo: Si A Invierte y B no invierte, entonces A pierde 10 y B gana 3
15
Estrategia dominante
Una estrategia es dominante si esta es preferidapor un jugador debido a que esta le proporciona lamayor utilidad (pago), independientemente de lasestrategias adoptadas por los demás jugadores.
© 2019 Pavel Gómez
Observemosestejuego
16
© 2019 Pavel Gómez
Jugador B
Juga
dorA
Izquierda Derecha
Arriba 9, 10 15, 13
Abajo 3, 8 1, 2
Observemosestejuego
17
© 2019 Pavel Gómez
Jugador B
Juga
dorA
Izquierda Derecha
Arriba 9, 10 15, 13
Abajo 3, 8 1, 2
“Arriba” es una estrategia dominante para el jugador A, ya que con esta A siempre gana más (independientemente de lo que juegue B)
¿Tiene el jugador B alguna estrategia dominante?
18
Equilibrio conestrategias dominantes
La existencia de estrategias dominantes permite definir de manera sencilla el equilibrio de un juego.
100,100
150, 8 10, 10
8,150Precio alto
Precio bajo
Precio bajoPrecio alto
Firm
a 1
Firma 2
Observe que “Precio bajo” es una estrategia dominante para ambas firmas. Un equilibrio es una combinación de estrategias. Por lo tanto, en este ejemplo, (Precio bajo, Precio bajo) es un “equilibrio de estrategias dominantes” .
19
Equilibrio deNash
Un Equilibrio de Nash es unresultado en el cual cada jugadorestá jugando su mejor estrategia,dadas las estrategias de los demásjugadores. Cuando esto ocurre,ningún jugador tiene incentivos acambiar su estrategia, una vez queconoce la jugada de los otrosjugadores
© 2019 Pavel Gómez
20
Elmétododelamejor respuesta parasaber siunjuego tiene algúnEquilibrio deNash
Una estrategia es una mejor respuesta para un jugador si, dadassus creencias acerca de las estrategias de los demás jugadores, esaestrategia maximiza la utilidad de ese jugador.
Procederemos usando un óvalo para señalar los pagoscorrespondientes a las mejores respuestas del jugador de laizquierda y un rectángulo para señalar los correspondientes a lasmejores respuestas del jugador de arriba.
Para que exista un equilibrio de Nash deben juntarse dosmenores respuestas en una misma celda
Un juego pueden tener cero, uno o varios equilibrios de Nash
© 2019 Pavel Gómez
21
Elmétododelamejor respuesta parasaber siunjuego tiene algúnEquilibrio deNash
Jugador 2
Izquierda Centro Derecha
Juga
dor1
A 3,1 2,3 10,2
B 4,5 3,0 6,4
C 2,2 5,4 12,3
D 5,6 4,5 9,7
Veamos el siguiente ejemplo:
Usaremos el método de la mejor respuesta para saber si hay algún equilibrio de Nash...
© 2019 Pavel Gómez
22
Elmétododelamejor respuesta parasaber siunjuego tiene algúnEquilibrio deNash
Jugador 2
Izquierda Centro Derecha
Juga
dor1
A 3,1 2,3 10,2
B 4,5 3,0 6,4
C 2,2 5,4 12,3
D 5,6 4,5 9,7
• Este juego tiene un solo Equilibrio de Nash: (C, Centro)• Esto lo sabemos porque en la celda correspondiente a esa combinación de
estrategias se juntan dos mejores respuestas.• Observe que una vez que cada jugador conoce la estrategia del otro, ninguno
desea cambiar su estrategia. Esta es una característica del Equilibrio de Nash. © 2019 Pavel Gómez
23
Jugador 2
X Y Z
Juga
dor1
A 2,3 8,2 10,6
B 3,0 4,5 6,4
C 5,4 6,1 2,5
D 4,5 2,3 5,2
Ejercicio 1
Use el método de la mejor respuesta para saber si este juego tienealgún Equilibrio de Nash.
© 2019 Pavel Gómez
Ejercicio 1
24
© 2019 Pavel Gómez
Candidato F
Cand
idat
o N
Izquierda Centro Derecha
Izquierda 55, 45 30, 70 50, 50
Centro 75, 25 50, 50 70, 30
Derecha 50, 50 25, 75 45, 55
El juego de la segunda vuelta de las elecciones de Chile 2019 (Si esta ocurre)
• ¿Hay algún Equilibrio de Nash?
• Interprete el resultado
25
26
Líder Jumbo
27
LOSDILEMASSOCIALESDesafío N° 1
28
Dos editorialesrivalesdecidenelnúmerodepáginasdesupróximolibrodeteoríadejuegos
29
© 2019 Pavel Gómez
Editorial B
Edito
rial A
400p 600p 800p
400p 45, 45 15, 50 10, 40
600p 50, 15 40, 40 15, 45
800p 40, 10 45, 15 35, 35
• ¿Hay algún Equilibrio de Nash?
• ¿Qué problema le sugiere el resultado esperado de este juego?
30
Losdilemas sociales
Decimos que hay un dilema social cuando un juego tiene unequilibrio de Nash que es subóptimo, desde el punto de vistasocial.
Este es uno de los temas más interesantes de los juegossimultáneos, el cual es descrito de manera muy elocuente por eljuego clásico denominado “El Dilema del Prisionero”, el cualanalizaremos más tarde.
El dilema social descrito por el Dilema del Prisionero es muyfrecuente en los mercados, en las relaciones personales, en lascomunidades y por supuesto, en la política.
© 2019 Pavel Gómez
LOSDESAFÍOSDECOORDINACIÓNDesafío N° 2
31
Dos emisorasderadioeligensuposicionamiento
32
© 2019 Pavel Gómez
Emisora B
Emis
ora
A
Rock Pop Opinión
Rock 35, 35 50, 40 80, 10
Pop 40, 50 20, 20 40, 10
Opinión 10, 80 10, 40 5, 5
• ¿Hay algún Equilibrio de Nash?• Interprete el resultado• ¿Coordinación?• ¿Punto de Schilling/focal?
33
Losdesafíos decoordinación
Decimos que hay un desafío de coordinación cuando un juego tienevarios equilibrios de Nash y existe el riesgo de incurrir en pérdidasdebido a una falla de coordinación.
En este caso, los jugadores se enfrentan al reto de “adivinar” a cuálequilibrio de Nash le apuestan los demás jugadores.
Thomas Schelling, premio Nobel de Economía por su contribución ala teoría de juegos (aplicada a la guerra fría), propuso que cuandohay dos o más equilibrios de Nash, los jugadores usan pistas oseñales para inferir cuál equilibrio es más probable.
El equilibrio de Nash más probable es desde entonces denominadoel “Punto de Schelling”.
© 2019 Pavel Gómez
ELMANEJOESTRATÉGICODELRIESGODesafío N° 3
34
Analicemoslossiguientesjuegos
35
© 2019 Pavel Gómez
Firma B
Firm
a A
Invertir No invertir
Invertir 7, 7 -10, 3
No invertir 3, -10 1, 1
• Evalúe si hay algún Equilibrio de Nash en estos juegos• ¿Cómo sería el resultado de cada uno si a los jugadores les preocupa el riesgo?
Empresa B
Empr
esa
A Esperar Avanzar
Esperar 0, 0 1, 5
Avanzar 5, 1 -100,-100
Jugador 2
Juga
dor 1 C D
A 20, 0 -90, 5
B 5, 2 30,-75
36
Larespuestaestratégicaalriesgo:EstrategiaMaximín
Cuando los jugadores son sensibles al riesgo, suelen protegerseusando las estrategias que minimizan las pérdidas posibles.
Se denomina “Estrategia Maximín” a aquella estrategia que permitea un jugador maximizar su ganancia mínima.
Una estrategia maximín es entonces aquella que contiene a losmayores payoffs mínimos. Esta permite minimizar el riesgo asociadocon errores estratégicos de los demás jugadores o con estrategiasdirigidas a “causar daño al rival”.
En los juegos anteriores, ¿cuál sería una estrategia maximín para eljugador de arriba? ¿Cuál sería el resultado si ambos jugadoresadoptan estrategias Maximín?
© 2019 Pavel Gómez
Juegos Clásicos: Ejemplos, interpretación y
utilidad estratégica
37
© 2019 Pavel Gómez
38
Juegosclásicos
100,100
200, 2 5, 5
2, 200C
NC
NCC
Pris
ione
ro 1
Prisionero 2
El dilema del prisionero
1,2
0, 0 2, 1
0, 0Ópera
Cine
CineÓpera
Juga
dor A
Jugador B
La “batalla de los sexos”
0,0
1, 3 2, 2
3, 1ND
D
DND
Con
duct
or 1
Conductor 2
El juego del “Gallina” (Chicken game)
39
Juegos clásicos
2,2
0, 0 1, 1
0, 0A
B
BAJu
gado
r 1Jugador 2
Pareto-Coordinación
1,-1
-1, 1 1, -1
-1, 1I
D
ID
Dis
para
dor
ArqueroEl juego del penal
1,1
0, 0 1, 1
0, 0A
B
BA
Juga
dor 1
Jugador 2Coordinación
ELDILEMADELPRISIONEROCOMODILEMASOCIAL
Ejemplos: Escena 1 – The Dark Knight40
41
Eldilemadelpresionero
-20, -20
-40, 0 -2, -2
0, -40Confiesa
No confiesa
No confiesaConfiesa
Juga
dor 1
Jugador 2
¿Cuál es el Equilibrio de Nash de este juego?
Se ha cometido un delito. La policía sospechade dos personas, pero no tiene pruebas. Laúnica prueba sería la confesión de uno oambos. Se les interroga en habitacionesseparadas (sin comunicación entre ellos) y seles ofrece el siguiente esquema de pagos:
© 2019 Pavel Gómez
42
Aplicacionesdeldilemadelpresionero:Guerras deprecios
Aplicacionesdeldilemadelpresionero:LaDelaciónCompensada
43
“Colusión de papel higiénico: Fiscalía Nacional Económica presenta
requerimiento por colusión contra CMPC y SCA”
Experta en libre competencia: “Sin la delación compensada esto jamás se habría sabido.”
44
¿CómosuperarelDilemadelPrisionero?
Los dilemas sociales semejantes al dilema del prisionero son bastantecomunes en los mercados, en la política, en las relaciones interpersonalesy al interior de los equipos de trabajo. Esto se expresa como una tensiónentre la cooperación y el comportamiento oportunista.
¿Qué elementos facilitan su superación?
• La perspectiva de largo plazo cuando los juegos son repetidos• Uso de estrategias que premian la cooperación y penalizan el
comportamiento oportunista (Trigger; Tit-for-tat)• La existencia de variables éticas o valóricas en la función de utilidad de
las personas (la cooperación genera utilidad “en sí misma”)• El uso sistemático de señales (ej.: reputación cooperativa)
© 2019 Pavel Gómez
45
Estrategiasparalacooperación:Gatillo (trigger)yOjo-por-ojo (Tit-for-tat)
Estrategia Gatillo (trigger)
§ Empezar Cooperando§ Seguir cooperando mientras el otro jugador lo haga, si el otro jugador no
coopera, jugar el equilibrio de Nash de ahí en adelante
Estrategia Ojo-por-Ojo (tit-for-tat)
§ Empezar Cooperando§ Luego cooperar si el otro jugador cooperó el periodo anterior§ No Cooperar si el otro jugador no cooperó el periodo anterior§ Retomar la cooperación en cualquier momento “sin rencor”
46
Gatillo yOjo por ojo
Dos objetivos contrapuestos:
§ Castigo debe ser lo suficientemente fuerte como para mantener la cooperación
§ Desde la perspectiva de quien castiga, es mejor que el castigo sea lo menor posible: Quien castiga también es castigado (Ventaja de Ojo-por-Ojo sobre Gatillo)
© 2019 Pavel Gómez
47
Ojo-por-ojo
Ojo-por-Ojo ha resultado preferida a Gatillo en experimentos
La estrategia Ojo-por-Ojo es:
§ Simple (total claridad)
§ Bondadosa (nunca ataca primero ni busca el enfrentamiento)
§ Provocable (nunca deja ofensa sin castigo)
§ Indulgente (no es rencorosa, olvida rápido)© 2019 Pavel Gómez
48
Variableséticasovalóricasenlafuncióndeutilidaddelaspersonas
La existencia de variables éticas o valóricas en lafunción de utilidad de las personas:
La cooperación genera utilidad “en sí misma”
Ejemplo:
Escena de “Batman – El Caballero de la Noche”
© 2019 Pavel Gómez
JUEGOSSIMULTÁNEOSCONESTRATEGIASCONTÍNUAS
49
50
© 2019 Pavel Gómez
En una elección parlamentaria hay dos coaliciones: Chile Vamos (V) y laNueva Mayoría (N). Cada coalición decide cuánto gastar en publicidad decara a las elecciones. Supongamos que el resultado obtenido por cadacoalición, en términos de su proporción de los votos totales, es igual a laproporción de su gasto en publicidad con respecto al total gastado porambos jugadores. Cuando V gasta X (en millones de dólares) y N gasta Y(en millones de dólares), la proporción de votos obtenidos para cada unoes:
𝑆" = $($&')
𝑆) = '($&')
El parlamento está compuesto por 100 diputados. Por simplicidad,asumimos que la utilidad (payoff) de cada coalición es igual al número deparlamentarios obtenidos menos su gasto en publicidad.
Juegossimultáneosconestrategiascontínuas
51
© 2019 Pavel Gómez
a. ¿Cuál es el gasto en publicidad política de N, cuandoV gasta 16 millones de dólares?
b. ¿Cuántos diputados obtiene cada coalición en elcaso señalado en (a)?
c. ¿Cuál es el equilibrio de Nash de este juego?
d. ¿Cuántos diputados obtiene cada jugador en elequilibrio de Nash?
e. ¿Es este equilibrio de Nash un óptimo social? ¿Porqué si o por qué no?
Juegossimultáneosconestrategiascontínuas
JUEGOSSIMULTÁNEOSCONESTRATEGIASMIXTAS
52
53
© 2019 Pavel Gómez
En algunos juegos, los jugadores desean o requieren hacer unuso estratégico de la incertidumbre. Esto ocurre cuandodeseamos sorprender a otros jugadores:
• Cuando jugamos cachipún
• Cuando un jugador de fútbol cobra un penal
• Cuando una empresa realiza promociones o rebajasanuales, pero desea que que los consumidores no esperensistemáticamente por las rebajas
Juegossimultáneosconestrategiasmixtas
54
© 2019 Pavel Gómez
En todos estos casos, uno o más jugadores adoptan estrategiasmixtas, esto es, juegan sus estrategias discretas con una ciertaprobabilidad:
• En cachipún, juegan piedra, papel o tijera con unaprobabilidad igual a 1/3, y ademas de manera no regular
• En el cobro del penal, cada jugador se lanza en unadirección con igual probabilidad
• En la realización de las promociones, la probabilidad derealizar una promoción en un momento debe ser la mismaque realizarla en otro momento.
En todos los casos, la idea es maximizar la incertidumbre de losdemás jugadores
Juegossimultáneosconestrategiasmixtas
55
Juegossimultáneosconestrategiasmixtas:Aplicación
56
Juegossimultáneosconestrategiasmixtas:Aplicación
“Carlos Bonet, investigador y parte del proyecto, explicó que “la Teoría de Juegos es unaciencia que busca ver cómo interactúan diferentes agentes. Cada uno tiene objetivosindividuales que son afectados por los objetivos del resto”.En este caso, existen dos agentes con dos objetivos diferentes: “El primero, es la personaque evade y cuyo objetivo es que el viaje tenga el menor costo posible, en tanto que elsegundo es el fiscalizador que quiere que el pasaje sea pagado”, explica Bastián Bahamondesacadémico de la Universidad de Chile.Según explican los expertos, hoy día para evitar la evasión, se eligen las calles con mayorevasión, donde los fiscales están por un largo periodo, lo que provocaría que “se pierda elfactor sorpresa“, ya que “los evasores saben por experiencia dónde se ubican losfiscalizadores, por lo que fácilmente pueden evitar el control de pago”.Por lo que este nuevo modelo, estaría basado en un sistema aleatorio.“Como contraparte surge naturalmente la idea de que el sistema de fiscalización debería seraleatorio, por lo que estamos creando un sistema basado en el azar que proponga los lugaresque serán fiscalizados y que, además, no tenga un patrón que los evasores puedanidentificar”, afirma Bonet.“Existen calles o sectores más peligrosos que otros, por lo que incluimos este factor a la horade diseñar el sistema”, concluye el investigador.
© 2019 Pavel Gómez
Estrategiasmixtas:Definicionesformales
57
Una estrategia mixta (σ) corresponde a aquellaque asigna una función de probabilidad p sobre unconjunto de estrategias puras S.
Un conjunto de estrategias σi corresponde a unEquilibrio de Nash en estrategias mixtas si paracada jugador i, σi es una mejor respuesta.
© 2019 Pavel Gómez
EquilibriodeNashconestrategiasmixtas
58
El objetivo es explotar la incertidumbre del rival.
Para que una estrategia mixta del jugador i sea parte de unequilibrio de Nash, el otro jugador debe ser indiferente entresus distintas alternativas.
Veamos una versión del juego del penal:
5, -5
-5, 5 5, -5
-5, 5I
D
ID
Juga
dor 1
(D
ispa
rado
r)
Jugador 2(Arquero)
© 2019 Pavel Gómez
EquilibriodeNashconestrategiasmixtas
59
Estrategias mixtas óptimas:
Llamaremos p a la probabilidad de que el Disparador elijadisparar hacia la Izquierda.
Luego, debe cumplirse que:
VE2D = VE2
I
è (p)-5 + (1-p)5 = (p)5 + (1-p)-5
è p = ½© 2019 Pavel Gómez
Estrategiasmixtasóptimas
60
El mismo procedimiento es usado para encontrar la estrategiaóptima para el jugador 2.Sea q la probabilidad de que el Arquero elija lanzarse hacia laDerecha. Luego debe cumplirse que:
VE1I = VE1
D
(q)5 + (1-q)-5 = (q)-5 + (1-q)5 è q = ½
Entonces, el equilibrio de Nash de este juego es
(σ1*= (1/2; 1/2), σ2* = (1/2; 1/2))© 2019 Pavel Gómez
Estrategiasmixtasóptimas
61
Para evitar confusiones, se sugiere que el equilibrio seaexpresado de manera exhaustiva y explícita:
ENM = (P1I = ½; P1
D = ½; P2D = ½; P2
I = ½)
donde:
ENM: Equilibrio de Nash en estrategias mixtasP1
I: Probabilidad de que el Jugador 1 juegue IP1
D: Probabilidad de que el jugador 1 juegue DP2
D: Probabilidad de que el jugador 2 juegue DP2
I: Probabilidad de que el jugador 2 juegue I
© 2019 Pavel Gómez
PRÓXIMACLASE:JUEGOSSECUENCIALES
62