teoría de juegos - pavelgomez.com · pagos o payoffs: el primer número de cada celda indica lo...

1

Teoría de Juegos:Una herramienta de pensamiento estratégico

para el emprendedor

Profesor: Pavel Gó[email protected]

Nov. 2019

MBA

1

Contenido – Sesión1

§ Introducción: Teoría de juegos y estrategia§ Conceptos preliminares§ Los Juegos simultáneos y la “forma normal”§ Equilibrio de Nash§ Dilemas sociales§ Desafíos de coordinación§ Riesgo y Estrategia Maximín§ Estrategias contínuas y mixtas en juegos simultáneos

2

© 2019 Pavel Gómez

TeoríadeJuegos

3


La teoría de juegos es una aproximación alcomportamiento humano que estudia laelección racional de estrategias, y trata lainteracción entre personas, organizaciones opaíses como si fueran juegos, con reglas ypagos conocidos, en los cuales cada jugadortrata de “ganar”.

EstrategiayTeoríadeJuegos

4


La teoría de juegos ha incorporado una visión clave a laestrategia de negocios:

La idea de que el éxito de la estrategia de una empresadepende de la estrategia de otros jugadores relevantes.

Ha innovado en medicamentos para reducir el colesterol

Su capacidad de sostener beneficios depende de los movimientos de sus

competidores, que producen medicamentos similares basados en

marcas o genéricos

EstrategiayTeoríadeJuegos

5


yCompiten en la industria de aviones de pasajeros

Las decisiones de cada una, sobre qué aviones desarrollar, dependen de lo que haga la otra

CONCEPTOSPRELIMINARES 6

7

Elementos deunjuego

§ Jugadores: participantes del juego

§ Acciones: alternativas disponibles para cada jugador

§ Estrategias: plan de acciones

§ Información: descripción de la información disponible

§ Pagos: lo que recibe cada jugador en cada confluenciade estrategias

§ Reglas de juego


8

Tipos dejuegos

§ Simultáneos: los jugadores juegan al mismotiempo o no conocen lo que hacen otrosjugadores

§ Consecutivos o secuenciales: un jugador juegatras otro y ambos conocen la jugada anterior


9

Juegos simultáneos

§ Los jugadores toman sus respectivas decisiones almismo tiempo, o no saben cómo han jugado losdemás jugadores

§ Cuando existe información completa, los jugadoresconocen las estrategias de los demás, así como lospagos que cada jugador recibiría en cada escenario

§ Cada jugador decide su estrategia, orientándose porlos pagos condicionados por las estrategias de losdemás


10

Formanormal

§ En los juegos simultáneos las acciones y pagos serepresentan en una matriz

§ Cada jugador debe tener un número finito deacciones, también llamadas estrategias en el casode los juegos simultáneos

§ Cada combinación de estrategias se denomina un“resultado”

§ Los resultados estables se denominan “equilibrios”


Dos tiendasdeunmalldecideninvertironoenpublicidad

11


Tienda B

Tien

da A

Invierte No invierte

Invierte 7, 7 -10, 3

No invierte 3, -10 1, 1

12

Conceptosfundamentales

§ Estrategias

§ Payoffs

§ Resultados

§ Estrategias dominantes

§ Equilibrio de estrategias dominantes

§ Equilibrio de Nash


Estrategias

13


Tienda B

Tien

da A




Estrategias del jugador B

Estrategias del jugador A

PagosoPayoffs

14


Tienda B

Tien

da A




Pagos o Payoffs: El primer número de cada celda indica lo recibido por el jugador de la izquierda,y el segundo número lo recibido por el jugador de arriba en cada combinación de estrategias.Signos positivos indican ganancias (o utilidad) y los negativos indican pérdidas (o desutilidad).

Ejemplo: Si A Invierte y B no invierte, entonces A pierde 10 y B gana 3

15

Estrategia dominante

Una estrategia es dominante si esta es preferidapor un jugador debido a que esta le proporciona lamayor utilidad (pago), independientemente de lasestrategias adoptadas por los demás jugadores.


Observemosestejuego

16


Jugador B

Juga

dorA

Izquierda Derecha

Arriba 9, 10 15, 13

Abajo 3, 8 1, 2

Observemosestejuego

17


Jugador B

Juga

dorA

Izquierda Derecha

Arriba 9, 10 15, 13

Abajo 3, 8 1, 2

“Arriba” es una estrategia dominante para el jugador A, ya que con esta A siempre gana más (independientemente de lo que juegue B)

¿Tiene el jugador B alguna estrategia dominante?

18

Equilibrio conestrategias dominantes

La existencia de estrategias dominantes permite definir de manera sencilla el equilibrio de un juego.

100,100

150, 8 10, 10

8,150Precio alto

Precio bajo

Precio bajoPrecio alto

Firm

a 1

Firma 2

Observe que “Precio bajo” es una estrategia dominante para ambas firmas. Un equilibrio es una combinación de estrategias. Por lo tanto, en este ejemplo, (Precio bajo, Precio bajo) es un “equilibrio de estrategias dominantes” .

19

Equilibrio deNash

Un Equilibrio de Nash es unresultado en el cual cada jugadorestá jugando su mejor estrategia,dadas las estrategias de los demásjugadores. Cuando esto ocurre,ningún jugador tiene incentivos acambiar su estrategia, una vez queconoce la jugada de los otrosjugadores


20

Elmétododelamejor respuesta parasaber siunjuego tiene algúnEquilibrio deNash

Una estrategia es una mejor respuesta para un jugador si, dadassus creencias acerca de las estrategias de los demás jugadores, esaestrategia maximiza la utilidad de ese jugador.

Procederemos usando un óvalo para señalar los pagoscorrespondientes a las mejores respuestas del jugador de laizquierda y un rectángulo para señalar los correspondientes a lasmejores respuestas del jugador de arriba.

Para que exista un equilibrio de Nash deben juntarse dosmenores respuestas en una misma celda

Un juego pueden tener cero, uno o varios equilibrios de Nash


21


Jugador 2

Izquierda Centro Derecha

Juga

dor1

A 3,1 2,3 10,2

B 4,5 3,0 6,4

C 2,2 5,4 12,3

D 5,6 4,5 9,7

Veamos el siguiente ejemplo:

Usaremos el método de la mejor respuesta para saber si hay algún equilibrio de Nash...


22


Jugador 2


Juga

dor1

A 3,1 2,3 10,2

B 4,5 3,0 6,4

C 2,2 5,4 12,3

D 5,6 4,5 9,7

• Este juego tiene un solo Equilibrio de Nash: (C, Centro)• Esto lo sabemos porque en la celda correspondiente a esa combinación de

estrategias se juntan dos mejores respuestas.• Observe que una vez que cada jugador conoce la estrategia del otro, ninguno

desea cambiar su estrategia. Esta es una característica del Equilibrio de Nash. © 2019 Pavel Gómez

23

Jugador 2

X Y Z

Juga

dor1

A 2,3 8,2 10,6

B 3,0 4,5 6,4

C 5,4 6,1 2,5

D 4,5 2,3 5,2

Ejercicio 1

Use el método de la mejor respuesta para saber si este juego tienealgún Equilibrio de Nash.


Ejercicio 1

24


Candidato F

Cand

idat

o N


Izquierda 55, 45 30, 70 50, 50

Centro 75, 25 50, 50 70, 30

Derecha 50, 50 25, 75 45, 55

El juego de la segunda vuelta de las elecciones de Chile 2019 (Si esta ocurre)

• ¿Hay algún Equilibrio de Nash?

• Interprete el resultado

26

Líder Jumbo

LOSDILEMASSOCIALESDesafío N° 1

28

Dos editorialesrivalesdecidenelnúmerodepáginasdesupróximolibrodeteoríadejuegos

29


Editorial B

Edito

rial A

400p 600p 800p

400p 45, 45 15, 50 10, 40

600p 50, 15 40, 40 15, 45

800p 40, 10 45, 15 35, 35

• ¿Hay algún Equilibrio de Nash?

• ¿Qué problema le sugiere el resultado esperado de este juego?

30

Losdilemas sociales

Decimos que hay un dilema social cuando un juego tiene unequilibrio de Nash que es subóptimo, desde el punto de vistasocial.

Este es uno de los temas más interesantes de los juegossimultáneos, el cual es descrito de manera muy elocuente por eljuego clásico denominado “El Dilema del Prisionero”, el cualanalizaremos más tarde.

El dilema social descrito por el Dilema del Prisionero es muyfrecuente en los mercados, en las relaciones personales, en lascomunidades y por supuesto, en la política.


LOSDESAFÍOSDECOORDINACIÓNDesafío N° 2

31

Dos emisorasderadioeligensuposicionamiento

32


Emisora B

Emis

ora

A

Rock Pop Opinión

Rock 35, 35 50, 40 80, 10

Pop 40, 50 20, 20 40, 10

Opinión 10, 80 10, 40 5, 5

• ¿Hay algún Equilibrio de Nash?• Interprete el resultado• ¿Coordinación?• ¿Punto de Schilling/focal?

33

Losdesafíos decoordinación

Decimos que hay un desafío de coordinación cuando un juego tienevarios equilibrios de Nash y existe el riesgo de incurrir en pérdidasdebido a una falla de coordinación.

En este caso, los jugadores se enfrentan al reto de “adivinar” a cuálequilibrio de Nash le apuestan los demás jugadores.

Thomas Schelling, premio Nobel de Economía por su contribución ala teoría de juegos (aplicada a la guerra fría), propuso que cuandohay dos o más equilibrios de Nash, los jugadores usan pistas oseñales para inferir cuál equilibrio es más probable.

El equilibrio de Nash más probable es desde entonces denominadoel “Punto de Schelling”.


ELMANEJOESTRATÉGICODELRIESGODesafío N° 3

34

Analicemoslossiguientesjuegos

35


Firma B

Firm

a A

Invertir No invertir

Invertir 7, 7 -10, 3

No invertir 3, -10 1, 1

• Evalúe si hay algún Equilibrio de Nash en estos juegos• ¿Cómo sería el resultado de cada uno si a los jugadores les preocupa el riesgo?

Empresa B

Empr

esa

A Esperar Avanzar

Esperar 0, 0 1, 5

Avanzar 5, 1 -100,-100

Jugador 2

Juga

dor 1 C D

A 20, 0 -90, 5

B 5, 2 30,-75

36

Larespuestaestratégicaalriesgo:EstrategiaMaximín

Cuando los jugadores son sensibles al riesgo, suelen protegerseusando las estrategias que minimizan las pérdidas posibles.

Se denomina “Estrategia Maximín” a aquella estrategia que permitea un jugador maximizar su ganancia mínima.

Una estrategia maximín es entonces aquella que contiene a losmayores payoffs mínimos. Esta permite minimizar el riesgo asociadocon errores estratégicos de los demás jugadores o con estrategiasdirigidas a “causar daño al rival”.

En los juegos anteriores, ¿cuál sería una estrategia maximín para eljugador de arriba? ¿Cuál sería el resultado si ambos jugadoresadoptan estrategias Maximín?


Juegos Clásicos: Ejemplos, interpretación y

utilidad estratégica

37


38

Juegosclásicos

100,100

200, 2 5, 5

2, 200C

NC

NCC

Pris

ione

ro 1

Prisionero 2

El dilema del prisionero

1,2

0, 0 2, 1

0, 0Ópera

Cine

CineÓpera

Juga

dor A

Jugador B

La “batalla de los sexos”

0,0

1, 3 2, 2

3, 1ND

D

DND

Con

duct

or 1

Conductor 2

El juego del “Gallina” (Chicken game)

39

Juegos clásicos

2,2

0, 0 1, 1

0, 0A

B

BAJu

gado

r 1Jugador 2

Pareto-Coordinación

1,-1

-1, 1 1, -1

-1, 1I

D

ID

Dis

para

dor

ArqueroEl juego del penal

1,1

0, 0 1, 1

0, 0A

B

BA

Juga

dor 1

Jugador 2Coordinación

ELDILEMADELPRISIONEROCOMODILEMASOCIAL

Ejemplos: Escena 1 – The Dark Knight40

41

Eldilemadelpresionero

-20, -20

-40, 0 -2, -2

0, -40Confiesa

No confiesa

No confiesaConfiesa

Juga

dor 1

Jugador 2

¿Cuál es el Equilibrio de Nash de este juego?

Se ha cometido un delito. La policía sospechade dos personas, pero no tiene pruebas. Laúnica prueba sería la confesión de uno oambos. Se les interroga en habitacionesseparadas (sin comunicación entre ellos) y seles ofrece el siguiente esquema de pagos:


42

Aplicacionesdeldilemadelpresionero:Guerras deprecios

Aplicacionesdeldilemadelpresionero:LaDelaciónCompensada

43

“Colusión de papel higiénico: Fiscalía Nacional Económica presenta

requerimiento por colusión contra CMPC y SCA”

Experta en libre competencia: “Sin la delación compensada esto jamás se habría sabido.”

44

¿CómosuperarelDilemadelPrisionero?

Los dilemas sociales semejantes al dilema del prisionero son bastantecomunes en los mercados, en la política, en las relaciones interpersonalesy al interior de los equipos de trabajo. Esto se expresa como una tensiónentre la cooperación y el comportamiento oportunista.

¿Qué elementos facilitan su superación?

• La perspectiva de largo plazo cuando los juegos son repetidos• Uso de estrategias que premian la cooperación y penalizan el

comportamiento oportunista (Trigger; Tit-for-tat)• La existencia de variables éticas o valóricas en la función de utilidad de

las personas (la cooperación genera utilidad “en sí misma”)• El uso sistemático de señales (ej.: reputación cooperativa)


45

Estrategiasparalacooperación:Gatillo (trigger)yOjo-por-ojo (Tit-for-tat)

Estrategia Gatillo (trigger)

§ Empezar Cooperando§ Seguir cooperando mientras el otro jugador lo haga, si el otro jugador no

coopera, jugar el equilibrio de Nash de ahí en adelante

Estrategia Ojo-por-Ojo (tit-for-tat)

§ Empezar Cooperando§ Luego cooperar si el otro jugador cooperó el periodo anterior§ No Cooperar si el otro jugador no cooperó el periodo anterior§ Retomar la cooperación en cualquier momento “sin rencor”

46

Gatillo yOjo por ojo

Dos objetivos contrapuestos:

§ Castigo debe ser lo suficientemente fuerte como para mantener la cooperación

§ Desde la perspectiva de quien castiga, es mejor que el castigo sea lo menor posible: Quien castiga también es castigado (Ventaja de Ojo-por-Ojo sobre Gatillo)


47

Ojo-por-ojo

Ojo-por-Ojo ha resultado preferida a Gatillo en experimentos

La estrategia Ojo-por-Ojo es:

§ Simple (total claridad)

§ Bondadosa (nunca ataca primero ni busca el enfrentamiento)

§ Provocable (nunca deja ofensa sin castigo)

§ Indulgente (no es rencorosa, olvida rápido)© 2019 Pavel Gómez

48

Variableséticasovalóricasenlafuncióndeutilidaddelaspersonas

La existencia de variables éticas o valóricas en lafunción de utilidad de las personas:

La cooperación genera utilidad “en sí misma”

Ejemplo:

Escena de “Batman – El Caballero de la Noche”


JUEGOSSIMULTÁNEOSCONESTRATEGIASCONTÍNUAS

49

50


En una elección parlamentaria hay dos coaliciones: Chile Vamos (V) y laNueva Mayoría (N). Cada coalición decide cuánto gastar en publicidad decara a las elecciones. Supongamos que el resultado obtenido por cadacoalición, en términos de su proporción de los votos totales, es igual a laproporción de su gasto en publicidad con respecto al total gastado porambos jugadores. Cuando V gasta X (en millones de dólares) y N gasta Y(en millones de dólares), la proporción de votos obtenidos para cada unoes:

𝑆" = $($&')

𝑆) = '($&')

El parlamento está compuesto por 100 diputados. Por simplicidad,asumimos que la utilidad (payoff) de cada coalición es igual al número deparlamentarios obtenidos menos su gasto en publicidad.

Juegossimultáneosconestrategiascontínuas

51


a. ¿Cuál es el gasto en publicidad política de N, cuandoV gasta 16 millones de dólares?

b. ¿Cuántos diputados obtiene cada coalición en elcaso señalado en (a)?

c. ¿Cuál es el equilibrio de Nash de este juego?

d. ¿Cuántos diputados obtiene cada jugador en elequilibrio de Nash?

e. ¿Es este equilibrio de Nash un óptimo social? ¿Porqué si o por qué no?

Juegossimultáneosconestrategiascontínuas

JUEGOSSIMULTÁNEOSCONESTRATEGIASMIXTAS

52

53


En algunos juegos, los jugadores desean o requieren hacer unuso estratégico de la incertidumbre. Esto ocurre cuandodeseamos sorprender a otros jugadores:

• Cuando jugamos cachipún

• Cuando un jugador de fútbol cobra un penal

• Cuando una empresa realiza promociones o rebajasanuales, pero desea que que los consumidores no esperensistemáticamente por las rebajas

Juegossimultáneosconestrategiasmixtas

54


En todos estos casos, uno o más jugadores adoptan estrategiasmixtas, esto es, juegan sus estrategias discretas con una ciertaprobabilidad:

• En cachipún, juegan piedra, papel o tijera con unaprobabilidad igual a 1/3, y ademas de manera no regular

• En el cobro del penal, cada jugador se lanza en unadirección con igual probabilidad

• En la realización de las promociones, la probabilidad derealizar una promoción en un momento debe ser la mismaque realizarla en otro momento.

En todos los casos, la idea es maximizar la incertidumbre de losdemás jugadores

Juegossimultáneosconestrategiasmixtas

55

Juegossimultáneosconestrategiasmixtas:Aplicación

56

Juegossimultáneosconestrategiasmixtas:Aplicación

“Carlos Bonet, investigador y parte del proyecto, explicó que “la Teoría de Juegos es unaciencia que busca ver cómo interactúan diferentes agentes. Cada uno tiene objetivosindividuales que son afectados por los objetivos del resto”.En este caso, existen dos agentes con dos objetivos diferentes: “El primero, es la personaque evade y cuyo objetivo es que el viaje tenga el menor costo posible, en tanto que elsegundo es el fiscalizador que quiere que el pasaje sea pagado”, explica Bastián Bahamondesacadémico de la Universidad de Chile.Según explican los expertos, hoy día para evitar la evasión, se eligen las calles con mayorevasión, donde los fiscales están por un largo periodo, lo que provocaría que “se pierda elfactor sorpresa“, ya que “los evasores saben por experiencia dónde se ubican losfiscalizadores, por lo que fácilmente pueden evitar el control de pago”.Por lo que este nuevo modelo, estaría basado en un sistema aleatorio.“Como contraparte surge naturalmente la idea de que el sistema de fiscalización debería seraleatorio, por lo que estamos creando un sistema basado en el azar que proponga los lugaresque serán fiscalizados y que, además, no tenga un patrón que los evasores puedanidentificar”, afirma Bonet.“Existen calles o sectores más peligrosos que otros, por lo que incluimos este factor a la horade diseñar el sistema”, concluye el investigador.


Estrategiasmixtas:Definicionesformales

57

Una estrategia mixta (σ) corresponde a aquellaque asigna una función de probabilidad p sobre unconjunto de estrategias puras S.

Un conjunto de estrategias σi corresponde a unEquilibrio de Nash en estrategias mixtas si paracada jugador i, σi es una mejor respuesta.


EquilibriodeNashconestrategiasmixtas

58

El objetivo es explotar la incertidumbre del rival.

Para que una estrategia mixta del jugador i sea parte de unequilibrio de Nash, el otro jugador debe ser indiferente entresus distintas alternativas.

Veamos una versión del juego del penal:

5, -5

-5, 5 5, -5

-5, 5I

D

ID

Juga

dor 1

(D

ispa

rado

r)

Jugador 2(Arquero)


EquilibriodeNashconestrategiasmixtas

59

Estrategias mixtas óptimas:

Llamaremos p a la probabilidad de que el Disparador elijadisparar hacia la Izquierda.

Luego, debe cumplirse que:

VE2D = VE2

I

è (p)-5 + (1-p)5 = (p)5 + (1-p)-5

è p = ½© 2019 Pavel Gómez

Estrategiasmixtasóptimas

60

El mismo procedimiento es usado para encontrar la estrategiaóptima para el jugador 2.Sea q la probabilidad de que el Arquero elija lanzarse hacia laDerecha. Luego debe cumplirse que:

VE1I = VE1

D

(q)5 + (1-q)-5 = (q)-5 + (1-q)5 è q = ½

Entonces, el equilibrio de Nash de este juego es

(σ1*= (1/2; 1/2), σ2* = (1/2; 1/2))© 2019 Pavel Gómez

Estrategiasmixtasóptimas

61

Para evitar confusiones, se sugiere que el equilibrio seaexpresado de manera exhaustiva y explícita:

ENM = (P1I = ½; P1

D = ½; P2D = ½; P2

I = ½)

donde:

ENM: Equilibrio de Nash en estrategias mixtasP1

I: Probabilidad de que el Jugador 1 juegue IP1

D: Probabilidad de que el jugador 1 juegue DP2

D: Probabilidad de que el jugador 2 juegue DP2

I: Probabilidad de que el jugador 2 juegue I


PRÓXIMACLASE:JUEGOSSECUENCIALES

62

teoría de juegos - pavelgomez.com · pagos o payoffs: el primer número de cada celda indica lo...

Documents