conducta y teoría de juegos

40
1 Conducta y Teoría de Juegos: ¿Cómo psicólogos y economistas se unen para explicar nuestra conducta frente a problemas sociales? Profesor: Pavel Gómez Email: [email protected] / [email protected] Marzo 2019 Facultad de Psicología 1

Upload: others

Post on 12-Jul-2022

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Conducta y Teoría de Juegos

1

Conducta y Teoría de Juegos:

¿Cómo psicólogos y economistas se unen para explicar nuestra conducta frente a problemas sociales?

Profesor: Pavel Gómez

Email: [email protected] / [email protected]

Marzo 2019

Facultad dePsicología

1

Page 2: Conducta y Teoría de Juegos

Contenido – Sesión2

§ Ejercicios: Estrategias dominantes y Equilibrio deNash

§ Repaso conceptos clave

§ Principales desafíos de los juegos simultáneos§ Dilemas sociales: el dilema del prisionero

§ Desafíos de coordinación

§ Riesgo y Estrategia Maximín

§ Estrategias mixtas en juegos simultáneos2

© 2019 Pavel Gómez

Page 3: Conducta y Teoría de Juegos

LOSDILEMASSOCIALES 3

Page 4: Conducta y Teoría de Juegos

4

Conceptos relevantes paraelanálisis delosdilemas sociales

• Equilibrio de estrategias dominantes: cada jugador juega suestrategia dominante

• Equilibrio de Nash: cada jugador juega su mejor estrategia dada laestrategias de los demás jugadores

• Solución cooperativa de un juego: lista de estrategias que losparticipantes elegirían si pudiesen comprometerse con una eleccióncoordinada (ej. Si pudieran firmar un contrato obligante)

• Solución no-cooperativa de un juego: lista de estrategias que losparticipantes elegirán si no es posible comprometerse con unaelección coordinada y por ende cada jugador elige la estrategiacorrespondiente a su mejor respuesta

• Resultado de un juego: el conjunto de pagos (pay-offs) que recibecada jugador en la intersección de las estrategias elegidas

© 2019 Pavel Gómez

Page 5: Conducta y Teoría de Juegos

5

Eldilemadelprisionero comometáfora delosdilemas sociales

Para ilustrar el concepto de los dilemas sociales,comenzaremos viendo un extracto del capítulo 8(temporada 1) de la serie de TV alemana

“Perros de Berlín”

© 2019 Pavel Gómez

Page 6: Conducta y Teoría de Juegos

6

Eldilemadelpresionero

-20, -20

-40, 0 -2, -2

0, -40Confesar

No confesar

No confesarConfesar

Prisi

oner

o 1

Prisionero 2

¿Cuál es el Equilibrio de Nash de este juego?

Se ha cometido un delito. La policía sospechade dos personas, pero no tiene pruebas. Laúnica prueba sería la confesión de uno oambos. Se les interroga en habitacionesseparadas (sin comunicación entre ellos) y seles ofrece el siguiente esquema de pagos:

© 2019 Pavel Gómez

Page 7: Conducta y Teoría de Juegos

7

Características clavedelDilemadelPrisionero

1. Cada jugador tiene una estrategia dominante

2. El equilibrio de estrategias dominantes es sub-óptimo, desde el punto de vista social (ambospudieran estar mejor)

3. Ambos jugadores conocen el juego y saben que siambos cooperan obtienen un mejor resultado

4. El esquema de pagos implica que si un jugadorcoopera, el otro tiene incentivos a comportarse demanera oportunista

© 2019 Pavel Gómez

Page 8: Conducta y Teoría de Juegos

8

¿Aqué llamamos comportamiento oportunista?

© 2019 Pavel Gómez

Por “comportarse de manera oportunista” nos referimos a queun jugador juegue de manera de tomar ventaja de una situacióndeterminada o aprovecharse de una oportunidad (ej.: asimetríade información) para obtener un beneficio extra individual, aexpensas de otro(s) jugador(es).

-20, -20

-40, 0 -2, -2

0, -40Confiesa

No confiesa

No confiesaConfiesa

Prisi

oner

o 1

Prisionero 2Ejemplo:Si P1 No confiesa, entonces P2 Confiesa...• P2 sale libre inmediatamente

(saca provecho de la actitud cooperativa de P1)

• P1 sufre un alto costo por confiar en la posible cooperación del otro jugador

Page 9: Conducta y Teoría de Juegos

9

Losdilemas sociales

Decimos que hay un dilema social cuando un juego tiene unequilibrio de estrategias dominantes que es subóptimo, encomparación con la solución cooperativa.

Este es uno de los temas más interesantes de los juegossimultáneos, el cual es descrito de manera muy elocuente por eljuego clásico denominado “El Dilema del Prisionero”.

El dilema social descrito por el Dilema del Prisionero es muyfrecuente , en los equipos de trabajo, en las comunidades, en losmercados y, por supuesto, en la política.

© 2019 Pavel Gómez

Page 10: Conducta y Teoría de Juegos

Dosprofesoresdecidenelnúmerodepáginasdesupróximolibrodeteoríadejuegos

10

© 2019 Pavel Gómez

Profesor B

Prof

esor

A

400p 600p 800p

400p 45, 45 15, 50 10, 40

600p 50, 15 40, 40 15, 45

800p 40, 10 45, 15 35, 35

• ¿Hay alguna estrategia dominada?

• ¿Cómo varía el juego si eliminamos las estrategias dominadas?

• ¿Este juego muestra un dilema social?

Page 11: Conducta y Teoría de Juegos

Aplicacionesdeldilemadelpresionero:LaDelaciónCompensada

11

“Colusión de papel higiénico: Fiscalía Nacional Económica presenta

requerimiento por colusión contra CMPC y SCA”

Experta en libre competencia: “Sin la delación compensada esto jamás se habría sabido.”

Page 12: Conducta y Teoría de Juegos

¿ESPOSIBLESUPERARELDILEMADELPRISIONERO?

Ejemplos: Escena 1 – The Dark Knight12

Page 13: Conducta y Teoría de Juegos

13

¿CómosuperarelDilemadelPrisionero?

© 2019 Pavel Gómez

Page 14: Conducta y Teoría de Juegos

14

¿CómosuperarelDilemadelPrisionero?

Los dilemas sociales semejantes al dilema del prisionero son bastantecomunes en las relaciones interpersonales, en la política, al interior de losequipos de trabajo y en los mercados. Esto se expresa como una tensiónentre la cooperación y el comportamiento oportunista.

¿Qué elementos facilitan su superación?

• La perspectiva de largo plazo, cuando los juegos son repetidos

• La existencia de variables éticas o valóricas en la función de utilidad delas personas (la cooperación genera utilidad “en sí misma”)

• El uso sistemático de señales (ej.: reputación cooperativa)

• El uso de estrategias que premian la cooperación y penalizan elcomportamiento oportunista (Gatillo; ojo-por-ojo)

© 2019 Pavel Gómez

Page 15: Conducta y Teoría de Juegos

15

Estrategiasparalacooperación:Gatillo (trigger)yOjo-por-ojo (Tit-for-tat)

Estrategia Gatillo (trigger)

§ Empezar Cooperando§ Seguir cooperando mientras el otro jugador lo haga, si el otro jugador no

coopera, jugar el equilibrio de Nash de ahí en adelante

Estrategia Ojo-por-Ojo (tit-for-tat)

§ Empezar Cooperando§ Luego cooperar si el otro jugador cooperó el periodo anterior§ No Cooperar si el otro jugador no cooperó el periodo anterior§ Retomar la cooperación en cualquier momento “sin rencor”

Page 16: Conducta y Teoría de Juegos

16

Gatillo yOjo por ojo

Dos objetivos contrapuestos:

§ Castigo debe ser lo suficientemente fuerte como para mantener la cooperación

§ Desde la perspectiva de quien castiga, es mejor que el castigo sea lo menor posible: Quien castiga también es castigado (Ventaja de Ojo-por-Ojo sobre Gatillo)

© 2019 Pavel Gómez

Page 17: Conducta y Teoría de Juegos

17

Ojo-por-ojo

Ojo-por-Ojo ha resultado preferida a Gatillo en experimentos

La estrategia Ojo-por-Ojo es:

§ Simple (total claridad)§ Bondadosa (nunca ataca primero ni busca el

enfrentamiento)

§ Provocable (nunca deja una ofensa sin castigo)

§ Indulgente (no es rencorosa, olvida rápido)

© 2019 Pavel Gómez

Page 18: Conducta y Teoría de Juegos

18

Variableséticasovalóricasenlafuncióndeutilidaddelaspersonas

La existencia de variables éticas o valóricas en lafunción de utilidad de las personas:

La cooperación genera utilidad “en sí misma”

Recordemos la escena de “Batman – El Caballero de la Noche”

© 2019 Pavel Gómez

Page 19: Conducta y Teoría de Juegos

LOSDESAFÍOSDECOORDINACIÓN 19

Page 20: Conducta y Teoría de Juegos

20

Recordemoseljuegodelcap.4delArtedelaEstrategia

• Fred y Barney son cazadores de conejos de la Edad de Piedra.• Mientras estaban carreteando, caen en cuenta que si cooperan pueden

cazar algo más sustancioso, como un ciervo o un bisonte.• Acuerdan hacerlo, pero el carrete fue largo y olvidaron ponerse de

acuerdo. Ciervos y bisontes se encuentran en direcciones opuestas, asícomo las cuevas de Fred y Barney. (Y, obvio, no hay celulares)

• Cada uno debe decidir unilateralmente hacia qué dirección se dirigirá,pensando en lo que hará el otro.

Page 21: Conducta y Teoría de Juegos

EljuegodeFredyBarney

21

© 2019 Pavel Gómez

Elección de Barney

Elec

ción

de Fr

ed

Ciervo Bisonte Conejo

Ciervo 3, 3 0, 0 0, 1

Bisonte 0, 0 3, 3 0, 1

Conejo 1, 0 1, 0 1, 1

• ¿Hay algún Equilibrio de Nash?• Interprete el resultado

Page 22: Conducta y Teoría de Juegos

Otrojuego:Dos emisorasderadioeligensuposicionamiento

22

© 2019 Pavel Gómez

Emisora B

Emiso

ra A

Rock Pop Opinión

Rock 35, 35 50, 40 80, 10

Pop 40, 50 20, 20 40, 10

Opinión 10, 80 10, 40 5, 5

• ¿Hay algún Equilibrio de Nash?• Interprete el resultado• ¿Coordinación?• Recordemos el concepto de “Punto focal”

Page 23: Conducta y Teoría de Juegos

23

Losdesafíos decoordinación

Decimos que hay un desafío de coordinación cuando un juego tienevarios equilibrios de Nash y existe el riesgo de incurrir en pérdidasdebido a una falla de coordinación.

En este caso, los jugadores se enfrentan al reto de “adivinar” a cuálequilibrio de Nash le apuestan los demás jugadores.

Thomas Schelling, premio Nobel de Economía por su contribución ala teoría de juegos (aplicada a la guerra fría), propuso que cuandohay dos o más equilibrios de Nash, los jugadores usan pistas oseñales para inferir cuál equilibrio es más probable.

El equilibrio de Nash más probable es desde entonces denominadoel “Punto focal” o “Punto de Schelling”.

© 2019 Pavel Gómez

Page 24: Conducta y Teoría de Juegos

ELMANEJOESTRATÉGICODELRIESGO 24

Page 25: Conducta y Teoría de Juegos

Analicemoslossiguientesjuegos

25

© 2019 Pavel Gómez

Individuo B

Indi

vidu

o A

Alto esfuerzo

Bajo esfuerzo

Alto esfuerzo 7, 7 -10, 3

Bajo esfuerzo 3, -10 1, 1

• Para cada uno, evalúe si hay algún Equilibrio de Nash

Jugador B

Juga

dor A

Esperar Avanzar

Esperar 0, 0 1, 5

Avanzar 5, 1 -100,-100

Jugador 2

Juga

dor 1 C D

A 20, 0 -90, 5B 5, 2 30,-75

Page 26: Conducta y Teoría de Juegos

Ahoraevaluemosquéocurriríasialosjugadoreslespreocupaelriesgo

26

© 2019 Pavel Gómez

Individuo B

Indi

vidu

o A

Alto esfuerzo

Bajo esfuerzo

Alto esfuerzo 7, 7 -10, 3

Bajo esfuerzo 3, -10 1, 1

Jugador B

Juga

dor A

Esperar Avanzar

Esperar 0, 0 1, 5

Avanzar 5, 1 -100,-100

Jugador 2

Juga

dor 1 C D

A 20, 0 -90, 5B 5, 2 30,-75

Page 27: Conducta y Teoría de Juegos

27

Larespuestaestratégicaalriesgo:EstrategiaMaximín

Cuando los jugadores son sensibles al riesgo, suelen protegerseusando las estrategias que minimizan las pérdidas posibles.

Se denomina “Estrategia Maximín” a aquella estrategia que permitea un jugadormaximizar su ganancia mínima.

Una estrategia maximín es entonces aquella que contiene a losmayores payoffsmínimos. Esta permite minimizar el riesgo asociadocon errores estratégicos de los demás jugadores o con estrategiasdirigidas a “causar daño al rival”.

En los juegos anteriores, ¿cuál sería una estrategia maximín para eljugador de arriba? ¿Cuál sería el resultado si ambos jugadoresadoptan estrategias Maximín?

© 2019 Pavel Gómez

Page 28: Conducta y Teoría de Juegos

Juegos Clásicos: Ejemplos, interpretación y

utilidad estratégica

28

© 2019 Pavel Gómez

Page 29: Conducta y Teoría de Juegos

29

Juegosclásicos

100,100

200, 2 5, 5

2, 200C

NC

NCC

Pris

ione

ro 1

Prisionero 2

El dilema del prisionero

1,2

0, 0 2, 1

0, 0Ópera

Cine

CineÓpera

Juga

dor A

Jugador B

La “batalla de los sexos”

0,0

1, 3 2, 2

3, 1ND

D

DND

Con

duct

or 1

Conductor 2

El juego del “Gallina” (Chicken game)

Page 30: Conducta y Teoría de Juegos

30

Juegos clásicos

2,2

0, 0 1, 1

0, 0A

B

BAJu

gado

r 1Jugador 2

Pareto-Coordinación

1,-1

-1, 1 1, -1

-1, 1I

D

ID

Dis

para

dor

ArqueroEl juego del penal

1,1

0, 0 1, 1

0, 0A

B

BA

Juga

dor 1

Jugador 2Coordinación

Page 31: Conducta y Teoría de Juegos

JUEGOSSIMULTÁNEOSCONESTRATEGIASMIXTAS

31

Page 32: Conducta y Teoría de Juegos

32

© 2019 Pavel Gómez

En algunos juegos, los jugadores desean o requieren hacer unuso estratégico de la incertidumbre. Esto ocurre cuandodeseamos sorprender a otros jugadores:

• Cuando jugamos cachipún• Cuando un jugador de fútbol cobra un penal

• Cuando una empresa realiza promociones o rebajasanuales, pero desea que que los consumidores no esperensistemáticamente por las rebajas

Juegossimultáneosconestrategiasmixtas

Page 33: Conducta y Teoría de Juegos

33

© 2019 Pavel Gómez

En todos estos casos, uno o más jugadores adoptan estrategiasmixtas, esto es, juegan sus estrategias discretas con una ciertaprobabilidad:

• En cachipún, juegan piedra, papel o tijera con unaprobabilidad igual a 1/3, y ademas de manera no regular

• En el cobro del penal, cada jugador se lanza en unadirección con igual probabilidad

• En la realización de las promociones, la probabilidad derealizar una promoción en un momento debe ser la mismaque realizarla en otro momento.

En todos los casos, la idea es maximizar la incertidumbre de losdemás jugadores

Juegossimultáneosconestrategiasmixtas

Page 34: Conducta y Teoría de Juegos

EquilibriodeNashconestrategiasmixtas

34

El objetivo es explotar la incertidumbre del rival.Para que una estrategia mixta del jugador i sea parte de unequilibrio de Nash, el otro jugador debe ser indiferente entresus distintas alternativas.Veamos una versión del juego del penal:

5, -5

-5, 5 5, -5

-5, 5I

D

ID

Juga

dor 1

(D

ispar

ador

)

Jugador 2(Arquero)

© 2019 Pavel Gómez

Page 35: Conducta y Teoría de Juegos

Estrategiasmixtas:Definicionesformales

35

Una estrategia mixta (σ) corresponde a aquellaque asigna una función de probabilidad p sobre unconjunto de estrategias puras S.

Un conjunto de estrategias σi corresponde a unEquilibrio de Nash en estrategias mixtas si paracada jugador i, σi es una mejor respuesta.

© 2019 Pavel Gómez

Page 36: Conducta y Teoría de Juegos

EquilibriodeNashconestrategiasmixtas(Materialopcional)

36

Estrategias mixtas óptimas:

Llamaremos p a la probabilidad de que el Disparador elijadisparar hacia la Izquierda.

Luego, debe cumplirse que:

VE2D = VE2

I

è (p)-5 + (1-p)5 = (p)5 + (1-p)-5

è p = ½© 2019 Pavel Gómez

Page 37: Conducta y Teoría de Juegos

Estrategiasmixtasóptimas(Materialopcional)

37

El mismo procedimiento es usado para encontrar la estrategiaóptima para el jugador 2.Sea q la probabilidad de que el Arquero elija lanzarse hacia laDerecha. Luego debe cumplirse que:

VE1I = VE1

D

(q)5 + (1-q)-5 = (q)-5 + (1-q)5 è q = ½

Entonces, el equilibrio de Nash de este juego es

(σ1*= (1/2; 1/2), σ2* = (1/2; 1/2))© 2019 Pavel Gómez

Page 38: Conducta y Teoría de Juegos

Estrategiasmixtasóptimas(Materialopcional)

38

Para evitar confusiones, se sugiere que el equilibrio seaexpresado de manera exhaustiva y explícita:

ENM = (P1I = ½; P1D = ½; P2D = ½; P2I = ½)

donde:

ENM: Equilibrio de Nash en estrategias mixtasP1

I: Probabilidad de que el Jugador 1 juegue IP1

D: Probabilidad de que el jugador 1 juegue DP2

D: Probabilidad de que el jugador 2 juegue DP2

I: Probabilidad de que el jugador 2 juegue I

© 2019 Pavel Gómez

Page 39: Conducta y Teoría de Juegos

39

Juegossimultáneosconestrategiasmixtas:Aplicación

Page 40: Conducta y Teoría de Juegos

40

Juegossimultáneosconestrategiasmixtas:Aplicación

“Carlos Bonet, investigador y parte del proyecto, explicó que “la Teoría de Juegos es unaciencia que busca ver cómo interactúan diferentes agentes. Cada uno tiene objetivosindividuales que son afectados por los objetivos del resto”.En este caso, existen dos agentes con dos objetivos diferentes: “El primero, es la personaque evade y cuyo objetivo es que el viaje tenga el menor costo posible, en tanto que elsegundo es el fiscalizador que quiere que el pasaje sea pagado”, explica Bastián Bahamondesacadémico de la Universidad de Chile.Según explican los expertos, hoy día para evitar la evasión, se eligen las calles con mayorevasión, donde los fiscales están por un largo periodo, lo que provocaría que “se pierda elfactor sorpresa“, ya que “los evasores saben por experiencia dónde se ubican losfiscalizadores, por lo que fácilmente pueden evitar el control de pago”.Por lo que este nuevo modelo, estaría basado en un sistema aleatorio.“Como contraparte surge naturalmente la idea de que el sistema de fiscalización debería seraleatorio, por lo que estamos creando un sistema basado en el azar que proponga los lugaresque serán fiscalizados y que, además, no tenga un patrón que los evasores puedanidentificar”, afirma Bonet.“Existen calles o sectores más peligrosos que otros, por lo que incluimos este factor a la horade diseñar el sistema”, concluye el investigador.

© 2019 Pavel Gómez