conducta y teoría de juegos

1

Conducta y Teoría de Juegos:

¿Cómo psicólogos y economistas se unen para explicar nuestra conducta frente a problemas sociales?

Profesor: Pavel Gómez

Email: [email protected] / [email protected]

Marzo 2019

Facultad dePsicología

1

Contenido – Sesión2

§ Ejercicios: Estrategias dominantes y Equilibrio deNash

§ Repaso conceptos clave

§ Principales desafíos de los juegos simultáneos§ Dilemas sociales: el dilema del prisionero

§ Desafíos de coordinación

§ Riesgo y Estrategia Maximín

§ Estrategias mixtas en juegos simultáneos2

© 2019 Pavel Gómez

LOSDILEMASSOCIALES 3

4

Conceptos relevantes paraelanálisis delosdilemas sociales

• Equilibrio de estrategias dominantes: cada jugador juega suestrategia dominante

• Equilibrio de Nash: cada jugador juega su mejor estrategia dada laestrategias de los demás jugadores

• Solución cooperativa de un juego: lista de estrategias que losparticipantes elegirían si pudiesen comprometerse con una eleccióncoordinada (ej. Si pudieran firmar un contrato obligante)

• Solución no-cooperativa de un juego: lista de estrategias que losparticipantes elegirán si no es posible comprometerse con unaelección coordinada y por ende cada jugador elige la estrategiacorrespondiente a su mejor respuesta

• Resultado de un juego: el conjunto de pagos (pay-offs) que recibecada jugador en la intersección de las estrategias elegidas


5

Eldilemadelprisionero comometáfora delosdilemas sociales

Para ilustrar el concepto de los dilemas sociales,comenzaremos viendo un extracto del capítulo 8(temporada 1) de la serie de TV alemana

“Perros de Berlín”


6

Eldilemadelpresionero

-20, -20

-40, 0 -2, -2

0, -40Confesar

No confesar

No confesarConfesar

Prisi

oner

o 1

Prisionero 2

¿Cuál es el Equilibrio de Nash de este juego?

Se ha cometido un delito. La policía sospechade dos personas, pero no tiene pruebas. Laúnica prueba sería la confesión de uno oambos. Se les interroga en habitacionesseparadas (sin comunicación entre ellos) y seles ofrece el siguiente esquema de pagos:


7

Características clavedelDilemadelPrisionero

1. Cada jugador tiene una estrategia dominante

2. El equilibrio de estrategias dominantes es sub-óptimo, desde el punto de vista social (ambospudieran estar mejor)

3. Ambos jugadores conocen el juego y saben que siambos cooperan obtienen un mejor resultado

4. El esquema de pagos implica que si un jugadorcoopera, el otro tiene incentivos a comportarse demanera oportunista


8

¿Aqué llamamos comportamiento oportunista?


Por “comportarse de manera oportunista” nos referimos a queun jugador juegue de manera de tomar ventaja de una situacióndeterminada o aprovecharse de una oportunidad (ej.: asimetríade información) para obtener un beneficio extra individual, aexpensas de otro(s) jugador(es).

-20, -20

-40, 0 -2, -2

0, -40Confiesa

No confiesa

No confiesaConfiesa

Prisi

oner

o 1

Prisionero 2Ejemplo:Si P1 No confiesa, entonces P2 Confiesa...• P2 sale libre inmediatamente

(saca provecho de la actitud cooperativa de P1)

• P1 sufre un alto costo por confiar en la posible cooperación del otro jugador

9

Losdilemas sociales

Decimos que hay un dilema social cuando un juego tiene unequilibrio de estrategias dominantes que es subóptimo, encomparación con la solución cooperativa.

Este es uno de los temas más interesantes de los juegossimultáneos, el cual es descrito de manera muy elocuente por eljuego clásico denominado “El Dilema del Prisionero”.

El dilema social descrito por el Dilema del Prisionero es muyfrecuente , en los equipos de trabajo, en las comunidades, en losmercados y, por supuesto, en la política.


Dosprofesoresdecidenelnúmerodepáginasdesupróximolibrodeteoríadejuegos

10


Profesor B

Prof

esor

A

400p 600p 800p

400p 45, 45 15, 50 10, 40

600p 50, 15 40, 40 15, 45

800p 40, 10 45, 15 35, 35

• ¿Hay alguna estrategia dominada?

• ¿Cómo varía el juego si eliminamos las estrategias dominadas?

• ¿Este juego muestra un dilema social?

Aplicacionesdeldilemadelpresionero:LaDelaciónCompensada

11

“Colusión de papel higiénico: Fiscalía Nacional Económica presenta

requerimiento por colusión contra CMPC y SCA”

Experta en libre competencia: “Sin la delación compensada esto jamás se habría sabido.”

¿ESPOSIBLESUPERARELDILEMADELPRISIONERO?

Ejemplos: Escena 1 – The Dark Knight12

13

¿CómosuperarelDilemadelPrisionero?


14

¿CómosuperarelDilemadelPrisionero?

Los dilemas sociales semejantes al dilema del prisionero son bastantecomunes en las relaciones interpersonales, en la política, al interior de losequipos de trabajo y en los mercados. Esto se expresa como una tensiónentre la cooperación y el comportamiento oportunista.

¿Qué elementos facilitan su superación?

• La perspectiva de largo plazo, cuando los juegos son repetidos

• La existencia de variables éticas o valóricas en la función de utilidad delas personas (la cooperación genera utilidad “en sí misma”)

• El uso sistemático de señales (ej.: reputación cooperativa)

• El uso de estrategias que premian la cooperación y penalizan elcomportamiento oportunista (Gatillo; ojo-por-ojo)


15

Estrategiasparalacooperación:Gatillo (trigger)yOjo-por-ojo (Tit-for-tat)

Estrategia Gatillo (trigger)

§ Empezar Cooperando§ Seguir cooperando mientras el otro jugador lo haga, si el otro jugador no

coopera, jugar el equilibrio de Nash de ahí en adelante

Estrategia Ojo-por-Ojo (tit-for-tat)

§ Empezar Cooperando§ Luego cooperar si el otro jugador cooperó el periodo anterior§ No Cooperar si el otro jugador no cooperó el periodo anterior§ Retomar la cooperación en cualquier momento “sin rencor”

16

Gatillo yOjo por ojo

Dos objetivos contrapuestos:

§ Castigo debe ser lo suficientemente fuerte como para mantener la cooperación

§ Desde la perspectiva de quien castiga, es mejor que el castigo sea lo menor posible: Quien castiga también es castigado (Ventaja de Ojo-por-Ojo sobre Gatillo)


17

Ojo-por-ojo

Ojo-por-Ojo ha resultado preferida a Gatillo en experimentos

La estrategia Ojo-por-Ojo es:

§ Simple (total claridad)§ Bondadosa (nunca ataca primero ni busca el

enfrentamiento)

§ Provocable (nunca deja una ofensa sin castigo)

§ Indulgente (no es rencorosa, olvida rápido)


18

Variableséticasovalóricasenlafuncióndeutilidaddelaspersonas

La existencia de variables éticas o valóricas en lafunción de utilidad de las personas:

La cooperación genera utilidad “en sí misma”

Recordemos la escena de “Batman – El Caballero de la Noche”


LOSDESAFÍOSDECOORDINACIÓN 19

20

Recordemoseljuegodelcap.4delArtedelaEstrategia

• Fred y Barney son cazadores de conejos de la Edad de Piedra.• Mientras estaban carreteando, caen en cuenta que si cooperan pueden

cazar algo más sustancioso, como un ciervo o un bisonte.• Acuerdan hacerlo, pero el carrete fue largo y olvidaron ponerse de

acuerdo. Ciervos y bisontes se encuentran en direcciones opuestas, asícomo las cuevas de Fred y Barney. (Y, obvio, no hay celulares)

• Cada uno debe decidir unilateralmente hacia qué dirección se dirigirá,pensando en lo que hará el otro.

EljuegodeFredyBarney

21


Elección de Barney

Elec

ción

de Fr

ed

Ciervo Bisonte Conejo

Ciervo 3, 3 0, 0 0, 1

Bisonte 0, 0 3, 3 0, 1

Conejo 1, 0 1, 0 1, 1

• ¿Hay algún Equilibrio de Nash?• Interprete el resultado

Otrojuego:Dos emisorasderadioeligensuposicionamiento

22


Emisora B

Emiso

ra A

Rock Pop Opinión

Rock 35, 35 50, 40 80, 10

Pop 40, 50 20, 20 40, 10

Opinión 10, 80 10, 40 5, 5

• ¿Hay algún Equilibrio de Nash?• Interprete el resultado• ¿Coordinación?• Recordemos el concepto de “Punto focal”

23

Losdesafíos decoordinación

Decimos que hay un desafío de coordinación cuando un juego tienevarios equilibrios de Nash y existe el riesgo de incurrir en pérdidasdebido a una falla de coordinación.

En este caso, los jugadores se enfrentan al reto de “adivinar” a cuálequilibrio de Nash le apuestan los demás jugadores.

Thomas Schelling, premio Nobel de Economía por su contribución ala teoría de juegos (aplicada a la guerra fría), propuso que cuandohay dos o más equilibrios de Nash, los jugadores usan pistas oseñales para inferir cuál equilibrio es más probable.

El equilibrio de Nash más probable es desde entonces denominadoel “Punto focal” o “Punto de Schelling”.


ELMANEJOESTRATÉGICODELRIESGO 24

Analicemoslossiguientesjuegos

25


Individuo B

Indi

vidu

o A

Alto esfuerzo

Bajo esfuerzo

Alto esfuerzo 7, 7 -10, 3

Bajo esfuerzo 3, -10 1, 1

• Para cada uno, evalúe si hay algún Equilibrio de Nash

Jugador B

Juga

dor A

Esperar Avanzar

Esperar 0, 0 1, 5

Avanzar 5, 1 -100,-100

Jugador 2

Juga

dor 1 C D

A 20, 0 -90, 5B 5, 2 30,-75

Ahoraevaluemosquéocurriríasialosjugadoreslespreocupaelriesgo

26


Individuo B

Indi

vidu

o A

Alto esfuerzo

Bajo esfuerzo

Alto esfuerzo 7, 7 -10, 3

Bajo esfuerzo 3, -10 1, 1

Jugador B

Juga

dor A

Esperar Avanzar

Esperar 0, 0 1, 5

Avanzar 5, 1 -100,-100

Jugador 2

Juga

dor 1 C D

A 20, 0 -90, 5B 5, 2 30,-75

27

Larespuestaestratégicaalriesgo:EstrategiaMaximín

Cuando los jugadores son sensibles al riesgo, suelen protegerseusando las estrategias que minimizan las pérdidas posibles.

Se denomina “Estrategia Maximín” a aquella estrategia que permitea un jugadormaximizar su ganancia mínima.

Una estrategia maximín es entonces aquella que contiene a losmayores payoffsmínimos. Esta permite minimizar el riesgo asociadocon errores estratégicos de los demás jugadores o con estrategiasdirigidas a “causar daño al rival”.

En los juegos anteriores, ¿cuál sería una estrategia maximín para eljugador de arriba? ¿Cuál sería el resultado si ambos jugadoresadoptan estrategias Maximín?


Juegos Clásicos: Ejemplos, interpretación y

utilidad estratégica

28


29

Juegosclásicos

100,100

200, 2 5, 5

2, 200C

NC

NCC

Pris

ione

ro 1

Prisionero 2

El dilema del prisionero

1,2

0, 0 2, 1

0, 0Ópera

Cine

CineÓpera

Juga

dor A

Jugador B

La “batalla de los sexos”

0,0

1, 3 2, 2

3, 1ND

D

DND

Con

duct

or 1

Conductor 2

El juego del “Gallina” (Chicken game)

30

Juegos clásicos

2,2

0, 0 1, 1

0, 0A

B

BAJu

gado

r 1Jugador 2

Pareto-Coordinación

1,-1

-1, 1 1, -1

-1, 1I

D

ID

Dis

para

dor

ArqueroEl juego del penal

1,1

0, 0 1, 1

0, 0A

B

BA

Juga

dor 1

Jugador 2Coordinación

JUEGOSSIMULTÁNEOSCONESTRATEGIASMIXTAS

31

32


En algunos juegos, los jugadores desean o requieren hacer unuso estratégico de la incertidumbre. Esto ocurre cuandodeseamos sorprender a otros jugadores:

• Cuando jugamos cachipún• Cuando un jugador de fútbol cobra un penal

• Cuando una empresa realiza promociones o rebajasanuales, pero desea que que los consumidores no esperensistemáticamente por las rebajas

Juegossimultáneosconestrategiasmixtas

33


En todos estos casos, uno o más jugadores adoptan estrategiasmixtas, esto es, juegan sus estrategias discretas con una ciertaprobabilidad:

• En cachipún, juegan piedra, papel o tijera con unaprobabilidad igual a 1/3, y ademas de manera no regular

• En el cobro del penal, cada jugador se lanza en unadirección con igual probabilidad

• En la realización de las promociones, la probabilidad derealizar una promoción en un momento debe ser la mismaque realizarla en otro momento.

En todos los casos, la idea es maximizar la incertidumbre de losdemás jugadores

Juegossimultáneosconestrategiasmixtas

EquilibriodeNashconestrategiasmixtas

34

El objetivo es explotar la incertidumbre del rival.Para que una estrategia mixta del jugador i sea parte de unequilibrio de Nash, el otro jugador debe ser indiferente entresus distintas alternativas.Veamos una versión del juego del penal:

5, -5

-5, 5 5, -5

-5, 5I

D

ID

Juga

dor 1

(D

ispar

ador

)

Jugador 2(Arquero)


Estrategiasmixtas:Definicionesformales

35

Una estrategia mixta (σ) corresponde a aquellaque asigna una función de probabilidad p sobre unconjunto de estrategias puras S.

Un conjunto de estrategias σi corresponde a unEquilibrio de Nash en estrategias mixtas si paracada jugador i, σi es una mejor respuesta.


EquilibriodeNashconestrategiasmixtas(Materialopcional)

36

Estrategias mixtas óptimas:

Llamaremos p a la probabilidad de que el Disparador elijadisparar hacia la Izquierda.

Luego, debe cumplirse que:

VE2D = VE2

I

è (p)-5 + (1-p)5 = (p)5 + (1-p)-5

è p = ½© 2019 Pavel Gómez

Estrategiasmixtasóptimas(Materialopcional)

37

El mismo procedimiento es usado para encontrar la estrategiaóptima para el jugador 2.Sea q la probabilidad de que el Arquero elija lanzarse hacia laDerecha. Luego debe cumplirse que:

VE1I = VE1

D

(q)5 + (1-q)-5 = (q)-5 + (1-q)5 è q = ½

Entonces, el equilibrio de Nash de este juego es

(σ1*= (1/2; 1/2), σ2* = (1/2; 1/2))© 2019 Pavel Gómez

Estrategiasmixtasóptimas(Materialopcional)

38

Para evitar confusiones, se sugiere que el equilibrio seaexpresado de manera exhaustiva y explícita:

ENM = (P1I = ½; P1D = ½; P2D = ½; P2I = ½)

donde:

ENM: Equilibrio de Nash en estrategias mixtasP1

I: Probabilidad de que el Jugador 1 juegue IP1

D: Probabilidad de que el jugador 1 juegue DP2

D: Probabilidad de que el jugador 2 juegue DP2

I: Probabilidad de que el jugador 2 juegue I


39

Juegossimultáneosconestrategiasmixtas:Aplicación

40

Juegossimultáneosconestrategiasmixtas:Aplicación

“Carlos Bonet, investigador y parte del proyecto, explicó que “la Teoría de Juegos es unaciencia que busca ver cómo interactúan diferentes agentes. Cada uno tiene objetivosindividuales que son afectados por los objetivos del resto”.En este caso, existen dos agentes con dos objetivos diferentes: “El primero, es la personaque evade y cuyo objetivo es que el viaje tenga el menor costo posible, en tanto que elsegundo es el fiscalizador que quiere que el pasaje sea pagado”, explica Bastián Bahamondesacadémico de la Universidad de Chile.Según explican los expertos, hoy día para evitar la evasión, se eligen las calles con mayorevasión, donde los fiscales están por un largo periodo, lo que provocaría que “se pierda elfactor sorpresa“, ya que “los evasores saben por experiencia dónde se ubican losfiscalizadores, por lo que fácilmente pueden evitar el control de pago”.Por lo que este nuevo modelo, estaría basado en un sistema aleatorio.“Como contraparte surge naturalmente la idea de que el sistema de fiscalización debería seraleatorio, por lo que estamos creando un sistema basado en el azar que proponga los lugaresque serán fiscalizados y que, además, no tenga un patrón que los evasores puedanidentificar”, afirma Bonet.“Existen calles o sectores más peligrosos que otros, por lo que incluimos este factor a la horade diseñar el sistema”, concluye el investigador.


conducta y teoría de juegos

Documents