conducta y teoría de juegos
TRANSCRIPT
1
Conducta y Teoría de Juegos:
¿Cómo psicólogos y economistas se unen para explicar nuestra conducta frente a problemas sociales?
Profesor: Pavel Gómez
Email: [email protected] / [email protected]
Marzo 2019
Facultad dePsicología
1
Contenido – Sesión2
§ Ejercicios: Estrategias dominantes y Equilibrio deNash
§ Repaso conceptos clave
§ Principales desafíos de los juegos simultáneos§ Dilemas sociales: el dilema del prisionero
§ Desafíos de coordinación
§ Riesgo y Estrategia Maximín
§ Estrategias mixtas en juegos simultáneos2
© 2019 Pavel Gómez
LOSDILEMASSOCIALES 3
4
Conceptos relevantes paraelanálisis delosdilemas sociales
• Equilibrio de estrategias dominantes: cada jugador juega suestrategia dominante
• Equilibrio de Nash: cada jugador juega su mejor estrategia dada laestrategias de los demás jugadores
• Solución cooperativa de un juego: lista de estrategias que losparticipantes elegirían si pudiesen comprometerse con una eleccióncoordinada (ej. Si pudieran firmar un contrato obligante)
• Solución no-cooperativa de un juego: lista de estrategias que losparticipantes elegirán si no es posible comprometerse con unaelección coordinada y por ende cada jugador elige la estrategiacorrespondiente a su mejor respuesta
• Resultado de un juego: el conjunto de pagos (pay-offs) que recibecada jugador en la intersección de las estrategias elegidas
© 2019 Pavel Gómez
5
Eldilemadelprisionero comometáfora delosdilemas sociales
Para ilustrar el concepto de los dilemas sociales,comenzaremos viendo un extracto del capítulo 8(temporada 1) de la serie de TV alemana
“Perros de Berlín”
© 2019 Pavel Gómez
6
Eldilemadelpresionero
-20, -20
-40, 0 -2, -2
0, -40Confesar
No confesar
No confesarConfesar
Prisi
oner
o 1
Prisionero 2
¿Cuál es el Equilibrio de Nash de este juego?
Se ha cometido un delito. La policía sospechade dos personas, pero no tiene pruebas. Laúnica prueba sería la confesión de uno oambos. Se les interroga en habitacionesseparadas (sin comunicación entre ellos) y seles ofrece el siguiente esquema de pagos:
© 2019 Pavel Gómez
7
Características clavedelDilemadelPrisionero
1. Cada jugador tiene una estrategia dominante
2. El equilibrio de estrategias dominantes es sub-óptimo, desde el punto de vista social (ambospudieran estar mejor)
3. Ambos jugadores conocen el juego y saben que siambos cooperan obtienen un mejor resultado
4. El esquema de pagos implica que si un jugadorcoopera, el otro tiene incentivos a comportarse demanera oportunista
© 2019 Pavel Gómez
8
¿Aqué llamamos comportamiento oportunista?
© 2019 Pavel Gómez
Por “comportarse de manera oportunista” nos referimos a queun jugador juegue de manera de tomar ventaja de una situacióndeterminada o aprovecharse de una oportunidad (ej.: asimetríade información) para obtener un beneficio extra individual, aexpensas de otro(s) jugador(es).
-20, -20
-40, 0 -2, -2
0, -40Confiesa
No confiesa
No confiesaConfiesa
Prisi
oner
o 1
Prisionero 2Ejemplo:Si P1 No confiesa, entonces P2 Confiesa...• P2 sale libre inmediatamente
(saca provecho de la actitud cooperativa de P1)
• P1 sufre un alto costo por confiar en la posible cooperación del otro jugador
9
Losdilemas sociales
Decimos que hay un dilema social cuando un juego tiene unequilibrio de estrategias dominantes que es subóptimo, encomparación con la solución cooperativa.
Este es uno de los temas más interesantes de los juegossimultáneos, el cual es descrito de manera muy elocuente por eljuego clásico denominado “El Dilema del Prisionero”.
El dilema social descrito por el Dilema del Prisionero es muyfrecuente , en los equipos de trabajo, en las comunidades, en losmercados y, por supuesto, en la política.
© 2019 Pavel Gómez
Dosprofesoresdecidenelnúmerodepáginasdesupróximolibrodeteoríadejuegos
10
© 2019 Pavel Gómez
Profesor B
Prof
esor
A
400p 600p 800p
400p 45, 45 15, 50 10, 40
600p 50, 15 40, 40 15, 45
800p 40, 10 45, 15 35, 35
• ¿Hay alguna estrategia dominada?
• ¿Cómo varía el juego si eliminamos las estrategias dominadas?
• ¿Este juego muestra un dilema social?
Aplicacionesdeldilemadelpresionero:LaDelaciónCompensada
11
“Colusión de papel higiénico: Fiscalía Nacional Económica presenta
requerimiento por colusión contra CMPC y SCA”
Experta en libre competencia: “Sin la delación compensada esto jamás se habría sabido.”
¿ESPOSIBLESUPERARELDILEMADELPRISIONERO?
Ejemplos: Escena 1 – The Dark Knight12
13
¿CómosuperarelDilemadelPrisionero?
© 2019 Pavel Gómez
14
¿CómosuperarelDilemadelPrisionero?
Los dilemas sociales semejantes al dilema del prisionero son bastantecomunes en las relaciones interpersonales, en la política, al interior de losequipos de trabajo y en los mercados. Esto se expresa como una tensiónentre la cooperación y el comportamiento oportunista.
¿Qué elementos facilitan su superación?
• La perspectiva de largo plazo, cuando los juegos son repetidos
• La existencia de variables éticas o valóricas en la función de utilidad delas personas (la cooperación genera utilidad “en sí misma”)
• El uso sistemático de señales (ej.: reputación cooperativa)
• El uso de estrategias que premian la cooperación y penalizan elcomportamiento oportunista (Gatillo; ojo-por-ojo)
© 2019 Pavel Gómez
15
Estrategiasparalacooperación:Gatillo (trigger)yOjo-por-ojo (Tit-for-tat)
Estrategia Gatillo (trigger)
§ Empezar Cooperando§ Seguir cooperando mientras el otro jugador lo haga, si el otro jugador no
coopera, jugar el equilibrio de Nash de ahí en adelante
Estrategia Ojo-por-Ojo (tit-for-tat)
§ Empezar Cooperando§ Luego cooperar si el otro jugador cooperó el periodo anterior§ No Cooperar si el otro jugador no cooperó el periodo anterior§ Retomar la cooperación en cualquier momento “sin rencor”
16
Gatillo yOjo por ojo
Dos objetivos contrapuestos:
§ Castigo debe ser lo suficientemente fuerte como para mantener la cooperación
§ Desde la perspectiva de quien castiga, es mejor que el castigo sea lo menor posible: Quien castiga también es castigado (Ventaja de Ojo-por-Ojo sobre Gatillo)
© 2019 Pavel Gómez
17
Ojo-por-ojo
Ojo-por-Ojo ha resultado preferida a Gatillo en experimentos
La estrategia Ojo-por-Ojo es:
§ Simple (total claridad)§ Bondadosa (nunca ataca primero ni busca el
enfrentamiento)
§ Provocable (nunca deja una ofensa sin castigo)
§ Indulgente (no es rencorosa, olvida rápido)
© 2019 Pavel Gómez
18
Variableséticasovalóricasenlafuncióndeutilidaddelaspersonas
La existencia de variables éticas o valóricas en lafunción de utilidad de las personas:
La cooperación genera utilidad “en sí misma”
Recordemos la escena de “Batman – El Caballero de la Noche”
© 2019 Pavel Gómez
LOSDESAFÍOSDECOORDINACIÓN 19
20
Recordemoseljuegodelcap.4delArtedelaEstrategia
• Fred y Barney son cazadores de conejos de la Edad de Piedra.• Mientras estaban carreteando, caen en cuenta que si cooperan pueden
cazar algo más sustancioso, como un ciervo o un bisonte.• Acuerdan hacerlo, pero el carrete fue largo y olvidaron ponerse de
acuerdo. Ciervos y bisontes se encuentran en direcciones opuestas, asícomo las cuevas de Fred y Barney. (Y, obvio, no hay celulares)
• Cada uno debe decidir unilateralmente hacia qué dirección se dirigirá,pensando en lo que hará el otro.
EljuegodeFredyBarney
21
© 2019 Pavel Gómez
Elección de Barney
Elec
ción
de Fr
ed
Ciervo Bisonte Conejo
Ciervo 3, 3 0, 0 0, 1
Bisonte 0, 0 3, 3 0, 1
Conejo 1, 0 1, 0 1, 1
• ¿Hay algún Equilibrio de Nash?• Interprete el resultado
Otrojuego:Dos emisorasderadioeligensuposicionamiento
22
© 2019 Pavel Gómez
Emisora B
Emiso
ra A
Rock Pop Opinión
Rock 35, 35 50, 40 80, 10
Pop 40, 50 20, 20 40, 10
Opinión 10, 80 10, 40 5, 5
• ¿Hay algún Equilibrio de Nash?• Interprete el resultado• ¿Coordinación?• Recordemos el concepto de “Punto focal”
23
Losdesafíos decoordinación
Decimos que hay un desafío de coordinación cuando un juego tienevarios equilibrios de Nash y existe el riesgo de incurrir en pérdidasdebido a una falla de coordinación.
En este caso, los jugadores se enfrentan al reto de “adivinar” a cuálequilibrio de Nash le apuestan los demás jugadores.
Thomas Schelling, premio Nobel de Economía por su contribución ala teoría de juegos (aplicada a la guerra fría), propuso que cuandohay dos o más equilibrios de Nash, los jugadores usan pistas oseñales para inferir cuál equilibrio es más probable.
El equilibrio de Nash más probable es desde entonces denominadoel “Punto focal” o “Punto de Schelling”.
© 2019 Pavel Gómez
ELMANEJOESTRATÉGICODELRIESGO 24
Analicemoslossiguientesjuegos
25
© 2019 Pavel Gómez
Individuo B
Indi
vidu
o A
Alto esfuerzo
Bajo esfuerzo
Alto esfuerzo 7, 7 -10, 3
Bajo esfuerzo 3, -10 1, 1
• Para cada uno, evalúe si hay algún Equilibrio de Nash
Jugador B
Juga
dor A
Esperar Avanzar
Esperar 0, 0 1, 5
Avanzar 5, 1 -100,-100
Jugador 2
Juga
dor 1 C D
A 20, 0 -90, 5B 5, 2 30,-75
Ahoraevaluemosquéocurriríasialosjugadoreslespreocupaelriesgo
26
© 2019 Pavel Gómez
Individuo B
Indi
vidu
o A
Alto esfuerzo
Bajo esfuerzo
Alto esfuerzo 7, 7 -10, 3
Bajo esfuerzo 3, -10 1, 1
Jugador B
Juga
dor A
Esperar Avanzar
Esperar 0, 0 1, 5
Avanzar 5, 1 -100,-100
Jugador 2
Juga
dor 1 C D
A 20, 0 -90, 5B 5, 2 30,-75
27
Larespuestaestratégicaalriesgo:EstrategiaMaximín
Cuando los jugadores son sensibles al riesgo, suelen protegerseusando las estrategias que minimizan las pérdidas posibles.
Se denomina “Estrategia Maximín” a aquella estrategia que permitea un jugadormaximizar su ganancia mínima.
Una estrategia maximín es entonces aquella que contiene a losmayores payoffsmínimos. Esta permite minimizar el riesgo asociadocon errores estratégicos de los demás jugadores o con estrategiasdirigidas a “causar daño al rival”.
En los juegos anteriores, ¿cuál sería una estrategia maximín para eljugador de arriba? ¿Cuál sería el resultado si ambos jugadoresadoptan estrategias Maximín?
© 2019 Pavel Gómez
Juegos Clásicos: Ejemplos, interpretación y
utilidad estratégica
28
© 2019 Pavel Gómez
29
Juegosclásicos
100,100
200, 2 5, 5
2, 200C
NC
NCC
Pris
ione
ro 1
Prisionero 2
El dilema del prisionero
1,2
0, 0 2, 1
0, 0Ópera
Cine
CineÓpera
Juga
dor A
Jugador B
La “batalla de los sexos”
0,0
1, 3 2, 2
3, 1ND
D
DND
Con
duct
or 1
Conductor 2
El juego del “Gallina” (Chicken game)
30
Juegos clásicos
2,2
0, 0 1, 1
0, 0A
B
BAJu
gado
r 1Jugador 2
Pareto-Coordinación
1,-1
-1, 1 1, -1
-1, 1I
D
ID
Dis
para
dor
ArqueroEl juego del penal
1,1
0, 0 1, 1
0, 0A
B
BA
Juga
dor 1
Jugador 2Coordinación
JUEGOSSIMULTÁNEOSCONESTRATEGIASMIXTAS
31
32
© 2019 Pavel Gómez
En algunos juegos, los jugadores desean o requieren hacer unuso estratégico de la incertidumbre. Esto ocurre cuandodeseamos sorprender a otros jugadores:
• Cuando jugamos cachipún• Cuando un jugador de fútbol cobra un penal
• Cuando una empresa realiza promociones o rebajasanuales, pero desea que que los consumidores no esperensistemáticamente por las rebajas
Juegossimultáneosconestrategiasmixtas
33
© 2019 Pavel Gómez
En todos estos casos, uno o más jugadores adoptan estrategiasmixtas, esto es, juegan sus estrategias discretas con una ciertaprobabilidad:
• En cachipún, juegan piedra, papel o tijera con unaprobabilidad igual a 1/3, y ademas de manera no regular
• En el cobro del penal, cada jugador se lanza en unadirección con igual probabilidad
• En la realización de las promociones, la probabilidad derealizar una promoción en un momento debe ser la mismaque realizarla en otro momento.
En todos los casos, la idea es maximizar la incertidumbre de losdemás jugadores
Juegossimultáneosconestrategiasmixtas
EquilibriodeNashconestrategiasmixtas
34
El objetivo es explotar la incertidumbre del rival.Para que una estrategia mixta del jugador i sea parte de unequilibrio de Nash, el otro jugador debe ser indiferente entresus distintas alternativas.Veamos una versión del juego del penal:
5, -5
-5, 5 5, -5
-5, 5I
D
ID
Juga
dor 1
(D
ispar
ador
)
Jugador 2(Arquero)
© 2019 Pavel Gómez
Estrategiasmixtas:Definicionesformales
35
Una estrategia mixta (σ) corresponde a aquellaque asigna una función de probabilidad p sobre unconjunto de estrategias puras S.
Un conjunto de estrategias σi corresponde a unEquilibrio de Nash en estrategias mixtas si paracada jugador i, σi es una mejor respuesta.
© 2019 Pavel Gómez
EquilibriodeNashconestrategiasmixtas(Materialopcional)
36
Estrategias mixtas óptimas:
Llamaremos p a la probabilidad de que el Disparador elijadisparar hacia la Izquierda.
Luego, debe cumplirse que:
VE2D = VE2
I
è (p)-5 + (1-p)5 = (p)5 + (1-p)-5
è p = ½© 2019 Pavel Gómez
Estrategiasmixtasóptimas(Materialopcional)
37
El mismo procedimiento es usado para encontrar la estrategiaóptima para el jugador 2.Sea q la probabilidad de que el Arquero elija lanzarse hacia laDerecha. Luego debe cumplirse que:
VE1I = VE1
D
(q)5 + (1-q)-5 = (q)-5 + (1-q)5 è q = ½
Entonces, el equilibrio de Nash de este juego es
(σ1*= (1/2; 1/2), σ2* = (1/2; 1/2))© 2019 Pavel Gómez
Estrategiasmixtasóptimas(Materialopcional)
38
Para evitar confusiones, se sugiere que el equilibrio seaexpresado de manera exhaustiva y explícita:
ENM = (P1I = ½; P1D = ½; P2D = ½; P2I = ½)
donde:
ENM: Equilibrio de Nash en estrategias mixtasP1
I: Probabilidad de que el Jugador 1 juegue IP1
D: Probabilidad de que el jugador 1 juegue DP2
D: Probabilidad de que el jugador 2 juegue DP2
I: Probabilidad de que el jugador 2 juegue I
© 2019 Pavel Gómez
39
Juegossimultáneosconestrategiasmixtas:Aplicación
40
Juegossimultáneosconestrategiasmixtas:Aplicación
“Carlos Bonet, investigador y parte del proyecto, explicó que “la Teoría de Juegos es unaciencia que busca ver cómo interactúan diferentes agentes. Cada uno tiene objetivosindividuales que son afectados por los objetivos del resto”.En este caso, existen dos agentes con dos objetivos diferentes: “El primero, es la personaque evade y cuyo objetivo es que el viaje tenga el menor costo posible, en tanto que elsegundo es el fiscalizador que quiere que el pasaje sea pagado”, explica Bastián Bahamondesacadémico de la Universidad de Chile.Según explican los expertos, hoy día para evitar la evasión, se eligen las calles con mayorevasión, donde los fiscales están por un largo periodo, lo que provocaría que “se pierda elfactor sorpresa“, ya que “los evasores saben por experiencia dónde se ubican losfiscalizadores, por lo que fácilmente pueden evitar el control de pago”.Por lo que este nuevo modelo, estaría basado en un sistema aleatorio.“Como contraparte surge naturalmente la idea de que el sistema de fiscalización debería seraleatorio, por lo que estamos creando un sistema basado en el azar que proponga los lugaresque serán fiscalizados y que, además, no tenga un patrón que los evasores puedanidentificar”, afirma Bonet.“Existen calles o sectores más peligrosos que otros, por lo que incluimos este factor a la horade diseñar el sistema”, concluye el investigador.
© 2019 Pavel Gómez