curso de teorÍa de juegos i

Upload: triad87

Post on 14-Jul-2015

510 views

Category:

Documents


1 download

TRANSCRIPT

SERGIO MONSALVE SEMESTRE II DE 2011

1

Clase Magistral #1. JUEGOS DE SUMA CERO Clase Magistral #2. JUEGOS NO-COOPERATIVOS (I) NOClase Magistral #3. JUEGOS NO-COOPERATIVOS (II) NOClase Magistral #4. JUEGOS NO-COOPERATIVOS (III) NOClase Magistral #5. JUEGOS NO-COOPERATIVOS (IV) NOClase Magistral #6. JUEGOS REPETIDOSClase Magistral #7. JUEGOS COALICIONALES (I) Clase Magistral #8. JUEGOS COALICIONALES (II)

2

PROGRAMA DEL CURSO (Continuacin) Clase Magistral #9. JUEGOS DE NEGOCIACIN (I) Clase Magistral #10. JUEGOS DE NEGOCIACIN (II) Clase Magistral #11. INFORMACIN ASIMTRICA (I) Clase Magistral #12. INFORMACIN ASIMTRICA (II) Clase Magistral #13. JUEGOS EVOLUTIVOS (I) Clase Magistral #14. JUEGOS EVOLUTIVOS (II) Clase Magistral #15. MODELOS DE COMPLEJIDAD3

JUEGOS COALICIONALES (I)

4

Comienzo esta sesin con una historia aparecida www.lasillavacia.com (Marcela Eslava, U. de los Andes):

en

En un pueblo costero de pescadores dedicados a recoger langostinos, un visitante forneo se asombra al ver que los miembros de la comunidad que consumen este producto lo adquieren en el supermercado y a un precio tan alto como el que se paga en el mercado internacional. --Por qu no simplemente consumen lo que pescan? Les saldra gratis,-- interroga el visitante al sabio del pueblo. El viejo le explica que los pescadores estn reunidos en una cooperativa, que exporta el producto al mercado en el que encuentra el precio ms alto. Quien lo quiera comprar en el pueblo debe pagar ese precio, para que no se pierda la oportunidad de vender a ese nivel. -Pero, eso es absurdo-- dice el forastero, jalndose el pelo. No tiene ningn sentido que una comunidad que produce algo tan bueno lo tenga que pagar carsimo. Seguro que algunos ni siquiera lo pueden consumir a ese precio. Y tenindolo tan a la mano!.

5

El anciano sonre y se da a la tarea de explicarle al forastero lo que los habitantes del pueblo hace rato entendieron. --Si vendemos el producto afuera, en el mercado donde est ms caro, podemos repartir los buenos ingresos entre todos. Los ms pobres de cualquier manera escogeran vender el langostino, as fuera en el pueblo y a malos precios, pues no se pueden dar el lujo de comerse la pesca y dejar de percibir los ingresos que les permiten consumir productos ms bsicos. Ellos, que son la mayora, claramente salen ganando si en lugar de repartirnos el producto lo vendemos bien caro.

6

Los ms ricos s pierden algo con esta estrategia: ellos siempre consumen langostino, y les toca pagarlo ms caro que si nos consumiramos lo pescado. Pero como igual tambin compran otras muchas cosas, pues recibir buenos ingresos por la venta cara del langostino al final tambin los beneficia. Y ni los ricos ni los pobres podran hacer la exportacin de manera individual.-- El visitante se re de si mismo. Qu fcil dejarse engaar por lo que pareca tan obvio, no mirar los lados menos evidentes de la historia! Se alegra de que en el pueblo las decisiones las tomen representantes bien asesorados y elegidos por un mecanismo de voto popular. As buscan buenas soluciones que favorecen a la mayora.

7

Juegos Cooperativos o Coalicionales

8

JUEGOS COALICIONALES (II)

9

L. Shapley (1953) defini un valor para un juego coalicional (N,v) como una distribucin de pagos ( i (v))i N (donde i (v) es el pago recibido por el jugador i N), que obedece tres axiomas: 1. El axioma de simetra, que requiere que los nombres de los jugadores no tengan ningn rol al determinar sus pagos, sino que stos sean sensibles nicamente a cmo la funcin caracterstica responde a la presencia de un jugador en una coalicin.

10

En particular, el axioma de simetra requiere que los nombres de los jugadores que son tratados idnticamente por la funcin caracterstica sean tratados idnticamente por el valor de Shapley. 2. El axioma de eficiencia, que exige que la suma total de las asignaciones sobre los jugadores, sea igual al pago de la gran coalicin. 3. El axioma de aditividad, que exige que el valor de Shapley sea aditivo entre diferentes juegos. Este axioma, que especifica cmo los valores de los diferentes juegos deben relacionarse unos con otros, es la verdadera fuerza conducente de la unicidad del valor de Shapley sobre el espacio de juegos coalicionales que satisfacen los otros dos axiomas.

11

Shapley demostr que estos pagos estn dados por la frmulai (v)=

S

N

[(s-1)!(n-s)!/n!] [v(S)-v(S-i)]

que muestra una suma ponderada de las contribuciones marginales del jugador i a todas las subcoaliciones. Aqu, s es el cardinal de S, y n es el cardinal de N De hecho, Shapley (1953) prob que su valor poda ser interpretado como la contribucin marginal esperada del jugador i, donde la distribucin de coaliciones surge de una forma muy particular:12

Supongamos que los jugadores entran en un saln en cierto orden, y que todos los n! rdenes de los jugadores en N son igualmente probables. Entonces i (v) es la contribucin marginal esperada por el jugador i cuando le corresponde entrar al saln. Para ver esto, considere cualquier coalicin S a la que pertenece i, y notemos que la probabilidad de que el jugador i entre en el saln y encuentre exactamente a los jugadores de S-{i }, all en el saln, es (s-1)!(n-s)!/n! pues:13

De las n! permutaciones de N, hay (s-1)! rdenes diferentes en los que los primeros s-1 jugadores pueden preceder a i, y (n-s)! rdenes diferentes en los que los restantes n-s jugadores pueden seguir despus de i, para un total de (s-1)!(n-s)! permutaciones en las que, precisamente, los jugadores S-i preceden a i. Pensar en el valor de Shapley en esta forma es, normalmente, un til artificio computacional.

14

Consideremos la interaccin entre un vendedor potencial y dos compradores potenciales de cierto objeto que el vendedor (que es su actual propietario) valora en $100,000; el primer comprador valora en $200,000 y el segundo comprador en $300,000. Si los jugadores pueden transferir dinero entre ellos sin ningn problema y si son riesgo-neutrales, esta situacin puede modelarse como un juego coalicional, de la siguiente forma:

15

N={1,2,3} v(1)=100,000; v(2)=v(3)=v(2,3)=0; v(1,2)=200,000; v(1,3)=v(1,2,3)=300,000 Esto refleja el hecho de que solo las coaliciones que contienen al vendedor (jugador 1) y al menos a un comprador pueden llevar a cabo transacciones que cambien la riqueza colectiva. Una coleccin que contiene al jugador 1 es valorada en el mximo que el objeto en cuestin vale para los miembros de la coalicin.

16

Inicialmente, calculamos el ncleo de esta economa: (x,y,z) (0 ) est en el ncleo si y solo si: x,y,z) x 100,000 ; x+y 200,000; x+y+z = 300,000 Y esto nos lleva a que: x 200,000; y=0; z=300,000 - x x+z 300,000

Esto corresponde a lo que se esperara si los compradores compitieran uno con otro en una subasta: el vendedor le vende el objeto al comprador que ms lo valora (el segundo comprador 2) a un precio entre la valoracin del primer comprador ($200,000) y del segundo comprador ($300,000).17

Por su parte, el valor de Shapley de este juego lo construimos a travs de la tabla siguiente:1 1,2,3 1,3,2 2,1,3 2,3,1 3,1,2 3,2,1 v(1) v(1) v(12)-v(2) v(123)-v(23) v(13)-v(3) v(123)-v(23) 2 v(12)-v(1) v(123)-v(13) v(2) v(2) v(123)-v(13) v(23)-v(3) 3 v(123)-v(1,2) v(1,3)-v(1) v(123)-v(12) v(2,3)-v(2) v(3) v(3)

Aqu, por ejemplo, 1,2,3 en la primera columna, significa que primero llega 1 al saln, despus 2 y luego 3.18

Y as el valor de Shapley de este juego es:1 1,2,3 1,3,2 2,1,3 2,3,1 3,1,2 3,2,11=

2 100,000 0 0 0 0 02=

3 100,000 200,000 100,000 0 0 03=

100,000 100,000 200,000 300,000 300,000 300,0001300,000 / 6

100,000 / 6

400,000 / 6

19

Un juego coalicional sin utilidad trasferible (UNT) es una tripla (N,V, i ) donde N={1,2,,n} es el conjunto de jugadores, y la funcin caracterstica V est definida as: V S ( N) V(S) ( X) Aqu, V(S) es el conjunto de posibles distribuciones de pagos de los miembros de S ; y i es una relacin de preferencia del agente i sobre X.

20

Cada juego coalicional UT (N,v) se puede ver como un juego coalicional NUT (N,V, i ) , as: i) X= N ii) Para cada coalicin S se tiene que V(S) = {x =(xi) N/ i S xi =v(S), con xj=0 si j iii) x i y si, y solo si, xi yi .UNT UT

N-S }

21

Ejemplo En el juego de un vendedor y dos compradores v(1)=100.000; v(2)=v(3)=v(2,3)=0; v(1,2)=200.000; v(1,3)=v(1,2,3)=300.000 se tiene que:V(1) = {(100.000 , 0, 0)} V(2) = V(3) = { (0, 0, 0)} V(1,2) = {(x1 , x2, 0) R3+ / x1+x2=200.000} V(1,3) = {(x1,0,x3 ) R3+ / x1+x3=300.000} V(2,3) = {(0,0,0) } V(1,2,3) = {(x1,x2,x3) R3+ / x1+x2+x3= 300.000}

22

x3

300.000

x1+x2+x3= 300.000

300.000

x2

300.000

x1

23

EL NCLEOEl ncleo de un juego coalicional NTU, (N,V, i ) , est definido por todas las asignaciones x V(N) tales que para ninguna coalicin S N y y V(S), se tiene que y i x para todo i S. Es decir, no existe ninguna coalicin S N en la que se puedan alcanzar pagos superiores (en trminos de i ) para todos sus miembros que el que le ofrece x.

24

EJEMPLOEn nuestro ejemplo de un vendedor y dos compradores, el ncleo est conformado por todas las triplas (x1,x2,x3) tales que: x1 200,000; x2=0; x3=300,000 x1

i)Ilustremos que stas satisfacen la condicin anterior de ncleo para, por ejemplo, la coalicin S={1,2} . Tomemos y=(y1,y2,0) V(12);es decir,y1+y2=200.000. Entonces notemos que y1x1. ii) Tambin podemos probar con la coalicin S={1,3 }. Tomemos y = (y1, 0, y3) V(13); es decir, y1+y3 =300.000. Entonces notemos que y1x1 y3 x3.25

x3

x1 200,000; x2=0; x3=300,000 x1

(Ncleo)

x1+x2+x3= 300.000

x2200.000

300.000

x1

26

Una economa de intercambio (N, , ( i ), (Ui)) consiste en: Un conjunto finito N de agentes. Un entero positivo de bienes. Para cada agente i N, un vector de dotacin de mercancas i + donde i N i > 0. Para cada agente i N, una funcin de utilidad U i: continua, no-decreciente en cada uno de + sus argumentos, y estrictamente cuasicncava. Cabe aqu mencionar que esto induce inmedia-tamente una relacin de preferencia i sobre + as: x i y si, y solo si, Ui (x) Ui (y) .27

Modelamos una economa de intercambio (N, , ( i ), (Ui) ) como un juego coalicional sin pagos transferibles (N, X , V, ( i )) , de la siguiente manera: X = {x=(xi)i N / xi N} + para todo i V(S) = {x=(xi)iN

X / i S xi = i S i xj=wj para todo j

,

N-S }

x

iy

si, y slo si, Ui (xi) Ui (yi )

28

El ncleo de la economa de intercambio ser, entonces, el ncleo del juego coalicional NTU asociado. Para fijar ideas, explicitemos el juego de una economa de intercambio con solo dos agentes (N={1,2}) y dos mercancas ( =2). Es decir:2 } X = {(x, y) / x, y + V(1) = V(2) = {( 1, 2)} V(1,2) = {(x,y) / x+y = 1+ 2} x i y si, y slo si, Ui (xi) Ui (yi ) , i=1,2.

29

El ncleo est definido por todas las asignaciones (x,y) V(12) tales que para ninguna coalicin S N y (z1,z2) V(S), se tiene que z1 1 x, z2 2 y Es decir,i)

Para S=N={1,2} no puede existir (z1,z2) tal que z1 1 x, z2 2 y (Eficiencia Pareto).1

V(12), x.

ii)Para S={1} debe tenerse entonces que iii) Para S={2} debe tenerse que2 2 y.

1

30

En resumen, el ncleo est conformado por las asignaciones eficientes Pareto (x , y) tales que: x+y= 1 + 21 1

x

;

2

2

y

Note que la eficiencia paretiana es, apenas, una condicin que debe satisfacer una solucin de ncleo, pues en un ptimo de Pareto podran venir protestas individuales aisladas con respecto a que no tienen incentivos para participar en el juego ya que sus utilidad deben ser , al menos ,las obtenidas con las dotaciones iniciales.31

EjemploSupongamos una economa de intercambio con dos agentes (1 y2) y dos mercancas (x y y), cuyas funciones de utilidad y dotaciones iniciales son: U1(x1,y1)=x1(y1)2 , U2(x2,y2)=(x2)(y 2) , (3,1) 2= (1,3)1=

Vamos a calcularle el ncleo y, para ello, primero, vamos a calcularle el conjunto de ptimos de Pareto (que Edgeworth llamaba curva de contrato).32

Existe una forma marginalista de calcularla que consiste en resolver dos problemas: i) Maximizar U1(x1,y1) sujeto a U2(x2,y2)= x1+x2=4 y1+y2=4 Maximizar U2(x2,y2) sujeto a U1(x1,y1) = x1+x2=4 y1+y2=4

2

(fijo)

ii)

1 (fijo)

33

Al resolver el primer problema mediante el mtodo lagrangiano, obtendremos que:

L = U1(x1,y1) Y as,

(U2(x2,y2)-

2)

U1/x1= - U2/x2 U1/y1= - U2/y2

U1/x1 /U1/y1 = U2/x2 / U2/y2(igualdad de tasas marginales de sustitucin)

34

Y as, obtenemos que (y1)2 / 2x1y1 = y2 / x2 o bien, y1 / 2 x1 = (4-y1 ) / (4-x1) Y as, y1= 8x1 / (4+x1) (Curva de contrato)

Finalmente, para encontrar el ncleo de esta economa de intercambio, debemos encontrar aquellos (x1,y1) y (x2,y2) en la curva de contrato (ptimos de Pareto) que satifagan:

x1(y1)2 3

;

(x2)(y 2) 3

35

Caja de Edgeworthx2 y1y1 = 8x1 / (4+x1) (Curva de contrato)

Agente 2

U2(x2,y2)=3

Ncleo1

U1(x1,y1)=3 y2 x1

Agente 1

36

En una economa de intercambio (N, , ( i ), (Ui) ) definimos un equilibrio competitivo como un par (p*, (x*i )i N ) donde p* + es un vector de precios (no todos nulos) y la asignacin (x*i )i N es tal que i N x*i = i N i para cada agente i N, se tenga que:

x*i

i

xi

cuando

p*xi = p*

i

37

Calculemos el equilibrio competitivo para la economa de intercambio U1(x1,y1)=x1(y1)2 , U2(x2,y2)=(x2)(y2) ,1=

(3,1) 2= (1,3)

La forma marginalista de calcular que consiste, inicialmente, en resolver dos problemas: i) Maximizar U1(x1,y1) sujeto a p1x1+p2 y1= 3p1+p2 Maximizar U2(x2,y2) sujeto a p1x2+p2 y2= p1+3p2

ii)

38

Las soluciones a estos dos problemas son: x1 = (3p1+p2 ) /3p1 y1 = 2(3p1+p2 ) /3p2 y x2 = (p1+3p2 ) /2p1 y2 = (p1+3p2 ) /2p2 Y ahora las colocamos para que satisfagan la condicin de que su suma sea igual a las dotaciones disponibles en la economa: (3p1+p2 ) /3p1 + (p1+3p2 ) /2p1 = 4 2(3p1+p2 ) /3p2 + (p1+3p2 ) /2p2 = 439

Resolviendo la primera ecuacin obtenemos quep*2 / p*1 = 15/11

Y as,x*1 = 16/11, x*2 = 28/11, y*1= 32/15 y*2 = 28/15

Pero resulta que esta asignacin est en el ncleo de la economa porque:

40

i) Est en la curva de contratoy1= 8x1 / (4+x1)

pues 32 /15 = 8(16 /11) / [4 + (16 /11)].ii) Y satisface la condicin de que x1(y1)2 3 ; (x2)(y 2) 3 pues (16/11) (32/15) 2 = 6.62 3 (28/11) (28/15) = 4.75 3

41

Caja de Edgeworthx2 y1y1 = 8x1 / (4+x1) (Curva de contrato)

Agente 2

U2(x2,y2)=3 Ncleo1

U1(x1,y1)=3 y2 x1

Agente 1Equilibrio competitivo

42

Pero esto no es una casualidad, pues, en general:

Todo equilibrio competitivo de una economa de intercambio est en el ncleo.

43

Pero la relacin va ms all: i) En primer lugar, toda economa de intercam-bio tiene un equilibrio competitivo (Arrow y Debreu (1954)), y, por lo tanto, el ncleo no es vaco.

ii) En general, en una economa de intercambio con muchos agentes, el equilibrio competitivo y el ncleo coinciden (Principio de Equivalencia) . Sobre esto, vamos a ilustrar enseguida basn-donos en nuestro ejemplo.

44

Supongamos ahora que nuestra economa de intercambio tiene cuatro (4) agentes: U1(x1,y1)=x1(y1)2 , U1 (x1,y1)=x1 ( y1)2 , U2(x2,y2)=(x2)(y2) , U2(x2,y2)=(x2)(y2) , (3,1) 1= (3,1) 2= (1,3) 2= (1,3)1=

en donde los dos primeros y los dos segundos, son idnticos. A esto se le llama una 2-rplica de la economa original. Vamos a observar que algunas asignaciones del ncleo original ya no son del ncleo de la 2-rplica.45

Por ejemplo, tomemos (ver la figura) la asignacin A para el agente 1 que pertenece al ncleo de la economa original y tomemos la asignacin B = (1/2) A + (1/2)1

Entonces, en la 2-rplica, la coalicin formada por 2 agentes tipo 1 y un agente tipo 2, puede mejorar sus pagos con respecto a A: los dos agentes tipo 1 reciben B, y el agente tipo 2 recibe (4,4)-A . Y esto hara que A no fuera parte del ncleo de la 2-rplica ya que 2 agentes tipo 1 y un agente tipo 2, podran mejorar.

46

La asignacin A no est en la 2-rplica 2de la economax2 y1 Agente 2

y1 = 8x1 / (4+x1) (Curva de contrato)

U2(x2,y2)=3 EA Ncleo de la 2-rplica C

B1

Ncleo

U1(x1,y1)=3 y2 x1

Agente 1

47

Lo anterior es una ilustracin de que la nica asignacin del ncleo original que sobrevive a las rplicas, es el equilibrio competitivo. Y la idea central es que el excedente (surplus) que surge en la economa original se puede repartir entre nuevos agentes (similares) de la economa, hasta alcanzar mediante ofertas y contraofertas (ARBITRAJES), la asignacin del equilibrio competitivo (en donde no hay ya surplus alguno). En 1962, Aumann probara que en una economa competitiva con un continuo de agentes, el ncleo y el equilibrio competitivo, coinciden, sin recurrir a ningn concepto de convexidad de las curvas de nivel ni monotonicidad, entre otros. Este es conocido como el Principio de Equivalencia

48

Intuitivamente, el Principio de EquiEquivalencia afirma que la institucin de los precios de mercado surge naturalmente a partir de fuerzas bsicas al interior del mercado, sin (casi) importar qu asumamos acer-ca de la forma en que trabajan estas fuerzas.49

Ejercicios0. Discutir Aumann (1962) sobre convexidad. 1.Ejercicio tipo Cournot del parcial anterior. 2.Ejercicio 6, libro azul de juegos (Monsalve y Arvalo (eds.), p.211). 3.a) Calcular una asignacin del conjunto estable del juego UT de un vendedor y dos compradores. b) En la economa de intercambio estudiada en el curso, calcular dos asignaciones numricas explcitas de ncleo. 4. Problema de asignacin de costos (libro azul de juegos (Monsalve y Arvalo (eds.), p.201)

50

5.Supongamos una economa de intercambio con dos agentes (1 y 2) y dos mercancas (x y y), cuyas funciones de utilidad y dotaciones iniciales son: U1(x1,y1)= (x1 )2(y1)2 , U2(x2,y2)=(x2)(y2) , (2,1) 2= (1,2)1=

a) Calcular el ncleo y dibujarlo en una caja de Edgeworth. b) Calcular el equilibrio competitivo y mostrar que est en el ncleo.

51

6. Un capitalista (notado por c) posee una factora y cada uno de los w trabajadores solo posee su propia mano de obra. Los trabajadores solos no pueden producir nada; pero junto con el capitalista, cualquier grupo de m trabajadores puede producir output con valor f(m) donde f(.) es una funcin cncava no-decreciente con f(0)=0. Un juego coalicional que modela esta situacin es (N,v) donde N = {c} U W, siendo W el conjunto de los trabajadores y V(S) = 0 f(|S si c no pertenece a S W |) si c pertenece a S

i. Demuestre que el ncleo de este juego es el conjunto de todos los perfiles de pagos x=(xi) tales que 0 xi f(w)-f(w-1) para i W y i N xi =f(w) donde w es el cardinal de W. ii. Encontrar el valor de Shapley y contrastarlo con las asignaciones de ncleo.

52

Sugerencia para la parte b) con |N|=3 (el jugador 3 es el capitalista)

1 1,2,3 1,3,2 2,1,3 2,3,1 3,1,2 3,2,1 0 0 0 f(2)-f(1) f(1)-f(0) f(2)-f(1)

2 0 f(2)-f(1) 0 0 f(2)-f(1) f(1)-f(0)

3 f(2) f(1) f(2) f(1) f(0) f(0)

53

JUEGOS DE NEGOCIACIN (I): NEGOCIACIN ESTTICA54

TEORA DE JUEGOS CLSICA

JUEGOS NONOCOOPERATIVOS

JUEGOS COOPERATIVOS

JUEGOS DE NEGOCIACIN

55

Un juego de negociacin (de dos agentes) es un 2 es el conjunto de par ( ,d) donde ,d) + asignaciones posibles de utilidad (o posibles acuerdos) de los dos jugadores (u1,u2). Al punto d=(d1,d2) se le denomina punto de desadesacuerdo. cuerdo Se asume, inicialmente, que es un conjunto no-vaco, convexo (por qu?), compacto (cerrado y acotado), y comprehensivo (si x y yx entonces y ). Adems que Ui(d) Ui(x) (i=1,2) para todo x . Un ejemplo tpico de un conjunto de negociacin es el presentado en la siguiente figura.56

u2 A la frontera superior de tambin la llaman la curva de contrato de la negociacin o tambin frontera Pareto .

d=(d1,d2)

u1

Conjunto de negociacin tpico

57

Qu es una solucin de negociacin?Es una regla que asigna a cada problema de negociacin ( ,d) un vector (o vectores) de la forma

( ,d)= (

1(

,d),

2(

,d))

Es decir, una asignacin en de los dos agentes.

para cada uno

58

AXIOMAS SOBRE LAS SOLUCIONES DE LOS JUEGOS DE NEGOCIACIN 1. AXIOMAS DE EFICIENCIA PARETOu2Solucin eficiente dbil

Solucin eficiente fuerte

u1

Toda asignacin eficiente fuerte tambin es eficiente dbil.59

2.

AXIOMA DE SIMETRAu1=u2Solucin simtrica

Si el conjunto de negociacin es simtrico con respecto a la recta u1=u2, entonces las soluciones de la negociacin son iguales para ambos jugadores.60

3.

AXIOMA DE INVARIANZA ESCALARSolucin despus de una transformacin afn

Solucin original

Las soluciones respetan las transformaciones afines.61

4. AXIOMA DE INDEPENDENCIA DE ALTERNATIVAS IRRELEVANTES (IAI)

Solucin para

El axioma IAI afirma que tambin es la solucin para

62

SOLUCIONES DE LOS JUEGOS DENEGOCIACIN1.

SOLUCIN NASH DE NEGOCIACIN

Es una solucin que satisface los axiomas de eficiencia fuerte de Pareto, simetra, invarianza escalar e independencia de alternativas irrelevantes.

63

Sin embargo, Nash demostr que esta solucin tiene un algoritmo muy particular para hallarla, pues es la solucin (u1, u2) al siguiente problema:

Maximizar (u1-d1)(u2-d2) sujeta a (u1 , u2)donde d=(d1,d2) es el punto de desacuerdo.

64

u2

Solucin Nash de negociacin

B(u1,u2) = (u1-d1)(u2-d2)

Conjunto de negociacin (d1,d2)

u1

65

Cuando la frontera Pareto (o conjunto de negociacin) es suave podemos describirla mediante suave, una funcin suave H(u1,u2) = 0 . Y por lo tanto, el problema que debemos resolver para la solucin Nash es de la forma

Maximizar (u1-d1)(u2-d2) sujeta a H(u1 , u2) = 0Que nos lleva a la ecuacin diferencial

H/u1 /H/u2 = (u1-d1) / (u2-d2) Ecuacin para soluciones Nash66

Ejemplos1. Sean ={(u1,u2)2 + /

(u1)2+(u2)2=1} , (d1,d2)=(0,0).

Entonces el problema es: Maximizar u1u2 sujeta a (u1)2+(u2)2=1 u10, u20 cuya obvia solucin es u1=u2= 1/2.67

2. Sean ={(u1,u2)2/ +

3(u1)2+(u2)2=1} , (d1,d2)=(0,0)

Entonces el problema es: Maximizar u1u2 sujeta a 3(u1)2+(u2)2=1 u10, u20 cuya solucin es u1= 1/6, u2= 1/2.

68

u2

La nueva situacin de negociacin Nash perjudica al agente 1 en relacin al agente 2, pues el conjunto inicial de acuerdos se contrajo en detrimento del agente 1.

(1/6, 1/2) (1/2 , 1/2)

u1

69

Pero la situacin anterior no siempre ocurre. De hecho, la hiptesis IAI de la solucin Nash lleva resultados contra-intuitivos como veremos en el siguiente ejemplo. Sea 1 el conjunto de todos los (u1,u2) tales que 0u1 1 , y 1- (u1 /3) si u1 3/4 u2 = 3(1- u1) si u1 3/4 y supongamos (d1,d2)=(0,0).70

2 +

Sea 2 el conjunto de todos los (u1,u2) tales que 0u1 1 , y 1- (10u1/3) si u1 3q + 2(1-q) Es decir, si, y slo si, q< 2/3 2/3.Potencial competidor Potencial competidor

(q)Monopolista

Monopolista

E C NC 0,-1 3,2

NE 2,0 5,0

E C NC 2,-1 3,2

NE 4,0 2,0

Costo alto

Costo bajo

117

De esta manera, ya se sabe cmo se comportar el monopolista: 1. Si tiene que enfrentar costos altos, no cons-truir la nueva planta. 2. Pero si enfrenta costos bajos, entonces cons-truir la nueva planta solo si la probabilidad de que el competidor entre al mercado sea menor que 2/3; es decir, que la probabilidad de que entren a competir no sea demasiado alta.

118

Y cmo se comportar el competidor potencial? Aqu es donde aparece la distribucin sobre los tipos de mono-polista: costos altos y costos bajos. Asumamos que se sabe (es conocimiento comn) que el monopolista tiene costos altos con probabilidad objetiva p1. Entonces, el competidor entrar al mercado si, y slo si: p1( valor esperado si entra cuando el costo es alto) + (1-p1 )( valor esperado si entra cuando el costo es bajo)

p1( valor esperado si no entra cuando el costo es alto) + (1-p1 )( valor esperado si no entra cuando el costo es bajo)Potencial competidor Potencial competidor

Monopolista

C NC

0,-1 3,2

2,0 5,0

Monopolista

E

NE

(q) E C NC 2,-1 3,2

NE 4,0 2,0119

Costo alto (p1)

Costo bajo

Pero el competidor potencial sabe que, por dominancia, el monopolista no construir (NC) una nueva planta si el costo es alto y, por tanto, en este caso entrar al mercado. De esta manera:`

`

Valor esperado si entra cuando el costo es alto= 2 Valor esperado si no entra cuando el costo es alto=0

Y para determinar los otros dos valores esperados (Valor esperado si entra cuando el costo es bajo y Valor esperado si no entra cuando el costo es bajo) se requiere de una nueva probabilidad:

120

p= probabilidad de que el monopolista construya cuando los costos son bajos.Potencial competidor Potencial competidor

(q) E

Monopolista

Monopolista

E C NC 0,-1 3,2

NE 2,0 5,0

NE 4,0 2,0

(p)

C NC

2,-1 3,2

Costo alto (p1)

Costo bajo

Valor esperado si el competidor entra cuando el costo es bajo= (-1)p + 2(1-p)= 2-3p. Valor esperado si el competidor no entra cuando el costo es bajo = (0)p + 0(1-p)=0.121

As, puesto que el competidor entrar al mercado si, y slo si: p1( valor esperado si entra cuando el costo es alto) + (1-p1 )( valor esperado si entra cuando el costo es bajo)

p1( valor esperado si no entra cuando el costo es alto) + (1-p1 )( valor esperado si no entra cuando el costo es bajo) Entonces, entrar al mercado, si, y solo si, 2p1+(1-p1)(2-3p) 0p1 + 0(1-p1) Es decir, si, y solo si, p 2 /3(1-p1)122

De esta manera, ya se sabe cmo se comportarn el monopolista y el competidor potencial: 1. El monopolista: a) Si tiene que enfrentar costos altos, no construir la nueva planta. b) Pero si enfrenta costos bajos, entonces construir la nueva planta solo si la probabilidad (q) de que el competidor entre al mercado sea menor que 2/3; es decir, que la probabilidad de que entren a competir no sea demasiado alta. 2. El competidor potencial: Entrar al mercado si la probabilidad (p) de que el monopolista construya la nueva planta cuando los costos son bajos, es menor o igual a (2/3)(1/(1-p1)).123

Toda la anterior informacin es conocimiento comn por parte de los dos jugadores. La pregunta ahora es, entonces: Qu podra ser un equilibrio de Nash en esta nueva situacin? No podra ser nada distinto a un comportamiento de expectativas auto-satisfechas, que llamaremos aqu equilibrio de Nash bayesiano, es decir, encontrar unas creencias (p,q) tales que p sea ptima dada q, y q sea ptima dada p, teniendo fija la probabilidad objetiva p1.

124

As, tenemos estos dos equilibrios de Nash bayesianos en estrategias puras:i)

(p=0, q=1) El monopolista no construye (sin importar los costos) y el competidor entrar al mercado. (p=1, q=0, p1bj ui (bi,bj| vi)= 0 si bi < bj (vi-bi)/2 si bi = bj

127

Si cada agente j=1,2 tiene una funcin de oferta (puja) bj(vj) entonces la mejor respuesta del agente i estar definida por el problema de maximizar el pago esperado E(ui )= (vi-bi)Prob(bi>b j(vj )) + (0)Prob(bi bj(vj)) con respecto a bi. Vamos ahora a probar que existe un equilibrio simtrico y lineal. Es decir, bi(v)=bj (v)= v para algn >0.128

E(ui ) = (vi-bi)Prob( bi>bj(vj) ) = (vi-bi) Prob( bi> vi ) = (vi-bi) Prob( vi< bi / ) = (vi-bi) (bi / ) Derivando esta funcin cncava estricta con respecto a bi obtenemos que: (vi-bi) - (bi ) = 0

bi = vi /2 Equilibrio simtrico129

En el caso general con N jugadores, la oferta es

bi = vi (1 - 1/N) Equilibrio simtrico

130

Ejemplo #3: Seleccin adversa y riesgo moralDos de los tipos de informacin asimtrica que ms se estudian en la literatura son los de seleccin seleccin riesgo moral. adversa y riesgo moral. a) Los de seleccin adversa son, en general (aunque no exclusivamente), modelos de mercado, en el que uno de los agentes no puede observar una caracterstica inalterable del bien que se comercia, y, as, el precio deja de ser una seal perfecta del valor de un bien, puesto que a un mismo precio se pueden obtener bienes de diferente calidad; adems, puede dar origen a eliminacin de buenos productos o incluso a la ausencia de intercambio, en donde los equilibrios no son ptimos de Pareto (second-best). second-best)

131

b) Por su parte los problemas de riesgo moral: son moral: los que implican una accin (o informacin) oculta. En general, se estructura a travs de modelos principal-agente principal-agente, donde el principal es el individuo que ordena al agente efectuar una tarea estipulada en un con-trato, pero que, a la vez, enfrenta un problema de riesgo moral cuando observa de manera imperfecta la accin emprendida por el agente (accin oculta). El problema del principal reside en encontrar un incentivo para que el agente acte de acuerdo con su inters). Este es el origen de la teora de contratos que es una sub-rea de la teora de diseo de mecanismos. mecanismos. Sobre problemas de riesgo moral, estudiaremos en la prxima sesin magistral.132

Un ejemplo sencillo de seleccin adversa: el mercado de carros usadosConsideremos un muy simple modelo de carros usados en que todos los compradores son idnticos y obtienen de su compra una utilidad U=Q-P (diferencia entre calidad y precio), y los vendedores una utilidad V=P-Q (diferencia entre precio y calidad). La mitad de los automviles es de buena calidad (Q=20) y la otra mitad es de mala calidad (Q=10). Con informacin simtrica, los buenos carros seran comprados por 20 y los de mala calidad por 10.

133

Con informacin asimtrica (es decir, los compradores no conocen la calidad, slo la informacin de que la mitad es buena y la otra mitad es mala, adems de los niveles de Q, en cada caso), la utilidad esperada de un comprador al pagar un precio P es de

0.5(10-P)+0.5(20-P) = 15-Py a este nivel de utilidad, los compradores no pagarn ms de 10 por automvil, y el vendedor, que sabe esto, solo ofrecer carros de mala calidad; es decir, los carros de buena calidad son excluidos del mercado. La seleccin adversa corresponde a un efecto perverso que elimin el producto de buena calidad!

134

Otro ejemplo de seleccin adversa: el mercado de carros usados (II) (Akerlof (Akerlof (1970))Consideremos un mercado de carros usados en el que, como antes, los propietarios tienen completa informacin sobre el estado del carro, pero no los compradores potenciales. Supongamos que es posible indexar la calidad de un carro usado mediante un nmero q, que es distribuido uniformemente sobre el intervalo [0,1], siendo entonces 1/2 la calidad promedio de los carros usados en el mercado.135

Supongamos que hay un gran nmero de personas que estn dispuestos a pagar qm por un carro (donde 0< 0 es el precio de equilibrio; entonces los nicos propietarios que querrn ofrecer sus carros para la venta son los de calidad menor que p, y la calidad promedio ser q=p/2. As, un comprador estar dispuesto a pagar (p/2) = ( /2)p. Pero como este es menor que p, no puede ser que p sea equilibrio. Por lo tanto, no se vender ningn carro al precio p, y el nico posible precio de equilibrio ser p=0. A este precio no habr ningn movimiento en el mercado. Este es un ejemplo (muy) simple en el que la informacin asimtrica destruye un mercado!137

Por su parte, despus del primer perodo, (en el que Fila jug T ), la probabilidad (posterior) de que la verdadera matriz sea M2 es, por la regla de Bayes, P(T|M2)P(M2) P(M2| T)= P(T|M2)P(M2) + P(T|M1)P(M1) (1/4)(1/2) = (1/4)(1/2) + (3/4)(1/2) =1/4

138

El juego esperado despus de T en el primer perodo es:L C 1 -1 R 1 1

()M1 + ()M2:

T B

3 3

en el que jugar T le garantiza a Fila un pago de1 (pues columna jugara C).

139

b) Despus del primer perodo, (en el que Fila jug B), la probabilidad (posterior) de que la verdadera matriz sea M2 es, por la regla de Bayes, P(M2|T)=1/4 y P(M2|B)=3/4 y el juego esperado le garantizara tambin un pago de 1. Por lo tanto, la estrategia le garantiza al jugador fila un pago de 1, que es mayor que revelar completamente la informacin o concilindola con la del jugador Columna.

140

Pero Cundo ocurre cada caso? La respuesta general est en el siguiente magnfico resultado: Sean M1 y M2 dos juegos de suma cero de dos personas (ambas matrices de la misma medi-da), y supongamos que M1 se escoge con probabilidad p, y M2 con probabilidad 1-p. Sea G(p) pM1+(1-p)M2 el juego promedio y G*(p) el juego repetido en donde el jugador Fila sabe cul matriz se escoge pero eso mismo no lo sabe el jugador Columna.

141

Entonces, Aumann y Maschler (1966) probaron que:

La funcin (dependiendo de p) de valores minmax del juego repetido G* es igual a la convexificacin de la funcin de valores minimax del juego G.Minmax de G Minmax de G*

p G G*

p

Ejemplo juego 3

142

Grficamente, expliquemos este resultado:Minmax de G Minmax de G*

1

1

a priori

1

p

1/4

a priori

3/4

1

p

a posteriori Pago por revelacin parcial de la informacin

Pago por revelacin completa de la informacin

p

Pago por revelacin completa de la informacin

Pago si ignora su informacin 143

(Ms informacin puede ser peor)

L T B 1, 1/2 2, 2

C 1,0 0,0

R 1, 3/4 0,3 T B

L 1, 1/2 2,2

C 1, 3/4 0,3

R 1,0 0,0

M1 (Probabilidad=1/2 para ambos jugadores)

M2 (Probabilidad=1/2 para ambos jugadores)

a. El nico equilibrio de Nash es (B,L). Fila y Columna obtienen 2. b. Supongamos que Columna supo cul juego se va a jugar. El nico equilibrio de Nash es (T,R) o (T,M). En ambos casos el pago de Columna es : hubiera preferido no saber tanto.

144

Equilibrios bayesianos y Equilibrios de Nash mixtos En 1973, Harsanyi prob que:Los equilibrios de Nash bayesianos de un juego al que se le ha perturbado un poco la informacin simtrica (para convertirlo en un juego con informacin asimtrica), tienen la caracterstica de que a medida que va desapareciendo esa perturbacin, coincidirn con los equilibrios de Nash mixtos del juego con informacin simtrica. simtrica.145

Consideremos el juego siguiente con un poco de informacin perturbada, tomado de Myerson (1991):Prob. z2 L Prob. z1 T B t1, 1, t2 t2 R t1, -1 -1, 3

donde t1 y t2 son variables aleatorias uniformes iid sobre [0,1], y es un nmero pequeo. El jugador 1 conoce su tipo t1, pero no el del jugador 2 (t2). Y, recprocamente, el jugador 2 conoce su tipo t2 pero no el del jugador 1 (t1). La tabla de arriba s es conocimiento comn y tambin la distribucin de los tipos.146

Notemos primero que si =0 entonces el juego es uno con informacin simtrica:Prob. z2 L Prob. z1 T B 0, 0 1, 0 R 0, -1 -1, 3

y tiene un nico equilibrio de Nash (mixto) z1=3/4, z2= 1/2

14 7

Y ahora vamos a calcular el (nico) equilibrio bayesiano del juego perturbado:Prob. z2 L Prob. z1 T B t1, 1, t2 t2 R t1, -1 -1, 3

i) El jugador 1 escoge T en lugar de B si, y solo si, z2( t1) + (1- z2)( t1)> z2 (1) + (1-z2 )(-1) Es decir, si, y solo si, t1 > (2 z2 1)/ ii) Por su parte, el jugador 2 escoge L en lugar de R si y solo si z1( t2) + (1- z1)( t2)> z1 (-1) + (1-z1 )(3) Es decir, sii t2 > (3 -4z1)/148

Como t1 y t2 son uniformes iid, entonces: z1= Probabilidad de que el jugador 1 escoja T = 1- (2 z2 1)/ z2= Probabilidad de que el jugador 2 escoja L = 1- (3-4 z1)/ Y resolviendo simultneamente para z1 y z2 obtenemos que: z1= 1 - ( +2)/( 2 +8) z2 = 1 - (4- )/( 2 +8) Que son las probabilidades asignadas en el equilibrio de Nash bayesiano:149

T J1(t1)= B

si t1> ( +2)/( si t1< ( +2)/(

2

+8) +8)

2

L J2(t2)= R

si t2> (4- )/(

2

+8)

si t2< (4- )/( 2 +8)

Note que si 0, alcanzamos el equilibrio de Nash mixto del juego con informacin simtrica.

150

El Principio de RevelacinEn 1979, Myerson prob un simple pero profundo y til resultado:Todo equilibrio de Nash bayesiano de un juego con informacin asimtrica puede implementarse como un equilibrio del mismo juego bayesiano pero en el que las estrategias de los jugadores son los mismos tipos y en el que cada uno de ellos revela su verdadero tipo.151

Un juego bayesiano en el que las estrategias de los jugadores coincide con sus tipos se conoce directo. como un mecanismo (juego) directo. Y un juego bayesiano en el que revelar su propio tipo conforma un equilibrio bayesiano, se llama un mecanismo (juego) con compatibilidad de incentivos. incentivos. Ms adelante daremos una interesante aplicacin del Principio de Revelacin.152

Riesgo MoralAunque este trmino proviene de la teora de los seguros de vida, con respecto a los efectos adversos que la compaa de seguros puede tener sobre los contratos que firma con sus asegurados, el trmino fue acuado por Arrow (1971) en Essays in the Theory of Risk-bearing. Un caso importante, aunque extremo, es el de un asegurado contra incendios que decide quemar su casa para reclamar el seguro. En general, el riesgo moral es asociado con la existencia de acciones escondidas (hidden actions) en una relacin contractual. Veamos un ejemplo muy importante donde aparece el riesgo moral: la discriminacin de precios.153

UNA APLICACIN: RIESGO MORAL Y PRINCIPIO DE REVELACIN EN LA DISCRIMINACIN DE PRECIOSDiscriminar precios significa cobrar precios distintos a cada cliente o a cada mercado. Ejemplos de ello, son las lneas areas que tienen el monopolio de una determinada ruta: pueden cobrarle una tarifa ms alta a los clientes que viajan por negocios (pues stos no tienen ms remedio que viajar) que a los que van de vacaciones (pues estos pueden tener otras alternativas). Con estas prcticas, el monopolista obtiene ms beneficios que si cobrara un nico precio en el mercado. Por ello, los vuelos de temprano en la maana y a horas altas en la tarde de das regulares, son, normalmente, los ms costosos.

154

Otro ejemplo de esto es el monopolista que vende el mismo producto en dos pases diferentes. En la grfica se observan dos curvas de demanda distintas y, por lo tanto, cobra distintos precios en estos pases. Y esto da origen a los intermediarios que compran en un pas y venden en el otro.p2Oportunidad para intermediarios

p1

p1

155

El economista britnico A.C. Pigou (1920) clasific este fen-meno en tres tipos: Discriminacin de primer grado, que consiste en aplicarle al comprador el mximo precio que est dispuesto a pagar por unidad del bien. Aqu se incluyen negociaciones (y regateos) sobre el precio del bien. Un mdico rural es un caso tpico. Discriminacin de segundo grado (o colocacin de precios nolineales (nonlinear pricing), que consiste en aplicarle al comprador un precio diferente dependiendo del nmero de unidades que compre. Por ejemplo, compras en grandes cantidades, la factura telefnica. Discriminacin de tercer grado, que consiste en aplicarle distintos precios a distintos compradores. Por ejemplo, promociones tipo Martes del Descuento para los que cumplan aos; Los viernes, el aperitivo es gratis para mayores de 60 aos; Happy Hour; etc.

156

Un ejemplo sencillo de discriminacin de tercer grado con informacin simtricaUn vendedor monopolista tiene dos tipos de compradores, tipo 1 y tipo 2. Las curvas de demanda correspondientes son p1= 2-3y1, , p2= 1-2y2; y la funcin de costos es C(Y)= Y2 , Y=y1+y2. Entonces el vendedor maximizar su beneficio = p1 y 1 +p2 y 2 (y1+y2)2 = (2-3y1)y1 + (1-2y2)y2 (y1+y2)2 y obtendr, derivando con respecto a y1 y y2 e igualando a cero: 1- 4y1-y2= 0; 1-6y2-2y1=0

Resolviendo simultneamente, obtenemos que: y*2= 2/22, y*1=5/22 y as p*1= 29/22 , p*2= 18/22

157

Por lo tanto, le cobra menos al comprador de primer tipo que al de segundo tipo. Peropor qu? La clave est en las elasticidades-precio de la demanda, es decir, Le cobrar ms al que tenga menor elasticidad (en valor absoluto) o, lo que es lo mismo, al tipo de comprador que sea menos sensible a un cambio de precios. En efecto, la elasticidad-precio de la demanda del tipo 1 es - [p1/ (2-p1)] = - 29/15 y la elasticidad-precio de la demanda del tipo 2 es -[p2/(1-p2)] = - 9/2 El beneficio que obtiene el monopolista es *= p1 y 1 +p2y 2 (y1+y2)2 = 0.2973.

158

Si el monopolista no discrimina, entonces el problema ser Maximizar p Y(p) Y 2(p) donde Y= y1(p) + y2(p). Es decir, Maximizar p[ 7/6 5p/6] - [7/6 - 5p/6]2

Derivando con respecto a p e igualando a cero, obtenemos que: p*= 22.4 / 22 , Y* = y1 + y2 = 0.318

Y el beneficio ser = p Y - Y 2= 0.223. As, el beneficio ser mayor si el monopolista discrimina ( =0.2973) que si no discrimina ( =0.223).159

Discriminacin de precios con informacin asimtricaUn monopolista produce un bien a un costo marginal de y vende una cantidad de este bien a un consumidor. El consumidor recibe U0 = V(q) - T donde V(q) es su excedente bruto, con V(0)=0, V>0, V b.

160

El juego procede como sigue: El vendedor ofrece una tarifa (quizs no-lineal) T(q) (con T(0)=0) que especifica cunto pagara el consumidor si escoge consumir q. Entonces el consumidor puede elegir entre aceptar el mecanismo, escoger el consumo q y pagar T(q) o bien rechazar el mecanismo. En primer lugar, qu sucedera si el monopolista conociera el verdadero valor de ? Le ofrecera una cantidad q de tal forma que V (q)=c ( es decir, cobrndole una tarifa T= V(q) y maximizando su utilidad u0= T-cq).

161

Pero bajo informacin asimtrica la situacin es distinta. En este caso, el monopolista ofrecer un plan diferente dependiendo del tipo de consumidor (de alta o baja valoracin del bien). As, sea (qb ,Tb) el plan destinado al consumidor de tipo b ; y (qa,Ta) el plan destinado al consumidor de tipo a. Entonces el beneficio esperado del monopolista ser E(u0)= p(Tb cqb) + (1-p)(Ta cqa)

162

sujeta a restricciones de racionalidad individualidad (RI) por parte del consumidor, que indican los incentivos de ste a participar en el juego, y restricciones de compatibilidad de incentivos (CI), que obligan al consumidor a consumir lo indicado para su tipo. Estas son: V(qb)-Tb0 a V(qa)-Ta0 b V(q b)-Tb b V(qa)-Ta a V(qa)-Ta a V(qb)-Tbb

(RI 1) (RI 2) (CI 1) (CI 2)163

Con algo de trabajo (ejercicio) se muestra que, bajo nuestras hiptesis, este problema del monopolista se reduce a Maximizar E(u0)= p(Tb cqb) + (1-p)(Ta cqa) sujeta ab a

V(q b)-Tb0 V(q a)-Ta a

(RI 1) V(q b)-Tb (CI 2)

Lo que nos lleva a maximizar, con respecto a qa y qb , la expresin E(u0)= = p(Tb cqb) + (1-p)(Ta cqa) = p( b V(qb)-cqb)+(1-p)( aV(qa)- aV(q b) + bV(qb)-cqa)164

Para obtener (asumiendo V(0)=0 y (1-p) < b/ (1que el equilibrio es:

a

pbV(qb)

b

=c pb -(1-p)( a b)

(socialmente sub-ptimo) subaV(qa)=

c

(socialmente ptimo)

165

JUEGOS CON INFORMACIN ASIMTRICA (II)

166

Un juego con informacin asimtrica (o juego bayesiano ) G es una tupla de la forma G=(N, A,T, p, u) donde: Un conjunto de jugadores N={1,2,,n}. Los conjuntos de acciones A1, A2,,An para cada jugador y A = A1 X A2 X X An. Los conjuntos de tipos T1, T2,,Tn para cada jugador y T = T1 X T2 X X Tn.167

`

Para cada jugador i, una conjetura (creencia) a priori (dada) pi: Ti ti (T-i) pi (t-i | ti)

que asigna a cada tipo ti de jugador i, una distribucin de probabilidad pi (t-i | ti) (T-i) y que representa la informacin que el agente i tiene sobre los tipos de los dems agentes dado su propio tipo. Se asume que la distribucin pi (t-i | ti) de probabilidades condicionadas a posteriori se calculan mediante la regla de Bayes: Bayes p(t-i | ti) = p(ti | t-i) p(t-i) p(ti)

Aqu, p=(pi)i N.

168

Una estrategia del jugador i es una funcin ai: Ti Ai que asigna a cada uno de los tipos ti del jugador i, una accin ai(ti) Ai.`

Para cada jugador i, una funcin de utilidad ui: A x Ti (a, ti) ui(a, ti) donde a=(a1,a2,,an) es un vector de acciones y t=(t1,t2,,tn) un vector de tipos.`

Aqu, u=(ui)i

N.

169

Ahora: para definir la nocin de equilibrio bayesiano, construimos, a partir de las funciones ui, unas nuevas funciones de valor esperado Ui del juego, as: Ui(a1,a2,,an) = ui(a1(t1), a2(t2), ati-1(ti -1), ai, ati+1(ti+1), an(tn), ti ) pi(t-i|ti)t-i T-i

(Funcin de utilidad esperada) Un equilibrio bayesiano es un equilibrio de Nash de un juego bayesiano con funciones de utilidad definidas por Ui.170

Juegos Extensivos con informacin asimtrica y Equilibrio Bayesiano PerfectoEstticos con informacin simtrica Dinmicos con informacin simtrica Estticos con informacin asimtrica Dinmicos con informacin asimtrica Equilibrio de Nash Equilibrio de Nash Perfecto en Subjuegos Equilibrio de Nash Bayesiano

Teora de juegos No-cooperativos

Equilibrio de Nash Bayesiano Perfecto

171

Primer Ejemplo (El Caballo de Selten (1975))1 I C 2p

D

(2,6)

D(3,2)

1-pI(-1,3)

I(0,1)

D(1,5)

172

En este juego, todos los equilibrios de Nash coinciden con los ENPS. Basta entonces calcular los equilibrios de Nash del juego estratgico.

I I C D 2,6 0,1 -1,3

D 2,6 3,2 1,5

Equilibrios de Nash puros: (I,I), (C,D).

173

Supongamos que el jugador 2 sabe que tiene la posibilidad de jugar; es decir, sabe que el jugador 1 no jug I. Entonces, como el jugador 2 sabe que el jugador 1 va a escoger C con probabilidad p, y va a escoger D con probabilidad 1-p, esto lo va a obligar a nunca escoger I pues solo para p2 se tiene que p(1) + 3(1-p) 2p + 5(1-p) 3(15(1(Pago por escoger I Pago por escoger D) Por su parte, el jugador 1 no va a jugar I al comienzo ya que eso le dara un pago de 2 que es menor que 3 que es su pago si juega C.174

PeroCmo sabe el jugador 2 que tendr la oportunidad de jugar? Solo si as lo cree y sabe que su oponente tambin lo cree, etc. (es decir, si hay conocimiento comn de las creencias). Pero para que esto sea posible, el jugador 2 debe asumir que 1 va a jugar C, es decir, debe asumir que p=1.

175

Juegos de SealesEn problemas de informacin asimtrica, una de las claves es qu informacin privada se revela a partir de las acciones de los agentes (incluyendo all la informacin que revelan aquellos que deciden no actuar). Es el caso de aquellos que prefieren enviar una seal que los identifique como algo que no son, debido a que esto es conveniente para ellos. En lo que sigue, daremos un ejemplo tpico de esto, modelando mediante un juego de seales.

183

El problema de contratar a un trabajador Aquel que solicita un trabajo puede saber si es un buen trabajador (capaz y con buena pro-ductividad) o un mal trabajador (perezoso y con baja productividad). Pero esto no lo sabe, de manera directa, el que lo contrata. Por ello, el empleador buscar, en lo posible, que los empleadores revelen la verdad mediante algn mecanismo. Una estrategia tpica es llevar a los trabajadores potenciales a realizar alguna actividad que no sea muy atractiva para el perezoso pero s para el buen trabajador. Qu podra suceder en una situacin as?

177

Una forma de modelar este tipo de situaciones es mediante un juego de seales. All, los trabajadores son de dos tipos (con problemas en la espalda y sin ellos), donde cada uno de ellos sabe qu tipo de trabajador es.

178

(0,0)

(1,0) Trabajador con mala espalda [0.1]El empleador no entrena

El empleador no entrena

Silla ejecutiva El empleador entrena

Silla ortopdica

El empleador entrena

(2,-1)Naturaleza

(3,-1)

(1,0)El empleador no entrena

(0.9, 0)El empleador no entrena

El empleador entrena

Silla ejecutiva

Silla ortopdica

Trabajador con buena espalda [0.9]

El empleador entrena

(3,1)

(2.9, 1)

Juego de seales179

Ejemplo #4: Una primera aproximacin al problema del uso ptimo de la informacin Una de las ms interesantes aplicaciones de la informacin asimtrica es al Folk Theorem (Teorema Popular), donde diferentes jugadores tienen diferente conocimiento de los parmetros relevantes del juego esttico que se juega repeti-damente. El problema es cmo sacar ventaja competitiva o cooperativa a partir de la informacin que se revela.

180

Para fijar ideas, supongamos que un jugador (el jugador informado) tiene informacin privada que el otro jugador no posee. En la interaccin de una sola vez, el jugador informado recurrir a su informacin tanto como sea posible. Sin embargo, si la situacin se repite, entonces el otro jugador, observando las acciones tomadas por el jugador informado, podra inferir cul era la informacin privada, y ya no tendra la ventaja del principio.

181

Un problema, entonces, es encontrar el correcto balance: utilizar la informacin tanto como sea posible, pero a la vez revelar cuanto menos sea posible. Y otro problema es que hay situaciones en donde el jugador informado querr revelar informacin a otros de tal manera que las acciones de ellos le beneficien. El problema es cmo hacer que la informacin que se est revelando sea creble al otro jugador. Entender estos problemas en el marco de los juegos repetidos de suma cero, fue parte del trabajo de Aumann y Maschler (1966, 1967 y 1968) durante la Guerra Fra.182

Primero, comenzaremos por determinar cunto es lo mnimo que puede garantizarse el jugador informado, sin importar lo que haga su opositor en el juego, es decir, analicemos el problema de la individualidad racional. En los tres juegos de suma cero (el jugador fila maximiza pagos y el columna minimiza) que presento a continuacin, solo hay dos jugadores que juegan repetidamente el juego. En cada caso estudiaremos la individualidad racional del jugador fila que es el jugador informado de cul de las dos matrices del juego es la verdadera. El jugador columna no sabe esto: cree que las dos matrices son igualmente probables. Despus de cada etapa solo se saben las acciones que se tomaron en las etapas precedentes pero no los pagos.

183

JUEGO 1L T B 4 0 R 0 0 T B L 0 0 R 0 4 T B L 2 0 R 0 2

M1 (Probabilidad=1/2)

M2 (Probabilidad=1/2)

(1/2)M1 + (1/2)M2

Fila juega T entonces Columna juega R

Fila juega B entonces Columna juega L

En el largo plazo, Fila obtiene 0 pues indic cul era la verdadera matriz

Fila obtiene, mnimo, un pago de 2 si ignora su propia informacin y opera conciliando con Columna

Fila obtiene ms ignorando su propia informacin184

JUEGO 2L T B 4 4 R 4 0 T B L 0 4 R 4 4 T B L 2 4 R 4 2

M1 (Probabilidad=1/2)

M2 (Probabilidad=1/2)

(1/2)M1 + (1/2)M2

Fila juega T

Fila juega B

En el largo plazo, Fila obtiene 4 indicando cul era la verdadera matriz

Fila obtiene un pago mximo de 3 si ignora su propia informacin y opera conciliando con Columna.

Fila obtiene ms utilizando su propia informacin185

JUEGO 3L T B 4 4 C 2 -2 R 0 0 T B L 0 0 C -2 2 R 4 4 T B L 2 2 C 0 0 R 2 2

M1 (Probabilidad=1/2) Fila juega T entonces Columna juega R

M2 (Probabilidad=1/2) Fila juega B entonces Columna juega L

(1/2)M1 + (1/2)M2

Columna juega C

En el largo plazo, Fila obtiene 0 pues indic cul era la verdadera matriz

Fila obtiene un pago de 0 si ignora su propia informacin

Da lo mismo revelar completamente la informacin o ignorarla?

186

No, porque revelando parcialmente la informacin el jugador Fila puede esperar ms. Sea la estrategia de Fila dada por: Jugar T por siempre con prob. 3/4 Si M1: Jugar B por siempre con prob. 1/4

Jugar T por siempre con prob. 1/4 Si M2: Jugar B por siempre con prob. 3/4

187

Veremos que la estrategia de revelacin parcial de la informacin le garantizar a Fila un pago esperado de 1, que es mayor que el 0 (cero) que obtiene tanto revelando totalmente la informacin como conciliando con Columna. Para que veamos lo que sucede, tenemos dos casos: a) Fila juega T siempre b) Fila juega B siempre

188

a) Despus del primer perodo, (en el que Fila jug T), la probabilidad (posterior) de que la verdadera matriz sea M1 es, por la regla de Bayes, P(T|M1)P(M1) P(M1| T)= P(T|M1)P(M1) + P(T|M2)P(M2) (3/4)(1/2) = (3/4)(1/2) + (1/4)(1/2) =3/4

189

Por su parte, despus del primer perodo, (en el que Fila jug T ), la probabilidad (posterior) de que la verdadera matriz sea M2 es, por la regla de Bayes, P(T|M2)P(M2) P(M2| T)= P(T|M2)P(M2) + P(T|M1)P(M1) (1/4)(1/2) = (1/4)(1/2) + (3/4)(1/2) =1/4

190

1. 2. 3. 4.

5.

El problema de Cournot con informacin asimtrica en los costos (ver M y A (eds.)). El problema de bienes pblicos con informacin asimtrica (ver M y A (eds.)). La subasta de segundo precio (ver M y A (eds.)). Identificar los elementos de un juego bayesiano en los ejemplos estudiados en esta clase magistral. Calcule los pagos del juego #3 con informa-cin simtrica.

191

6.(Para el parcial #2 (segunda serie de ejercicios)) Estudiar el Dilema del Prisionero repetido con un poco de informacin asimtrica (por ejemplo, una probabilidad pequea de que el agente 1 coopere siempre). Llevar esto a que los dos agentes cooperen casi siempre como un ENPS?

192

JUEGOS EVOLUTIVOS (I)

193

DEFINICIN DE UN JUEGO EVOLUTIVOConsideremos un juego en forma estratgica en el que ambos jugadores tienen el conjunto S={s1,s2,,sn} de estrategias puras. Los pagos cuando el agente 1 juega la estrategia si S y el agente 2 juega la estrategia sj S, es ij para el jugador 1 y ji para el jugador 2. Asumiremos que el juego es simtrico en pagos y en estrategias (no importa quines 1 o quin es 2). As una sola matriz A con los pagos del jugador 1, representa el juego total pues la traspuesta AT representar los pagos del jugador 2. A esta matriz A se le llamar el juego de estado estado.194

Continuando con la construccin de un juego evolutivo, evolutivo asumiremos lo siguiente: i) Una poblacin grande de agentes. ii) En cada perodo de tiempo t, los agentes se encuentran por parejas a jugar el juego de estado A. iii) Si un agente juega la estrategia si, diremos que es de tipo i. iv) Si la proporcin de agentes de tipo j es pj en un tiempo en particular, diremos que el estado de la poblacin, en ese tiempo, es = p1s1+p2s2++pnsn

195

12 10 8 Gen 1 Gen 2 Gen 3 Gen 4 Gen 5 Gen 6 Gen 7

6 4 2 0 Poblacin en el tiempo t

196

v)

El pago a un jugador de tipo i cuando el estado de la poblacin es , est definido por:iAgente que entra a la poblacin

= p jj NPoblacin que est

ij

,

N={1,2,n}

Este mide la mejor o peor disposicin al proceso de seleccin natural.Un juego evolutivo (simtrico) lo conforma un juego de estado A, bajo las condiciones i) a v) anteriores.197

DEFINICIN DE UN A ESTRATEGIA EVOLUTIVAMENTE ESTABLE En primer lugar, si la poblacin (entrante) est en estado ,

= qNsj j j

N={1,2,n}

y se mezcla con otra poblacin (status quo) (status quo) que est en estado

= jpjsj N

N={1,2,n}

198

i) Entonces el pago esperado de un jugador de la poblacin mezclada ser

= qipji,j N

ij

,

N={1,2,n}

ii) Y el pago esperado por un jugador (aleatoriamente escogido) del status quo, es decir, de la poblacin , ser

= pipji,j N

ij

N={1,2,n}

199

12 10 8 6 4 2 0Poblacin Poblacin Poblacin Poblacin

Gen 1 Gen 2 Gen 3 Gen 4

200

DEFINICIN DE ESTRATEGIA EVOLUTIVAMENTE ESTABLE DE UN JUEGO EVOLUTIVO (J. Maynard Smith (1982)) Diremos que una poblacin * es evolutivamente estable (EEE) si no puede ser invadida por ninguna poblacin mutante . Es decir, si:i) ii)* *

* *

Si

=

*

para toda poblacin mutante * entonces * >

Esto significa que si * es invadida por entonces el pago esperado por un jugador (aleatoriamente escogido) del status quo * es mayor o igual que el pago esperado por un jugador de la poblacin mezclada. Pero dice algo ms: que si estos dos ltimos pagos esperados son iguales, entonces el status quo * puede invadir con xito a la poblacin mutante .201

La poblacin12 10 8 6 4 2 0Poblacin Poblacin * *

* se defiende del mutante

Gen 1 Gen 2 Gen 3 Gen 4

* Tiempo de Tiempo de Tiempo de Poblacin interaccin interaccin interaccin * *202

Teoremas sobre EEEi)

Toda EEE de A (como juego evolutivo) es un equilibrio de Nash de A (como juego estra-tgico): estra-tgico) Comentario1:Racionalidad como producto de la evolucin? Comentario 2: Toda EEE es un equilibrio de Nash con cierta propiedad de estabilidad evolutiva que resiste a presiones de mutacin (por ejemplo, experimentacin y aprendizaje).

203

Comentario 3: La definicin de una EES no explicita ninguna dinmica de evolucin. Es similar a cuando mostrbamos que un equilibrio de Nash no explicita ninguna dinmica hacia la racionalidad interactiva. ii) Todo juego evolutivo finito (finito nmero de ii) estrategias) tiene un nmero finito de EEE (a diferencia de los equilibrios de Nash que puepueden ser infinitos). Sin embargo, puede no infinitos). tener ninguna EEE. EEE. iii) Toda EEE es un equilibrio de Nash aislado iii) aislado.204

Una definicin biolgica equivalente de EEE, es la siguiente (Ejercicio1): Diremos que una poblacin * es evolutivamente estable (EEE) si para toda poblacin mutante y toda mezcla de estas dos, = con + (1- ) *

suficientemente pequeo, se tiene que:*La que entra

>La que est

Esto significa que una poblacin * es EEE si para vencer a cualquier poblacin mutante (invasora) , basta con vacunarse con un poco de la poblacin de sta.

205

Ejemplos1. El Juego de CoordinacinA= D 2 I 0 0 2

Los equilibrios de Nash son, dos puros (que son EEE) y uno mixto (que no es EEE): i) *=D es EEE pues:(D,D) = 2 = ( =pD+(1-p)I, D) =p(2)+(1p)(0)=2p cuando p=1. Por lo tanto, no existe mutante (es decir, *) que satisfaga (D,D)= ( , D) . Por lo tanto, la propiedad se satisface vacamente.ii) Similarmente

*=I es EEE.206

iii)

El equilibrio de Nash mixto *=1/2(D) + (1/2)I no es una EEE, pues aunque la condicin 1= ((1/2)D+ (1/2)I , (1/2)(D) + (1/2)I )= (p(D) + (1-p)I , (1/2)D + (1/2)I )= p + (1-p)=1

siempre se da (es decir, para cualquier p), la condicin 1= ((1/2)D + (1/2)I , p(D) + (1-p)I ) > (p(D) + (1-p)I , p(D) + (1-p)I ) = p(2p)+(1-p)(2(1-p)) = 2-4p+4p2 o, lo que es lo mismo, (1-2p)2

; es decir,

((1/3)D+ (2/3)H , qD+ (1-q)H) > (qD+ (1-q)H, qD+ (1-q)H) Y esto nos lleva a que: -2/3 > -3q2+2q-1 o, lo que es lo mismo, nos lleva a que (1+3p)2>0 , que es siempre cierta.210

3. El Dilema del Prisionero[q]

A=

C NC

-1 0

-5 -4

El nico equilibrio de Nash es *= 0(C)+(1)NC y es el nico EEE. En efecto, vemos que la condicin (con =q(C) + (1-q)NC ) * * = * se da solo cuando q=0 , pues:* *

= -4

,

*

=(-4)(1-q)

Y as

nunca puede ser mutante.211

El actor central de un sistema dinmico evolutivo es el replicador. Esta es una enti-dad que tiene replicador manera de hacer copias muy aproximadas de s misma. Un replicador pue-de ser un gen, un organismo, una estra-tegia, una creencia, una moda, una conven-cin, una tcnica, o incluso formas institu-cionales o culturales ms generales.

212

Dinmica del ReplicadorConsideremos un juego evolutivo donde ca-da jugador sigue una de sus i=1,2,3,,n es-trategias puras y todos los periodos t=1, 2,3,. Si pit es la fraccin de jugadores que son de tipo i en el tiempo t, y it es el correspondiente pago esperado recibido, entonces la dinmica del replicador est definida por el sistema dinmico dpit /dt= pit ( it - D t ) i=1,2,,n213

dondeDt

= 7i=1,,n pit

it

es el pago promedio de la poblacin total. As, bajo la dinmica del replicador, la frecuencia de una estrategia (gen) aumenta cuando est por encima del promedio, y disminuye cuando est por debajo. A un equilibrio asintticamente estable de la dinmica del replicador se le llama un equilibrio evolutivo. evolutivo.214

Notemos que la dinmica del replicador no es una dinmica de mejor-respuesta dada la distribucin de frecuencias en el perodo anterior: los agentes aqu tienen un conocimiento limitado y localizado del sistema. Sin embargo, podra sistema. uno preguntarse: Y cmo se transmite la seal agregada preguntarse: de la media de comportamiento al gen para que ste se reproduzca? De otro lado: Podemos ilustrar en el caso 2x2 (con estrategias B lado: y C), que todo equilibrio de Nash del juego es un equilibrio de la dinmica del replicador pues si, por ejemplo, PB>0 entonces B = C y as (1-PB ) B = (1-PB ) C (1(1o bien, (1B = PB B + (1-PB ) C =D Y entonces surge la pregunta: Ser que la dinmica del pregunta: replicador representa una dinmica plausible de convergencia a los equilibrios de Nash?215

Notemos tambin que un replicador puede llegar a extinguirse, pero si en un instante del tiempo no est representado por en una poblacin, nunca ms lo estar: Si Pt=0 y Pt+1>0 entonces a partir de Pt+1 Pt = Pt( -D ) Se obtiene que pt+1=0, lo que es una contra-diccin. Por lo tanto la dinmica determinstica del replicador no puede tratar problemas de mutacin e innovacin. Normalmente, esto se modela adicionando a la dinmica del replicador procesos estocsticos (cadenas Markov, Path Dependen-ce, etc.) que permite la emergencia espontnea de replicadores

216

Dinmica del Replicador12 10 8 6 4 2 0 Tiempo t=1 Tiempo t=2 Tiempo t=3 Tiempo t=4 Tiempo t=5217

Gen 1 Gen 2 Gen 3 Gen 4

Ejemplos1. El Juego de El Dilema del Prisionero: El Prisionero: equilibrio de Nash puro *=NC (no cooperar) es la nica EEE y, adems, es el mismo equilibrio evolutivo del juego. En efecto,[PC]

A=

C NC

-1 -5 0 -4

C = gen altruista NC = gen egosta

C

= -PC -5(1-PC)= -5+4PC

NC

= 0PC + (-4)(1-PC) = 4PC - 4

218

D

= PC

C

+ PNC

NC

= = [PC ] [-5+4PC] + [1- PC ] [4PC - 4 ] = 3 PC - 4

dPC/dt = PC ( C - D ) = PC (PC -1) Dinmica del Replicador Equilibrios de la dinmica de replicador: PC =0 , PC =1

Equilibrio Evolutivo: 100% gen egosta

PC =0 Diagrama de fase

PC =1

Note que si 1> PC >0 entonces PC (PC -1) < 0.219

Dinmica del Replicador en el Dilema del Prisionero14 12 10 8 6 4 2 0 Tiempo t=1 Tiempo t=2 Tiempo t=3 Tiempo Equilibrio t=4 evolutivo Gen altruista ( C ) Gen egoista (NC)

220

2. El Juego de Halcn y Paloma: El equilibrio Paloma: de Nash mixto *=1/3(D) + (2/3)H es una EEE y, adems, es el mismo equilibrio evolutivo del juego. En efecto,PD

A=

D H

-2 0

0 -1

D = gen pacfico H = gen agresivo

D

= -2PD -0(1-PD)= -2PDD

H=

0PD + (-1)(1-PD )= PD - 1

D

= PD =

+ PH

H

=

[PD] [-2PD] + [1- PD] [PD - 1] = -3 (PD ) 2 + 2 PD -1

221

dPD/dt = PD(

- D ) = PD( 3 (PD ) 2 - 4 PD +1) D = PD( 3 PD -1 )( PD -1) Dinmica del Replicador

Equilibrios de la dinmica de replicador: PD=0 , PD=1/3 , PD=1

Equilibrio Evolutivo: 0,33% gen pacfico + 0,66 % gen agresivo

PD=0

+++++++

---------------PD=1/3 Diagrama de fase

PD=1

222

Dinmica del Replicador en Halcn y Paloma Paloma9 8 7 6 5 4 3 2 1 0 Tiempo t=1Tiempo t=2Tiempo t=3Tiempo t=4 Equilibrio evolutivo223

Gen pacfico Gen agresivo

3. El Juego de Coordinacin . Los equilibrios de Nash puros son los equilibrios evolutivos del juego. En efecto,PD

A=

D I

2 0

0 1

D = gen derecha H = gen izquierda

D

= 2PD -0(1-PD)= 2PDD

I=

0PD + (1-PD )= (1-PD )

D

= PD =

+ PI

I

=

[PD] [2PD] + [1- PD] [1-PD ] = 3 (PD ) 2 - 2PD +1

224

dPD/dt = PD(

D-

D ) = PD( 1-3PD ) ( PD - 1)

Dinmica del ReplicadorEquilibrios de la dinmica de replicador: PD=0 , PD=1/3 , PD=1

Equilibrios Evolutivos:100% gen pacfico + 0% gen agresivo; 0% gen pacfico +100% gen agresivo - - - - - - - - PD=0 ++++++++++++

PD=1/3 Diagrama de fase

PD=1

225

Dinmica del Replicador en el juego de Coordinacin (Caso I)14 12 10 8 6 4 2 0 Tiempo t=1 Tiempo t=2 Tiempo t=3 Tiempo t=4 EEE Gen derecho Gen izquierdo

226

Dinmica del Replicador en el juego de Coordinacin (Caso II)14 12 10 8 6 4 2 0 Tiempo t=1 Tiempo t=2 Tiempo t=3 Tiempo t=4 EEE Gen derecho Gen izquierdo

227

Equilibrios de la dinmica del replicador

Equilibrios Nash Equilibrios estables de la dinmica del replicador

Equilibrios evolutivos

Estrategias evolutivamente estables

228

Teorema . En un juego 2x2, una estrategia es EEE si y solo si es un equilibrio asintticamente estable de la dinmica del replicador. Sin embargo, esto solo es cierto en este caso. Y un contraejemplo importante (van Damme (1991)) es el siguiente:S1 S1 S2 S3 0, 0 -2, 1 1, 1 S2 1, -2 0, 0 1, 4 S3 1, 1 4,1 0,0

229

cuyo nico equilibrio de Nash es *=(1/3,1/3,1/3) que es asintticamente estable en la dinmica del replicador, pero que no es una EEE pues ntese que ( *, *)=2/3 , pero si tomamos =(0, , ) entonces tendramos que ( , )= 5/4 > ( *, )=7/6. Y as puede invadir a *.

230

Dos notas finales1.

2.

Cuando las mutaciones se hacen pequeas, la diferencia de la dinmica estocstica con respecto a la dinmica del replicador, se hace arbitrariamente pequea con probabilidad arbitrariamente cercana a 1. Sin embargo, si la probabilidad de error sea positiva, bajo condiciones muy plausibles un sistema estocstico con dinmica del replicador, har transiciones regulares de un equilibrio evolutivo a otro (ver Samuelson (1997)).

231

Ejercicios1. Pruebe que en el juego general Halcn y PalomaHalcn (H) Paloma (D) (V-C)/2 0 V V/2

donde V = valor de cierto recurso; C = costo de agredirse al tratar de obtener el recurso (C>V), los dos equilibrios de Nash puros no son EEE, pero s lo es la estrategia en que la proporcin de halcones es V/C.

232

2. Pruebe que el juego Piedra-Papel-Tijera no tiene EEE a pesar de tener un nico equi-libro de Nash. 3. Pruebe lo afirmado sobre el contraejemplo de van Damme (1991). Este contraejemplo arroja dudas sobre la consistencia de los equilibrios asintticamente estables de la dinmica del replicador como comporta-mientos evolutivos estables de largo plazo?

233

4. Considere el siguiente juego de alianza comercial (joint venture):In In Out 2,2 0,0 Out 0,0 0,0

Y calcule los equilibrios de Nash, las EEE y los equilibrios evolutivos. Pruebe que la estabilidad evolutiva dirige nuestra atencin al equilibrio de Nash ms plausible, es decir, a (In,In). Podra justificar este equilibrio afirmando que resulta porque los agentes evitan las estrategias dbilmen-te dominadas ya que es la nica estrategia nodominada?

234

5. Segn lo visto en esta clase, podra considerarse que la economa basada en modelos evolutivos es economa neoclsica? En particular, Existe algn proceso de optimizacin all? Es un modelo de economa con racionalidad acotada? Los equilibrios de Nash son alcanzados conscientemente? Es decir, son modelos con racionalidad consciente? 6. Pruebe que la dinmica del replicador elimina estrategias estrictamente dominadas. Podra ser una de estas una EEE?

235

JUEGOS EVOLUTIVOS (II): DINMICAS ESTOCSTICAS236

1.

El modelo de Kandori-Mailath-Rob (1993) Kandori-Mailath-

(Learning, Mutation and Long Run equilibrium in Games. Econometrica 61:29-56 (1993))a)

Comenzamos con un juego simtrico en forma estratgica jugado por una poblacin de N jugadores, cada uno caracterizado por una estrategia pura. En cada perodo los jugadores se encuentran por parejas a jugar el juego. Cada uno tiene la misma probabilidad de encontrarse con sus oponentes. Al final del perodo, todos los jugadores pueden aprender, es decir, podran cambiar su estrategia a una mejor-respuesta (condicin de racionalidad) con respecto al estado actual de la poblacin. Pero esto, como veremos, no es esencial.

b)

c)

237

d) Despus del aprendizaje, ocurren las mutacio-nes (errores, experimentaciones, etc.) e)Cada jugador puede ser un mutante con probabilidad ; es decir, en cada perodo, una proba-bilidad de que un agente juegue una estrategia distinta de la mejor-respuesta. f) Se modela la incertidumbre mediante un proceso de Markov con solo dos estrategia (X y Y), siendo el espacio-estado el conjunto de jugadores {1,2,,N}, y donde el estado se identifica por el nmero de agentes que juega la estrategia X. Se asume que la matriz de transicin (matriz de probabilidades) es estrictamente positiva.

238

Bajo estas hiptesis es bien sabido que existir una distribucin estacionaria que es nica independiente de las condiciones iniciales y con probabilidad positiva en todos los estados. Pero entoncescul es resultado del modelo KMR? Inicialmente es este: Si es suficientemente pequeo, entonces la distribucin estacionaria concentrar casi toda su probabilidad en slo unos pocos estados. Pero dice algo ms. Consideremos el juego simtrico de coordinacin

239

X X Y 9,9 7,0

Y 0,7 8,8

Entonces el diagrama de fase sin choques estocsticos ser el siguiente, en donde el eje mide la proporcin de la poblacin que juega la estrategia X:0 (todo Y)

0.8

1 (todo X)

240

sta va desde 0 (que corresponde al equilibrio (Y,Y)) hasta 1 (que corresponde al equilibrio (X,X)). La proporcin 0.8 corresponde al equi-librio mixto. Si la proporcin que juega X inicialmente, es menos que el 80% (y as, la mejor respuesta es Y), entonces la proporcin converger al equilibrio 0, que es donde todos juegan Y. Pero si ms del 80% juega X, entonces X es la mejor respuesta, y la proporcin converger al equilibrio 1, es decir, donde todos juegan Y. Est claro entonces que el sistema siempre se aproxima a un equilibrio, pero a cul de ellos exactamente, depende de cmo est distribuida la proporcin inicial.

241

Sin embargo, sumergiendo este modelo de coordinacin dentro de la estructura de KMR ellos prueban que, sin importar cul sea la condicin inicial, el sistema gasta virtualmen-te todo su tiempo en el equilibrio (Y,Y), para una probabilidad de mutacin suficientemen-te pequea. El diagrama de fase muestra que se necesitan ms mutaciones (80% de la poblacin) para hacer de X una mejor-respuesta en una po-blacin donde todos juegan Y, que llevar a cabo la transicin inversa (que requiere solo de 20% de mutantes). Esto hace que la primera transicin sea ms probable.

242

Cuando la probabilidad de mutacin se hace pequea, la primera transicin se hace arbitrariamente ms probable, haciendo que toda la probabilidad de la distribucin estacionaria se acumule en el equilibrio (Y,Y). Surge entonces la pregunta del porqu la diferencia de resultados entre el modelo determinista y el estocstico. Aqu llegamos al concepto de equilibrio de largo plazo y de ultra-largo plazo muy comn en modelos evolutivos. El primero consiste en la aproximacin (y alcance) al equilibrio. La segunda tiene que ver, adems de los anterior, con saltos aleatorios entre equilibrios.243

2. Nota sobre juegos evolutivos asimtricos Los juegos asimtricos surgen debido a que diversas poblaciones juegan papeles diferen-tes. Por ejemplo, los agentes en una tran-saccin pueden tener roles de comprador y vendedor; de empresarios y sindicalistas; de proponentes y aceptantes; etc. Ahora veremos cmo, para aplicarle toda la teora anterior, podemos hacer de un juego asimtrico, uno simtrico.

244

Las estrategias del juego simtrico es una eleccin de la estrategia a ser jugada en el papel del jugador I en el juego asimtrico, y una estrategia a ser jugada en el papel del jugador II en el mismo juego. Es decir, la estrategia del juego simtrico asociado es un plan de contingencias y los pagos asociados en el juego simtrico aso-ciado estarn determinados por los valores esperados del plan de contingencias.

245

3. El juego de El UltimtumConsideremos el juego simplificado de El Ultimtum en forma normal y extensiva:S 2,2 A 2,2 No A

I B

B 3,1 0,0 2 2 S

II

No 0 0

3 1

246

Un equilibrio de este juego es el ENPS calculado por induccin hacia atrs: El jugador 1 hace una oferta baja y el jugador 2 la acepta, recibiendo pagos respectivos de (3,1). Sin embargo hay otros equilibrios de Nash identificados por correspondencias de mejor- respuesta: El jugador 1 hace una oferta alta (A) y el jugador 2 juega No con probabilidad de al menos 1/3. Note que No es una estrategia dbilmente dominada para el jugador 2, y podra creerse, intuitivamente, que un proceso evolutivo ejercera suficiente presin constante sobre esta estrategia hasta eliminarla.247

1/3

(A, S)

(A, No)

Equilibrios de Nash ordinarios ENPS Y

(B, S)

X S No 2,2

(B, No)

[X]

[Y]

A

2,2

B

3,1

0,0248

La dinmica del replicador es:

dX/ =X(1-X)(YdX/dt =X(1-X)(Y-1) ; dY/dt= Y(1-Y)(3X-1) dY/dt= Y(1-Y)(3X1/3

(A, S)

(A, No)

Equilibrios de Nash ordinarios ENPS Y

(B, S)

X

(B, No)249

Ahora consideremos una versin perturbada de la anterior dinmica del replicador:

dX/ dX/dt = 0.9 X(1-X)(Y-1) + 0.1( X) X(1-X)(YdY/ dY/dt = 0.99 Y(1-Y)(3X-1) + 0.01( -Y) Y(1-Y)(3XEs decir, existe ms presin evolutiva por X=1 (es decir, por poblacin de dice No al trato inequitativo) que por Y=1 (es decir, por poblacin que ofrece B (oferta baja e inequitativa). El valor 1/2 de arriba es una divisin igual de la poblacin en X e Y, inicialmente.

250

La nueva dinmica del replicador permite ver la aparicin de un nuevo equilibrio evolutivo!!! En l, parte de la poblacin le dice No a la propuesta inequitativa.(A, S)1/3

(A, No)

Nuevo equilibrio evolutivo

Equilibrios de Nash ordinarios

ENPS Y

(B, S)

X

(B, No)251

Tres Comentarios y una Afirmacin1.

Acaso es este un ejemplo de la aparicin de cierto sentido de justicia como producto de la presin evolutiva? Experimentos mostraran que el contexto importa. Acaso la teora de juegos evolutivos nos ensea que no deberamos ser tan rpidos en aplicar criterios de dominancia o de induccin hacia atrs, como nos lo ensea la literatura de teora de juegos clsica sobre refinamientos de equilibrio? En particular, en modelos de negociacin, contratacin e intercambio, estas sospechas sobre este tipo de seleccin de equilibrios, es sustancial.

2.

3.

252

4.

Justifica la evolucin la nocin de equilibrio de Nash?

Ninguno de nosotros, estoy casi seguro, cree que los mercados estn siempre en equilibrio, as como tampoco cree que la gente es siempre racional sobre la base de que maximiza utilidades o beneficios. Sin beneficios. embargo, la extrema mayora de nuestra atencin se concentra en modelos con equilibrios ya sea porque tenemos la esperanza de que el comportamiento de equilibrio es suficientemente persistente y que el comportamiento de desequilibrio es suficien-temente suficientransitorio como para que el com-portamiento comrobusto sea el de equilibrio. Tam-bin lo hacemos equilibrio. Tamporque al estudiar el com-portamiento de equilibrio comcreemos alcanzar suficiente entendimiento del ms efmero comportamiento de desequilibrio. desequilibrio.

253

Perspectiva principal de la Teora de Juegos Evolutivos: Ligar la teora al comportamiento observado, con pruebas de laboratorio o de campo. Por ejemplo, Battalio, Samuelson y van Huyck (2001) estudian los tres juegos de abajo:X Y X 45, 45 35,0 Y 0,35 40,40 X 45, 45 40, 0 Y 0, 40 20,20 X 45, 45 42, 0 Y 0, 42 12,12

Es fcil mostrar que los tres juegos tienen similares equilibrios , similares corresponden-cias de mejor respuesta y similares diagramas de fase bajo la dinmica del replicador (la misma del modelo KMR):0 Todo Y

0.8

1Todo X254

As, muchos modelos basados en la racio-nalidad pura no distinguiran entre estos tres juegos. Pero la teora de juegos evolutivos s permite distinguir entre ellos.

255

Economa Neoclsica

Economa Incentivos

Visin de la Economa como un organismo darwiniano. La biologa evolutiva es su modelo epistemolgico.

Economa Evolutiva

Complejidad

256

MODELOS DE COMPLEJIDAD

257

LA ERA DE LA ECONOMA NEOCLSICA HA FINALIZADO Y HA SIDO REEMPLAZADA POR LA VISIN DE UNA ECONOMA COMPLEJA.(HOLT, ROSSER Y COLANDER (2010))

258