apunte- teoría de juegos

36
Microeconom ´ ıa II Teor ´ ıa de Juegos y Aplicaciones Aldo Gonz´alez T. Daniel Hojman T. Fabi´anSep´ ulveda C. Esta versi´on: 10 de marzo de 2014, Primera versi´on: Agosto 2012

Upload: conicz

Post on 22-Aug-2015

274 views

Category:

Economy & Finance


9 download

TRANSCRIPT

Microeconomıa II

Teorıa de Juegos y Aplicaciones

Aldo Gonzalez T. Daniel Hojman T.

Fabian Sepulveda C.

Esta version: 10 de marzo de 2014, Primera version: Agosto 2012

Capıtulo 1

Teorıa de Juegos

1.1. Introduccion

En muchas situaciones donde un sujeto debe tomar una decision, el resultado que obtenga depen-dera no solo de sus propias acciones, sino tambien de las decisiones que tomen otros individuos. Por suparte, los resultados de esos otros individuos tambien dependen de la decision del sujeto en cuestion.Ası, un agente en este tipo de situacion se cuestionara que haran los demas... y que piensan los demasque hara el mismo. Esta interdependencia -que se puede observar en una amplia variedad de situacio-nes sociales- se conoce como interaccion estrategica. Cuando la interaccion estrategica sea un elementofundamental en la toma de decisiones entre individuos, hablaremos de situacion estrategica.

El objetivo de la teorıa de juegos es estudiar el comportamiento de individuos en situaciones es-trategicas. Y aunque el enfasis esta puesto en las decisiones que son tomadas de forma individual, unade las dimensiones mas interesantes de la teorıa es que permite hacer predicciones respecto de los resul-tados agregados que divergen de los resultados clasicos en economıa, en el sentido de que la motivacionindividual (self-interest) puede llevar a resultados ineficientes desde un punto de vista social. Mas en ge-neral, la teorıa de juegos es util para analizar diversas situaciones de interes economico, como mercadospoco competitivos, asimetrıas de informacion, cumplimiento bajo contratos incompletos, etc. Ademas,tiene aplicaciones en otras disciplinas, como ciencias sociales, management, e incluso biologıa.

Una tipologıa de juegos

Algo que conviene tener en mente antes de comenzar el estudio formal de la teorıa de juegos es que,dependiendo del contexto o la situacion que nos interese, la interaccion estrategica puede manifestarse endiferentes formas. Por ejemplo, la situacion estrategica mas sencilla que podemos pensar es una en la cualcada agente involucrado debe tomar una decision de forma simultanea considerando el efecto que tienenlas decisiones de los demas en el resultado propio. Pero pensemos, por otro lado, en un juego de ajedrezdonde cada jugador toma decisiones en funcion de lo que ha ocurrido previamente y de lo que espera queocurrira en el futuro. En este ultimo caso existe un elemento secuencial relevante, pues las decisionestomadas en por un jugador incidiran en las jugadas subsecuentes. Ası, cuando analicemos situaciones delprimero tipo hablaremos de juegos estaticos, mientras que en el segundo caso nos referiremos a juegosdinamicos.

Otro elemento que puede diferir segun la situacion que nos interese dice relacion con la informacionque posee cada jugador respecto de los demas. Por ejemplo, pensemos en una subasta a sobre cerrado,donde cada potencial comprador debe hacer una unica oferta y aquel que ofrezca un mayor pago se lleva

1

Facultad de Economıa y Negocios - Universidad de Chile 2

el bien subastado. Si un postor no conoce la valoracion de los demas por el bien en cuestion, entoncesse enfrenta al dilema de ofrecer un pago alto y con ello aumentar las probabilidades de ser el ganador,u ofrecer un pago mas bajo y tener la posibilidad de adquirir el bien a un precio conveniente. En esteejemplo, la valoracion que tiene cada comprador sobre el bien es informacion valiosa, en tanto el poseerlao no incidira en la decision tomada.

Cuando en una situacion estrategica no exista informacion privada como la descrita en el parrafoanterior, hablaremos de juegos de informacion completa, mientras que cuando existe informacion sobrelos jugadores que no sea de conocimiento comun se tratara de juegos de informacion incompleta. Ası, unatipologıa de juegos muy general nos permite clasificar las diferentes situaciones estrategicas en cuatrocategorıas:

Juegos estaticos de informacion completa

Juegos dinamicos de informacion completa

Juegos estaticos de informacion incompleta

Juegos dinamicos de informacion incompleta

Cada uno de estos tipos de juego involucra -en terminos de la teorıa- conceptos e instrumentos le-vemente diferentes, que estudiaremos caso a caso. No obstante, el foco del curso estara puesto sobre losjuegos de informacion completa, partiendo por los de tipo estatico, para luego analizar las situacionesque requieran un elemento dinamico. Los juegos de informacion incompleta, aunque no seran estudiadosal mismo nivel de profundidad, seran relevantes en el capıtulo correspondiente a economıa de la infor-macion.

Ejemplos clasicos

En las siguientes secciones estudiaremos en detalle la terminologıa y las tecnicas que se utilizan alanalizar situaciones estrategicas bajo la perspectiva de la teorıa de juegos. Pero para introducir cualesseran los elementos basicos en los que pondremos nuestra atencion, a continuacion se muestran algunosjuegos clasicos que son utiles para ejemplificar ciertos tipos de interaccion estrategica donde destacaalguna dimension como la cooperacion, la coordinacion, el conflicto, etc.

El primer ejemplo que revisaremos es probablemente uno de los juegos mas famosos, conocido como eldilema del prisionero. La situacion consiste en dos sospechosos que han sido arrestados y son mantenidosen celdas separadas. La policıa solo tiene evidencia suficiente para acusar a cada uno de un delito menor,pero no para condenarlos por un delito mayor a menos que uno de ellos testifique en contra del otro(confesar). Ası, si ambos guardan silencio (callar) entonces cada uno sera sentenciado por el delitomenor y pasara un ano en prision. Si solo uno de ellos confiesa, entonces sera liberado por cooperar conla policıa, mientras que su complice sera condenado a 9 meses. Finalmente, si ambos confiesan entoncescada uno pasara 6 meses en prision.

Aunque toda la informacion relevante para entender esta situacion se encuentra en el parrafo anterior,muchos juegos en los que nos interesaremos pueden ser resumidos de forma comoda en lo que se conocecomo una matriz de pagos. Para el caso del dilema del prisionero, esta matriz se muestra a continuacion:

Prisionero 2

Callar Confesar

Prisionero 1Callar -1, -1 -9, 0

Confesar 0, -9 -6, -6

Figura 1.1: Dilema del prisionero

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 3

La forma en la que esta escrita esta matriz nos indica que el jugador que llamamos “prisionero 1”elige una accion entre las dos posibles filas “callar” y “confesar”. Por su parte, el “prisionero 2” puedeelegir entre las mismas alternativas, pero que en la matriz estan representadas por las columnas. Losnumeros en cada celda de la matriz nos indican los pagos que recibe cada uno segun las estrategiasescogidas, donde convencionalmente se entiende que el primer numero corresponde al pago del jugadorque elige filas (prisionero 1 en este ejemplo), mientras el segundo corresponde al pago del jugador queelige columnas. Por ejemplo, si el prisionero 1 elige confesar y el 2 callar, la celda correspondiente indica(0,−9) porque aquel que confeso saldra libre mientras que el que callo sera condenado a 9 meses. Engeneral, los numeros asociados a los pagos no tienen por que tener una interpretacion concreta como eneste caso, y los utilizaremos simplemente para indicar que aquellos resultados con un pago mayor sonpreferidos a los que tienen un pago menor.

Viendo la matriz de pagos es facil notar que resulta mas conveniente para ambos la situacion en laque cada uno guarda silencio por sobre la alternativa en la que cada uno confiesa. Ası, el resultado enel que ambos eligen “callar” es uno cooperativo, en tanto les permite asegurar una sentencia menor. Eldilema esta en el hecho de que bajo el resultado cooperativo, existe una tentacion individual a romper lacooperacion y confesar para salir en libertad. Esta tension entre la cooperacion social y el interes propiose presenta en diversas situaciones cotidianas (es el mismo principio que se aplica en el analisis de laprovision de bienes publicos), y es capturada de forma sencilla en este juego. El analisis de los posiblesresultados de este juego lo dejamos para las secciones siguientes.

Para motivar el siguiente ejemplo, pensemos en situaciones donde la cooperacion no es lo relevante,sino que los intereses de los jugadores estan completamente contrapuestos porque -por ejemplo- lo quegana uno lo pierde el otro.1 Un juego que ejemplifica esto se conoce como matching pennies y consisteen dos jugadores, cada uno de los cuales tiene una moneda y debe mostrar una cara de esta. Si ambosmuestran la misma cara, entonces el jugador 1 gana el juego y se lleva las dos monedas; mientras que simuestran distintas caras, entonces el jugador 2 gana el juego y el derecho a quedarse las monedas. Estamecanica se resume en la siguiente matriz de pagos:

Jugador 2

Cara Sello

Jugador 1Cara 1,−1 −1, 1

Sello −1, 1 1,−1

Figura 1.2: Matching Pennies

En este tipo de juegos el conflicto entre los jugadores es el elemento relevante, y la razon fundamentalpor la que existe interaccion estrategica es porque a cada uno le gustarıa saber que es lo que hara elotro pero que el otro no sepa lo que hara el primero. Podemos pensar -por ejemplo- en la ejecucion deforma simplificada de un penal en un partido de futbol: el arquero debe elegir si saltar a la izquierda oa la derecha, mientras que el tirador debe elegir si patear a la izquierda o a la derecha. Al igual que enel juego de las monedas, el exito de uno de los jugadores significa el fracaso del otro.

Otro elemento que puede resultar relevante en ciertas situaciones, y que podemos capturar en unjuego sencillo, es la coordinacion. El ejemplo clasico en este contexto se conoce como la batalla de lossexos2, cuya historia cuenta que una pareja tenıa una cita, pero cada uno olvido el lugar de encuentro(que puede ser un partido de futbol o el museo) y ya no pueden ponerse en contacto para aclararlo.

1A veces se denominan juegos de suma cero, pues no se generan ganancias netas de la interaccion entre los agentes.Esto es, dado algun resultado, la suma de los pagos de los jugadores es cero.

2El nombre es un tanto anacronico, pues hace referencia a una concepcion sexista de las preferencias por entretencion.En los ejemplos modernos del juego, como el que se presenta aquı, se intenta eliminar este elemento aun cuando se conservael nombre.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 4

Ademas, suponemos que cada uno tiene preferencias por uno de los lugares (Josefa por el futbol yManuel por el museo), pero que de todos modos ambos prefieren la companıa del otro por sobre ir a sulugar favorito solos. Ası, la matriz de pagos asociada al juego es la siguiente:

Manuel

Futbol Museo

JosefaFutbol 2,1 0,0

Museo 0,0 1,2

Figura 1.3: Batalla de los sexos

En este caso el conflicto no es la dimension relevante, sino la necesidad de coordinacion para alcanzarun resultado conveniente. Como cada uno tiene preferencias distintas respecto de los lugares de encuen-tro, no resulta obvio a cual de estos deben dirigirse y eventualmente pueden terminar en diferentes sitios,lo que no es conveniente en ningun caso.

Los ejemplos anteriores son una muestra del tipo de problematicas que se puede capturar de maneramuy sencilla en forma de juegos con dos estrategias y dos jugadores. Sin embargo, estudiaremos juegoscon estructuras mas generales, donde puede haber mas jugadores u otros tipos de estrategias. Para esto,en la siguiente seccion se introducen los conceptos que utilizaremos a lo largo del curso y se define demanera formal la idea de juego introducida con estos ejemplos.

1.2. Conceptos basicos y definicion de juego

Para el estudio formal de la teorıa de juegos requerimos de un marco teorico sobre el cual podertrabajar, estudiar problemas y proponer posibles soluciones. Aunque muchas veces nos interesemos enjuegos que basicamente son una situacion cotidiana y que resultan intuitivos de entender, para poderutilizar el instrumental que la teorıa nos entrega necesitamos definir de forma concreta ciertos aspectosque resultan claves para entender la interaccion estrategica que puede darse entre los agentes en lasituacion que queramos estudiar.

Ası, si queremos analizar situaciones estrategicas desde una perspectiva de juegos, es necesario quenos preguntemos cuestiones como, ¿quienes toman decisiones relevantes en esta situacion?, ¿cuales sonlas distintas opciones que tiene cada uno?, ¿cuales son las preferencias que tienen sobre los posiblesresultados finales cada jugador?. Esta ultima pregunta es particularmente relevante ya que en ellaesta implıcita la potencial interaccion estrategica presente en el juego.

En terminos generales, los elementos que hay que definir con precision para estructurar un juego son:

Jugadores: Son los agentes (individuos, firmas, organizaciones, paıses, etc) que toman decisiones rele-vantes en la determinacion del resultado final.

Estrategias: Estas explicitan cual es la decision que debe tomar cada jugador, y entre cuales alterna-tivas puede elegir. Notar que esta nocion es bastante general, ya que una estrategia puede ir desdealgo sencillo como decidir entre un par de acciones (confesar o no confesar), hasta algo elaboradocomo elegir un plan de accion completo para cada posible situacion en la que se encuentre eljugador.

Pagos: Corresponde a alguna forma de definir la valoracion que tienen los individuos respecto de losposibles resultados del juego. Puede ser simplemente un orden de preferencias (prefiero el resultado

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 5

A por sobre el B, y este ultimo por sobre el C), o una funcion de utilidad definida sobre lasestrategias de todos los jugadores.

Reglas del juego: Es fundamental definir si las decisiones se toman en forma simultanea o existe algunelemento temporal, y en este ultimo caso, determinar que informacion se maneja al momento detomar una decision3.

Podemos notar que son varias las dimensiones a tener en consideracion al momento de analizaruna situacion estrategica. Es por ello que nos gustarıa resumir todas las caracterısticas de un juego enalguna estructura relativamente simple y bien definida. Para este proposito existen dos maneras basicasde plantear un juego: las denominadas forma normal y forma extensiva. En esta seccion vamos a definirun juego en forma normal, y dejaremos la forma extensiva para el caso de juegos secuenciales, en dondenos resultara mas util.

Antes de entregar una definicion formal de juego en forma normal estudiaremos un ejemplo diferente alos vistos en la seccion anterior. Se trata de un modelo de competencia imperfecta entre firmas, conocidocomo modelo de Cournot. Pensemos en un mercado en el cual existen dos empresas que producen unmismo bien, cuya demanda agregada esta dada por una funcion P (Q) = A−Q, donde P es el precio demercado y Q la produccion agregada. Cada una de las firmas i = 1, 2 elige una cantidad a producir qi,de modo que Q = q1 + q2. Ademas cada firma enfrenta un costo marginal constante que denotaremos c.Ası, los beneficios de cada firma estan dados, respectivamente, por:

π1 = (A− q1 − q2)q1 − cq1

π2 = (A− q1 − q2)q2 − cq2

La competencia que se da entre estas firmas al momento de elegir sus niveles de produccion en formasimultanea, puede ser entendida como un juego. En efecto, la interaccion estrategica es fundamentalen este caso, ya que el precio que enfrente la firma dependera de la produccion de su competidora, yası dependera tambien su nivel de produccion optimo.

Lo relevante del ejemplo -por el momento- es notar que este juego, aun cuando solo tiene 2 jugadores,no puede ser escrito de forma matricial, porque cada jugador tiene un conjunto de posibilidades muygrande sobre el cual elegir: cualquier nivel de produccion (numero real) es un nivel de produccion factiblepara la firma. Ası, escribir este juego en forma matricial no es solo poco conveniente, sino que es imposibleya que se trata de un espacio de estrategias continuo.

Pero ademas de enfrentarnos a diferentes tipos de estrategias segun el tipo de juego, podemos enfren-tarnos a otras situaciones que hacen de la matriz de pagos un esquema poco conveniente en varios casos.Pensemos, por ejemplo, en el mismo juego de competencia a la Cournot, pero con n firmas, donde n esun numero cualquiera mayor que 1. En este caso, la produccion agregada viene dada por Q =

∑ni=1 qi,

y tenemos que la funcion de beneficio es, para cada firma:

πi =

A− n∑j=1

qj

qi − cqi ∀i = 1, ..., n

Tener una cantidad mayor de jugadores tambien hace complicado el uso de las matrices de pagospara plantear juegos. Por todo lo anterior, requerimos de un esquema un tanto mas general para definirun juego, que nos permita utilizar los conceptos desarrollados por la teorıa en diversas situaciones,independiente de cuestiones como el tipo de estrategias existentes o el numero de jugadores. Este esquemaes la forma normal de un juego.

3Una cuestion clave en este sentido es si al momento de elegir su estrategia, un jugador observa las estrategias seguidaspor los que jugaron antes que el.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 6

Para definir formalmente esta estructura, introduciremos un poco de notacion que sera utilizadaregularmente en lo sucesivo. Consideraremos juegos de n jugadores, que seran indizados por la letra i,de modo que i = 1, ..., n. Ademas denotaremos con Si al conjunto de estrategias del jugador i-esimo, ycon si ∈ Si a alguna estrategia particular perteneciente a este conjunto. Dado lo anterior, entenderemoscomo perfil de estrategias s = (s1, s2, ..., sn) a una combinacion particular de estrategias individuales.Finalmente, la informacion respecto a las preferencias o pagos puede ser resumidas en funciones deutilidad que asocian a cada perfil de estrategias s un numero real ui(s), de modo que si un perfil s espreferido a un perfil s por el individuo i, se cumple que ui(s) > ui(s).

4

Definicion 1. Un juego en forma normal viene dado por:

1. Un conjunto de n jugadores, denotado por I

2. Para cada jugador i = 1, ..., n, un conjunto de estrategias Si que define las estrategias disponiblespara cada uno

3. Una funcion de utilidad ui(s1, ..., sn) para cada jugador i = 1, ..., n, que define el pago que recibeel jugador i si el juego se resuelve segun el perfil (s1, ..., sn)

Formalmente, podemos resumir toda la informacion del juego en una estructura G = 〈I, {Si}ni=1, {ui}ni=1〉

Esta forma de definir un juego es particularmente conveniente para el caso de juegos estaticos,donde cada jugador elige simultaneamente una accion entre un conjunto de posibilidades. Por ejemplo,para el caso del dilema del prisionero tenemos que el conjunto de estrategias de cada jugador es Si ={Callar, Confesar} y un posible perfil de estrategias serıa (Callar, Callar).5 La funcion de utilidad eneste caso es discreta, y se puede escribir como:

u1(s1, s2) =

−1 si (s1, s2) = (Callar, Callar)−9 si (s1, s2) = (Callar, Confesar)

0 si (s1, s2) = (Confesar, Callar)−6 si (s1, s2) = (Confesar, Confesar)

y de forma analoga para el jugador 2. Notar que en este ejemplo en particular se trata de un juegosimetrico, donde las estrategias y los pagos son iguales para cada jugador. En general, esto no tienepor que ser ası, y podemos pensar en juegos donde cada jugador toma distintas decisiones y/o tienediferentes preferencias sobre los potenciales resultados.

Por su parte, para el caso de la competencia a la Cournot con n firmas, el juego queda definido porlos siguientes elementos:

I = {1, 2, ..., n}

Si = R, para cada i en I

ui(q1, ..., qn) =(A−

∑nj=1 qj

)qi − cqi, para cada i en I

Podemos notar que aunque este juego es mucho “mas grande” que los juegos de la introduccion, enel sentido de que hay n jugadores e infinitas estrategias disponibles para cada uno, la forma normal del

4Notar que, tal como estudiamos en Microeconomıa I, la funcion de utilidad tiene un caracter ordinal. Esto es, losnumeros que entrega no tienen necesariamente interpretacion en si mismo, sino que indican la preferencia de un resultadodel juego por sobre otro

5Una aclaracion de notacion: en el primer caso utilizamos los sımbolos { } porque estamos haciendo referencia a unconjunto -el de todas las opciones disponibles para el jugador i-, mientras que en ultimo utilizamos ( ) porque se tratade un par ordenado -el que indica las estrategias seguidas por los jugadores 1 y 2 respectivamente.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 7

juego resume toda la informacion relevante de una forma comoda y nos permitira utilizar el instrumentalque estudiaremos en las secciones siguiente sin restringirnos a estructuras muy particulares (como loson, por ejemplo, las matrices de pagos).

1.3. Estrategias dominantes y dominadas

El objetivo de estudiar teorıa de juegos es ser capaces de hacer predicciones sobre cual resultadopodrıamos esperar que se diera en una situacion estrategica. Ası, el paso natural luego de formalizarla idea de juego es preguntarse como lo resolvemos, o mas en general, que podemos decir respecto delcomportamiento esperado de los jugadores. Los conceptos presentados a continuacion son una primeraaproximacion a estas preguntas.

Consideremos a un jugador en el ejemplo del dilema del prisionero. El sujeto en cuestion probable-mente se estarıa preguntando si su complice va a confesar o guardara silencio. Si el otro va a confesar,entonces lo mejor para el serıa confesar tambien, pues de ese modo pasarıa 6 meses en prision, en vezde los 9 a los que es sentenciado si callase. Por otra parte, si el otro guarda silencio entonces el jugadorpreferirıa confesar, pues ası sale libre por cooperar con la policıa, en vez de pasar un mes cumpliendosentencia. Lo clave es entonces, que no importa la estrategia que siga el otro, al sujeto siempre le con-vendra confesar. En este caso, diremos que “confesar” es una estrategia dominante para el jugador, yaque otorga un pago mayor sin importar cual es la estrategia que siga el otro.

Definicion 2. Una estrategia es una estrategia dominante para un jugador, si esta entrega el mejorpago para ese jugador, sin importar cual estrategia sigan los demas jugadores.

En el caso del dilema del prisionero, la estrategia “confesar” es dominante para cada jugador, por loque proponer que ambos seguiran esta estrategia parece una prediccion natural. Ası, de acuerdo a estecriterio, el resultado del juego serıa (confesar, confesar) segun lo cual cada jugador recibe un pago de(−9).

Aunque plantear que un jugador siempre preferira una estrategia dominante por sobre otras estra-tegias resulta muy intuitivo y es potencialmente una buena prediccion de los resultados de un juego,nos enfrentamos al problema de que no siempre existiran este tipo de estrategias. En efecto, en generaltendremos que la estrategia optima de cada jugador variara segun las estrategias que sigan los demas,lo cual es un elemento la mayorıa de las veces relevante en situaciones estrategicas. Ası, el concepto deestrategia dominante puede ser muy atractivo, pero poco util en muchas aplicaciones.

Cuando nos enfrentamos a juegos donde no existen estrategias dominantes, podemos utilizar otroconcepto util e intuitivo: estrategia dominada. En palabras simples, una estrategia es dominada si existeotra estrategia que siempre resulta mas conveniente. Consideremos el siguiente ejemplo para ver deque se trata:

Jugador B

Izquierda Centro Derecha

Jugador A

Arriba 10,10 14,12 14,15

Medio 12,14 20,20 28,15

Abajo 15,14 25,28 25,25

Figura 1.4: Estrategias dominadas

Comprobemos en primer lugar que no existen estrategias dominantes. En efecto, si el jugador Bjuega centro, el A preferira abajo (porque 25 es preferido a 20 y a 14), mientras que si el B elige derecha,

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 8

entonces al A le convendra jugar medio (porque 28 es preferido a 25 y a 14). Ası, no existe una estrategiapara el jugador A que sea optima en cualquier caso (de forma analoga se puede comprobar que para elB tampoco existe).

No obstante, en este juego sı existen estrategias dominadas. Por ejemplo, la estrategia “arriba” esdominada por la estrategia “medio” para el jugador A, ya que esta ultima le entrega un pago mayor sinimportar lo que haga el B (12 > 10, 20 > 14, y 28 > 14). Ası, aun cuando “medio”no es una estrategiadominante segun lo discutido en el parrafo anterior, sı es correcto afirmar que domina a la estrategia“arriba”.

Definicion 3. La estrategia s′i esta estrictamente dominada por la estrategia s′′i para el jugador i, sies que ui(s1, ..., s

′′i , ..., sn) > ui(s1, ..., s

′i, ..., sn) para cualquier combinacion de estrategias de los demas

jugadores (s1, ..., si−1, si+1, ..., sn).

De la definicion se desprende que la estrategia s′′i no es necesariamente una estrategia dominante, yaque es superior bajo cualquier circunstancia solamente respecto de la estrategia s′i. En nuestro ejemplovimos que la estrategia “medio” del jugador A no siempre es superior a la estrategia “abajo”, puesdependıa de la estrategia jugada por B; sin embargo, es claro que “medio” sı es superior a “arriba”, sinimportar lo que haga B.

Como no existe una estrategia dominante, no podemos aplicar el criterio utilizado en el dilemadel prisionero para proponer un potencial resultado del juego. ¿En que nos pueden ayudar entonces lasestrategias dominadas?. Una idea natural es pensar que un jugador nunca utilizara una estrategia estric-tamente dominada, pues no importa que supuesto haga sobre la estrategia que seguira el otro jugador,siempre tendra una alternativa superior a la estrategia que esta dominada. Mas aun, si nos ponemos enel lugar del jugador B -quien esta conjeturando sobre la posible estrategia que seguira su contraparte-es razonable pensar que descartara la posibilidad de que el jugador A siga una estrategia estrictamen-te dominada, como lo es la estrategia “arriba”. Ası, ambos jugadores eliminaran esta posibilidad y seenfocaran en un juego reducido que no considera la estrategia estrictamente dominada:

Jugador B

Izquierda Centro Derecha

Jugador AMedio 12,14 20,20 28,15

Abajo 15,14 25,28 25,25

Figura 1.5: Juego reducido

Si analizamos para este nuevo juego las posibilidades del jugador B, notaremos que la estrategia“centro” es estrictamente dominante. Como la existencia de una estrategia estrictamente dominanteno es mas que un caso en el que todas las estrategias -excepto una- estan estrictamente dominadas,utilizando el mismo criterio que en el paso anterior podemos eliminar “izquierda” y “derecha” paraobtener una nueva version reducida del juego.

Jugador B

Centro

Jugador AMedio 20,20

Abajo 25,28

Figura 1.6: Juego reducido

En este ultimo juego, mucho mas sencillo que el original, se tiene que el jugador A tiene certeza

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 9

respecto del resultado de su decision, por lo que seguira la estrategia que le otorga un mayor pago:“abajo”.6 Este proceso se denomina eliminacion iterativa de estrategias estrictamente dominadas. Ası,bajo el criterio de eliminar estrategias estrictamente dominadas, podemos proponer que un resultadoprobable de este juego sera el perfil (abajo, centro).

Definicion 4. Un perfil de estrategias es un equilibrio por eliminacion iterativa de estrategiasestrictamente dominadas si es el unico perfil que sobrevive al procedimiento de eliminacion.

La eliminacion iterativa de estrategias estrictamente dominadas es un criterio mas general que elde estrategias dominantes que revisamos en primer lugar, y por lo tanto es util en mas situaciones.Sin embargo, seguiran existiendo juegos donde no existiran estrategias estrictamente dominadas, porlo cual requeriremos de otros instrumentos para analizarlos y poder proponer posibles resultados. Lasiguiente seccion se dedica a elaborar el concepto mas ampliamente utilizado en teorıa de juegos paraeste proposito, conocido como equilibrio de Nash.

1.4. Equilibrio de Nash

Probablemente el concepto mas importante en teorıa de juegos es el denominado Equilibrio de Nash,llamado ası por el matematico estadounidense John F. Nash, quien gano el premio Nobel de economıaen el ano 1994 por su contribucion fundamental a esta area. La potencia de este concepto radica en quese basa en una idea sencilla, pero muy general, y por lo tanto es util al momento de analizar diversassituaciones estrategicas sin que se requiera la existencia de conceptos mas exigentes, como el de estrategiadominada.

La intuicion detras del equilibrio de Nash (EN), es que si se propone que un juego tendra cierto perfilde estrategias como resultado, lo mınimo que se puede pedir es que este perfil sea estrategicamente estable,en el sentido de que ningun jugador tenga incentivos unilaterales a cambiar su estrategia. Dicho de otromodo, si existe alguna razon para pensar que los jugadores seguiran ciertas estrategias7, entonces cadauno de ellos puede hacer esta conjetura. Si bajo esa conjetura algun jugador tiene incentivos a cambiarde estrategia, entonces serıa ingenuo proponer la conjetura como un resultado del juego, ya que aqueljugador con incentivos a desviarse de la estrategia conjeturada probablemente tomara la alternativa quele resulta mas conveniente. Formalmente,

Definicion 5. En un juego de n jugadores, el perfil de estrategias s∗ = (s∗1, ..., s∗n) es un equilibrio de

Nash si, para cada jugador i, s∗i es una mejor respuesta a las estrategias de los otros (n− 1) jugadores.Esto es, la desigualdad:

ui(s∗1, ..., s

∗i , ...s

∗n) ≥ ui(s∗1, ..., si, ..., s∗n)

se cumple para cada posible estrategia si en Si.

Es decir, la estrategia de equilibrio de cada jugador es la mejor respuesta a las estrategias de equilibriode los demas jugadores. Para entender como a partir de esta idea podemos proponer algun resultadopara un juego, resolveremos algunos ejemplos. En el caso del dilema del prisionero, la mejor respuestade cada jugador a cualquier estrategia que pueda seguir su contraparte es “confesar” (una estrategiadominante siempre sera una mejor respuesta). En particular, el perfil (confesar, confesar) es un EN,ya que ambos estan jugando su mejor respuesta a la estrategia del otro. Tambien se puede ver que noexisten incentivos unilaterales a desviarse, ya que la alternativa “callar” disminuye el pago desde (−6)a (−9) dado que el otro esta jugando “confesar”.

6Tambien podemos decir que la estrategia “medio” esta estrictamente dominada por “abajo” y eliminarla tal como lohicimos en las iteraciones anteriores.

7Por ejemplo, imaginemos que cada jugador anuncia la estrategia que planea seguir a todos los demas.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 10

Una forma conveniente de computar el equilibrio de Nash cuando escribimos el juego en forma matri-cial es ir analizando cual es la mejor respuesta a cada posible estrategia del otro jugador, y subrayandoel mayor pago para indicar que la estrategia asociada a esa celda es la optima. Esto esta ejemplificadopara el caso del dilema del prisionero en la figura 1.7, donde el hecho de que en la celda asociada alperfil (confesar, confesar) ambos pagos esten subrayados, nos indica que encontramos un EN.

Prisionero 2

Callar Confesar

Prisionero 1Callar -1, -1 -9, 0

Confesar 0, -9 -6,-6

Figura 1.7: Mejores respuestas en dilema del prisionero

El ejemplo del dilema del prisionero ilustra un resultado interesante: todo equilibrio bajo eliminacioniterativa de estrategias estrictamente dominadas es un equilibrio de Nash. Sin embargo, la implicanciava en una sola direccion, en tanto no todo EN sera un equilibrio segun eliminacion iterativa. El hecho deque -como veremos a continuacion- es posible que exista EN cuando no existen estrategias dominadases evidencia de este ultimo punto.

Un caso mas interesante que el dilema del prisionero sera un juego donde la eliminacion iterativano nos entregue ninguna prediccion del resultado del juego (porque no existen estrategias estrictamentedominadas), y sin embargo sı exista un EN. Consideremos entonces el ejemplo dado por la matriz de lafigura 1.8.

Jugador Columna

I C D

Jugador Fila

A 0,4 4,0 5,3

M 4,0 0,4 5,3

B 3,5 3,5 6,6

Figura 1.8: Buscando EN cuando no existen estrategias dominadas

El lector ya debiese ser capaz de verificar que este juego no tiene estrategias estrictamente domina-das. Para buscar un EN, hacemos el analisis de mejor respuesta: si el jugador columna fuera a jugar I,por ejemplo, la mejor respuesta del jugador fila serıa M , puesto que 4 es mayor que 3 y que 0; por ello, laganancia de 4 que recibe el jugador fila en la celda (M , I) de la matriz esta subrayada. De forma analo-ga encontramos la mejor respuesta ante las estrategias C y D, que son A y B, respectivamente. Luegobuscamos las mejores respuestas del jugador columna (lo que es directo, ya que el juego es simetrico), yobtenemos ası que el perfil (B,D) es un EN para este juego.

Funcion de respuesta optima

Para computar el EN en los ejemplos anteriores, hemos analizado la mejor respuesta de un jugador acada posible estrategia del otro. Esto nos permite encontrar de forma directa el par de estrategias bajolas cuales nadie tiene incentivos unilaterales a desviarse. En el caso de juegos con estrategias continuaspodemos encontrar un EN bajo el mismo principio, aunque con una tecnica diferente.

Consideremos el ejemplo de competencia a la Cournot planteado en la seccion (1.2). En ese caso,como los jugadores tienen infinitas estrategias a su disposicion, no es posible ir verificando la respuestaoptima para cada caso como lo hacemos en los juegos matriciales. No obstante, podemos preguntarnos

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 11

cual es la respuesta optima de una de las firmas ante una cantidad fija arbitraria de su competidora.Por ejemplo, fijemos la produccion de la firma 2 en un nivel q2. Siendo ese el caso, la respuesta optimade la firma 1 corresponde a la solucion del problema:

max{q1}

(A− q1 − q2)q1 − cq1

La condicion de primer orden del problema es A − 2q1 − q2 − c = 0, a partir de la cual obtenemos lasolucion q∗1 = A−q2−c

2 . Pero q2 es una cantidad arbitraria, por lo tanto lo que hemos encontrado es enrealidad la funcion que nos indica cual es la cantidad optima para la firma 1 ante cualquier nivel deproduccion de la firma 2:

q1(q2) =A− q2 − c

2

Esta ultima se conoce como funcion de respuesta optima o funcion de reaccion, en este caso, de lafirma 1.8 Como el problema es simetrico, la funcion de reaccion de la firma 2 es completamente analoga:

q2(q1) =A− q1 − c

2

La utilidad de obtener este resultado radica en el hecho de que nos permite calcular de forma sencillael equilibrio de Nash de este juego. En efecto, si existe un par (q1, q2) tal que ningun jugador tengaincentivos a desviarse, ese par constituira un EN. Pero esto ocurre en el punto donde las funcionesde reaccion coinciden (graficamente se intersectan), por lo que encontrar el EN del juego se reduce aresolver el sistema de ecuaciones dado por las dos funciones de respuesta optima. Al resolver el sistemase obtiene el resultado:

qN1 = qN2 =A− c

3

donde utilizamos el supraındice N para indicar que corresponde a la cantidad de EN.

Cabe destacar que el procedimiento recien desarrollado no es diferente del aplicado en el caso de losjuegos matriciales, donde lo que hacemos es computar la funcion de reaccion para el caso en el cual losespacios de estrategia son discretos y luego buscar un perfil donde estas coincidan. La unica diferenciaes que como en este caso las estrategias son continuas, podemos utilizar las herramientas de calculodiferencial para obtener el resultado.

Sobre la unicidad del EN

Volvamos ahora al ejemplo de la Batalla de los Sexos, el cual resolveremos para aprender otroelemento relevante del EN. A continuacion se muestra la matriz de pagos con los pagos asociados a lasmejores respuestas ya subrayados:

Manuel

Futbol Museo

JosefaFutbol 2,1 0,0

Museo 0,0 1,2

Figura 1.9: Batalla de los sexos y mejores respuestas

8Notar que esta es la respuesta optima para niveles de q2 menores a A − c. Si q2 > A − c, la respuesta optima esproducir cero porque ela firma 2 ha saturado el mercado y el precio asociado es muy bajo.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 12

En este caso, tal como en el juego de la figura 1.8, la mejor respuesta varıa junto con la estrategiadel otro jugador. Pero lo interesante ahora es que, como se desprende a partir de la matriz, existen dosperfiles en los cuales la mejor estrategia coincide. ¿Significa esto que no existe equilibrio de Nash?. Alcontrario, lo que ocurre en este caso es que existen 2 equilibrios de Nash, pues cada perfil de estrategiascumple con la definicion de que la estrategia de cada jugador es mejor respuesta a las estrategias seguidaspor los demas. Ademas, es facil ver que -por ejemplo- dado el perfil (futbol, futbol), ningun jugadortienen incentivos unilaterales a desviarse.

Este ejemplo nos muestra que el EN no tiene por que ser unico, y que pueden existir 2 o incluso masperfiles que cumplan con la definicion de equilibrio. Lo que sı ocurre en este caso, es que se pierde laposibilidad de hacer una prediccion unıvoca respecto del resultado que se observara en esta situacionestrategica. En las secciones posteriores veremos cuales son las alternativas que tenemos en estos casos,respecto de si podemos inclinarnos por un equilibrio por sobre el otro, o si existe otro tipo de prediccionque pueda ayudarnos a precisar el posible resultado del juego.

Sobre la existencia del EN

Una ultima arista del concepto de EN que es relevante discutir en este momento, dice relacion consu existencia. Consideremos el juego de Matching Pennies que fue explicado en la introduccion, y cuyamatriz de pagos reescribimos aquı incluyendo las mejores respuestas:

Jugador 2

Cara Sello

Jugador 1Cara 1,−1 −1, 1

Sello −1, 1 1,−1

Figura 1.10: Matching Pennies

Al analizar las mejores respuestas en este juego, se observa que no existe ningun perfil de estrategiasen el cual se cumpla la definicion de EN. Esto resulta intuitivo si consideramos el hecho de que no existeninguna combinacion de estrategias bajo la cual no existan incentivos a desviarse: si ambos mostraron lamisma cara, entonces el jugador 2 preferirıa cambiar de estrategia; mientras que si mostraron distintascara, el primer jugador tendra incentivos a desviarse.

Este ejemplo ilustra que el concepto de EN no sera una herramienta infalible al momento de analizarlos posibles resultados de un juego, por el simple hecho de que no siempre existira un EN, al menoscomo lo conocemos hasta ahora. Al igual que con el problema de la multiplicidad de equilibrios, en lassecciones subsecuentes analizaremos algunos conceptos a los cuales podremos echar mano cuando noexista equilibrio de Nash.

1.5. Estrategias mixtas

Para motivar la idea de estrategia mixta, recordemos el ejemplo del tiro penal en un juego de futbolque planteamos en la introduccion. Lo modelamos concretamente como se muestra en la matriz de pagosde la figura 1.11, donde las estrategias D e I corresponden a derecha e izquierda respectivamente.9

Ademas, aunque suponemos que cuando el arquero ataja el gol los pagos son (0, 0), es importante notarque en terminos estrategicos este juego no es diferente de matching pennies (el orden de preferenciassobre los posibles resultados del juego es el mismo, aunque los numero en particular sean diferentes).

9Para los que no son seguidores del futbol, se aclara que Alexis serıa el pateador e Iker el arquero.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 13

Iker

D I

AlexisD 0,0 1,-1

I 1,-1 0,0

Figura 1.11: Penal de futbol

En una situacion de este tipo existe un elemento fundamental para ambos jugadores, el cual esla posibilidad de sorprender al otro. En efecto, si es que por algun motivo Alexis supiera con certezaen que direccion saltara Iker, entonces podrıa lograr su mejor resultado pateando el balon en la otradireccion. Del mismo modo, si Iker supiera de antemano la direccion del tiro, podrıa saltar correctamentey atajarlo. Ası, dada la incertidumbre que tiene cada uno respecto de la estrategia del otro, a un delanteroo arquero en la realidad le convendra jugar algunas veces I y algunas otras D. Si Iker saltase siempreen la misma direccion serıa una estrategia perdedora, puesto que el otro sabrıa en que direccion tirarpara convertir con seguridad.

Otro ejemplo de una situacion que es interesante de modelar bajo la perspectiva de juegos, es larelacion entre una entidad fiscalizadora y un agente que debe cumplir cierta obligacion por ley. Porejemplo, podemos pensar en el Servicio de Impuestos Internos (SII) y un contribuyente que se esta cues-tionando si disminuye o no su carga tributaria de alguna forma ilegıtima (evasion). Para el SII resultacostoso hacer una auditorıa para fiscalizar si se esta evadiendo el pago de impuestos, por lo que no esobvio que siempre deba auditar. Por su parte, el contribuyente obtiene un beneficio evadiendo el pagode impuestos, pero se enfrenta a un castigo si es que es descubierto. Ası, la incertidumbre constituyeparte fundamental de la interaccion estrategica, pues el contribuyente estara considerando cual es laprobabilidad de ser auditado al momento de decidir si evade, mientras que el SII evalua la probabilidadde efectivamente descubrir un evasor al momento de realizar una auditorıa que le resulta costosa. Po-demos pensar ejemplos similares con firmas que deben cumplir estandares medioambientales, y el enteregulador que las fiscaliza.

Esta idea de darle relevancia a la incertidumbre y pensar que para un jugador lo optimo no escomprometerse con una estrategia en particular (saltar siempre a la izquierda), sino que variar suestrategia si el juego hipoteticamente se repitiese (algunas veces saltar a la izquierda y otras a la derecha),tiene una expresion concreta en teorıa de juegos conocida como estrategias mixtas. Cuando analicemosun juego desde esta perspectiva, pensaremos que los jugadores ya no eligen una estrategia particularde su conjunto de posibilidades, sino que eligen una probabilidad con la cual jugaran cada estrategia.Por ejemplo, en el juego del penal, una estrategia mixta particular serıa jugar con probabilidad 1/3 laestrategia I, y con probabilidad 2/3, la D. Ası, para un jugador que dispone de dos estrategias, unaestrategia mixta consiste en elegir un numero p en el intervalo [0, 1], de modo que p y (1 − p) son lasprobabilidades con las que jugara una estrategia o la otra.

En general, si un jugador i dispone de un conjunto Si con L estrategias, Si = {si1 , si2 , ..., siL}, unaestrategia pura consiste en elegir un elemento particular de este conjunto (este es el concepto que hemosutilizado en las secciones anteriores y que de ahora en adelante llamaremos estrategia pura). En cambio,una estrategia mixta consiste en elegir un vector p = (p1, p2, ..., pL), donde pl denota la probabilidadcon la que jugara la estrategia sil ∈ Si. Como lo que esta eligiendo es una distribucion de probabilidadessobre los elementos del conjuntos Si, este vector tiene que cumplir con las propiedades que por definicionposee una distribucion. Estas son:

1.L∑l=1

pl = 1

2. 0 ≤ pl ≤ 1, para cada l ∈ {1, 2, ..., L}

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 14

Es fundamental notar que al hacer esto, cambiamos la decision que debe tomar el individuo. Si antesdebıa elegir un elemento de su conjunto de posibilidad Si, ahora debe elegir un vector entre todos aquellosque cumplen las propiedades recien enunciadas. Para que este cambio en las posibilidades de cada agentenos sea util, resulta necesario definir una funcion de utilidad acorde a las nuevas estrategias. La ideanatural en este caso es que dado un perfil de estrategias mixtas, el pago de cada jugador corresponde ala utilidad esperada que se deriva de las probabilidades elegidas por cada uno.

Para aclarar esta idea, construiremos las funciones de utilidad esperada para el juego del penal. Sea pla probabilidad con la que Alexis juega D, y sea q la probabilidad con la que Iker juega D. Ası, tenemosque -por ejemplo- el perfil (D, I) ocurre con probabilidad p · (1 − q), el cual entrega pagos 1 y -1 aAlexis e Iker, respectivamente. Esta informacion, para cada perfil de estrategias puras, se resume en lasiguiente tabla:

Perfil Probabilidad Pago Alexis Pago Iker

(D,D) p · q 0 0(D, I) p · (1− q) 1 -1(I,D) (1− p) · q 1 -1(I, I) (1− p) · (1− q) 0 0

Con la informacion anterior, se tiene que el pago esperado de Alexis, dado un perfil (p, q) es de

uA(p, q) = p · q · 0 + p · (1− q) · 1 + (1− p) · q · 1 + (1− p)(1− q) · 0= p(1− 2q) + q,

mientras que para Iker, de forma analoga se obtiene

uI(p, q) = p · q · 0 + p · (1− q) · (−1) + (1− p) · q · (−1) + (1− p)(1− q) · 0= q(2p− 1)− p

Ası, tenemos un nuevo juego asociado al juego original, pero en el cual los espacios de estrategiasson distintos10 y se tiene una funcion de utilidad adecuada a aquellos espacios. La pregunta natural eneste punto serıa, ¿cual es el equilbirio de Nash de este nuevo juego, si es que existe? Para responderla,no necesitamos saber nada nuevo sobre el EN, pues simplemente aplicamos la definicion ya estudiada aljuego “modificado”.

Tal como hicimos en la seccion anterior, utilizaremos la funcion de respuesta optima para computarel EN. Recordemos que Alexis elige p en el intervalo [0, 1] y que su funcion de utilidad viene dada poruA(p, q) = p(1 − 2q) + q. En primer lugar, se tiene que dada una estrategia q cualquiera de Iker, elsegundo termino de la suma esta fijo para el jugador 1. Ası, basta notar que cuando (1 − 2q) > 0, lomejor que puede hacer Alexis es elegir p = 1, mientras que si (1 − 2q) < 0 la respuesta optima serıaelegir p = 0. En cambio, si es que (1 − 2q) = 0 cualquier valor de p sera optimo, en tanto su utilidadno dependera de su estrategia sino que estara fija. Reescribiendo las condiciones para cada caso comoq R 1

2 , podemos resumir este analisis en la siguiente funcion de reaccion11:

p(q) =

1 si q < 12

0 si q > 12

[0, 1] si q = 12

10En estrategias mixtas cada jugador tiene disponible infinitas estrategias aun cuando solo existan 2 estrategias puras,ya que el conjunto factible [0, 1] es un continuo de numeros reales.

11Tecnicamente, la mejor respuesta no es una funcion, pues las funciones por definicion asocian puntos de un conjuntocon puntos de otro. En cambio, lo que observamos en este caso es que al evaluar p(q) en q = 1

2no obtenemos un punto

en particular, sino que un conjunto de ellos (el de todos los valores que son una respuesta optima). En matematicas estas“funciones”, que al evaluarlas entregan conjuntos en vez de puntos, se conocen como correspondencias. Aunque esto esrelevante en el estudio formal de teorıa de juegos, no es parte de los temas del curso.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 15

Este resultado es bastante intuitivo, pues nos dice que si Iker fuera a jugar D con mayor probabilidadque I (q > 1

2 ), entonces lo mejor que puede hacer Alexis es patear a la izquierda (p = 0), puesto queel perfil (I,D) lo hace ganar. Del mismo modo, cuando I es mas probable (q < 1

2 ), lo mejor que puedehacer es patear a la derecha, esto es, (p = 1). Finalmente, cuando Iker pone igual probabilidad enambas estrategias, entonces cualquier estrategia es igualmente buena para Alexis, puesto que no hayinformacion que pueda explotar para cargar la balanza a su favor.

Similarmente, la funcion de reaccion de Iker viene dada por:

q(p) =

0 si p < 12

1 si p > 12

[0, 1] si p = 12

Con lo anterior, resulta directo observar que el par de estrategias (p, q) = (12 ,

12 ) es un EN, en tanto

ningun jugador tiene incentivos unilaterales a cambiar de estrategias. Ası, hemos encontrado un EN enestrategias mixtas para un juego que no tenıa equilibrio en estrategias puras. Esto no es casualidad,pues uno de los resultados mas importantes en teorıa de juegos es el teorema de existencia de Nash,cuya version simplificada se entrega a continuacion:

Teorema 1. En un juego G = 〈I, {Si}ni=1, {ui}ni=1〉, donde la cantidad de jugadores y los espacios deestrategias son finitos, siempre existira un equilibrio de Nash en estrategias mixtas.

Es importante notar que una estrategia pura es un caso particular de estrategia mixta. Por ejemplo,en el caso del juego del penal el perfil (p, q) = (1, 1) corresponde al perfil de estrategias puras (D,D).Ası, si en un juego encontramos un equilibrio en estrategias puras, es factible que este sea el unico ENdel juego, ya que el teorema no debe ser interpretado como que siempre existira un equilibrio donde lasprobabilidades sean diferentes de 0 y 1.

Computando equilibrio en estrategias mixtas en juegos de 2× 2

A continuacion se presenta un metodo relativamente heurıstico para encontrar los EN de un juego de2× 2. Para ello, comenzaremos por graficar las funciones de reaccion obtenidas para el juego del penal.En la figura 1.12 dibujamos en rojo la funcion de reaccion de Alexis, p(q), y en azul la Iker, q(p), segunlas condiciones descritas mas arriba. Se puede observar que en este caso el unico perfil de estrategiasdonde estas se intersectan es en el EN ya planteado, p = q = 1

2 .

q

p

1

1 q(p)

p(q)

12

12

Figura 1.12: Juego del penal: Funciones de reaccion

La propuesta para encontrar todos los EN se basa en la idea de que en estos juegos existen dos“tipos” de equilibrio: (i) aquellos en estrategias puras, y (ii) aquellos en los cuales cada jugador, dado

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 16

lo que hace su contraparte, esta indiferente respecto de su propia estrategia ya que no puede afectarsu utilidad. Estos ultimos son los que permiten una estrategia mixta que no sea un caso particular deestrategia pura, esto es, una estrategia donde el parametro de probabilidad se encuentre en el intervaloabierto (0, 1).

Para entender mejor la idea, consideremos el ejemplo de la batalla de los sexos, que como ya vimostiene dos EN en estrategias puras. Si denotamos por p y q la probabilidad con la que Josefa y Manuel,respectivamente, juegan la estrategia “futbol”, podemos plantear las funciones de utilidad esperada paraobtener:

uJ(p, q) = 2pq + (1− p)(1− q) = p(3q − 1)− quM (p, q) = pq + 2(1− p)(1− q) = q(3p− 2)− 2p,

donde uJ y uM son las funciones de utilidad de Josefa y Manuel, respectivamente. Al hacer el analisis demejor respuesta para Josefa, tenemos que existe un punto crıtico para la estrategia de su adversario, q =13 , en el cual ella se encontrara indiferente respecto de su estrategia p. Cuando q > 1

3 le convendra jugarp = 1 y, en caso contrario, le convendra p = 0. Ası, la funcion de reaccion queda de la forma:

p(q) =

1 si q > 13

0 si q < 13

[0, 1] si q = 13

,

y haciendo el mismo analisis para Manuel, obtenemos:

q(p) =

1 si p > 23

0 si p < 23

[0, 1] si p = 12

Al dibujar estas funciones de reaccion en el plano (p, q) obtenemos el grafico de la figura 1.13, dondela lınea roja corresponde a la funcion p(q), y la azul a q(p). En este caso observamos que las funcionesse intersectan en los perfiles asociados a estrategias puras (p, q) = (1, 1) y (p, q) = (0, 0), ademas del ENen estrategias mixtas dado por ( 2

3 ,13 ).

q

p

1

1p(q)

q(p)23

13

Figura 1.13: Batalla de los sexos: Funciones de reaccion

Aplicando este mismo concepto a otros juegos -como el dilema del prisionero- podremos observar queen general nos enfrentaremos a alguno de los casos de funciones de reaccion mostrados en los distintos

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 17

paneles de la figura 1.14. Los paneles (a) y (b) corresponden al caso donde existe un unico equilibrio enestrategias puras, como el dilema del prisionero. Los paneles (c) y (d) muestran el caso en el cual existen2 equilibrios en estrategias puras, con lo cual observamos que siempre existira un tercer equilibrio enestrategias mixtas. Finalmente, los paneles (e) y (f) corresponden al caso en el cual no existen equilibrioen estrategias puras, pero sı existe uno en estrategias mixtas, tal como asegura el teorema de existenciade Nash.

q

p

1

1

(a)

q

p

1

1

(b)

q

p

1

1

V C1

V C2

(c)

q

p

1

1

V C1

V C2

(d)

q

p

1

1

V C1

V C2

(e)

q

p

1

1

V C1

V C2

(f)

Figura 1.14: Casos generales de funcion de reaccion en juegos de 2× 2

El valor V C1 corresponde a la estrategia p, bajo la cual el otro jugador se encuentra indiferente entrecualquier estrategia disponible, esto es, q(V C1) = [0, 1]. Del mismo modo, V C2 corresponde al valor deq que hace indiferente al jugador que elige p, esto es, p(V C2) = [0, 1]. Ası, una vez que encontramos losequilibrios en estrategias puras (si es que estos existen), encontrar los equilibrios en mixtas se reduce-para el caso de juegos de 2× 2- a encontrar las probabilidades de cada jugador que deja indiferente alotro. Notar que este valor no existe en juegos como los de los paneles (a) y (b), ya que en esos caso laexistencia de una estrategia pura dominante, hace imposible que el individuo se encuentre indiferente.

Linealidad del problema individual bajo estrategias mixtas

Para entender que es lo que subyace al metodo recien expuesto, consideremos un juego de 2 × 2generico, donde p y q corresponden a las estrategias mixtas de los jugadores 1 y 2 respectivamente. Si Ay B son las estrategias puras del jugador 1 (donde p corresponde a la probabilidad de jugar la estrategiaA), entonces podemos escribir su utilidad esperada de la siguiente manera:

u1(p, q) = pu1(A, q) + (1− p)u1(B, q)

= p [u1(A, q)− u1(B, q)] + u1(B, q)

Donde u1(A, q) denota la utilidad esperada del jugador 1 cuando juega la estrategia pura A y sucontraparte juega una estrategia mixta cualquiera, q. Lo mismo para u1(B, q), pero con la estrategiapura B. Ası, dado que u1(B, q) es un valor fijo cuando q esta fijo, se tiene que para cualquiera valor q

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 18

tal que u1(A, q) 6= u1(B, q), entonces el valor de p que maximiza u1(p, q) necesariamente tiene que ser 0o 1, dependiendo del signo de la desigualdad u1(A, q) ≷ u1(B, q).

La unica forma en la que el valor optimo de p puede ser estrictamente mayor que 0 y estrictamentemenor que 1, es cuando u1(A, q) = u1(B, q), pues en ese caso el jugador estara indiferente entre cualquiervalor de p perteneciente al intervalo [0, 1]. Esta idea corresponde a la generalizacion de lo observado en losejemplos resueltos anteriormente, en los cuales los equilibrios en estrategias mixtas que no correspondıanal caso particular de estrategias puras, eran aquellos pares (p, q) en los cuales ambos individuos estabanindiferentes respecto de su propia eleccion.

Si definimos p1 = p y p2 = (1− p), podemos graficar este argumento en el plano (p1, p2), tal como semuestra en los graficos de la figura 1.15. La lınea oscura que une a los puntos (1, 0) y (0, 1) correspondeal conjunto de posibilidades del jugador, ya que ahı yacen todos los pares (p1, p2) que cumplen lascondiciones (p1 + p2 = 1) y (0 ≤ p1 ≤ 1). Las lıneas azules corresponden a las curvas de nivel (curvasde indiferencia) de la funcion de utilidad esperada, dado un valor q fijo. En particular, las lınea azulessolidas son las asociadas al maximo nivel de utilidad esperada que puede alcanzar el jugador, mientrasque las punteadas muestran como otras estrategias distintas a las optimas entregan una menor utilidadesperada.

p1

p2

1

1

(a) u1(A, q) > u1(B, q)

p1

p2

1

1

(b) u1(A, q) < u1(B, q)

p1

p2

1

1

(c) u1(A, q) = u1(B, q)

Figura 1.15: Optimizacion bajo estrategias mixtas en un juego de 2× 2

Ası, se observa que dependiendo de la relacion u1(A, q) R u1(B, q), se tendra que el valor optimo dep sera una solucion esquina -como en los paneles (a) y (b)-, excepto cuando la pendiente de la curvade indiferencia es igual a (-1) -como en el panel (c)-, en cuyo caso el individuo esta indiferente entrecualquier par (p1, p2).

Observacion. Un punto que se deriva de la discusion anterior, y que conviene tener presente almomento de computar equilibrio en este tipo de juegos porque puede resultar un poco contra-intuitivo,es que de la condicion de indiferencia de un individuo se obtiene la estrategia de equilibrio del otro.Por ejemplo, cuando planteamos la condicion u1(A, q) = u1(B, q), lo que podremos despejar sera unvalor q. Del mismo modo, la condicion de indiferencia del jugador 2 nos permitira despejar un valorp. Ası, la estrategia de cada jugador no sera relevante para sı mismo, porque de hecho cada individuoestara indiferente entre cualquiera de sus estrategias factibles. Sin embargo, la indiferencia nos permi-te proponer que, bajo ese par de estrategias en particular, no existiran incentivos unilaterales a desviarse.

Dominancia en estrategias mixtas

Una ultima dimension de las estrategias mixtas que mencionaremos, dice relacion con el conceptode dominancia estudiado anteriormente. Consideremos el juego abstracto planteado en la matriz de lafigura 1.16. Omitimos los pagos del jugador 2, porque no seran relevantes para el ejemplo.

En este caso, para el jugador 1 no existe ninguna estrategia dominada, al menos en el sentido que

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 19

Jugador 2

D I

Jugador 1

A 3, 0,

M 0, 3,

B 1, 1,

Figura 1.16: Dominancia en estrategias mixtas

estudiamos anteriormente. Sin embargo, si consideramos estrategias mixtas en nuestro analisis, parecerazonable pensar que una combinacion de las estrategias A y M puede resultar mejor que la estrategia B.En efecto, si tomamos la estrategia mixta p = (1/2, 1/2, 0) se tiene que la utilidad esperada del jugador1 sera igual a 1.5, sin importar la estrategia que siga el jugador 2. Ası, esta estrategia mixta domina a laestrategia pura D. Recordemos que las estrategias puras son un caso particular de estrategia mixta, queen este caso serıa p = (0, 0, 1). Ası, aunque en estrategias puras no exista dominancia, sı puede existirdominancia en estrategias mixtas.

1.6. Juegos secuenciales

Todos los juegos que hemos estudiado en las secciones anteriores corresponden, de acuerdo a latipologıa mencionada en la introduccion, a juegos estaticos de informacion completa. Pero muchas si-tuaciones de interes economico que involucran interaccion estrategica tienen una dimension dinamicarelevante, que no es capturada por el marco teorico que manejamos hasta el momento. Pensemos, porejemplo, en una industria como el retail donde compiten pocas empresas de gran tamano. Es naturalpensar que si una de las firmas observa las decisiones de sus competidoras antes de tomar su propiadecision, entonces su comportamiento sera diferente de aquel que seguirıa si las decisiones se tomarande forma simultanea. Al mismo tiempo, si una de las firmas sabe que las demas observaran su decisionantes de actuar, entonces tendra en cuenta como este elemento afecta lo que haran sus competidoras ytendra un efecto sobre su propia decision.

Por lo anterior, nuestro siguiente objetivo sera el estudio de juegos dinamicos de informacion com-pleta. Es decir, incorporaremos la dimension temporal en el analisis de diferente situaciones estrategicas,pero siempre manteniendonos bajo el supuesto de que las funciones de pago son conocidas por todos(esto es lo que llamamos informacion completa en la introduccion). Esto implica que cada jugador tieneperfecto conocimiento de los intereses que tienen los demas sobre los distintos resultados del juego, ypor lo tanto, que las decisiones observadas no entregan informacion adicional a este respecto.12

Como mencionamos anteriormente, la forma extensiva de un juego resultara mas conveniente e intui-tiva cuando nos interesemos en juegos dinamicos. Pero antes de introducir este concepto formalmente,analizaremos algunos ejemplos donde se observa cuales son los principales conceptos que se tienen enmente al estudiar este tipo de situaciones. Pensemos que dos paıses, A y B, se enfrentan en un conflictoarmado, en el cual A esta decidiendo si invade o no a B. Si el primero decide invadir, entonces el se-gundo debe decidir entre batallar para defenderse o rendirse. Esta dinamica se resume en el arbol de lafigura 1.17, donde los cırculos negros corresponden a nodos de decision y las ramas que nacen de cadauno de ellos indican el conjunto de decisiones disponibles en ese nodo. Por su parte, los cırculos grisescorresponden a nodos terminales, cada uno de los cuales es un resultado particular del juego, al que sellegara o no dependiendo de las decisiones de los jugadores.

12La revelacion de informacion privada a traves de las decisiones -y la interaccion estrategica que esto implica- es unacaracterıstica fundamental de los juegos de informacion incompleta, como veremos en los modelos estudiados en el capıtulode economıa de la informacion.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 20

A

B

(7,2)

(9,6)

(8,8)

Invadir

No invadir

Pelear

Rendirse

Figura 1.17: Arbol de un juego dinamico

Es importante notar que cada nodo de decision tiene una etiqueta que indica quien decide en esenodo (o a quien le corresponde jugar), mientras que cada rama tiene una etiqueta que indica la accion ala cual esta asociada. Por su parte, cada nodo terminal tiene una etiqueta con los pagos asociados a eseresultado particular del juego. En nuestro ejemplo, los pagos indican que el paıs A prefiere la situacionen la que invade y su enemigo se rinde, luego aquella en la que no invade, y finalmente aquella en la queinvade y su enemigo se defiende. Por su parte, el paıs B prefiere no ser invadido, pero en caso de serinvadido prefiere rendirse antes que pelear.

¿Que resultado podemos esperar en este juego? Para tener una primera aproximacion, escribiremosel juego en su forma normal, lo que para este caso es sencillo ya que cada jugador solo enfrenta un nodode decision, con dos posibles acciones cada uno (por lo tanto, queda como una matriz de 2 × 2). Estonos permitira encontrar los EN del juego tal como lo hemos venido haciendo hasta ahora.

Paıs B

Pelear Rendirse

Paıs AInvadir 7,2 9,6

No invadir 8,8 8,8

Figura 1.18: Juego de invasion en forma normal

Observemos que existen dos EN en este juego, dados por los perfiles (No invadir, Pelear) e (Invadir,Rendirse). El primero es un EN porque si el paıs B esta dispuesto a pelear, entonces el A prefiere noinvadir y nadie tiene incentivos a desviarse. El segundo es EN porque cuando el paıs A invade el Bprefiere rendirse, y dado esto, ocurre que ninguno querra desviarse.

Al escribir el juego en forma normal estamos haciendo abstraccion de la dimension dinamica delproblema, y conviene preguntarnos si esto tiene implicancias sobre la precision del analisis que esto nospermite hacer. Analicemos, en particular, el equilibrio (No invadir, Pelear): es claro que el paıs A notiene incentivos a desviarse, porque el resultado en el que terminan batallando es el menos preferido parael. Sin embargo, ese argumento se basa en una estrategia poco creıble de parte del paıs B: Pelear. Siobservamos el arbol, salta a la vista que antes una invasion, la mejor respuesta del paıs B es Rendirse. Porlo tanto, parece natural mostrarse esceptico si alguien propone que (No invadir, Pelear) es un resultadopredecible para este juego.

Por su parte, el EN dado por el perfil (Invadir, Rendirse) no presenta este problema, puesto quecomo ya hemos dicho, cuando el paıs A ataca lo racional para el paıs B es rendirse, y nadie tieneincentivos a desviarse. Entonces surge la pregunta, ¿es este equilibrio de alguna manera “mejor” que elequilibrio (No invadir, Pelear)?. La respuesta es sı: aunque ambos son equilibrios de Nash del juego, elperfil (Invadir, Rendirse) es, ademas, un Equilibrio Perfecto en Subjuegos (EPS). Aunque este nombreparece extrano dado que aun no hemos definido lo que es un subjuego, lo clave respecto del concepto eslo que observamos en el ejemplo: el equilibrio no esta basado en amenazas no creıbles.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 21

Induccion hacia atras

Dada la discusion de los parrafos anteriores, surge la pregunta de como diferenciar un EN de unEPS. Afortunadamente existe un metodo muy sencillo para encontrar los EPS de los juegos en los queestaremos interesados, conocido como induccion hacia atras. Este consiste, como su nombre lo indica,en comenzar por los nodos de decision finales y analizar que harıan los jugadores en cada uno de ellos.Una vez que se tiene la respuesta optima, se avanza hacia los nodos predecesores, y en cada uno de ellosse analiza cual es la estrategia mas conveniente dado que en los nodos sucesores cada jugadorelegira su estrategia optima.

Veamos como funciona en el ejemplo anterior. El analisis comienza en el nodo donde decide elpaıs B, y consiste en definir la accion optima si le tocase jugar en ese nodo en particular: esta accionsera Rendirse, dado que el pago asociado a esta decision (6) es mayor que el pago de Pelear (2). Elsiguiente paso es ir al nodo de decision precedente (en el cual decide A), y determinar la accion optimadado que el paıs B elegira Rendirse en caso de llegar al nodo en el cual debe decidir. Como el pago de8 asociado a No Invadir es menor que el de 9 asociado a Invadir (el que a su vez esta determinado porla accion optima Rendirse), entonces nos quedamos con la accion de Invadir. Ası, el EPS de este juegoviene dado por el perfil (Invadir, Rendirse), tal como habıamos propuesto anteriormente.

Para enriquecer el entendimiento de la induccion hacia atras, consideremos un ejemplo un poco maselaborado. Un sujeto entra a un banco, se acerca a un cajero y le dice que si no le entregan el dinerode la boveda hara explotar una bomba que lleva consigo. La situacion que nos interesa modelar en estecaso es dinamica, pues nos enfocamos en la decision del cajero de entregar o no entregar el dinero, ydado esto, la decision del asaltante de explotar o no la bomba. El arbol del juego se presenta en la figura1.19.

IIa(Asaltante)

Bomba No Bomba

Entregar No Entregar

No BombaBomba

I (Cajero)

IIb (Asaltante)

uc = −1

ua = −1

uc = 1

ua = 1

uc = −1

ua = −1

uc = 2

ua = 0

Figura 1.19: Asalto a un banco

Los pagos representan la idea de que, sea cual sea la decision del cajero, el resultado en el cual elasaltante explota la bomba es el menos preferido para ambos. Respecto a los resultados en los cualesno explota la bomba, el cajero prefiere aquel en el que no entrega el dinero, mientras que el asaltante-obviamente- prefiere aquel en el cual le entregan su botın.

Resolvamos el juego por induccion hacia atras. Si el asaltante se ubica en el nodo en el que le entreganel dinero, entonces su decision optima es No Bomba. Ahora, si lo ubicamos en el nodo en el cual no leentregan el dinero, su decision optima tambien sera No Bomba (aquı esta la clave para la existencia deuna amenaza no creıble). A continuacion analizamos la decision del cajero, dadas las decisiones optimasdel asaltante: si entrega el dinero recibira un pago de 1, mientras que si no lo entrega recibira un pagode 2. Por lo tanto, la decision optima del cajero sera No Entregar. Por lo tanto, el resultado del juegosegun el metodo de induccion hacia atras sera que el cajero no entrega el dinero y el asaltante no entregala bomba.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 22

Estrategias en un juego dinamico

Es importante notar que en el parrafo anterior no hemos dicho que el EPS del juego sea (No Entregar,No Bomba), porque aquello serıa -en rigor- incorrecto. La razon de ello es que (No Entregar, No Bomba)no es un perfil de estrategia por el simple hecho de que “No Bomba” no constituye una estrategia parael asaltante. Esto nos lleva a la siguiente discusion, sobre que es lo que entenderemos por estrategia enun juego dinamico.

En el juego recien expuesto, por ejemplo, es natural pensar que las estrategias que puede seguir elasaltante son “bomba” y “no bomba”, cuando en realidad estas son simplemente acciones que puedeseguir en determinados nodos. En un juego en forma extensiva, una estrategia sera un plan de accionque indique que accion seguira el jugador en cada nodo en los cuales le puede tocar jugar.

Ası, una estrategia posible para el asaltante serıa no explotar la bomba si le entregan el dinero, ysı explotarla en caso que no se lo entreguen. Una forma comoda de describir esta estrategia es de la forma(No Bomba, Bomba), donde el primer elemento del par indica la accion que seguira si se encuentra enel nodo IIa, mientras que el segundo indica la accion ejecutada en el nodo IIb. Con lo anterior, tenemosque el conjunto completo de estrategias posibles para el asaltante sera {(B,B), (B,NB), (NB,B), (NB,NB)}. Por su parte, el cajero solo tiene que tomar una decision en un nodo, por lo que las acciones delas que dispone coinciden con su espacio de estrategias {Entregar, No entregar}.

Esta forma de entender las estrategias en un juego en forma extensiva facilita ver la equivalencia queexiste con la forma normal de un juego. En efecto, si lo que tiene que decidir el asaltante es un plan deaccion para cada posible situacion en la que le toque jugar, entonces podemos entender el juego desdeuna perspectiva estatica, donde cada jugador debe tomar solo una decision: cual sera su plan de accion.Para aclarar esta idea, en la matriz de la figura 1.20 se muestra el juego en su forma normal.

Asaltante

(B,B) (B,NB) (NB,B) (NB,NB)

CajeroEntregar -1, -1 -1, -1 1, 1 1, 1

No Entregar -1, -1 2, 0 -1, -1 2, 0

Figura 1.20: Asalto a un banco en forma normal

Esta matriz de pagos contiene exactamente la misma informacion que el arbol del juego. Considere-mos por ejemplo la segunda columna de pagos, en la cual la estrategia del asaltante (B,NB) nos indicaque este explotara la bomba si le entregan el dinero y no la explotara en caso contrario.13 Si el cajerosigue la estrategia “entregar”, entonces la estrategia del asaltante (B,NB) indica que explotara la bomba,con lo que se obtiene los pagos de (-1, -1) indicados en la celda correspondiente. Si en cambio el cajerono entrega el dinero, el plan de accion indica no explotar la bomba, con lo cual los pagos son de 2 parael cajero y 0 para el asaltante, tal como se indica en la celda. De forma analoga se obtienen las demascolumnas de la matriz.

Al computar los EN del juego en la matriz de pagos, se observa que existen tres perfiles bajo loscuales no existen incentivos a desviarse: (No Entregar, (B,NB)), (Entregar, (NB,B)) y (No Entregar,(NB,NB)). De acuerdo al analisis bajo induccion hacia atras, concluimos que la estrategia optima parael asaltante es (NB,NB), porque para el siempre era peor explotar la bomba. Ası, el unico EN que es ala vez EPS viene dado por el perfil (No Entregar, (NB,NB)). Notar que lo clave para que este perfil seaEPS es que la estrategia del asaltante es optima en cada uno en el que le podrıa tocar jugar. El perfil(No Entregar, (B,NB)) implica el mismo resultado del juego que el perfil (No Entregar, (NB,NB)), sin

13Es posible que esta estrategia parezca no tener sentido en el contexto que se le ha dado al juego. Sin embargo, es unaposibilidad para el asaltante y como tal podemos analizarla.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 23

embargo no constituye un EPS porque el asaltante esta siguiendo una estrategia suboptima en el nodoIIa.

Notar que tambien es un EN el perfil (Entregar, (NB,B)), segun el cual el resultado del juego es queel cajero entrega el dinero al asaltante. Sin embargo, el hecho de que en este perfil el cajero no tengaincentivos a desviarse, se basa en la amenaza no creıble de que en el nodo IIb el asaltante explotarıa labomba. Ası, observamos que en este contexto el EN por sı solo puede ser un criterio poco satisfactorio,pues no considera la dinamica temporal del problema. El EPS aparece entonces como un refinamientoutil que nos permite quedarnos con un equilibrio mas creıble, y en algun sentido mas racional.

Dentro y fuera de la senda de equilibrio

En la discusion previa se plantea que un perfil de estrategias -y por lo tanto un equilibrio- constituyeun plan de accion completo para cada jugador, y por lo tanto no basta con definir cual sera el resultadodel juego sino que es necesario definir cuales son las acciones que se llevarıan a cabo en cada nodo, auncuando estos no ocurran segun nuestra prediccion de equilibrio. Esto no es solo una cuestion formal, sinoque es fundamental para el analisis completo del juego porque las decisiones de cada jugador estan a suvez condicionadas por lo que espera este que haran los demas si se llegasen a encontrar en determinadascoyunturas. Mas concretamente, si pensamos en una partida de ajedrez, es claro que antes de decidiruna jugada el ajedrecista analiza cual sera la respuesta de su oponente ante las distintas movidas queesta tanteando en un determinado momento.

En terminologıa de juegos, si tenemos un perfil de equilibrio, aquellos nodos que segun las estrategiasdefinidas efectivamente ocurriran se dice que estan en la senda de equilibrio. De modo similar, los nodosque no ocurren se dice que estan fuera de la senda de equilibrio. En el ejemplo del asalto al banco, elnodo los nodos I y IIb estan en la senda de equilibrio, mientras que IIa esta fuera. Entonces, la idea delparrafo anterior se puede resumir en que un equilibrio no se constituye solo por las acciones que ocurrenen la senda de equilibrio, sino tambien por aquellas que se tomarıan fuera de esta (aun cuando nuncase concreten segun nuestra prediccion del resultado del juego).

Para observar la relevancia de las estrategias fuera de la senda de equilibrio en la determinacion delmismo, analizaremos una extension del juego de invasion, cuyo arbol se muestra en la figura 1.21. Enesta version, agregamos un nodo en el cual el paıs bajo amenaza tiene la posibilidad de constituir unejercito pequeno o grande antes de que el potencial invasor decida si ataca o no. Ademas, en el nodoinicial el paıs A puede elegir entre firmar un tratado de paz y terminar el conflicto o no hacerlo. Ası, losnodos Ai y Bi corresponden a aquellos donde juega A y B, respectivamente.

De los pagos se desprende la idea de que, en contraste con la version original del juego, si el paısB constituye un ejercito grande entonces ante una invasion preferira defenderse que rendirse. El casoen el que constituye un ejercito pequeno es igual al juego original, por lo que preferira rendirse encaso de ser invadido. Es decir, al realizar el analisis de induccion hacia atras, se tiene que en los nodosB2 y B3 las decisiones optimas son Rendirse y Pelear, respectivamente. Dado esto, en los nodos A2 yA3 las decisiones optimas para el paıs A son Invadir y No invadir, respectivamente. El siguiente pasoes preguntarse que decidira B en el nodo B1; si constituye un ejercito pequeno, entonces el pago querecibira -dadas las decisiones optimas subsecuentes- sera de 6, mientras que si juega “Ejercito Grande”el nodo final al que se llega tiene asociado un pago de 7. Por lo tanto, en el nodo B1 la decision optimasera Ejercito Grande. Finalmente, en el nodo A1 la decision optima del paıs A sera firmar el tratado, yaque con eso recibe un pago de 8, en comparacion a los 7 que recibirıa si decide no firmar, y el juego sedesarrolla segun las decisiones optimas ya discutidas.

En resumen, el EPS del juego vendra dados por la estrategia (Tratado, Invadir, No invadir) para elpaıs A, y (Ejercito grande, Rendirse, Pelear) para el paıs B (donde las acciones estan ordenadas siguiendola numeracion de los nodos para cada jugador). Por lo tanto, el resultado que parece razonable en estecaso es que los paıses firmaran el tratado de paz y el juego se acaba luego del primer nodo. Lo fundamental

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 24

A2

B2

A3

B3

A1

B1

(7,2)

(9,6)

(8,8)

(3,6)

(8,5)

(7,7)

(8,8)

Invadir

No inv.

Pelear

Rendirse

Invadir

No inv.

Pelear

Rendirse

Ejercito Pequeno

Ejercito Grande

No firmar trat.

Firmar tratado

Figura 1.21: Juego de invasion extendido

del ejemplo, es que este resultado se sostiene gracias a lo que ocurrira fuera de la senda de equilibriosegun las estrategias propuestas. En efecto, el mejor escenario para el paıs A serıa aquel en el que invadecontra un ejercito pequeno y el paıs B se rinde, pero la razon por la que firma el tratado y no intentallegar a ese nodo es que sabe que si B tiene la oportunidad para armarse, entonces constituira un ejercitogrande.14 Ası, el resultado que observamos en la senda de equilibrio es consecuencia de las decisionesque se tomarıan en aquellos nodos que finalmente no ocurren.

Estrategias continuas

Al igual que en el caso de los juegos estaticos, en los juegos dinamicos podemos analizar y encontrarequilibrios de juegos con espacios de estrategias continuos utilizando las herramientas de calculo diferen-cial. A modo de ejemplo, consideremos un modelo de duopolio denominado competencia a la Stackelberg.Suponemos que hay dos firmas que compiten en cantidades, pero a diferencia del modelo de Cournot,existe una firma que elige su nivel de produccion q1 primero, denominada “lıder”. La segunda firma,llamada “seguidora”, observa esta cantidad y luego elige su propia produccion q2. Suponiendo la mismafuncion de demanda utilizada anteriormente, P (Q) = A − Q, resolveremos el modelo por induccionhacia atras. Para ello, resolvemos el problema de la firma seguidora, el cual consiste en maximizar susbeneficios, dado el nivel de q1 observado.

maxq2

(A− q1 − q2)q2 − cq2

De la CPO se tiene que q2(q1) = A−q1−c2 . Esta funcion coincide con la respuesta optima de la firma

en el modelo de Cournot, pues el problema que resuelve es el mismo. Sin embargo, la interpretaciones diferente, ya que en este caso se trata de la estrategia de la firma seguidora. En efecto, esta funcionresume un plan contingente a cada posible cantidad q1 que pueda observar.

El siguiente paso de la induccion hacia atras es resolver el problema de la firma lıder, teniendoen cuenta la estrategia optima de la seguidora. Esto es, la lıder elige q1 tomando en cuenta que la

14Del mismo modo que en el asalto al banco, el cajero sabıa que llegado el momento el asaltante no explotarıa la bomba.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 25

seguidora reaccionara de acuerdo a la funcion q2(q1) = A−q1−c2 . Esto es completamente analogo a lo

que hemos hecho con los juegos dinamicos hasta ahora, donde para encontrar la accion optima de unjugador tomamos en cuenta las acciones subsecuentes que resultan optimas. Por lo tanto, el problemaque resuelve la lıder es

maxq1

(A− q1 − q2(q1))q1 − cq1

donde escribimos q2(q1) para explicitar que en su decision esta tomando en cuenta que la seguidorareaccionara de forma optima al nivel de produccion elegido. Al resolver la CPO se obtiene que:

qS1 =A− c

2

Ası, el perfil de estrategias de EPS viene dado por (qS1 = A−c2 , q2(q1) = A−q1−c

2 ), donde tal como enel juego de invasion definimos la estrategia de la firma seguidora como un plan de accion contingente,y no como una cantidad en particular. Sin embargo, con esto en la mano podemos calcular cual es elresultado asociado al equilibrio. En efecto, basta con reemplazar la cantidad optima qS1 en la funcionque define la estrategia de la seguidora para obtener

qS2 (qS1 ) =A− c

4

Es decir, en la senda de equilibrio se observara q1 = A−c2 y q2 = A−c

4 . Entonces la prediccion del EPS esque la firma lıder produce mas que en el modelo de Cournot, mientras que la seguidora produce menos.Es facil verificar, reemplazando estas cantidades en la funcion de beneficios, que la firma lıder esta mejorque en el modelo de Cournot y que la seguidora esta peor.

A partir de esta ultima observacion surge la pregunta de que ocurre si la firma seguidora elige laestrategia q2(q1) = A−c

3 , esto es, su plan consiste en producir la cantidad de Cournot independientede cual sea la cantidad producida por q1. Si la firma lıder toma esa estrategia como fija, entonces suestrategia optima tambien sera la cantidad de Cournot. Ası, el perfil de estrategias (q1 = A−c

3 , q2(q1) =A−c

3 ) constituye un EN puesto que aun cuando la firma seguidora reconsiderara su estrategia “rıgida”de siempre producir la cantidad de Cournot, observaremos que no tendra incentivos a cambiar su plande accion.

Sin embargo, este equilibrio se basa en una “amenaza” no creıble de parte de la firma seguidora, lacual es que si la lıder produce la cantidad de Stackelberg, qS1 , de todos modos la seguidora respondera conla cantidad de Cournot a pesar de que esta no es optima. En efecto, a partir de la induccion hacia atrassabemos que cuando la lıder produce qS1 la seguidora prefiere responder con qS2 , de modo que cuandodice que producira la cantidad de Cournot es lo mismo que cuando el asaltante de banco decıa que deno recibir el dinero entonces explotarıa la bomba.

1.6.1. Informacion perfecta e imperfecta

Una dimension de los juegos dinamicos que hemos ignorado hasta ahora dice relacion con el conoci-miento que tienen los jugadores respecto de como se ha desarrollado el juego hasta el momento en el queles toca jugar. Esto es, podemos permitir que en ciertas situaciones le corresponda mover a un jugador,sin que este sepa con precision que es lo que ha hecho su contraparte previamente. Cuando ocurra esto,hablaremos de juegos de informacion imperfecta. 15

Un caso sencillo de un juego de informacion imperfecta corresponde al ejemplo de matching pennies,tal como lo hemos visto en las secciones anteriores. Aunque hasta ahora lo hemos descrito como un juego

15Recordemos que informacion completa se referıa al hecho de que las funciones de pago de cada jugador (o sus prefe-rencias) son de conocimiento publico. Esto nada dice respecto de la capacidad de observar la jugada del otro, por lo queun juego puede ser de informacion completa pero imperfecta.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 26

estatico, tambien podemos entenderlo como un juego dinamico, donde un jugador elige primero un ladode la moneda, y luego el otro elige el suyo sin observar la moneda del primero. La forma extensiva deljuego se representa en la figura1.22, donde la lınea punteadas denota el hecho de que cuando al jugador2 le corresponde mover, no sabe si se encuentra en el nodo IIa o en el IIb.

IIa(Jugador 2)

C S

C S

SC

I(Jugador 1)

IIb(Jugador 2)

u1 = 1

u2 = −1

u1 = −1

u2 = 1

u1 = −1

u2 = 1

u1 = 1

u2 = −1

Figura 1.22: Matching pennies en forma extensiva

Resulta claro que el hecho de que uno de los jugadores mueva primero no tiene implicancias es-trategicas sobre la decision del otro, ya que al no observar la moneda el juego es equivalente al caso enel que muestran las monedas simultaneamente. De hecho cualquier juego estatico puede ser entendidocomo un juego dinamico de informacion incompleta, donde uno de los jugadores mueve primero pero elotro no observa la jugada. Lo importante en terminos estrategicos no es si un jugador mueve primeroque el otro, sino que aquel que mueve despues pueda observar la jugada del primero. Por lo tanto, nohay nada nuevo que decir sobre el equilibrio en este caso, pues tal como estudiamos en el contexto dejuegos estaticos, el unico EN es aquel en estrategias mixtas donde cada uno elige probabilidad 0,5.

En la terminologıa de juegos, cuando a un jugador le corresponde jugar y no sabe con precision loque ha ocurrido antes, el conjunto de nodos en los cuales podrıa estar ubicado lo llamaremos conjuntode informacion. En particular, cuando sı sabe la historia del juego (y por lo tanto el nodo en el cualesta ubicado) el conjunto de informacion tiene un unico elemento. Por ejemplo, en la figura 1.22 obser-vamos dos conjuntos de informacion: el que contiene al nodo I y el que contiene a los nodos IIa y IIb.Ası, en este ejemplo cada jugador tiene un conjunto de informacion.

Consideremos, en cambio, una version de informacion completa del mismo juego. Es decir, un jugadormuestra primero su moneda, y el otro juega una vez que la observa. Esta version del juego esta represen-tada en la figura 1.23, donde la unica diferencia en terminos del dibujo es que no esta la lınea punteadaque une los nodos IIa y IIb. Por lo tanto, el jugador 2 ahora tiene dos conjuntos de informacion, aquelque contiene solo al nodo IIa y el que contiene solo el IIb.

IIa(Jugador 2)

C S

C S

SC

I(Jugador 1)

IIb(Jugador 2)

u1 = 1

u2 = −1

u1 = −1

u2 = 1

u1 = −1

u2 = 1

u1 = 1

u2 = −1

Figura 1.23: Matching pennies con informacion perfecta

En este caso, igual que en los juegos de informacion perfecta analizados anteriormente, una estrategiacorresponde a un plan de accion ante cada posible coyuntura en la que tenga que mover. Ası, el conjuntode estrategias factibles para el jugador 2 viene dado por {(C,C), (C, S), (S,C), (S,C)}, mientras que el

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 27

del jugador 1 es {C, S}. En el caso de informacion incompleta, en cambio, el jugador 2 debe tomar unaunica decision porque no sabe en cual nodo se ubicara. Dicho de otro modo, en los juegos de informacionimperfecta, una “coyuntura” en la cual le corresponde mover a un jugador no es un nodo, sino que unconjunto de informacion. Ası, para generalizar la nocion de estrategia desarrollada en la seccion anterior,diremos que en juegos dinamicos una estrategia es un plan que indica que accion tomara el jugador encada posible conjunto de informacion en el cual le puede tocar jugar.

1.7. Definicion de juego en forma extensiva, subjuego y EPS

Con el concepto de conjunto de informacion explicado en la seccion anterior ya tenemos todo lonecesario para definir la forma extensiva de un juego, ademas de aclarar que es un subjuego y por lotanto un EPS. En los ejemplos vistos hasta ahora hemos observado cuales son los elementos que sonnecesarios determinar para definir de forma completa un juego dinamico. Estos los resumimos en lasiguiente definicion,

Definicion 6. Un juego en forma extensiva viene dado por:

1. Una lista de n ≥ 1 jugadores, indizados por i, i = 1, 2, ..., n. (conjunto de jugadores)

2. a. Cuando le corresponde mover a cada jugador (nodos asociados con los respectivos jugadores)

b. Acciones disponibles al momento de mover (ramas que nacen a partir de cada nodo)

c. Que es lo que el jugador sabe cuando mueve (conjuntos de informacion)

3. Los pagos que reciben en cada nodo terminal los jugadores (funciones de utilidad)

Tal como planteamos en la seccion 1.2, para analizar una situacion estrategica desde la teorıa dejuegos resulta necesario definir de forma clara y concreta ciertos aspectos del problema, los que para elcaso de un juego dinamico se resumen en la definicion de juego en forma extensiva recien entregada.

Por su parte, un subjuego corresponde a cada juego cuyo nodo inicial es un conjunto de informaciondel juego original con un unico elemento. En terminos del arbol de un juego, corresponde al conjuntode nodos y ramas que nacen en los conjuntos de informacion con un unico elemento y que puedenser entendidos como un juego “mas pequeno”. Cabe destacar que el juego original es un subjuego ensı mismo. Por ejemplo:

El juego de la figura 1.17 tiene 2 subjuegos: aquel que nace en el nodo B, y el juego original quenace en el nodo A.

El juego de la figura 1.19 tiene 3 subjuegos, los cuales nacen de cada uno de los nodos del juego.

El juego de la figura 1.21 tiene 6 subjuegos: los sub-arboles que nacen en cada uno de sus nodos.De estos tres ejemplos ya debiese quedar claro que para juegos de informacion perfecta, la cantidadde subjuegos coincide con la cantidad de nodos, pues cada nodo es un conjunto de informacioncon un unico elemento. (y por lo tanto, cada nodo corresponde al nodo inicial de un subjuego).

El juego de la figura 1.22 tiene un unico subjuego: el juego completo. La razon por la cual losnodos IIa y IIb con sus respectivas ramas no constituyen un subjuego, es que ambos pertenecena un conjunto de informacion mayor, lo que contradice la definicion de subjuego.

De los ejemplos anteriores salta a la vista que un subjuego no es mas que lo que queda de unjuego una vez que se ha alcanzado cierto nodo decision. Esta definicion resulta sencilla y pareciera que

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 28

pudimos haberla entregado antes para explicar concretamente que es un EPS. Sin embargo, es importanteentender que los nodos que no son un conjunto de informacion en si mismo no son el nacimiento de unsubjuego, y para ello primero tenıamos que conocer el concepto de informacion imperfecta. Ahora quehemos aclarado este punto, podemos definir formalmente un EPS.

Definicion 7. Un equilibrio de Nash perfecto en subjuegos es un EN tal que las acciones definidaspor el perfil de estrategias son, a su vez, equilibrios de Nash de cada subjuego.

Es decir, el EPS se diferencia de los demas EN del juego en el hecho de que si analizamos los subjuegos,las decisiones de cada jugador siguen siendo satisfactorias en el sentido de que son una respuesta optima.Por ejemplo, recordemos que en el juego del asalto al banco el perfil (Entregar,(NB,B)) era un EN deljuego. Sin embargo, si observamos el subjuego que comienza en el nodo IIb, el cual consiste en unasimple decision entre las alternativas {B,NB}, la estrategia B no es optima, y por lo tanto no es unEN del subjuego. Se puede verificar que el equilibrio que encontramos haciendo induccion hacia atrassı verifica la definicion recien planteada.

Microeconomıa II

Capıtulo 2

Informacion incompleta

Como ya mencionamos en la introduccion, una de las dimensiones mas importantes a considerar enmuchas situaciones estrategicas es que es lo que saben los jugadores respecto de las caracterısticas de losdemas. En efecto, si en los conceptos de equilibrio que hemos desarrollado hasta ahora se observa quela estrategia de cada jugador depende de las estrategias de otros jugadores, resulta natural cuestionarseque ocurre cuando cierta informacion (como las preferencias o alguna otra caracterıstica) no es deconocimiento publico. El objetivo de este capıtulo es introducir los conceptos necesarios para analizareste tipo de situaciones, basandonos fundamentalmente en ejemplos sencillos que nos permitiran resaltarlos puntos relevantes a tener en consideracion.

2.1. Juegos estaticos de informacion incompleta

Para comenzar, revisitemos un ejemplo que ya hemos analizado en distintos contextos: la competenciaa la Cournot. Tenemos la estructura ya familiar en la que existen dos firmas, denotadas por i = {1, 2}, y lademanda inversa del mercado en el que compiten viene dada por P (Q) = A−Q. Supongamos que la firma1 tiene un costo marginal c fijo y conocido por ambas firmas. En cambio, la firma 2 tiene informacionprivada sobre su costo, el cual puede ser alto (ca) o bajo (cb). Concretamente, supondremos que la firma 1solo sabe que con probabilidad α se trata de una firma con costo alto y con probabilidad (1−α), de costobajo. Recordemos que para el caso de informacion completa la funcion de reaccion de cada firma dependıade los costos de su contraparte. Por lo tanto, el hecho de que la firma 1 enfrente incertidumbre respectode los costos de la 2 deja en evidencia que se requiere agregar elementos adicionales al analisis. Enparticular, para obtener una nocion de equilibrio satisfactoria en un contexto de informacion incompletasera necesario replantearnos la forma en la que analizamos el comportamiento de los individuos.

Analicemos primero la decision de la firma 2. Dado que esta conoce su costo con certeza, entonces esnatural pensar que su decision optima sera distinta segun cual sea el costo que efectivamente enfrente.En efecto, si fijamos la cantidad que produce la firma 1 en algun valor q1, la funcion objetivo de la firma2 viene dada por πa = (A− q1 − q2)q2 − caq2 si enfrenta costos altos. En cambio, si el costo verdaderode la firma es bajo (cb), su funcion de beneficios sera πB = (A− q1− q2)q2− cbq2. Si maximizamos cadauna de estas funciones respecto de q2 obtendremos que la respuesta optima de la firma 2 en funcion desu costo, se puede escribir como:

q∗2(ca) =A− q1 − ca

2

q∗2(cb) =A− q1 − cb

2

29

Facultad de Economıa y Negocios - Universidad de Chile 30

Podemos notar que corresponde a la misma funcion de reaccion que obtuvimos en el caso de informa-cion completa. La diferencia clave es que la firma puede encontrarse en 2 situaciones diferentes, y sucomportamiento optimo variara segun ocurra una o la otra.

Consideremos ahora la situacion que enfrenta la firma 1. Como ya se planteo, nuestro supuesto es queesta no sabe si la firma 2 enfrenta costos altos o bajos, pero sı sabe que existen solo dos valores posibles(ca y cb) y asigna cierta probabilidad a la ocurrencia de cada uno. Ademas, seguimos suponiendo quecada jugador entiende que el otro actua de forma racional y buscando maximizar su ganancia, lo queen este caso se traduce en que la firma 1 sabe que la 2 seguira una estrategia distinta segun sus costosefectivos sean altos o bajos. Todas estas ideas se resumen en el hecho de que la estrategia optima de lafirma 1, dadas ciertas cantidades q2(ca) y q2(cb) fijas, es aquella que maximiza su ganancia esperada:

π1 = α [(A− q1 − q2(ca))q1 − cq1] + (1− α) [(A− q1 − q2(cb))q1 − cq1]

Al derivar respecto de q1 y despejar obtenemos que la respuesta optima de la firma 1, a cualquier parde cantidades q2(ca) y q2(cb), viene dada por:

q∗1 =α (A− q2(ca)− c) + (1− α) (A− q2(cb)− c)

2

Ası, para proponer un equilibrio para este juego, hemos seguido hasta ahora el mismo camino quepara el caso de informacion completa: computar las funciones de reaccion. Las diferencias fundamentalesque se evidencian a partir del ejemplo son que: (1) hay que encontrar una funcion de reaccion para cadacaso en el que se pueda encontrar un jugador (costo alto o bajo en el ejemplo), y (2) la funcion objetivorelevante toma en cuenta la incertidumbre que tienen los jugadores respecto de las caracterısticas de losdemas.

Una vez que hemos tenido en consideracion estas cuestiones, encontrar el equilibrio del juego sereduce a calcular el perfil de estrategias en el cual las funciones de reaccion se intersectan. De la discusionanterior se deduce que un perfil viene dado por las cantidades q1, q2(ca) y q2(cb). Las tres funciones dereaccion ya planteadas constituyen un sistema que nos permiten calcular estas incognitas. En efecto, aldespejar se obtienen los siguientes resultados:

qN1 =A− 2c+ αca + (1− α)cb

3

qN2 (ca) =A− 2ca + c

3+

(1− α)(ca − cb)6

qN2 (cb) =A− 2cb + c

3− α(ca − cb)

6

El supraındice N hace referencia a Nash, pero en juegos de informacion incompleta muchas vecesse denomina equilibrio de Bayes-Nash. Aunque este ultimo concepto tiene una definicion formal queda cuenta de las diferencias con el EN, lo importante para nuestros propositos lo podemos observar apartir del ejemplo: el perfil de estrategias define una accion para cada posible “realizacion” de la firma2 (ya que como discutimos esta actuara diferente segun los costos que enfrente) y la funcion objetivorelevante da cuenta de la incertidumbre que implica la informacion incompleta (en este caso se trata dela ganancia esperada dada la probabilidad α).

Una subasta a sobre cerrado

Una situacion de interes que naturalmente debe ser estudiada como un juego de informacion in-completa son las subastas. Esto, porque la valoracion que tiene cada postor o posible comprador es

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 31

informacion privada que afectara la oferta maxima que estara dispuesto a hacer. Esto es particularmen-te relevante cuando las ofertas son a sobre cerrado, lo que no permite revelar informacion como cuandoexisten ofertas sucesivas.

Para analizar esta situacion consideremos un ejemplo sencillo: se subasta un unico bien a 2 postores,1 y 2, quienes solo pueden ofertar 0 o 30 unidades monetarias (suponga que si la oferta ganadora es 0,el bien se vende de todos modos). En caso de que ambos hagan la misma oferta, se sortea el ganadorlanzando una moneda. La valoracion que tiene cada postor por el bien, vi, es informacion privada. Sinembargo, cada uno sabe que esta solo puede tomar los valores 20 o 50, con probabilidad (1 − α) y α,respectivamente.

Sea yi una variable que toma el valor yi = 1 si el postor i gana la subasta y el valor yi = 0 encaso contrario. Ademas, denotamos por pi el precio que paga el individuo cuando gana la subasta. Ası,podemos escribir la funcion de utilidad del agente i como

ui(yi, pi, vi) = (vi − pi)yi,

es decir, el pago es igual al excedente de la compra en caso de ganar, y 0 en caso contrario.

Tal como en el ejemplo de Cournot, una estrategia para el jugador i es una accion para cada posiblevaloracion que pueda ocurrir, por lo que la denotaremos por bi(vi). Por ejemplo, una posible estrategiaes ofertar 50 cuando tengo valoracion alta (bi(50) = 30) y ofertar 0 cuando es baja (bi(20) = 0). Comoel individuo 1 desconoce la valoracion que tiene el 2, no puede saber con certeza la oferta que hara esteultimo aun cuando conozca su plan de accion, descrito por b2(v2). Dada esta incertidumbre, la utilidadesperada que busca maximizar viene dada por:

(v1 − b1) Pr(b1 > b2) +1

2(v1 − b1) Pr(b1 = b2),

donde se observa claramente el trade-off entre hacer una oferta menor, con lo que aumenta el excedente(v1 − b1), y hacer una oferta mayor aumentando la probabilidad Pr(b1 > b2).

Como ya es usual, un perfil de equilibrio es un par de estrategias (b1(v1), b2(v2)) tal que nadie puedemejorar cambiando su propia estrategia. Ası, lo primero que podemos decir respecto de la estrategiade equilibrio es que necesariamente bi(20) = 0, ya que cuando la valoracion es baja comprar el bien enpi = 30 deja un excedente negativo. Con esto, solo nos falta determinar cual es la estrategia optimacuando vi = 50. Para ello, fijemos la estrategia del jugador 2 en b2(50) = 0 y analicemos cual es larespuesta optima del individuo 1, dado que v1 = 50. La informacion relevante se resume en la siguientetabla:

b1(50) Excedente si gana Pr(ganar) Utilidad Esperada

b1 = 0 50 12 25

b1 = 30 20 1 20

Si b1 = 0 entonces los jugadores empatan (fijamos que 2 juega 0 independiente de su tipo) y en ese casogana con probabilidad 0.5. lo que le deja un pago de 25. En cambio, si juega b1 = 30 gana con certeza, loque le deja un pago de 20. Ası, cuando el jugador 2 sigue la estrategia (b2(20) = 0, b2(50) = 0), la mejorrespuesta del individuo 1 es (b1(20) = 0, b1(50) = 0). Como el problema es simetrico, tambien es ciertoque la mejor respuesta del jugador 2 a la estrategia (b1(20) = 0, b1(50) = 0) es (b2(20) = 0, b2(50) = 0.Entonces hemos encontrado un equilibrio del juego en el cual cada individuo oferta 0 independiente dela valoracion vi que le corresponda.

Lo anterior no descarta la posibilidad de que exista otro equilibrio, ya que aun no consideramos elcaso en que el jugador 2 sigue la estrategia (b2(20) = 0, b2(50) = 50). Fijando esta estrategia, construimosla misma tabla con informacion relevante:

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 32

b1(50) Excedente si gana Pr(ganar) Utilidad Esperada

b1 = 0 50 12 (1− α) 25(1− α)

b1 = 30 20 1− α2 20

(1− α

2

)Donde la columna Pr(ganar) se construye a partir de:

Si b1 = 0, solo empata si v2 = 20 (lo que ocurre con probabilidad (1− α)). Dado el empate, ganacon probabilidad 0.5.

Si b1 = 30, gana si v2 = 20 y empata si v2 = 50. Dado esto, la probabilidad total de ganar es(1− α) + α

2 = 1− α2 .

Con lo anterior, tenemos que b1 = 30 sera optimo solo si se verifica la condicion:

20(

1− α

2

)≥ 25(1− α)

20− 10α ≥ 25− 25α

15α ≥ 5

α ≥ 1

3

Por lo tanto, si α > 1/3 se tiene que (b1(20) = 0, b1(50) = 30) es respuesta optima a (b2(20) =0, b2(50) = 30) y este perfil -por simetrıa- sera de equilibrio. En caso contrario, la respuesta optimasera (b1(20) = 0, b1(50) = 0), y por lo tanto el equilibrio en el que siempre se oferta cero sera unico.

Para analizar las implicancias de este resultado, fijemos por un momento un α ≤ 1/3. En este caso seobtiene una prediccion interesante del comportamiento de los postores, ya que el sujeto i, aun teniendouna valoracion de 50, no ofertara en equilibrio un monto de 30 que le asegura la posibilidad. En elejemplo esto se debe a que la probabilidad de que el individuo j tenga una valoracion alta (y por lotanto valga la pena competir ofertando 30) es relativamente baja. Ası, el incentivo a hacer una ofertamenor para obtener un mayor excedente domina -en este caso- al incentivo a hacer una oferta mayorpara llevarse el bien. En cambio, cuando α > 1/3 el aumentar la probabilidad de ganar toma mayorrelevancia, por lo que en equilibrio los jugadores pueden terminar haciendo apuestas altas.

2.2. Juegos dinamicos: Senalizacion

Cuando hablamos de juegos dinamicos de informacion incompleta, una de las aplicaciones mas intere-santes e importantes (en terminos de aplicabilidad) son los juegos de senalizacion. En este tipo particularde juegos existen, basicamente, dos tipos de jugadores: un emisor y un receptor. Este ultimo desconocecierta caracterıstica (que en terminos genericos llamaremos tipo) del primero, la cual es relevante parala interaccion que se da entre los dos y para la decision sobre su propia estrategia. El emisor por su partesı conoce la caracterıstica en cuestion, y puede utilizar un mensaje para dar al receptor alguna senalrespecto de su tipo. La idea es modelar situaciones donde el mensaje puede ser utilizado para que uncierto tipo de mensajero pueda diferenciarse de otro, y los incentivos que se generan para que aquellostipos menos favorecidos en la interaccion envıen mensajes confusos con el objetivo de no revelar su tipo.

Aplicaciones concretas de juegos de senalizacion se pueden encontrar, entre otros, en los modelosdel mercado laboral donde los trabajadores tienen diferente productividad y el empleador no es capazde observarla con certeza. En este contexto el nivel de educacion formal alcanzado puede ser utilizado

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 33

como una senal, bajo el supuesto de que para los individuos mas productivos resulta menos costosoeducarse. Lo interesante es que en la realidad es posible argumentar que muchas veces la educacionformal, mas que aumentar la productividad de un trabajador, es relevante para los empleadores porquerevela informacion sobre sus capacidades. Ası, modelar esta situacion como un juego de senalizacionpermite encontrar la racionalidad del fenomeno y estudiar sus implicancias.

Otros ejemplos de interes son los que estudian la relacion entre agentes que requieren fondos pararealizar un proyecto y los bancos o inversionistas que pueden prestar estos fondos. Si la calidad orentabilidad del proyecto no es clara para el banco, entonces las senales que pueden enviar los agentes-como el interes que estan dispuestos a pagar- se vuelven relevantes. Ejemplos de este tipo puedenvariar en distintas dimensiones que en cada caso sean de interes, como la capacidad de negociacion decada parte o la posibilidad de que el monto financiado afecte la rentabilidad del proyecto. Mas adelanteestudiaremos un ejemplo de este tipo de modelos.

Los juegos de senalizacion tambien tienen aplicaciones en polıtica economica y monetaria. Los mo-delos de expectativas racionales donde el banco central (BC) es un agente optimizador que tiene interestanto en el nivel de producto como en la inflacion, llevan a los conocidos resultados de equilibrios in-eficientes donde el BC “permite” una inflacion mayor sin lograr su objetivo de aumentar el producto.Subyacente a este resultado esta el parametro de “aversion a la inflacion” del BC. Ası, en un modelo convarios perıodos, el ente monetario puede utilizar la inflacion de los primeros perıodos como un mensajepara senalizar que es averso a la inflacion (inverte en reputacion), lo que le permitirıa en perıodos futurosaumentar el producto a costa de una inflacion mayor.

Vemos ası que los juegos de senalizacion tienen aplicaciones de interes en distintos temas y areas. Loideal es tener una estructura relativamente sencilla que nos permita analizar estas situaciones con unenfoque unificado, basado en la teorıa de juegos. Por lo tanto, a continuacion se enlistan los elementosnecesarios para definir un juego de senalizacion basico:

Existen dos jugadores, llamados Emisor y Receptor.

El emisor es de algun tipo ti perteneciente a un conjunto de tipos factibles T = {t1, ..., tn}.

Cada tipo tiene a priori una probabilidad de ocurrencia p(ti) > 0, conocida por el receptor.

El emisor observa su tipo ti y elige un mensaje mj de un conjunto de mensajes factibles M ={m1, ...,mj}.

El receptor observa mj (pero no ti) y elige una accion ak del conjunto de acciones factiblesA = {a1, ..., ak}.

Los pagos vienen dados por las funciones Ue(ti,mj , ak) y Ur(ti,mj , ak) para el emisor y receptor,respectivamente.

Para observar una expresion concreta de esta estructura, estudiaremos un ejemplo basado en elmodelo de Myers y Majluf (1984) que analiza el problema de una empresa que requiere conseguir finan-ciamiento de un inversionista que no conoce la rentabilidad del proyecto. Ası, la oferta de participacionque le hace la empresa al inversionista constituye un mensaje que puede entregar informacion al respecto.

Inversion empresarial y estructura de capital

Existe una empresa que pretende realizar un nuevo proyecto de inversion. El tipo de la empresaviene dado por sus beneficios π que pueden ser altos (A) o bajos (B), con A > B > 0. Para realizar elproyecto, que tiene un retorno de R, se requiere una inversion de I. Se supone que R > I de modo queeste siempre es rentable. La probabilidad de que π = A es α.

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 34

El empresario, una vez que observa su tipo, hace una oferta de participacion en los beneficios de laempresa al inversionista s, de modo que 0 ≤ s ≤ 1. El inversionista observa s y decide si acepta o rechazaparticipar del proyecto. En caso de rechazar la oferta, los pagos son de I(1 + r) para el inversionista y πpara el empresario, ya que el proyecto no se realiza. En caso de aceptar, cada uno recibe su participacionen el beneficio total generado por la empresa con proyecto: s(π+R) para el inversionista y (1−s)(π+R)para el empresario.

En terminos de la estructura descrita anteriormente, tenemos que T = {A,B}, p(A) = α y p(B) =(1− α), M = [0, 1], A = {Acepta, Rechaza}, y las funciones de pago son:

Ue(π, s, a) =

{π si a = Rechaza(1− s)(π +R) si a = Acepta

Um(π, s, a) =

{I si a = Rechazas(π +R) si a = Acepta

Una cuestion fundamental en los juegos de senalizacion son las conjeturas que hace el receptorrespecto del tipo del emisor una vez que observa los mensajes. Es natural pensar que estas debenestar basadas en las probabilidades a priori definidas por p(ti), pero como veremos tambien deben sercoherentes con la estrategia del emisor. Por ahora, supongamos que dado un mensaje s fijo, el receptorconsidera que con probabilidad q se trata de una firma tipo B. Dado esto, aceptara la oferta si y solo sisu beneficio esperado es mayor que el costo de oportunidad del proyecto, q ·s(B+R)+(1−q) ·s(A+R) ≥I(1 + r). Esta condicion se puede reescribir como:

s ≥ I

(qB + (1− q)A+R)

Por su parte, un empresario de tipo π solo estara dispuesto a recibir el financiamiento si la participacions que otorga al inversionista cumple la condicion de que el pago que recibe con proyecto es mayor queel pago sin proyecto, (1− s)(π +R) ≥ π. Despejando s se obtiene la condicion:

s ≤ R

π +R

Para simplificar la exposicion de los conceptos, vamos a resolver una version particular del modelo.Consideremos los parametros A = 15, B = 5, R = 15, I = 10, y α = 0,4. Ademas, supondremos quelas firmas solo pueden hacer dos ofertas de participacion, las cuales son 2/3 y 1/5, de modo que ahoraM = {2/3, 1/5}. Las condiciones de participacion ya calculadas siguen siendo validas, y las utilizaremospara este caso particular.

Consideremos la posibilidad de un equilibrio mezclador, esto es, un perfil en el que tanto el tipoA como el B juegan la misma estrategia s.1 Una primera condicion que le exigimos a las conjeturasde equilibrio es que cuando todos los tipos envıan el mismo mensaje, la conjetura debe ser igual a laprobabilidad a priori. Esto, porque al no resultar informativo el mensaje, el receptor no puede hacernada mejor que quedarse con las probabilidades originales.

Lo anterior implica que al proponer un equilibrio mezclador, en la condicion de participacion delinversionista reemplazamos q = 0,6 (la probabilidad a priori de que la firma sea tipo B), con lo cual lacondicion de participacion del inversionista se reduce a s ≥ 5

12 . Por lo tanto, tenemos que:

Si ambos tipos ofrecen s(A) = s(B) = 2/3, el inversionista acepta el proyecto ya que 2/3 > 5/12por lo que se verifica la condicion.

1En general, un equilibrio mezclador es aquel en que todos los tipos envıan el mismo mensaje

Microeconomıa II

Facultad de Economıa y Negocios - Universidad de Chile 35

Si ambos tipos ofrecen s(A) = s(B) = 1/5, el inversionista rechaza el proyecto, ya que 1/5 < 5/12por lo que no se cumple la condicion.

Notemos que la condicion bajo la cual la firma A prefiere hacer el proyecto es, para los parametrosparticulares, sA ≤ 1

2 . Ası, no puede haber un equilibrio mezclador en el que s(A) = 2/3, ya que lafirma preferira hacer la oferta 1/5 que le entrega mayor beneficio sin importar si el inversionista aceptao rechaza. Por otro lado, el equilibrio mezclador s(A) = s(B) = 1/5 tampoco puede ocurrir, ya quela firma tipo B preferira ofrecer 2/3 con tal de realizar el proyecto y obtener 1/3 de 20 en vez de subeneficio sin proyecto (que es 5). Por lo tanto, concluimos que en este caso no puede existir un equilibriomezclador.

Analicemos ahora la existencia de un equilibrio separador, esto es, un perfil en el que los distintostipos envıan distintos mensajes. Cuando ello ocurre, el mensaje es completamente informativo del tipodel individuo y esto tiene que influenciar la conjetura del receptor. Por ejemplo, si tenemos que la firmasigue la estrategia s(A) = 2/3 y s(B) = 1/5, entonces la conjetura de la firma cuando observa s = 2/3es que la firma es tipo A con certeza, y cuando observa s = 1/5 es que la firma es tipo B con certeza.

Con la nocion de conjetura aclarada para un equilibrio separador, podemos analizar entonces loscasos separadores:

Dado s(A) = 2/3 y s(B) = 1/5, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 20, quees menor a la inversion de 10) y acepta ante 2/3. Dado esto, la firma tipo B tiene incentivos adesviarse, ya que si envıa el mensaje 2/3 el inversionista aceptara y obtendra mayor beneficio.

Dado s(A) = 1/5 y s(B) = 2/3, el inversionista rechaza ante 1/5 (porque recibe 1/5 de 30, que esmenor a la inversion de 10) y acepta ante 2/3. En este caso la firma tipo A no tiene incentivos adesviarse (porque prefiere su beneficio sin proyecto de 15 antes los 10 que recibe si se queda con1/3 del proyecto), y la firma B tampoco porque siempre prefiere realizar el proyecto.

Por lo tanto, en nuestro ejemplo el unico equilibrio es uno separador en el que la firma tipo Aofrece una porcion pequena de las ganancias, la tipo B ofrece una porcion grande, y por lo tanto elinversionista solo acepta la propuesta de esta ultima. Aunque en el caso mas general puede existir unequilibrio mezclador (donde la inversion siempre se realiza), la existencia del separador no se debe a laparticularidad del ejemplo pues este siempre existe. En el caso de que se de un equilibrio separador,la implicancia del modelo es que el resultado es suboptimo dado que realizar el proyecto siempre esrentable. El problema que genera la informacion incompleta se observa en la condicion de participaciondel inversionista ante un mensaje mezclador, donde la firma A esta sujeta a ofrecer una participacionmayor al inversionista, ya que este no esta seguro si los beneficios seran altos o bajos.

Ası, los juegos de senalizacion se pueden usar en aplicaciones generales donde se observa que laasimetrıa de informacion entre dos agentes genera algun problema de eficiencia. Por ejemplo, el modelode senalizacion en el mercado laboral mencionado mas arriba, en el cual la educacion se utiliza comosenal, se pueden generar ineficiencias en el caso en el que la educacion es productiva (los trabajadoresde alta productividad se educan mas que lo eficiente con tal de senalizar y diferenciarse de los menoseficientes).

Microeconomıa II