apuntes de la teoria de la decision y de los juegos juegos estaticos (universidad carlos iii madrid...

17

Click here to load reader

Upload: mfpetru

Post on 29-Jul-2015

47 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

Apuntes de Teoría de la Decisión y de los Juegos:

Juegos Estáticos

Universidad Carlos III de Madrid

Curso 2001-02

1 La Teoría de los Juegos

La Teoría de los Juegos proporciona una metodología para el estudio de los problemas

de decisión multipersonal; es decir, para el estudio de las situaciones de decisión

interactiva en las acciones de cada individuo (dentro de un grupo) tienen consecuen-

cias sobre el bienestar de todos los individuos del grupo. En estas situaciones, a las

que en adelante nos referimos como juegos, los individuos se enfrentan a dos tipos de

incertidumbre: una incertidumbre exógena, asociada con elementos aleatorios fuera

de su control, y otra incertidumbre endógena, consecuencia del desconocimiento que

cada individuo tiene sobre los efectos de las acciones que vayan a adoptar los demás

individuos.

1.1 Juegos cooperativos y no cooperativos

El tratamiento de un juego requiere distinguir entre aquellas en las que los individuos

tienen la posibilidad de alcanzar acuerdos “contractuales” por los que se comprometen

1

Page 2: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

a realizar determinadas acciones, de aquellas en las que los acuerdos contractuales

no son posibles. Las primeras son objeto de estudio de la Teoría de los Juegos

cooperativos, cuyo tema central es el estudio de propuestas alternativas de reparto

de las ganancias que se derivan de la cooperación.

La Teoría de los Juegos no cooperativos estudia situaciones en las que los indivi-

duos no pueden contratar sus acciones, yo sea porque no exista una autoridad externa

que garantice el cumplimiento de los contratos (como ocurre, por ejemplo, con las

relaciones comerciales, políticas, etc., entre estados soberanos), o porque las acciones

involucren derechos inalienables (que impiden, por ejemplo, que un trabajador renun-

cie a su derecho a rescindir su relación laboral con una empresa), o porque involucren

acciones consideradas ilegales (como, por ejemplo, los acuerdos para la fijación de pre-

cios entre empresas o los acuerdos de reparto de territorio entre mafiosos), o porque

no sean observables (que imposibilita la compra-venta de votos o resta credibilidad a

declaraciones de “invulnerabilidad a la corrupción” — ja ja).

Los juegos no cooperativos se caracterizan por la presencia de una mezcla de

intereses conflictivos y de posibilidades de cooperación que dificultan su tratamiento.

Estas notas se dedican a una breve presentación de la teoría básica de los juegos no

cooperativos.

1.2 Juegos estáticos y dinámicos: forma normal y extensiva

Como en los problemas de decisión individual, en el tratamiento de los juegos no

cooperativos conviene distinguir entre juegos estáticos y juegos dinámicos.

Los juegos estáticos son aquellos en los que los jugadores adoptan acciones de

forma simultánea o cuando, aunque no se realicen de forma simultánea, no son direc-

tamente observables. En estos juegos, los jugadores deciden sus acciones sobre la base

de la información disponible inicialmente y durante el proceso de toma de decisiones

no se genera información adicional. Ejemplos de este tipo de juegos son las elecciones

por voto secreto,

Los juegos dinámicos se caracterizan por que en el proceso de toma de decisiones

los jugadores reciben nueva información, que puede ser información acerca de acciones

adoptadas por otros jugadores (o por uno mismo) o resultados de movimientos de azar.

Ejemplos

Como los problemas de decisión individual, los juegos pueden representarse en

forma normal (una representación análoga a la matriz de pagos en problemas de de-

2

Page 3: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

cisión individual) o en forma extensiva (análoga a los árboles de decisión). Cualquier

juego puede representarse en un formato u otro. Sin embargo, mientras que la forma

normal es una representación económica y precisa de un juego estático, no lo es de

un juego dinámico, sino que, como veremos, la representación en forma normal pro-

porciona una información deficiente de un juego dinámico.

2 Juegos Estáticos: forma normal

Los elementos que describen un juego en forma normal G son

• Un conjunto de jugadores N = {1, . . . , n}.

• Un conjunto de acciones o estrategias posibles Si para cada jugador i ∈ N.

• Una función de utilidad (esperada) sobre los perfiles de acciones posibles (s1, . . . , sn) ∈S = S1 × · · · × Sn, ui : S → R, para cada jugador i ∈ N.

Así, un juego en forma normal esta descrito por una terna (N,S, u).

2.1 Ejemplos

Ejemplo 1 (Pares/Nones). En este juegos dos individuos eligen simultáneamente

un número par o impar (non) (“sacan dedos”); si la suma es par (non), el Jugador 2

(1) paga un euro al Jugador 1 (2). Este juego puede representarse en forma normal

como G = (N,S, u), donde N = {1, 2}, y para i ∈ N, Si = {Pi,Ni} (P por “par”

e N por “non”) y 1 = u1(P1, P2) = u1(N1, N2) = −u2(P1, P2) = −u2(N1,N2) =−u1(P1,N2) = −u1(N1, P2) = u2(P1,N2) = u2(N1, P2). Esta información puede de-

scribirse de forma compacta mediante la siguiente tabla:

P2 N2

P1 1,−1 −1, 1N1 −1, 1 1,−1

En la tabla la fila representan la estrategia elegida por el del Jugador 1 y la columna

la elegida por el Jugador 2. Para cada perfil de estrategias (fila, columna), el primer

(segundo) número de cada casilla representa la utilidad esperada del Jugador 1 (2).

En los siguientes ejemplos mantenemos esta convención.

3

Page 4: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

Ejemplo 2 (Dilema del Prisionero). Dos individuos son detenidos e incomunicados.

La policía sospecha que estos individuos han cometido un delito grave (penado con

4 años de cárcel), aunque sólo dispone de pruebas para condenarles por un delito

menor (penado con 1 año de cárcel). La policía propone a cada preso el mismo trato:

si delata a su compañero (D) quedará libre (y por supuesto éste será condenado a 4

años de cárcel). Si ambos se acusan mutuamente, la pena se reduciría de 4 a 3 años

(para cada uno), mientras que si ambas guardan silencio (es decir, si “cooperan”

entre ellos, C) entonces, con la evidencia circunstancial de que dispone la policía sólo

podrían ser condenados a un año de cárcel. Este juego puede representarse en forma

normal mediante la siguiente tabla:

C2 D2

C1 −1,−1 −4, 0D1 0,−4 −3,−3

.

Ejemplo 3 (Batalla de los Sexos). Alberto y Bea quieren salir juntos, pero discrepan

sobre a donde ir. Alberto es un gran aficionado al ballet, mientras que Bea prefiere el

fútbol. Dadas sus preferencias, a la hora de decidir a dónde ir se enfrentan al juego

representado en la siguiente tabla:

F2 B2

F1 1, 2 0, 0

B1 0, 0 2, 1

.

Ejemplo 4 (Coordinación). Dos napolitanos aparcan sus coches en el mismo garaje

y con frecuencia coinciden al entrar o salir. En varias ocasiones han coincidido y

hasta ahora han tenido suerte. Sin embargo, son conscientes del riesgo, así que han

decidido discutir un acuerdo sobre si circular por la derecha (D) o por la izquierda

(I) al entrar y salir del garaje. El juego al que se enfrentan está representado en la

siguiente tabla:D2 I2

D1 1, 1 0, 0

I1 0, 0 1, 1

Los ejemplos 1-4 representan situaciones en las que las posibilidades de coop-

eración y conflicto de intereses están mezcladas de manera inextricable. Estos dos

ingredientes, cooperación u conflicto, están presenten, en distinto grado, en cualquier

4

Page 5: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

juego no cooperativo. El conflicto de intereses es extremo en el Ejemplo 1, muy

intenso en el Ejemplo 2, y también está presente, aunque en menor medida, en el

3; sin embargo, está ausente en el Ejemplo 4. Las posibilidades de cooperación son

crecientes en los ejemplos 2, 3 y 4, mientras que son inexistentes en el Ejemplo 1.

El Ejemplo 1 pertenece a una clase de juegos que se denominan de suma cero

o estrictamente competitivos. En estos juegos los intereses de los jugadores

son diametralmente opuestos: en cada circunstancia posible, las ganancias de cada

jugador son pérdidas del oponente. Obviamente, los juegos de suma cero representan

situaciones de puro conflicto. Estas situaciones son relativamente infrecuentes en

problemas económicos.

El Ejemplo 2 representa un juego recurrente en situaciones económicas: aunque

existen amplias posibilidades de cooperación, la existencia de ganancias substanciales

derivadas de la desviación del comportamiento cooperativo impiden que este se ma-

terialice. Como veremos, la competencia entre empresas o la provisión de bienes

públicos son ejemplos de este tipo de situaciones.

2.2 Racionalidad e Información

Las propuestas de solución que se presentan a continuación están justificadas bajo dos

hipótesis fundamentales sobre la conducta de los individuos y su información básica.

Estos hipótesis son:

Racionalidad. El objetivo de cada individuo es maximizar su bienestar.

Esta hipótesis no excluye la posibilidad de que el bienestar de un individuo de-

penda de la situación de otros individuos y, por tanto, admite la posibilidad de

comportamientos tanto individualistas como altruistas. Ahora bien, cualquier con-

sideración sobre el bienestar de los demás debe estar recogida expresamente en la

función de utilidad esperada de cada jugador.

Conocimiento. El hecho de que los individuos son racionales es de conocimiento

público; es decir, todos lo saben, todos saben que todos lo saben, todos saben que

todos saben que todos lo saben, ...(ad infinitum).

2.3 Soluciones a Juegos Estáticos

Predecir el comportamiento de los jugadores de un juego estático requiere identificar

un perfil de estrategias o acciones y, por tanto, identificar indirectamente el

resultado del juego. Proponemos dos conceptos de solución para los juegos estáticos

5

Page 6: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

no cooperativos: el conjunto de estrategias racionalizables y el conjunto de equilibrios

de Nash.

2.4 Estrategias Racionalizables

En esta primera aproximación formulamos un concepto de solución que se basa no

tanto en identificar positivamente la conducta de los jugadores, como en eliminar de

nuestra consideración aquellas acciones que definitivamente no son compatibles con

las hipótesis de racionalidad y conocimiento común y que, por tanto, no cabe esperar

que se adopten. Para formalizar este concepto necesitamos primero introducir la

noción de estrategia estrictamente dominada.

Informalmente, una estrategia está estrictamente dominada si existe otra estrate-

gia posible que es uniformemente mejor, es decir, que proporciona al jugador un pago

mayor cualesquiera que sean las estrategias de los demás jugadores. Obviamente, un

jugador racional nunca utilizará una estrategia estrictamente dominada, puesto que

esta conducta sería inconsistente con nuestro postulado de que los jugadores adoptan

siempre aquellas acciones que maximizan su bienestar. Obsérvese que en esta de-

scripción hemos considerado cualquier perfil estrategias de los demás jugadores como

posible. Sin embargo, la noción de estrategia estrictamente dominada debería formu-

larse respecto a los al conjunto de perfiles de estrategias para los demás jugadores

que el jugador cree que podrían adoptarse. Por ello, formulamos la noción de estrate-

gia dominado respecto a un conjunto dado de perfiles de estrategias de los demás

jugadores.

Consideramos en juego en forma normal G = (N,S, u). Recordemos que S =

S1 × S2 × · · · × Sn es el conjunto de perfiles de estrategias posibles. Usaremos lanotación s = (s1, s2, . . . , sn); asimismo, para i ∈ N escribiremos s = (si, s−i), donde

s−i ∈ S−i = S1× · · ·Si−1×Si+1 · · · ×Sn es un perfil de estrategias que especifica unaacción para cada jugador excepto el i.

Estrategias estrictamente dominadas. Sea S = S1 × S2 × · · · × Sn, dondeSi ⊆ Si. Decimos que la estrategia si ∈ Si está estrictamente dominada respecto a Ssi existe s0i ∈ Si tal que para todo s−i ∈ S−i tenemos ui(s0i, s−i) > ui(si, s−i).Como ya hemos discutido, el uso estrategias estrictamente dominadas (respecto

a S) es inconsistente con la hipótesis de racionalidad. Por tanto, estas estrategias

pueden ser eliminadas como estrategias posibles. Pero puesto que este hecho puede

ser inferido por cualquier jugador que sepa que los jugadores son racionales, tenemos

6

Page 7: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

que llevar este argumente hasta sus últimas consecuencias, ya que es posible que

una vez eliminadas las estrategias estrictamente dominadas respecto a S, aparezcan,

sucesiva mente, nuevas estrategias estrictamente dominadas. Para proporcionar un

concepto de solución consistente con la hipótesis de que la racionalidad es un hecho de

conocimiento público, hemos de eliminar iterativamente todas las estrategias estric-

tamente dominadas. A continuación se formaliza este procedimiento de eliminación.

Estrategias racionalizables. Definimos la secuencia {S0, S1, . . . , Sk, . . .} de perfilesde estrategias que sobreviven a la eliminación iterativa de estrategias estrictamente

dominadas. Sea S0 = S, y para k = 1, 2, . . . , definimos el conjunto Sk = Sk1×Sk2×· · ·×Skn, donde para cada i ∈ N,Ski es el conjunto de estrategias que no están estrictamentedominadas respecto a Sk−1. Así, la secuencia {Sk} se obtiene eliminando en cadaiteración las estrategias estrictamente dominadas respecto al conjunto de estrategias

no eliminadas en etapas anteriores. Por tanto, cada elemento de la sucesión está

contenido en el anterior: S0 ⊇ S1 ⊇ · · · ⊇ Sk−1 ⊇ Sk ⊇ . . . , de manera que se tratade una sucesión decreciente. El conjunto de perfiles de estrategias racionalizables S∞

es el límite de esta sucesión, que podemos calcular como

S∞ =∞\k=0

Sk.

Propiedades de S∞. Las dos propiedades básicas del conjunto S∞ son

1. S∞ 6= ∅, y

2. Si el conjunto de perfiles de estrategias es finito entonces puede calcularse en

un número finito de iteraciones; es decir, existe k tal que S∞ = S k.

La primera propiedad es consecuencia del siguiente hecho: para que haya una

estrategia estrictamente dominada debe haber otra que la domine. Por tanto, todos

los conjuntos de la secuencia {S0, S1, . . . , Sk, . . .} son no vacíos.La segunda propiedad es consecuencia del hecho de que si en alguna iteración

tenemos Sk = Sk+1 entonces la secuencia se hace constante, con lo que tenemos

S∞ = Sk. Por tanto, el número máximo de iteraciones necesarios para calcula S∞ es

igual al numero de perfiles de estrategias contenidos en S menos n (porque al menos

una estrategia para cada jugador sobrevive a la eliminación iterativa).

Cálculo de S∞. Para calcular el conjunto de estrategias racionalizables de un juego

G = (N,S, u) conviene seguir el siguiente procedimiento:

7

Page 8: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

1. Eliminar las estrategias estrictamente dominadas de cada jugador identificando

el conjunto S1.

2. Considerar ahora el juego reducido que resulta de eliminar los perfiles de estrate-

gias que no están en S1 y sus correspondientes pagos. Identificar las estrategias

estrictamente dominadas en este nuevo juego.

3. Continuar este proceso hasta que en alguna iteración k no se encuentren es-

trategias estrictamente dominadas. El conjunto S∞ coincide con S k.

A continuación aplicamos este procedimiento para encontrar el conjunto de es-

trategias racionalizables en varios ejemplos.

Ejemplos: En los ejemplos 1-4 el conjunto S∞ se puede calcular fácilmente: en

los ejemplos 1, 3 y 4 tenemos S∞ = S, pues ninguna estrategia está estrictamente

dominada respecto a S. En el Ejemplo 2, las estrategia C1 y C2 están estrictamente

dominadas en S y por tanto S∞ = {(D1, D2)}.A continuación presentamos un ejemplo en el que el cálculo del conjunto S∞

requiere varias etapas de eliminación de estrategias estrictamente dominadas.

Ejemplo 5. Consideremos el siguiente juego en forma normal:

A2 B2 C2

A1 1, 1 0, 0 −1, 0B1 0, 0 0, 6 10,−1C1 2, 0 10,−1 −1,−1

1. Cálculo de S1: C2 está estrictamente dominada (por A2); no hay ninguna otra

estrategia estrictamente dominada para ningún jugador. Por tanto S11 = S,

S12 = {A2, B2}.

2. El juego (N,S1, u) esA2 B2

A1 1, 1 0, 0

B1 0, 0 0, 6

C1 2, 0 10,−1

.

Las estrategiasA1 yB1 están estrictamente dominadas (porC1).No hay ninguna

estrategia estrictamente dominada para el Jugador 2. Por tanto, S21 = {C1}, yS22 = S

12 = {A2, B2}.

8

Page 9: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

3. El juego (N,S2, u) esA2 B2

C1 2, 0 10,−1 .

En este juego la estrategia B2 está estrictamente dominada (por A2). Por tanto,

S31 = {C1}, y S32 = {A2}.

4. El juego (N,S3, u) esA2

C1 2, 0.

En este juego no hay estrategias estrictamente dominadas. Por tanto, S4 = S3.

Consiguientemente, para k ≥ 3, Sk = S3 = S∞ = {(C1, A2)}.

2.5 Equilibrio de Nash

El conjunto S∞ es un conjunto generalmente grande. De hecho, con frecuencia (como

muestran los ejemplos 1, 3 y 4) no hay estrategias estrictamente dominadas, de man-

era que S∞ = S. En este caso, este concepto de solución carece de poder predictivo

alguno. Necesitamos, por tanto, un concepto de solución más operativo, que identi-

fique positivamente las estrategias que cabría esperar que adopten los jugadores.

El concepto de equilibrio de Nash1 identifica los perfiles de estrategias que

son estables, en el sentido de que ningún jugador quiera desviarse si espera que los

demás adopten las acciones que se prescribe para ellos. El equilibrio de Nash indica

el desenlace predecible del juego, y puede interpretarse como un “acuerdo” o una

“norma” que tiene la propiedad de que es autosostenible: una vez aceptado, ningún

jugador tiene incentivos para modificarlo unilateralmente. Otra interpretación intere-

sante contempla al concepto de equilibrio de Nash como perfil de expectativas que

se “autoconfirman”, en el sentido de que si los jugadores esperan que los demás se

comporten de acuerdo con lo prescrito, entonces estas acciones ocurren como con-

secuencia de la conducta óptima de los jugadores; es decir, las expectativas de los

jugadores son “racionales” porque son consistentes con la conducta racional.

Consideremos un juego en forma normal G = (N,S, u).

1John Nash (1928—), se licenció en matemáticas a los 20 años en el Carnegie Institute of Tech-

nology y se doctoró a los 22 años (con una tesis de 27 páginas) en Princeton. Profesor del MIT

de Boston, enfermó muy joven y tuvo que abandonar la investigación. Recibió el premio Nobel de

economía en 1994.

9

Page 10: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

Equilibrio de Nash. Un equilibrio de Nash (EN) de G es un perfil s∗ = (s∗1, . . . , s∗n)

tal que para cada Jugador i y cada estrategia si ∈ Si tenemos

ui (s∗) ≥ ui

¡si, s

∗−i¢.

Escribimos EN(G) para denotar el conjunto de equilibrios de Nash del juego G.

Como veremos, el conjunto G puede contener más de un elemento (como ocurre en

los ejemplos 3 y 4 que discutimos más abajo). También puede ser vacío (como en el

Ejemplo 1); trataremos este problema más adelante.

Un equilibrio de Nash se caracteriza por que cada jugador responde óptimamente

a las estrategias de los demás jugadores. Esta interpretación permite reformular el

concepto de equilibrio de Nash como una solución a un sistema de ecuaciones. Para

cada jugador i ∈ N y para cada perfil de estrategias s−i ∈ S−i para los demás ju-gadores, identifiquemos la estrategia que maximiza la utilidad del Jugador i, Ri(s−i).

Con frecuencia nos referimos a Ri(s−i) como la mejor respuesta del Jugador i al perfil

s−i–para simplificar, supondremos, por el momento, que la óptima es única, aunque

generalmente no lo será. Con esta notación, podemos caracterizar a los equilibrios de

Nash como las soluciones al sistema de ecuaciones2

s1 = R1(s−1)

s2 = R2(s−2)...

sn = Rn(s−n).

Para mostrar la utilidad de esta formulación para el cálculo de los equilibrios de

Nash de un juego, discutimos los ejemplos 1-5.

Ejemplos:

1. Consideremos el juego del Ejemplo 1. En la tabla adjunta hemos subrayado la

mejor respuesta de cada jugador: por ejemplo, el pago del Jugador 1 subrayado

el la posición (1,1) de la matriz indica que la mejor respuesta del Jugador 1

a la estrategia s2 = P2 es P1; análogamente el pago del Jugador 2 subrayado

en la posición (1,2) indica que la mejor respuesta del Jugador 2 a la estrategia

2Puesto que cada jugador puede tener más de una mejor respuesta (es decir, Ri(s−i) puede ser

un conjunto en vez de un único punto), el sistema de ecuaciones debería formularse sustituyendo el

símbolo de igualdad (=) por el de pertenencia (∈).

10

Page 11: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

s1 = P1 es N2.P2 N2

P1 1,−1 −1,1N1 −1,1 1,−1

Así, en un equilibrio de Nash los pagos de ambos jugadores deben estar sub-

rayados. Como se observa, esta situación no existe en este juego. Volveremos

sobre este ejemplo.

2. Consideremos el Ejemplo 2. En la tabla hemos subrayado las mejores respuestas

de los jugadores 1 y 2.C2 D2

C1 −1,−1 −4,0D1 0,−4 −3,−3

El único perfil de estrategias que tiene ambos pagos están subrayados es el

(D1, D2). Este perfil es el único equilibrio de Nash del juego. Por tantoEN(G) =

{(D1, D2)}.

3. Consideremos el Ejemplo 3. En la tabla hemos subrayado las mejores respuestas

de los jugadores 1 y 2.F2 B2

F1 1,2 0, 0

B1 0, 0 2,1

Existen dos perfiles de estrategias que tienen ambos pagos subrayados, (F1, F2) y

(B1, B2). Ambos perfiles son equilibrios de Nash del juego. Por tanto EN(G) =

{(F1, F2), (B1, B2)}.

4. Consideremos el Ejemplo 4. En la tabla hemos subrayado las mejores respuestas

de los jugadores 1 y 2.I2 D2

I1 1,1 0, 0

D1 0, 0 1,1

También en este juego existen dos perfiles de estrategias que tienen ambos pagos

subrayados, (I1, I2) y (D1,D2). Por tanto, EN(G) = {(I1, I2), (D1,D2)}.

5. Consideremos ahora el Ejemplo 5. En la tabla hemos subrayado las mejores

respuestas de los jugadores 1 y 2.

11

Page 12: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

A2 B2 C2

A1 1,1 0, 0 −1, 0B1 0, 0 0,6 10,−1C1 2,0 10,−1 −1,−1

En este juego existen un único perfil de estrategias que tiene ambos pagos subrayados,

(C1, A2). Por tanto, EN(G) = {(C1, A2)}.

Equilibrios de Nash y estrategias racionalizables. Como ilustran los ejemplos,

todo perfil de estrategias de equilibrio de Nash es un perfil de estrategias racionaliza-

ble; es decir, EN(G) ⊆ S∞. Así, el concepto de equilibrio de Nash puede interpretarsecomo una “propuesta de selección” dentro del conjunto S∞. El problema es que, como

revela el juego de Pares/Nones (Ejemplo 1), existen juegos que no poseen un equi-

librio de Nash. Para discutir este problema necesitamos introducir la posibilidad de

que los jugadores elijan sus estrategias de acuerdo con un procedimiento aleatorio.

2.6 Estrategias Mixtas

El juego de Pares/Nones (Ejemplo 1) carece de un equilibrio de Nash. Por otra

parte, nuestra perspectiva sobre el comportamiento de los jugadores en este juego,

en concreto nuestro objetivo de predecir qué estrategia adoptará cada jugador, no

parece la adecuada. Cualquiera que haya participado en este juego sugeriría que lo

que cabe esperar es que los jugadores jueguen Pares o Nones con aproximadamente

la misma frecuencia, de manera que lo que se observa es que cada perfil de estrategias

se adopte con una frecuencia igual a 1/4. Si un jugador fuese propenso a jugar Pares

(o Nones) más frecuentemente que Nones (Pares) y este hecho fuera reconocido por

su oponente, perdería con más frecuencia que ganaría. Para evitar la explotación

de esta información por parte del rival, cada jugadores debe protegerse eligiendo

aleatoriamente su estrategia.

Esta discusión sugiere que debemos considerar la posibilidad de que los jugadores

utilicen distribuciones de probabilidad para seleccionar sus acciones. Incluir esta posi-

bilidad supone cambiar nuestra perspectiva sobre el comportamiento de los jugadores.

Además, también tenemos que adoptar otra perspectiva sobre el objetivo de predecir

este comportamiento: el objetivo de identificar las estrategias que vayan a adoptar los

jugadores no es viable ni adecuado. Puesto que los jugadores eligen sus estrategias de

12

Page 13: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

manera aleatoria, nuestro objetivo debe ser predecir la distribución de probabilidad

sobre los perfiles de estrategia posibles que mejor explica este comportamiento.

Consideremos un juego G = (N,S, u). Una estrategia mixta para el Jugador

i ∈ N es un distribución de probabilidad sobre Si. A partir de ahora, nos referiremos

a los elementos de Si como estrategias puras. Si el Jugador i tiene un número finito

de estrategias puras, es decir, Si = {s1i , . . . , smii }, entonces una estrategia mixta es

un vector σi = (σ1i , . . . , σmii ), donde σki ≥ 0 es la probabilidad con que el jugador

adopta la estrategia ski ; y puesto que σi es una distribución de probabilidad, tenemosPmi

k=1 σki = 1. Obsérvese que la estrategia pura s

1i es equivalente a la estrategia mixta

(1, 0, . . . , 0), la s2i a (0, 1, . . . , 0), etcétera, de manera que las estrategias puras son ca-

sos particulares de estrategia mixta (son distribuciones de probabilidad degeneradas).

El conjunto de estrategias mixtas del Jugador i lo denotamos como Σi, y el conjunto

de perfiles de estrategias mixtas como Σ = Σ1 × · · · × Σn.

Cada perfil de estrategias mixtas σ ∈ Σ es una lotería sobre el conjunto de perfiles

de estrategias puras S. Para cada σ ∈ Σ, la utilidad esperada de cada jugador i ∈ Nviene dada por

Eui(σ) =m1Xk1=1

m2Xk2=1

· · ·mnXkn=1

σk11 σk22 · · ·σknn ui(sk11 sk22 · · · sknn ).

Ejemplos:

1. En el juego del Ejemplo 1 supongamos que los jugadores eligen las estrategias

σ1 = (p, 1 − p) y σ2 = (q, 1 − q), donde p (q) es la probabilidad con que elJugador 1 (2) elige P1 (P2). En este caso σ = (σ1, σ2) es una lotería que resulta

en (P1, P2) con probabilidad pq, (P1, N2) con probabilidad p(1 − q), etcétera.La utilidad esperada del Jugador 1 es, por tanto,

Eu1(σ) = pq(1) + p(1− q)(−1) + (1− p)q(−1) + (1− p)(1− q)(1)= 1− 2q + 2p(2q − 1).

Y puesto que se trata de un juego de suma cero, tenemos

Eu2(σ) = −Eu1(σ) = −1 + 2p+ 2q(1− 2p).

2. En el juego del Ejemplo 3 supongamos que los jugadores eligen las estrategias

σ1 = (p, 1 − p) y σ2 = (q, 1 − q), donde p (q) es la probabilidad con que elJugador 1 (2) elige F1 (F2). En este caso σ = (σ1,σ2) es una lotería que resulta

13

Page 14: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

en (P1, P2) con probabilidad pq, (P1, N2) con probabilidad p(1 − q), etcétera.La utilidad esperada del Jugador 1 es

Eu1(σ) = pq(1) + (1− p)(1− q)(2) = 2− 2q + p(3q − 2).

Y la utilidad esperada del Jugador 2 es

Eu2(σ) = pq(2) + (1− p)(1− q)(1) = 1− p+ q(3p− 1).

Equilibrio de Nash en estrategias mixtas: La noción de equilibrio de Nash se

puede formular fácilmente cuando los jugadores eligen una estrategia mixta, en vez

de una pura. Un perfil de estrategias mixtas σ∗ es un equilibrio de Nash si para cada

i ∈ N y cada σi ∈ Σi tenemos

Eui(σ∗i , σ

∗−i) ≥ Eui(σi, σ∗−i).

Como en el caso de estrategias puras, denotemos mediante Ri(σ−i) la(s) estrate-

gia(s) (mixta) óptima del cada jugador i ∈ N cuando los demás jugadores utilizan

las estrategias mixtas σ−i. Así, un equilibrio de Nash σ∗ es una solución al sistema

de ecuaciones

σ1 = R1(σ−1)

σ2 = R2(σ−2)...

σn = Rn(σ−n).

De nuevo esta formulación nos proporciona un definición más operativa, que nos

orienta en el cálculo de los equilibrios de Nash de un juego.

Puesto que las estrategias puras pueden también representarse como estrategia

mixtas, mantendremos la notación EN(G) para referirnos al conjunto de perfiles de

estrategias (mixtas) que constituyen un equilibrio de Nash del juego G. La propiedad

más importante de la noción de equilibrio de Nash (en estrategias mixtas) es que

todo juego posee un equilibrio. Por supuesto, algunos juegos sólo tienen equilibrios

en estrategias mixtas (como ilustra el ejemplo del juego de Pares/Nones que volve-

mos a discutir a continuación), otros tienen equilibrios en estrategias puras y mixtas

(como el juego de la Batalla de los Sexos), y otros sólo en puras (como el Dilema del

Priosionero).

Ejemplos:

14

Page 15: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

1. En el juego del Ejemplo 1, si los jugadores eligen las estrategias σ1 = (p, 1− p)y σ2 = (q, 1− q), la utilidad esperada del Jugador 1 es

Eu1(p, q) = 1− 2q + 2p(2q − 1).

Por tanto, la Eu1(p, q) es (1) creciente en p si q > 12, (2) constante en p si q = 1

2

y (3) decreciente en p si q < 12. En el primer caso, la estrategia óptima del

Jugador 1 es p = 1, mientras que en el segundo cualquier estrategia es óptima

y en el tercero la estrategia óptima es p = 0. Así, su función de reacción es

R1(q) =

1 si q > 1

2

[0, 1] si q = 12

0 si q < 12.

Análogamente, la utilidad esperada del Jugador 2 es

Eu2(p, q) = −1 + 2p+ 2q(1− 2p),

y su función de reacción es

R2(p) =

0 si p > 1

2

[0, 1] si p = 12

1 si p < 12.

La única solución al sistema de ecuaciones

p = R1(q)

q = R2(p)

es p∗ = q∗ = 12. Por tanto EN(G) =

©¡(12, 12), (1

2, 12)¢ª.

2. En el juego del Ejemplo 3, silos jugadores eligen las estrategias σ1 = (p, 1− p)y σ2 = (q, 1− q), la utilidad esperada del Jugador 1 es

Eu1(σ) = pq(1) + (1− p)(1− q)(2) = 2− 2q + p(3q − 2)

y su función de reacción es

R1(q) =

1 si q > 2

3

[0, 1] si q = 23

0 si q < 23.

15

Page 16: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

La utilidad esperada del Jugador 2 es

Eu2(σ) = pq(2) + (1− p)(1− q)(1) = 1− p+ q(3p− 1)

y su función de reacción es

R2(p) =

1 si p > 1

3

[0, 1] si p = 13

0 si p < 13.

El sistema de ecuaciones

p = R1(q)

q = R1(p)

tiene tres soluciones (1) p∗ = q∗ = 1, (2) p∗ = q∗ = 0, y (3) p∗ = 13, q∗ = 2

3. Por

tanto EN(G) =©((1, 0), (1, 0)) , ((0, 1), (0, 1)) ,

¡(13, 23), (2

3, 13)¢ª.

Estrategias mixtas y estrategias racionalizables: una vez que hemos abierto la

posibilidad de que los jugadores elijan sus acciones de acuerdo con distribuciones de

probabilidad, también tenemos que plantearnos esta posibilidad a la hora de deter-

minar si una estrategia está estrictamente dominada.

Ejemplo 6. Consideremos el siguiente juego en forma normal:

A2 B2 C2

A1 1, 1 2, 2 0, 4

B1 2, 2 1, 1 2, 0

C1 3, 3 0, 2 4, 1

En este juego no hay estrategias estrictamente dominidas de acuerdo con la defini-

ción formulada anteriormente. Sin embargo, la estrategia mixta del Jugador 2 σ2 =

(58, 0, 5

8) proporciona unos pagos

σ2

A158(1, 1) + 3

8(0, 4) = (5

8, 178)

B158(2, 2) + 3

8(2, 0) = (16

8, 108)

C158(3, 3) + 3

8(4, 1) = (27

8, 188)

.

16

Page 17: Apuntes de La Teoria de La Decision Y de Los Juegos Juegos Estaticos (Universidad Carlos III Madrid 2001)

Esta estrategia mixta claramente domina a la estrategia B2

A2 B2 C2 σ2

A1 1, 1 2, 2 0, 4 (58, 178)

B1 2, 2 1, 1 2, 0 (168, 108)

C1 3, 3 0, 2 4, 1 (278, 188)

.

Una vez eliminada esta estrategia, la eliminación sucesiva de estrategias dominadas

resulta en S∞ = {(C1, A2)}.Concluimos con una nueva reformulación de la noción de estrategia estrictamente

dominada que incorpora la posibilidad de que una estrategia (pura) esté dominada

por una mixta. Si S = S1 × S2 × · · · × Sn, donde Si ⊆ Si, denotamos mediante Σi elconjunto de estrategias mixtas σi ∈ Σ tales que solos las estrategias en Si se adoptan

con probabilidad positiva.

Estrategias estrictamente dominadas. Sea S = S1 × S2 × · · · × Sn, dondeSi ⊆ Si. Decimos que la estrategia si ∈ Si está estrictamente dominada respectoa S si existe una estrategia mixta σi ∈ Σi tal que para todo s−i ∈ S−i tenemosEui(s

0i, s−i) > Eui(si, s−i).

17