instituto politecnico nacional´ escuela superior de f ......a mi querida mam´a, por todo el amor...

Post on 05-Feb-2021

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

  • INSTITUTO POLITÉCNICO NACIONAL

    Escuela Superior de F́ısica y Matemáticas

    Teoŕıa de Juegos Matriciales y Aplicaciones

    TESIS

    QUE PARA OBTENER EL TÍTULO DELICENCIADO EN FÍSICA Y MATEMÁTICAS

    PRESENTA:Guillermina Ávila Garćıa.

    Director de Tesis:

    Prof. Rubén Téllez Sánchez.

    México D. F., agosto de 2006

  • A mi querida mamá, por todo el amor que me ha manifestado siempre, la

    paciencia y confianza que deposita en mi, y sobre todo por que me ha mostrado lo

    bello de la vida a través de sus dulces palabras y su tierna luz en la mirada.

    A mi padre por el apoyo que me ha brindado.

    A mis hermanos: Lety, Lúıs, Geovanni, Ricky y Nenita por el amor, cariño,

    comprensión y alegŕıa que siempre me demuestran.

    A Iván por su infinita paciencia, cariño, amor y comprensión que siempre me

    expresa.

    A Dios por permitirme ser hija, hermana y compañera de tan excelentes y

    maravillosos seres humanos.

    Con amor y agradecimiento.

    2

  • Agradecimientos

    Al M. en C. Rubén Mancio Toledo, docente de la Escuela Superior de F́ısica y

    Matemáticas, amigo y excelente profesor, que me ha brindado todo su apoyo incondi-

    cional durante y después del trayecto de la carrera, aśı como su colaboración para la

    escritura del presente trabajo.

    Al M. en I. Rubén Téllez Sánchez asesor de la presente tésis, por su valioso

    apoyo y paciencia para llevar a cabo éste trabajo.

    A los integrantes del jurado: M. en C. Rubén Mancio Toledo, Dr. Isidro Romero

    Medina, Lic. Francisco Quezada Campo, Lic. Armando Hernández Solis, por su valiosa

    colaboración en la revisión y sugerencias de ésta tésis.

    A todos los profesores de la Escuela Superior de F́ısica y Matemáticas por

    contribuir a mi formación académica.

    Agradeciendo infinitamente la atención, apoyo y paciencia recibida.

    3

  • Índice general

    Introducción 6

    1. Esquema Conceptual y Contexto de la Teoŕıa de Juegos 9

    1.1. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    1.2. La importancia de la Teoŕıa de Juegos . . . . . . . . . . . . . . . . . 10

    1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos . . . . . . . . . 11

    1.4. Aplicación de la Teoŕıa de Juegos . . . . . . . . . . . . . . . . . . . . 13

    2. Tipoloǵıas y Fundamentos Matemáticos de la Teoŕıa de Juegos 14

    2.1. Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    2.2. Tipos de jugadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    2.3. Juegos de información perfecta . . . . . . . . . . . . . . . . . . . . . 16

    2.4. Juegos de suma-cero para 2 oponentes . . . . . . . . . . . . . . . . . 16

    3. Metodoloǵıa para la solución de problemas 19

    3.1. Estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    3.2. Estrategias de Seguridad . . . . . . . . . . . . . . . . . . . . . . . . . 19

    3.3. Estrategias Mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    3.4. Uso de estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . 23

    3.5. Métodos para resolver juegos matriciales . . . . . . . . . . . . . . . . 24

    3.6. Técnica de punto de silla de montar . . . . . . . . . . . . . . . . . . . 25

    3.7. Técnica de dominación . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    3.7.1. Reducción de orden de Matrices . . . . . . . . . . . . . . . . . 27

    3.8. Método Algebraico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    3.9. Método Geométrico para los juegos 2× n . . . . . . . . . . . . . . . . 383.10. Solución de juegos 2 x 2 con engaño . . . . . . . . . . . . . . . . . . . 41

    4

  • ÍNDICE GENERAL 5

    3.11. Método de subjuegos para encontrar el valor del juego . . . . . . . . . 44

    4. Programación Lineal 49

    4.1. Teorema del Mı́nimax . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    4.2. Solución por medio de Programación Lineal . . . . . . . . . . . . . . 51

    5. Juegos No Cooperativos 59

    5.1. Juegos suma diferente de cero o metajuegos . . . . . . . . . . . . . . 59

    Conclusiones 64

    Bibliograf́ıa 65

    Indice Alfabético 66

    Avila Garcia

  • Introducción

    Antecedentes

    Los inicios de lo que hoy se conoce como Teoŕıa de Juegos se remontan al año 1759

    cuando el economista Quesnay empieza a utilizar modelos primitivos de programación

    matemática. Más tarde, otro economista de nombre Walras, hace uso, en 1874, de

    técnicas similares. Los modelos lineales de la investigación de operaciones, tienen

    como precursores a Jordan en 1873, Minkowsky en 1896 y a Farkas en 1903. La

    teoŕıa de juegos se cimentó en 1939 con el matemático von Neuman y el economista

    Oskar Morgenstern. No fue sino hasta la Segunda Guerra Mundial cuando la Teoŕıa

    de Juegos empezó a tomar auge. Primero se le utilizó en la loǵıstica estratégica para

    vencer al enemigo y, más tarde al finalizar la guerra, en la loǵıstica de distribución de

    todos los recursos militares de los aliados por todo el mundo. Fue debido precisamente

    a este último problema que el doctor George Datzing, el que en 1947, resumiendo el

    trabajo de muchos de sus precursores, inventará el método simplex con lo cual dio

    inicio a la programación lineal, que hoy en d́ıa se utiliza con mucha frecuencia en la

    teoŕıa de juegos.1

    Problemática

    Los conflictos que se presentan hoy en d́ıa, no sólo es en el sector privado, sino tam-

    bién en el sector de los servicios públicos, en contratos, guerras militares, guerras

    comerciales, marketing para la competencia de los mercados, negociaciones domésti-

    cas, comerciales y colectivas, y en alianzas, tanto en los páıses desarrollados como en

    los páıses del tercer mundo, lo cual ha dado lugar a que se aplique la teoŕıa de juegos

    constantemente. En México la Teoŕıa de Juegos se utiliza dentro del sector público,

    entre otros la Secretaŕıa de Comunicaciones, Partidos Poĺıticos, Bancos, etc.

    1veáse [6]

    6

  • Dado a que todos somos agentes económicos, conviene estudiar esta teoŕıa,

    a fin de entender qué operaciones teóricas y prácticas podŕıan ofrecernos premios

    monetarios más grandes. Debe incluirse en la lista a cualquier otra situación en que

    dos o más individuos requieran interactuar a fines de obtener ganancias económicas.

    Como el ser humano es un homo economicus tanto como un homo ludicus, él

    puede encontrar infinidad de aplicaciones a la Teoŕıa de juegos.

    Objetivo

    El objetivo principal del presente trabajo es desarrollar la teoŕıa de juegos y sus

    aplicaciones en el ámbito laboral y en estrategias tanto militares como de mercadeo.

    Hipótesis

    La teoŕıa de juegos constituye una herramienta adecuada para resolver racionalmente

    situaciones de conflicto.

    Presentación

    En el Caṕıtulo 1 se hace referencia a un texto bibĺıco, donde se realiza un

    análisis de cómo intuitivamente ya se usaba la teoŕıa de juegos y que en la vida

    cotidiana estamos estrechamente ligados con la toma de decisiones usando juegos.

    En el caṕıtulo 2, se introducen los conceptos básicos de la teoŕıa de juegos

    aśı como los tipos de juegos que se tienen; como son: aleatorios, no aleatorios y de

    información perfecta, aśı mismo se introduce el concepto de juegos de suma cero y

    las valoraciones que se tienen de acuerdo a un juego establecido.

    En el caṕıtulo 3, tenemos la parte central del trabajo, pues se define y se explica

    a detalle algunas de las metodoloǵıas para la solución a un problema de teoŕıa de

    juegos, aśı como las diferentes aplicaciones a las que conducen.

    En el caṕıtulo 4, se lleva a cabo una solución mediante programación lineal, un

    tema muy importante en el contexto de la teoŕıa de juegos, además de un bosquejo de

    la demostración del importante teorema del Minimax aplicable a la teoŕıa de juegos;

    haciendo uso de teoremas muy importantes, tales como: Teorema de Dualidad, Teo-

    rema de Holgura Complementaria. Todos estos resultados nos conllevan a la solución

    de problemas de teoŕıa de juegos por medio de programación lineal.

    7

  • En el caṕıtulo 5, se tiene un breve estudio de los juegos diferente de cero, y se

    explica el famoso Dilema del prisionero, y las semejanzas que existe entre éste juego

    y las técnicas de mercadeo, en donde d́ıficilmente se conocen las pérdidas o ganancias

    que puede tener nuestro oponente.

    Finalmente, de acuerdo a la metodoloǵıa empleada en el transcurso de la in-

    vestigación nos conlleva a la conclusión y a algunas recomendaciones para el uso de

    teoŕıa de juegos.

    El presente trabajo se desarrolla por medio de la metodoloǵıa, ilustrando con

    ejemplos partiendo desde las técnicas básicas (técnica de punto de silla, dominancia y

    geométricos) hasta llegar a el planteamiento y solución de aquellos juegos de m×n, loscuales son imposibles de resolver utilizando técnicas comunes, para ello se implementa

    la programación lineal la cual es útil y práctica para resolver estos juegos, haciendo

    uso del método simplex.

    8

  • Caṕıtulo 1

    Esquema Conceptual y Contexto

    de la Teoŕıa de Juegos

    1.1. Aportaciones

    La Teoŕıa de Juegos es un tipo de análisis matemático orientado a predecir

    cuál será el resultado cierto o el resultado más probable de una disputa entre dos

    individuos. Fue diseñada y elaborada por el matemático John von Neumann y el

    economista Oskar Morgenstern en 1939, con el fin de realizar el análisis económico

    de ciertos procesos de negociación. von Neumann y Morgenstern, escribieron el libro

    The Theory of Games and Economic Behaviour1 (1944). A.W. Tucker es quien

    diseñó el famośısimo problema del “Dilema del Prisionero”. El matemático John

    Forbes Nash, Jr. (1928-) creó en 1950 la noción de “Equilibrio Nash”, que corresponde

    a una situación en la que dos partes rivales están de acuerdo con determinada situación

    del juego o negociación, cuya alteración ofrece desventajas a ambas partes. Otros

    importantes representantes de la teoŕıa de juegos fueron el húngaro nacionalizado

    estadounidense John Harsanyi (1920-) y el alemán Reinhard Selten, Nash, Harsanyi

    y Selten recibieron el Premio Nobel de Economı́a de 1994 por sus contribuciones a la

    Teoŕıa de Juegos.

    1referencia completa.

    9

  • 1.2. La importancia de la Teoŕıa de Juegos 10

    1.2. La importancia de la Teoŕıa de Juegos

    Un juego es un proceso en que dos o más personas toman decisiones y acciones,

    la estructura de las cuales está inscrita en un conjunto de reglas (que pueden ser

    formales o informales), a fines de obtener beneficio. Cada combinación de decisiones

    y acciones determina una situación particular, y, dado que las decisiones y acciones

    de los agentes involucrados (llamados los jugadores) pueden ser combinadas de nu-

    merosas formas, las situaciones generadas también serán numerosas y su magnitud

    igual a las de las combinaciones de decisiones y acciones de los agentes. El conjun-

    to total de situaciones posibles es el cuadro incidental del juego. Siguiendo con este

    razonamiento, encontramos que cada situación (es decir, cada punto del cuadro inci-

    dental) genera una combinación de premios determinada. El premio que le da a un

    jugador una situación particular puede ser comparado con los premios que le ofre-

    cen las otras situaciones. Un concepto importante es el de pago. Como se dijo, cada

    situación particular ofrece una combinación de premios, de la manera siguiente: si

    se trata de dos jugadores, la situación ofrece un premio para el primero y otro para

    el segundo. Si se trata de tres jugadores, la situación genera un premio para cada

    jugador. Ésta es la lógica de los premios y las situaciones. A cada premio se le llama

    pago. La Teoŕıa de juegos nos ayuda a analizar juegos en los que dos o más personas

    compiten por un único premio o pago situación o conjunto de situaciones que en lo

    adelante se les llamará la solución del juego. La solución del juego se sustenta en que

    la conducta de cada jugador llega a engancharse con la de los otros, derivando todo

    esto en situaciones más fuertes que otras. Las situaciones más fuertes son las que

    se producen con la mayor probabilidad, y debido a esto es que se considera que la

    solución o desenlace del problema del juego corresponde a la situación o situaciones

    más fuertes, más probables.

    El análisis de un juego lleva muchas veces a que se determine cuál va a ser el

    punto final de solución de dicho juego a este resultado se le denominará resultado

    inminente o fatal del juego. No obstante, en realidad existen muchos juegos cuyo final

    es imposible de determinar, incluso con la ayuda de la Teoŕıa de Juegos: estos juegos

    no tienen resultados inminentes, o, si es que los tienen, éstos no son previsibles y la

    Teoŕıa de Juegos no puede predecirlos. Tal es el caso de un juego de ajedrez, el cual es

    un juego de suma cero: todo lo que la Teoŕıa de Juegos nos puede decir acerca de este

    juego es que uno de los dos jugadores ganará y el otro perderá el juego. Al margen

    Avila Garcia

  • 1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos 11

    de esta grave circunstancia, la Teoŕıa de Juegos śı puede ayudarnos a determinar

    los resultados de otros muchos importantes juegos y situaciones de negociaciones e

    intereses en conflicto. La Teoŕıa de Juegos es importante porque permite hallar los

    resultados inminentes o fatales de numerosos juegos diversos que debemos enfrentar

    cotidianamente en el mundo real. La Teoŕıa de Juegos no deja de ser importante sólo

    porque no puede analizar la totalidad de los juegos que jugamos en el mundo real.

    1.3. El sabio rey Salomón hace uso de la Teoŕıa de

    Juegos

    La Teoŕıa de Juegos es una disciplina que involucra en grado alto la capaci-

    dad anaĺıtica y proyectiva del ser humano. Es, a la vez, una disciplina susceptible

    de ser aplicada a diversidad de casos. Para mostrar ambas cosas simultáneamente,

    se hará mención de la conocida historia de las madres y el rey Salomón. Salomón

    recibió a dos mujeres que declaraban ser las madres de un bebé (1 Reyes 3, 16-28)2.

    Ante la ausencia de datos o indicios tangibles, deb́ıa creerse bien a una o a la otra,

    luego de lo cual el bebé seŕıa entregado a la mujer considerada la madre de éste. De-

    mostrando que su gran sabiduŕıa lo relevaba de la necesidad de mayor información,

    Salomón elaboró un juego, el cual tomó la forma de una propuesta: “Con esta espada

    habrá de partirse al bebé, luego de lo cual se dará una mitad del niño a cada mujer”.

    “Inteligentemente”, el sabio rey recurrió a una proposición perfectamente aceptable si

    ella era aplicada a juicios sobre materias y objetos comerciales. Este juego exaltaŕıa la

    voluntad “competitiva” de obtener ganancia en grado máximo. El truco de Salomón

    consist́ıa en que una valoración primordial de competencia rivalizada con la valoración

    dictada por el amor maternal. El criterio de optimización individual llevó a una de

    las madres a aceptar la peculiar propuesta salomónica. El criterio de amor maternal

    llevó a la otra madre a pedir una solución inscrita en la optimización colectiva:

    Prefeŕıa que el niño siguiera entero, contentándose con sólo saber que él

    segúıa vivo, aún si no pudiera nunca más volver a verlo.

    2veáse [5]

    Avila Garcia

  • 1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos 12

    Salomón observó la siguiente escala de valores:

    Primero: Que su hijo exista, que conserve su vida.

    Segundo: Tener a su hijo consigo.

    Salomón hizo la suposición de que sólo la verdadera madre podŕıa instintiva-

    mente conocer y respetar esta escala. Trabajando en base a dicha suposición, las

    sometió a una crisis, cuya solución evidente le permitiŕıa acceder a sólo una parte del

    premio, o renunciar completamente el premio. Este premio era la tenencia del hijo,

    es decir, un pago correspondiente al segundo nivel de la escala de valores.

    La falsa madre, por su parte, teńıa la siguiente escala de valores:

    Primero: Tener al hijo consigo.

    Segundo: Conservar por lo menos una parte del hijo consigo.

    Esto, traducido a términos análogos a los de la escala de valores de una verdadera

    madre, toma la forma de:

    Primero: Tener al hijo consigo.

    Segundo: Aunque eso conllevara la pérdida de su vida, conservar una parte del

    hijo consigo.

    Sin embargo, eso mismo llevado a una escala de valores materiales, equivale a:

    Primero: Ganar todo el premio.

    Segundo: Ganar al menos una parte del premio.

    Es decir que la lógica de la falsa madre era materialista, mientras que la lógica de

    la verdadera madre era “lógica de madre”. De hecho, Salomón supusó que la falsa

    madre seguiŕıa la lógica materialista que es apropiada para la mayoŕıa de problemas

    de obtención de premios, en tanto que la verdadera madre seguiŕıa la lógica de madre.

    El problema impuesto por Salomón, de cumplirse las suposiciones de sabio, quitaŕıa

    el disfraz de madre a la falsa madre.

    Avila Garcia

  • 1.4. Aplicación de la Teoŕıa de Juegos 13

    1.4. Aplicación de la Teoŕıa de Juegos

    Para usar la Teoŕıa de Juegos como una aplicación para una situación real, se re-

    quiere construir modelos simplificados de la realidad. En estos modelos, se tendrá que

    representar a cada jugador con sus respectivas formas de conducta. Cuando se trata

    de un juego en el que se enfrenta a un único rival, normalmente se puede decir que se

    conoce perfectamente cuál es su propia forma de actuar, pero ignora o conoce sólo en

    parte la de su rival u oponente. Por esto se hace más fácil representar simplificada-

    mente su propia conducta que representar la conducta del rival. En cualquier caso, se

    requiere representar adecuadamente las conductas de los dos (o más) jugadores que

    intervienen. A veces se necesitaŕıa plantear dos o más representaciones de la conducta

    probable del rival. Cada representación recibe el nombre de escenario. Cada escenario

    es un juego simple. El conjunto de dos o más escenarios es un juego compuesto.

    Avila Garcia

  • Caṕıtulo 2

    Tipoloǵıas y Fundamentos

    Matemáticos de la Teoŕıa de

    Juegos

    2.1. Conceptos

    En un juego; puede haber dos o más oponentes; entonces se habla de juegos

    para dos personas o, en general, para n personas. Los jugadores en un juego para

    n personas pueden formar coaliciones permanentes o temporales durante el curso

    del juego; todos los miembros de una coalición permanente se consideran en conjunto

    como un jugador, puesto que tienen los mismos intereses. A los juegos de dos personas

    también se les llama bipersonales.

    Considérense dos jugadores I y II, con intereses opuestos. Por juego, se entiende

    un curso de eventos que consisten de una sucesión de acciones por parte de I y II.

    Para que el juego sea susceptible de análisis matemático, también debe tenerse un

    sistema de reglas establecidas sin ambigüedad, es decir, un sistema de condiciones

    que regulen las acciones permisibles para cada jugador en cada etapa del juego, la

    cantidad de información que tiene cada bando acerca del comportamiento del otro,

    la sucesión de jugadas (es decir, las decisiones que se toman en el curso del juego) y

    también el resultado del juego, que se obtiene de la totalidad de las jugadas realizadas

    por cada bando.

    Se dice que un juego es de suma cero si la suma de las ganancias es cero, es

    14

  • 2.2. Tipos de jugadas 15

    decir, si uno de los bandos pierde exactamente tanto como lo que el otro gana. En los

    juegos de suma cero, las metas que persiguen los jugadores son totalmente opuestas.

    La teoŕıa de juegos se divide en cuanto a:

    a) Jugadores - Juego de dos personas - Juego de n personas

    b) Número de estrategias disponibles a cada decisor - Juegos finitos - Juegos

    infinitos

    c) Objetivos del juego - Juegos de suma - cero - Juegos suma diferente de cero

    o metajuegos.

    2.2. Tipos de jugadas

    Un juego se realiza mediante jugadas sucesivas; cada jugada es una elección de

    una de las alternativas posibles especificadas por las reglas. Una jugada puede ser

    personal o aleatoria. Una jugada personal es una elección y ejecución consciente, por

    parte de uno de los jugadores, de una de las jugadas que sean posibles en la situación

    dada. Un ejemplo de una jugada personal es cualquier jugada en un juego de ajedrez.

    Cuando le corresponde su turno, el jugador hace una elección consciente de entre

    las jugadas posibles, dependiendo de la posición de las piezas sobre el tablero. El

    conjunto de posibilidades disponibles para una jugada personal está determinado por

    las reglas del juego y depende de la totalidad de las jugadas previas realizadas por

    ambos jugadores. Una jugada aleatoria es la elección de una posibilidad de entre un

    cierto número de ellas, no por la decisión de un jugador, sino por el resultado de

    algún evento aleatorio (lanzamiento de una moneda, lanzamiento de dados, baraja y

    reparto de cartas, etc.). Por ejemplo, si el juego requiere que se extraiga una carta al

    azar de una baraja completa, ésta es una jugada aleatoria con 52 resultados posibles,

    cada uno con la misma probabilidad. Para que el juego sea matemáticamente deter-

    minado, las reglas del juego deben aclarar cuál es la distribución de probabilidad de

    los diversos resultados posibles de cada una de las jugadas aleatorias. Algunos juegos

    sólo contienen jugadas aleatorias y, con propiedad, se les da el nombre de ”juegos de

    azar”. Otros sólo contienen jugadas personales (ajedrez, damas). La mayoŕıa de los

    juegos de cartas son mixtos, contienen tanto jugadas personales como aleatorias.

    Avila Garcia

  • 2.3. Juegos de información perfecta 16

    2.3. Juegos de información perfecta

    Los juegos también se clasifican según el tipo y cantidad de la información

    disponible -para cada jugador- acerca de las jugadas del oponente. Un juego en el

    cual cada participante, al hacer una jugada, conoce los resultados de todas las jugadas

    hechas previamente, sean éstas personales o aleatorias, se llama juego de información

    perfecta. Ejemplos de tales juegos son el ajedrez, las damas y el juego de tres en raya.

    En otros juegos, los jugadores no tienen esa información perfecta; en el póker, por

    ejemplo, los jugadores no saben cuáles cartas han recibido sus oponentes.

    En la vida real la mayoŕıa de las situaciones antagónicas no son juegos de infor-

    mación perfecta, dado que la ignorancia de las acciones del oponente, generalmente,

    es un elemento esencial de tales situaciones.

    2.4. Juegos de suma-cero para 2 oponentes

    Los elementos en la formulación de un juego normal son los siguientes:

    1. Un conjunto finito de estrategias puras E1 = {I1, I2, . . . , In}, para el jugador I yun conjunto finito de estrategias puras E2 = {II1, II2, . . . , IIm} para el jugadorII.

    2. Una matriz real de orden n×m A = (aij). Cada elemento de esta matriz es elpago para el jugador I cuando elige la estrategia Ii y el jugador II escoge la

    estrategia IIj. El pago para el jugador II en estas circunstancias es −aij . Larepresentación de la matriz, es:

    Estrategia del jugador de renglones,

    jugador I

    Estrategia del jugador de columnas,

    jugador II

    renglón 1

    renglón 2...

    renglón m

    columna 1 columna 2 · · · columna na11 a12 · · · a1na21 a22 · · · a2n...

    ... · · · ...am1 am2 · · · amn

    Una solución de estos juegos especif́ıca las estrategias óptimas que los jugadores

    racionales usarán y el pago que se obtiene con ellas. La solución o soluciones de un

    Avila Garcia

  • 2.4. Juegos de suma-cero para 2 oponentes 17

    juego de 2 personas de suma nula pueden caracterizarse de dos formas: mediante las

    estrategias de seguridad y con el concepto de punto de equilibrio.

    Ejemplo 1.1 O.G. Haywood (1954)1. En el desembarco aliado, en agosto de

    1944, se ha abierto una brecha por mar Avranches (Francia). La cabeza de playa ha

    expuesto el flanco oeste del noveno ejército alemán, mandado por el general von Kluge.

    Este tiene dos posibles formas de actuar: (1) Atacar hacia al oeste para llegar al mar,

    asegurándose su flanco occidental y dividir a las fuerzas americanas. (2) Retirarse

    hacia el este para llegar a una mejor posición defensiva cerca del ŕıo Sena. El general

    americano Bradley tiene al primer ejército americano conteniendo al ejército alemán

    desde la cabeza de playa, y más al interior tiene al tercer ejército, bajo las órdenes del

    general Patton, en reserva, haciendo misiones de limpieza del terreno hacia el este,

    sur y oeste. Bradley consideró tres posibilidades: (1) Ordenar a la reserva volver a

    defender la brecha abierta. (2) Enviar la reserva hacia el este para intentar cortar la

    retirada del noveno ejército alemán. (3) Mantener las reservas en su posición durante

    un d́ıa y decidir después si ordenar ayudar a la cabeza de playa si era atacada o

    enviarlas hacia el este.

    El análisis completo de la situación le llevó a valorar los diferentes resultados

    de acuerdo con la tabla siguiente, en la que las filas representan las estrategias del

    general Bradley, y las columnas las estrategias del general von Kluge.

    1. Atacar 2. Retirarse

    1. Reforzar Se mantiene la brecha Débil presión sobre la retirada alemana

    2. Mover Se produce el corte alemán Fuerte presión en la retirada alemana

    3. Esperar Se mantiene la brechay los alemanes son rodeados Moderada presión en la retirada alemana

    Lógicamente, la resolución del conflicto dependerá de la valoración de los resul-

    tados v (i, j), i = 1, 2, 3 y j = 1, 2. El orden de preferencias de mejor a peor según la

    doctrina del ejército americano era:

    v (3, 1) > v (2, 2) > v (3, 2) > v (1, 2) > v (2, 1) ,

    por lo que al buscar la estrategia menos mala, maximin, el general Bradley escogió la

    tercera estrategia. Las valoraciones alemanas deb́ıan ser similares, pues el general von

    1veáse [3]

    Avila Garcia

  • 2.4. Juegos de suma-cero para 2 oponentes 18

    Kluge decidió retirarse, pero nunca ejecutó su decisión. Hitler, a cientos de kilómetros

    del campo de batalla, debió tener otras valoraciones del conflicto y ordenó atacar y

    cerrar la brecha. El resultado fue que Bradley resistió el ataque alemán; y mantuvo

    la reserva en el sur, lo que permitió enviarla el segundo d́ıa hacia el este; los alemanes

    comenzaron la retirada, siendo rodeados por las armadas americana y francesa, lo que

    llevó al suicidio al general alemán.

    Cada jugador puede ordenar las valoraciones y dar valores numéricos a las

    consecuencias

    v(i, j) (vI(i, j), vII(i, j))

    En el caso de que las valoraciones se consideren de forma totalmente opuesta

    por los jugadores para uno supone ganancias y para el otro implique pérdidas éstas

    pueden expresarse se dice que la situación corresponde a un juego de suma nula.

    Cuando esto no ocurre la valoración del juego vendrá dada para cada resultado por dos

    números no necesariamente relacionados pues suponen el reflejo de dos valoraciones

    independientes llamándose a estos juegos por oposición a los anteriores juegos de

    suma no nula.

    En otras ocasiones las valoraciones no pueden ordenarse, e incluso valorar las

    estrategias pueden tenerse en cuenta diferentes aspectos. En el ejemplo anterior, los

    generales pod́ıan valorar los resultados no sólo dependiendo del curso de la guerra

    sino también del impacto que se podŕıa producir en la población civil y su entorno.

    De hecho muchos modelos se consideran con objetivos escalares debido a la

    dificultad de resolver el modelo con objetivos múltiples. Hay situaciones en las que

    una misma estrategia debe ser empleada en diferentes escenarios por ejemplo las

    poĺıticas de producción de dos empresas que compiten en su mercado pueden valorarse

    escalarmente, pero si compiten simultáneamente en varios mercados debe emplearse

    la valoración vectorial.

    Avila Garcia

  • Caṕıtulo 3

    Metodoloǵıa para la solución de

    problemas

    3.1. Estrategias

    Uno de los conceptos fundamentales de la teoŕıa de juegos es la de estrategias.

    Representaremos por Ii, 1 ≤ i ≤ n las estrategias puras del jugador I y por IIj,1 ≤ j ≤ m las estrategias puras del jugador II. El juego permite determinar lavaloración que ocasiona el que cada jugador utilice una de sus estrategias por lo

    que representaremos por v (i, j) la valoración de las consecuencias del empleo de la

    estrategia Ii por el primer jugador y la estrategia IIj por parte del segundo. Al variar

    i y j en sus respectivos campos se tiene una estructura de matriz aunque los valores

    no sean números reales por lo que a estos juegos se les denomina juegos matriciales.

    Estas valoraciones pueden ser interpretadas de muy diversas formas por los jugadores

    que intervienen en el juego.

    3.2. Estrategias de Seguridad

    En los juegos de suma nula cuando un jugador intenta maximizar su pago a

    la vez esta intentando minimizar el pago de su oponente. Cada jugador considera el

    peor resultado que puede conseguir con cada una de sus estrategias y después escoge

    la estrategia que le proporciona el mejor de los peores resultados.

    19

  • 3.2. Estrategias de Seguridad 20

    Definición 3.2.1

    Para cada estrategia pura Ii ∈ E1, el nivel de seguridad del jugador I es el pagoque puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador II:

    vI (Ii) = mı́nj

    aij . (3.1)

    Para cada estrategia pura IIj ∈ E2 el nivel de seguridad del jugador II es el pago quepuede asegurarse con esa estrategia, prescindiendo de las acciones del jugador I:

    vII (IIj) = máxi

    aij . (3.2)

    Definición 3.2.2

    i) El valor maximin (o valor inferior del juego) del jugador I es:

    vI = máxi

    vi (Ii) = máxi

    mı́nj

    aij . (3.3)

    Una estrategia de seguridad o estrategia maximin es la que proporciona al ju-

    gador su valor maximin.

    ii) El valor minimax (o valor superior del juego) del jugador II es

    vII = mı́nj

    vII (IIj) = mı́nj

    máxi

    aij . (3.4)

    Una estrategia de seguridad o estrategia minimax es la que proporciona al ju-

    gador su valor minimax.

    Teorema 3.2.1

    Para cada juego matricial de matriz A = (aij) se tiene:

    i) Los valores vI y vII son únicos.

    ii) Existe al menos una estrategia de seguridad para cada jugador.

    iii) vI ≤ vII .

    Avila Garcia

  • 3.3. Estrategias Mixtas 21

    Definición 3.2.3

    Un juego matricial, de matriz A = (aij) tiene un punto de silla en estrategias

    puras cuando se cumple la igualdad:

    vI = vII .

    Este valor común se llama valor del juego y es el menor elemento de su fila y el

    máximo de su columna. Se denota por v.

    Observación 3.2.1

    Un punto de silla, si existe, es el pago correspondiente a una pareja de estrategias

    de seguridad. Dichas estrategias, junto con el valor del juego, constituyen una solución

    del juego.

    3.3. Estrategias Mixtas

    Definición 3.3.1

    Una estrategia mixta para un jugador es una distribución de probabilidad en

    el conjunto de sus estrategias puras.

    En general, si un jugador tiene n estrategias puras, una estrategia mixta para

    él es una n-tupla x = (x1, . . . , xn) tal quen∑

    i=1

    xi = 1, 0 ≤ xi ≤ 1, en donde xi

    indica la probabilidad con que el jugador seleccionará su i-ésima estrategia pura. El

    conjunto de estrategias mixtas siempre incluye a todas las estrategias puras porque

    estas últimas pueden considerarse como un caso especial de estrategia mixta en que

    la correspondiente estrategia pura se juega con probabilidad 1 y todas las demás con

    probabilidad cero.

    Observación 3.3.1

    Sea A = (aij), 1 ≤ i ≤ n, 1 ≤ j ≤ m, la matriz de pagos de un juego. Sean X eY los conjuntos de estrategias mixtas de los jugadores I y II respectivamente.

    X =

    {x ∈ Rn :

    n∑i=1

    xi = 1, xi ≥ 1, i = 1, . . . , n

    }.

    Y =

    {y ∈ Rm :

    m∑j=1

    yj = 1, yj ≥ 1, j = 1, . . . ,m

    }.

    Avila Garcia

  • 3.3. Estrategias Mixtas 22

    Para analizar el resultado del juego cuando uno o ambos jugadores utilizan

    estrategias mixtas podemos utilizar el concepto de valor esperado. En este caso la

    función de pagos del juego es:

    v (x, y) =n∑

    i=1

    m∑j=1

    xiaij yj, x ∈ X, y ∈ Y

    que es el valor esperado de conseguir los pagos del juego con la combinación de es-

    trategias mixtas x ∈ X, y ∈ Y .

    Los distintos conceptos estudiados en estrategias puras pueden extenderse al

    caso de las estrategias mixtas.

    Definición 3.3.2

    Para cada estrategia mixta x ∈ X, el nivel de seguridad del jugador I es el valoresperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del

    jugador II.

    v I (x) = mı́ny∈Y

    v (x, y) .

    Para cada estrategia mixta y ∈ Y , el nivel de seguridad del jugador II es el valoresperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del

    jugador I.

    v II (y) = máxx∈X

    v (x, y) .

    Definición 3.3.3

    El valor maximin en estrategias mixtas del jugador I es:

    vMI = máxx∈X

    mı́ny∈Y

    v (x, y) . (3.5)

    Una estrategia de seguridad o estrategia maximin es la que proporciona al jugador su

    valor maximin.

    Definición 3.3.4

    El valor mı́nimax en estrategias mixtas del jugador II es:

    vMII = mı́ny∈Y

    máxx∈X

    v (x, y) . (3.6)

    Una estrategia de seguridad o estrategia mı́nimax es la que proporciona al jugador su

    valor mı́nimax.

    Avila Garcia

  • 3.4. Uso de estrategias mixtas 23

    Teorema 3.3.1

    En un juego matricial de suma nula se tiene:

    i) Los valores vMI y vMII son únicos.

    ii) Al menos existe una estrategia mixta de seguridad para cada jugador.

    iii) Los niveles de seguridad en estrategias puras y mixtas cumplen:

    vI ≤ vMI y vMII ≤ vII .

    3.4. Uso de estrategias mixtas

    Supóngase que nuestra estrategia mixta consta de la aplicación de las estrategias

    puras I1, I2, I3 en las razones p1 : p2 : p3, donde las p están normalizadas de modo

    que p1 + p2 + p3 = 1; entonces esta estrategia se escribe:

    SI =

    (I1 I2 I3

    p1 p2 p3

    ).

    Análogamente,

    SII =

    (II1 II2 II3 II4

    q1 q2 q3 q4

    ).

    designa una estrategia mixta de nuestro oponente, en la cual se usan las estrategias

    puras II1, II2, II3, II4 en la razón q1 : q2 : q3 : q4, donde q1 + q2 + q3 + q4 = 1; esto

    significa que II1 se usa una fracción q1 de las partidas, II2 una fracción q2, etc.

    Supóngase que se ha encontrado una solución de un juego, que consta de las

    dos estrategias mixtas óptimas S∗I y S∗II . En general no todas las estrategias purasdisponibles para un jugador dado se usarán en sus estrategias mixtas óptimas. Aque-

    llas estrategias puras que se usan, en esta sección se denominarán “convenientes”.

    Resulta que la solución de un juego tiene otra propiedad notable que se probará a

    continuación. Si uno de los jugadores se adhiere a su estrategia mixta S∗I (S∗II), en-tonces la ganancia se mantendrá igual al valor del juego, v, sin importar lo que haga

    el otro jugador siempre que él sólo use estrategias convenientes. Por tanto, el segundo

    jugador puede usar cualesquiera de sus estrategias“convenientes” como una estrategia

    pura o puede combinarla en proporciones arbitrarias.

    Avila Garcia

  • 3.5. Métodos para resolver juegos matriciales 24

    Supóngase que se tiene una solución S∗I , (S∗II) de un juego de mxn. Ahorabien supongamos que la estrategia óptima S∗I es una mezcla de las tres estrategias“convenientes”, I1, I2, I3 y S

    ∗II es una mezcla de las tres estrategias “convenientes”,

    II1, II2, II3:

    SI =

    (I1 I2 I3

    p1 p2 p3

    ), SII =

    (II1 II2 II3

    q1 q2 q3

    ).

    donde p1+p2+p3 = 1 y q1+q2+q3+q4 = 1. Nótese que si nos adherimos a la estrategia

    S∗I , nuestro oponente puede mezclar las estrategias II1, II2, II3, en proporción quedesee y la ganancia permanecerá inalterada e igual a v, el valor del juego. Sean v1, v2

    y v3 las ganancias para las estrategias de nuestro oponente II1, II2 y II3 cuando las

    juega contra nuestra estrategia S∗I . De la definición de estrategia óptima se deduceque cualquier desviación de II respecto a su estrategia óptima S∗II no puede aumentarsus ganancias. Esto significa que:

    v1 ≥ v, v2 ≥ v, v3 ≥ v. (3.7)

    Ahora, bien obsérvese que no pueden cumplirse los signos de desigualdad de la

    ecuación (3.7); considérese que v representa v1, v2 y v3 combinadas en las propor-

    ciones q1, q2 y q3:

    v1q1 + v2q2 + v3q3,

    q1 + q2 + q3 = 1(3.8)

    A partir de (3.7), se deduce que si cualquiera de los v1, v2, v3 fuera mayor que v, el

    segundo miembro de (3.8), también seŕıa mayor que v, lo cual no puede ser cierto.

    Por lo tanto:

    v1 + v2 = v3 = v

    de modo que no importa cómo se combinan v1, v2, v3, su valor promedio será igual a v.

    Esta importante propiedad de las estrategias óptimas se usa constantemente cuando

    se trata de hallar las soluciones de juegos finitos.

    3.5. Métodos para resolver juegos matriciales

    La teoŕıa de juegos se ha desarrollado básicamente de acuerdo con el juego

    suma-cero para 2 participantes. En cuanto a los métodos que utiliza la teoŕıa de

    juegos para alcanzar el objetivo propuesto por los jugadores se tienen:

    Avila Garcia

  • 3.6. Técnica de punto de silla de montar 25

    ♣ Técnica de punto de silla.

    ♣ Simplificación de Matrices (técnica de dominación).

    ♣ Método algebraico.

    ♣ Métodos gráficos.

    ♣ Método de subjuegos.

    ♣ Programación Lineal.

    ♣ Metajuegos.

    3.6. Técnica de punto de silla de montar

    Ejemplo 3.6.1

    Aplicación de un problema con punto de silla:

    El general George C. Kenney, comandante de las fuerzas aéreas aliadas del

    paćıfico suroriental durante la Segunda Guerra Mundial, utilizó la teoŕıa de juegos

    para ganar una de las batallas más importantes en dicha zona.1 Ese conflicto se

    conoce como la “batalla del mar de Bismark”.

    Este evento histórico ocurrió en los últimos d́ıas de febrero de 1943. Las fuerzas

    japonesas agrupadas en Rabaul, Isla de Nueva Inglaterra, pretend́ıan apoderarse de

    1Véase [6].

    Avila Garcia

  • 3.6. Técnica de punto de silla de montar 26

    Lae, Nueva Guinea, que estaba en manos de los aliados. El general Kenney dedujo,

    mediante el análisis de ciertos reportes de inteligencia, que los japoneses teńıan sólo

    dos estrategias disponibles (figura 1): atacar por la ruta 1 (mar de Coral) o por la

    2, (mar de Bismarck). Ambas rutas requeŕıan de 3 d́ıas (aproximadamente 72 horas)

    para alcanzar Lae. El general Kenney queŕıa bombardear el convoy japonés antes de

    su llegada a Lae. La ruta 2 ofrećıa poca visibilidad; la de la ruta 1 era buena. Su

    función objetivo 2 fue la de maximizar el número de horas efectivas de bombardeo del

    convoy enemigo.

    El general Kenney pensó aśı: 3 “Si concentro un ataque aéreo en la ruta 2 y, en

    efecto, los japoneses eligen esa ruta, la búsqueda del convoy será obstaculizada por una

    visibilidad pobre y esto se descubrirá hasta el segundo d́ıa, permitiéndonos dos d́ıas

    de bombardeo; si, por el contrario, el convoy elige la ruta 1 (mientras yo concentro

    mi búsqueda en la 2), una pequeña escuadrilla aérea de reconocimiento descubriŕıa

    al convoy después de 1 d́ıa, permitiendo, también, dos d́ıas de bombardeo. Por el

    contrario, si concentro el ataque en la ruta 1 y los japoneses eligen esa ruta, serán

    descubiertos de inmediato permitiendo 3 d́ıas de bombardeo; en cambio, si eligen la

    ruta 2, una pequeña escuadrilla de reconocimiento descubriŕıa al convoy tras 2 d́ıas

    de búsqueda, permitiendo un solo d́ıa de bombardeo”.

    La decisión del general Kenney se puede traducir a la siguiente matriz de con-

    secuencias

    Concentracióndel bombardeoaliado

    Convoy Japonés

    Ruta 1 Ruta 2

    3 1

    2 2

    Dı́as de bombardeo

    Ruta 1

    Ruta 2

    La decisión del general Kenney fue la entrada a22, idéntica a la que seleccionó el

    comandante japonés (la entrada a22 es un punto de silla).El resultado de esta decisión

    fue una derrota para el ejército japonés, en la épica conocida en la historia bélica como

    la ”batalla del mar Bismark”. El nombre se deriva de que tanto el comandante aliado

    como el japonés eligieron la ruta 2, la del mar de Bismark. Esta batalla junto con la

    2intuitiva.3veáse[6].

    Avila Garcia

  • 3.7. Técnica de dominación 27

    de Buna y Guadalcanal marcan el inicio de la derrota japonesa en la Segunda Guerra

    Mundial [27]. Como vI = vII = 2 entonces existe un punto de silla que es el valor del

    juego, es decir; v = 2

    3.7. Técnica de dominación

    3.7.1. Reducción de orden de Matrices

    No en todos los juegos existe punto de silla, para este tipo de juegos se utiliza

    la siguiente metodoloǵıa.

    Por lo general, es dif́ıcil encontrar una solución, cuando un juego de m× n notiene punto de silla, en especial, si m y n son grandes. A veces puede simplificarse

    el problema, reduciendo el número de estrategias en la matriz de ganancias. Las

    estrategias que pueden eliminarse de una matriz son:

    a) Aquellas que están duplicadas.

    b) Aquellas que son dominadas.

    Ejemplo 3.7.1

    Considérese la siguiente matriz de 4× 4:

    II1 II2 II3 II4

    I1 1 2 4 3

    I2 0 2 3 2

    I3 1 2 4 3

    I4 4 3 1 0

    Primeramente, se hallan las estrategias duplicadas. Obsérvese que las ganancias

    para las estrategias I1 y I3 son idénticas, término a término; ninguna de ella es

    preferible a la otra y cualquiera podŕıa ser eliminada, en este caso eliminemos I3 .

    Ahora se buscan las estrategias dominantes. Cada elemento del renglón I2 es

    menor que (o igual a) el elemento correspondiente del renglón I1. Obsérvese que,

    nunca debe usarse la estrategia I2, ya que siempre es menos ventajosa que la I1 y, para

    Avila Garcia

  • 3.7. Técnica de dominación 28

    los propósitos del análisis, también se puede eliminar la I2. Se dice que la estrategia

    I1 domina a la estrategia I2 o que la I2 es dominada por la I1.

    Después de eliminar las estrategias I2 y I3, queda una matriz más sencilla:

    II1 II2 II3 II4

    I1 1 2 4 3

    I4 4 3 1 0

    Además, se nota que, para nuestro oponente, la estrategia II3 es dominada por

    la II4, la cual es menor, elemento por elemento. Aśı, la matriz original de 4 × 4 seha reducido a una matriz de 2× 3:

    II1 II2 II4

    I1 1 2 3

    I4 4 3 0

    En general, todas las estrategias duplicadas y dominadas deben eliminarse en

    esta forma, antes de buscar una solución.

    Ejemplo 3.7.2

    Aplicación en Técnicas de guerra

    El bando I desea destruir un objetivo defendido por el bando II. I tiene dos

    aviones y II tiene tres cañones antiaéreos. Cada avión lleva explosivo suficiente para

    destruir él solo el objetivo.

    Para llegar al objetivo, únicamente existen tres posibles v́ıas de acceso (A, B, C).

    II puede emplazar cualquiera de sus cañones antiaéreos en cualquiera de las v́ıas de

    aproximación, pero un cañon sólo puede cubrir la v́ıa de acceso en la cual quedó ubi-

    cado. Cada cañon sólo puede atacar a uno de los aviones, pero si ataca a un avión

    tiene la certeza de derribarlo. El bando I no sabe cómo éstan dispuestos los cañones

    y el bando II no sabe que v́ıas de acceso tomarán los aviones. El propósito de II es

    evitarlo.

    Solución:

    Este problema puede representarse en la forma de un juego de 2×3. La gananciaconsiste en la probabilidad de destruir el blanco. Las estrategias posibles de I son:

    Avila Garcia

  • 3.7. Técnica de dominación 29

    I1 - Enviar cada avión por v́ıas de acceso diferentes;

    I2 - Enviar ambos aviones a lo largo de la misma v́ıa de acceso.

    Las estrategias de II son:

    II1 - Emplazar cada uno de sus cañones para cubrir una v́ıa de acceso diferente;

    II2 - Emplazar dos cañones para cubrir una v́ıa de acceso y uno para cubrir

    otra diferente;

    II3 - Emplazar los tres cañones para cubrir la misma v́ıa de acceso.

    ..............

    ..............

    ...............

    ...............

    ............................

    ............................

    ................................................................................................................................................

    ..............

    ..............

    ...............

    ...............

    ..............

    ..........

    ....

    ..........

    ....

    ..............

    ...............

    ...............

    ..............

    ..............

    .............. .............. ............... ............... .............. .............. .............. .............. ......................................................................................

    ...............

    ...............

    ..............

    ..............objetivo

    .

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    .........

    ........

    A

    B

    C

    .

    ...................................................................................................................................................................

    .

    ....................................

    ....................................

    ....................................

    ....................................

    ....................................

    ....................................

    ..............

    .

    .......................................................................................................................................................................................................................

    A continuación se construirá la matriz del juego.

    i) I1II1 (Los aviones vuelan a lo largo de v́ıas de acceso diferentes; cada cañón

    cubre una v́ıa diferente). Claramente ningún avión puede llegar al objetivo. La

    ganancia será:

    a11 = 0

    ii) I2II1 (Los aviones vuelan juntos a lo largo de una de las v́ıas; cada cañón cubre

    una v́ıa diferente). Aqúı, un avión llegará ileso al objetivo:

    a21 = 1

    iii) I1II2 (Los aviones vuelan a lo largo de v́ıas diferentes; se tienen dos cañones en

    una de las v́ıas y uno en otra; la tercera v́ıa no está defendida). La probabilidad

    de que uno de los aviones llegue al objetivo es igual a la probabilidad de que

    uno de ellos elija la v́ıa no defendida:

    a12 =2

    3

    Avila Garcia

  • 3.7. Técnica de dominación 30

    iv) I2II2 (Los aviones vuelan a lo largo de uno de las v́ıas; dos cañones cubren una

    de las v́ıas, el tercer cañón cubre otra y la tercera v́ıa se deja indefensa; esto

    significa que, en efecto, sólo una de las v́ıas está cubierta, mientras que dos

    quedan indefensas). La probabilidad de que por lo menos un avión pasará es

    igual a la probabilidad de que la v́ıa elegida no sea la que está cubierta por los

    dos cañones:

    a22 =2

    3

    v) I1II3 (Los aviones vuelan a lo largo de v́ıas diferentes; todos los cañones cubren

    la misma v́ıa). Es seguro que uno de los aviones llega hasta el blanco:

    a13 = 1

    vi) I2II3 (Los aviones vuelan a lo largo de una v́ıa de acceso; todos los cañones

    cubren la misma v́ıa) Para que el objetivo sea destruido, los aviones deben

    elegir una v́ıa no defendida:

    a23 =2

    3

    La matriz de 2× 3 se muestra aqúı.

    II1 II2 II3

    I1 023

    1

    I2 123

    23

    Es claro, que la estrategia II3 es dominada por la estrategia II2. Por lo tanto,

    podemos eliminar II3 y reducir la matriz a un juego de 2× 2. La matriz de 2× 2 semuestra aqúı. Esta matriz tiene un punto de silla: los valores inferior y superior del

    juego son los mismos:

    v =2

    3

    II1 II2

    I1 023

    I2 123

    Nótese también que la estrategia I1 es dominada por la estrategia I2. La solución del

    juego es que ambos jugadores deben usar estrategias puras, la I2 y la II2. Es decir,el

    Avila Garcia

  • 3.8. Método Algebraico 31

    jugador I siempre debe enviar ambos aviones juntos, eligiendo al azar la v́ıa de acceso

    particular, mientras que el jugador II debe cubrir una v́ıa con dos cañones y otra

    con el tercero, también eligiendo al azar las dos v́ıas. Nótese que, en este caso, aun

    las estrategias “puras” contienen elecciones que rige al azar. Con estas estrategias

    óptimas, la ganancia media siempre será v = 23; es decir, el objetivo será destruido

    con una probabilidad de v = 23. Hay un rango cont́ınuo de estrategias mixtas que son

    óptimas para I, yendo desde p1 = 0 hasta p1 =13.

    3.8. Método Algebraico

    Los juegos finitos más sencillos, que siempre pueden resolverse por medio de

    métodos elementales, son los juegos de 2× 2 y los de 2× n. Considérese un juego de2× 2 con la matriz que se muestra. Si este juego tiene un punto de silla, la soluciónconsiste de la pareja de estrategias puras que se intersectan en el punto silla.

    II1 II2

    I1 a11 a12

    I2 a21 a22

    Supóngase que el juego no tiene punto de silla, de modo que los valores inferior

    y superior del juego son desiguales. Se desea hallar nuestra estrategia mixta óptima

    S∗i =

    (I1 I2

    p1 p2

    )(3.9)

    la cual tiene la propiedad de que no importa lo que haga el oponente (en tanto que

    sólo use sus estrategias convenientes) la ganancia promedio será igual a v, el valor del

    juego. En un juego de 2× 2 sin punto de silla, ambas estrategias de nuestro oponenteson puras convenientes. En caso contrario, la solución consistiŕıa de estrategias puras,

    lo cual significa que tendrá un punto de silla. De aqúı que si nos adherimos a nuestra

    estrategia óptima el oponente puede usar cualquiera de sus estrategias puras II1, II2

    sin cambiar la ganancia media v. Esto proporciona dos ecuaciones:

    a11p1 + a21p 2 = v,

    a12p1 + a22p 2 = v,(3.10)

    Avila Garcia

  • 3.8. Método Algebraico 32

    Puesto que p1 + p2 = 1, a partir de estas ecuaciones se ve que:

    a11p1 + a21 (1− p1) = a12p1 + a22 (1− p1) ,

    o bien

    p1 =a22 − a21

    a11 + a22 − a12 − a21, (3.11)

    p2 = 1− p1 (3.12)

    El valor v del juego se encuentra substituyendo los valores de p1 y p2 en

    cualquiera de las ecuaciones 3.10.

    Análogamente se puede aplicar para q1, q2, que nos proporciona dos ecuaciones:

    a11q1 + a12q 2 = v,

    a21q1 + a22q 2 = v,(3.13)

    Puesto que q1 + q2 = 1, a partir de estas ecuaciones se ve que:

    a11q1 + a12 (1− q1) = a21q1 + a22 (1− q1) ,

    o bien

    q1 =a22 − a12

    a11 − a12 − a21 + a22, (3.14)

    q2 = 1− q1 (3.15)

    Por otro lado, también se puede calcular el valor de q1 y q2, conociendo el valor

    del juego, digamos:

    a11q1 + a12q2 = v.

    Puesto que q1 + q2 = 1, se tiene:

    q1 =v − a12

    a11 + a12, (3.16)

    q2 = 1− q1. (3.17)

    Avila Garcia

  • 3.8. Método Algebraico 33

    Ejemplo 3.8.1

    El grupo de administración de la empresa Pascual, ha recibido el encargo de

    preparar una estrategia que pueda seguir la empresa durante las próximas negocia-

    ciones. En su experiencia anterior, el grupo ha desarrollado las siguientes estrategias

    para la empresa Pascual:

    C1 = Se esperan negociaciones muy dif́ıciles con los trabajadores

    C2 = Se considera que las peticiones de los trabajadores son prácticas.

    C3 = Se considera que las peticiones de los trabajadores son poco prácticas.

    C4 = Amplias variaciones en las peticiones de los trabajadores.

    De acuerdo con su historia pasada, los trabajadores sugieren las siguientes es-

    trategias:

    U1 = Peticiones muy costosas de parte de los trabajadores

    U2 = Peticiones costosas de parte de los trabajadores

    U3 = Peticiones normales de parte de los trabajadores

    U4 = Peticiones favorables a la empresa, pero no para los trabajadores

    El problema de cuál estrategia debe emplear el grupo de administración de la empresa

    Pascual, depende de la estrategia que adopten los trabajadores (que es dif́ıcil conocer).

    Sin embargo, con ayuda de la Secretaŕıa del Trabajo y Previsión Social (STPS - de

    donde han solicitado apoyo en vista de las perspectivas de unas negociaciones muy

    dif́ıciles con los trabajadores, y la posibilidad de una huelga prolongada), el grupo

    de administración preparó una tabla de costos de un aumento condicional de salarios

    (tabla 1). La STPS indicó que los trabajadores prepararon una tabla semejante, porque

    se les ha proporcionado la misma información.

    La tabla de costos del aumento condicional de salarios se interpretará como

    sigue: si la administración de la empresa Pascual adopta la estrategia C1 y el sindicato

    adopta la estrategia U1 el contrato final estipulará que la compañ́ıa concedeŕıa un

    aumento de $25.00. Las demás anotaciones de la tabla 1 tienen el mismo significado.

    En vista de esas cifras, ¿qué harán los negociadores?.

    Avila Garcia

  • 3.8. Método Algebraico 34

    Tabla de costos de un aumento condicional de salarios (matriz de 4× 4)

    Estrategias

    de lostrabajadores

    Estrategias de la esmpresa Pascual

    C1 C2 C3 C4

    U1 +$25.00 +$14.00 +$15.00 +$32.00

    U2 +$40.00 +$17.00 +$13.00 +$16.00

    U3 +$30.00 +$5.00 +$12.00 +$15.00

    U4 −$1.00 +$8.00 +$11.00 +$3.00

    En cualquier problema de la teoŕıa de juegos, el primer paso consiste en hacer

    la prueba del punto de silla, que en este caso especial no es aplicable. El siguiente

    consiste en examinar la matriz para buscar si hay algún dominio que pueda aplicarse,

    y entonces puede preguntarse: ¿por qué deben jugar los trabajadores el renglón U4, ya

    que esto daŕıa a la empresa la posibilidad de ganar, o aceptar un aumento menor?. Es

    claro, que los trabajadores nunca jugarán el renglón U4, porque pueden obtener mejores

    resultados jugando los renglones U1 y U2. Por lo tanto, el renglón U4 está dominado

    y se desecha, porque una o más estrategias siempre proporcionarán a los trabajadores

    un mejor pago que el de la estrategia dominada, independientemente de lo que haga

    la empresa respecto a la regla de renglones, todas las anotaciones de los renglones U1

    y U2, son iguales o mayores que la anotación correspondiente del renglón U4, desde

    el punto de vista de la S.T.P.S, lo que reduce la matriz original 4 × 4, a la de 3 × 4que se muestra en la siguiente tabla.

    Tabla de costos de un aumento condicional de salarios (matriz de 3× 4)

    Estrategias

    de lostrabajadores

    Estrategias de la empresa Pascual

    C1 C2 C3 C4

    U1 +$25.00 +$14.00 +$15.00 +$32.00

    U2 +$40.00 +$17.00 +$13.00 +$16.00

    U3 +$30.00 +$5.00 +$12.00 +$15.00

    Una inspección adicional revela que la columna C4 está dominada por la colum-

    na C3, porque la empresa está tratando de reducir al mı́nimo sus pérdidas. Todas las

    entradas de la columna C3 son iguales o menores que la anotación correspondiente de

    la columna C4, de acuerdo con la regla de columnas. La nueva matriz de 3×3 apareceen la tabla.

    Avila Garcia

  • 3.8. Método Algebraico 35

    Tabla 3: Costos de un aumento condicional de salarios (matriz de 3× 3)

    Estrategias

    de lostrabajadores

    Estrategias de la empresa Pascual

    C1 C2 C3

    U1 +$25.00 +$14.00 +$15.00

    U2 +$40.00 +$17.00 +$13.00

    U3 +$30.00 +$5.00 +$12.00

    La inspección de la tabla 3 revela que el renglón U3 está dominado por el renglón

    U2. Los aumentos de salarios del renglón U2 ($40.00, $17.00 y $13.00), son iguales o

    mayores que las anotaciones correspondientes del renglón U3 ($30.00, $5.00 y $12.00).

    La nueva matriz de 2× 3 aparece en la tabla 4.

    Tabla 4: Costos de un aumento condicional de salarios (matriz de 2× 3)

    Estrategias

    de lostrabajadores

    Estrategias de la empresa Pascual

    C1 C2 C3

    U1 +$25.00 +$14.00 +$15.00

    U2 +$40.00 +$17.00 +$13.00

    La última oportunidad para aplicar el dominio ocurre en la columna C1. Desde

    el punto de vista de la empresa, los aumentos propuestos, que se muestran en la

    columna C2 (+$14.00 y +$17.00), son iguales o menores que los de la columna C1

    (+$25.00 y +$40.00). La matriz resultante es de 2× 2 (tabla 5). Hay que notar queel procedimiento de dominio puede emplearse para remover más de un renglón o una

    columna en el mismo paso.

    Tabla de costos de un aumento condicional de salarios (matriz de 2× 2)

    Estrategias

    de lostrabajadores

    Estrategias de la empresa Pascual

    C2 C3

    U1 +$14.00 +$15.00

    U2 +$17.00 +$13.00

    Avila Garcia

  • 3.8. Método Algebraico 36

    Obsérvese que después de realizar la técnica de dominación, ésta última matriz tam-

    poco tiene punto de silla, se aplicará el método algebraico para la solución de este

    juego.

    Aplicando (3.11), se calcula el valor de p, obtenemos:

    p1 =13− 17

    14 + 13− 15− 17=

    4

    5

    Por lo tanto

    p 2 = 1− p 2 = 1−4

    5=

    1

    5

    El cálculo anterior indica que los trabajadores jugarán el primer renglón =45 partes

    del tiempo y el segundo renglón =15

    Analogamente, aplicando (3.14) y (3.15), se calcula q1 y q2, obteniendo:

    q1 =2

    5

    y

    q 2 = 1− q 2 = 1−2

    5=

    3

    5

    Luego, podemos encontrar el valor del juego v, haciendo uso de las ecuaciones (3.10).

    a11p1 + a21p2 = v

    14

    (4

    5

    )+ 17

    (1

    5

    )=

    56

    5+

    17

    5=

    73

    5

    El valor del juego es $73

    5o bien $14.60, que es el aumento que pueden esperar

    los trabajadores. Los trabajadores deben ganar, porque el valor del juego es positi-

    vo; si fuera negativo la empresa ganaŕıa. Sin embargo, en la matriz original sólo se

    presentó un valor negativo contra 15 positivos.

    A continuación se ilustra está técnica para el caso de 2 jugadores, con 2 estrategias

    de juego para cada uno e inexistencia de un punto silla.

    Ejemplo 3.8.2

    Supóngase la siguiente matriz de consecuencias:

    II1 II2 Probabilidades

    I1 5 35 p1

    I2 20 10 p2

    Probabilidades q1 q2

    Avila Garcia

  • 3.8. Método Algebraico 37

    Solución. Si el jugador I selecciona la estrategia I1, su consecuencia esperada será:

    5q1 + 35q2,

    mientras que si selecciona la I2, ésta será:

    20q1 + 10q2.

    Como ambos valores esperados deben ser los mismos, se tiene que:

    5q1 + 35q2 = 20q1 + 10q2.

    Dado que qi ≤ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:

    q1 + q2 = 1.

    Las dos ecuaciones anteriores con dos incógnitas generan los valores

    q1 = 0.625

    q2 = 0.375

    Análogamente, si el jugador II selecciona la estrategia II1, su consecuencia esperada

    será

    5p1 + 20p2,

    mientras que si selecciona la II2, ésta será:

    35p1 + 10p2

    y, como ambas deben ser iguales, se tiene que:

    5p1 + 20p2 = 35p1 + 10p2.

    Dado que pi ≥ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:

    p1 + p2 = 1.

    Las dos ecuaciones anteriores con dos incógnitas generan:

    p1 = 0.25

    p2 = 0.75

    Avila Garcia

  • 3.9. Método Geométrico para los juegos 2× n 38

    El valor del juego será, entonces:

    V = 5 (0.25) + 20 (0.75) = 35 (0.25) + 10 (0.75)

    = 5 (0.625) + 35 (0.375) = 20 (0.625) + 10 (0.375)

    = 16.25

    Nótese que existen cuatro posibilidades diferentes para calcular el mismo valor V .

    Lo anterior se interpreta diciendo que las estrategias mixtas para el jugador I son

    (0.25, 0.75) y para II (0.625, 0.375). La consecuencia esperada es que I gane 16.25 y

    II pierda la misma cantidad.

    La técnica anterior se complica cuando cada jugador tiene más de dos estrategias

    a elegir. La solución para un caso más general se proporcionará, con técnicas de

    programación lineal. Para el caso en que un jugador tiene dos estrategias y el otro m

    (m > 2), entonces los métodos gráficos trabajan adecuadamente. Éstos enseguida se

    explican.

    3.9. Método Geométrico para los juegos 2× n

    Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo

    menos uno de los jugadores, tiene solamente dos estrategias.

    Considérese el siguiente juego 2× n.

    II

    I

    y1 y2 . . . yn

    x1

    x2 = 1− x1a11 a12 . . . a1n

    a21 a22 . . . a2n

    Supóngase que este juego no tiene un punto de silla. Puesto que I tiene dos

    estrategias, se deduce que x2 = 1− x1; x1 ≥ 0, x2 ≥ 0.Los pagos esperados correspondientes a las estrategias puras de II se muestran

    en la siguiente tabla.

    Estrategia pura de II Pago esperado de I

    1 (a11 − a21)x1 + a212 (a12 − a22) x1 + a22...

    n (a1n − a2n) x1 + a2n

    Avila Garcia

  • 3.9. Método Geométrico para los juegos 2× n 39

    Esto muestra que el pago promedio de I vaŕıa linealmente con x1. Según el criterio

    minimax de juegos de estrategias mixtas, el jugador I debe seleccionar el valor de x1

    que maximice sus pagos mı́nimos esperados. Esto se hace mediante el trazo de ĺıneas

    rectas como funciones de x1. El siguiente ejemplo ilustra esta técnica.

    Considere el siguiente juego (2× 4)

    II

    I

    1 2 3 4

    1

    2

    2 2 3 -1

    4 3 2 6

    Este juego no tiene un punto de silla. Consecuentemente, los pagos esperados

    de I correspondientes a las estrategias puras de II están dados de la siguiente forma.

    Estrategia pura de II Pago esperado de I

    1 −2x1 + 42 −x1 + 33 x1 + 2

    4 −7x1 + 6

    Estas cuatro rectas se deben trazar como funciones de x1 como se muestran en la

    figura. Gráficamente el maximin ocurre en x∗1 = 12 . Este es el punto de intersección dedos rectas 2, 3 y 4. Consecuentemente, la estrategia óptima de I es (x∗1 = 12 , x

    ∗2 =

    12),

    y el valor del juego se obtiene sustituyendo x1 en la ecuación de cualesquiera de las

    ĺıneas que pasan por el punto maximin. De aqúı obtenemos,

    v∗ =

    −12

    + 3 =5

    2

    1

    2+ 2 =

    5

    2

    −712

    + 6 =5

    2

    A fin de determinar las estrategias óptimas de II se debe observar que 3 rectas

    pasan por el punto maximin. Lo cual nos indica que II puede combinar las tres

    estrategias.

    Avila Garcia

  • 3.9. Método Geométrico para los juegos 2× n 40

    .

    .......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .

    ..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    . .............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    . ............................................. ..............................................

    . ............................................. ..............................................

    . ............................................. ..............................................

    . ............................................. ..............................................

    . ............................................. ..............................................

    . ............................................. ..............................................

    . ............................................. ..............................................

    . ............................................. ...............................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ................................

    ......................

    .

    ................................................................................................

    ................................................................................................

    ................................................................................................

    ................................................................................................

    ................................................................................................

    ................................................................................................

    ....................................................

    .

    ..........................................................................................................................................................................................

    ..........................................................................................................................................................................................

    ..........................................................................................................................................................................................

    ..................................................

    .

    ................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

    −2−1

    x1 = 0

    4

    1

    23

    x1 = 1

    1

    2

    3

    4

    5

    6

    Pagopromedio

    x∗1 =12

    v∗ = 52

    ?

    Maximin

    Dos rectas cualesquiera que tengan signos opuestos en sus pendientes definen

    una solución óptima alternativa. Por consiguiente, de las tres combinaciones (2, 3),

    (2, 4) y (3, 4), la combinación (2, 4) debe excluirse como no óptima.

    La primera combinación (2, 3) implica que y∗1 = y∗4 = 0. En consecuencia, y3 = 1−y2y los pagos promedios dde II correspondientes a las estrategias puras I están dadas

    como sigue:

    Estrategia pura de I Pago esperado de II

    1 −y2 + 32 y2 + 2

    Por consiguiente,y∗2 (correspondiente al punto minimax) puede determinarse de

    −y∗2 + 3 = y∗2 + 2

    Esto da por resultado y∗2 = 12 .

    Obsérvese que si sustituimos y∗2 =1

    2en los pagos esperados de II dados an-

    teriormente, el valor minimax es5

    2, el que es igual al valor del juego v∗ como es de

    esperarse.

    La combinación restante (3, 4) puede ser tratada da manera similar para obtener

    una solución óptima alternativa. Cualquier promedio ponderado de las combinaciones

    (2, 3) y (3, 4) proporcionará también una nueva solución óptima que mezcle las tres

    estrategias 2, 3 y 4.

    Avila Garcia

  • 3.10. Solución de juegos 2 x 2 con engaño 41

    3.10. Solución de juegos 2 x 2 con engaño

    Considérese a continuación un juego más complicado, uno cuya solución no es

    tan obvia. Es un ejemplo sencillo pero instructivo de juegos que contienen engaño. En

    las situaciones antagónicas que se presentan en la vida real, se usan muchos recursos

    para engañar al oponente (información falsa, representación falsa de objetivos, etc.).

    Ejemplo 3.10.1

    Se tienen dos cartas, un as y un dos, con la cara hacia abajo sobre la mesa. El

    jugador I levanta una de ellas al azar, sin mostrarla al jugador II. Si la carta es el

    as, I debe decir “Tengo el as” y pedir $1.00 a II. Si la carta es el dos, I puede decir:

    “Tengo el dos” y pagar $1.00 a II, o bien, “tengo el as” y pedir $1.00 a

    II.

    Si se le ofrece un peso a II, debe tomarlo. Si se le pide un peso, puede:

    a) Creer que I tiene el as y pagarle, o bien,

    b) No creerle y exigir que se le muestre la carta. Si pide que se le muestre la carta

    y resulta que I tiene en efecto el as, debe pagar $2.00 a I. Si pide que le muestre

    la carta y I tiene el dos, I debe pagarle $2.00. A continuación se analiza este

    juego para hallar la estrategia óptima para cada bando.

    Solución. El juego tiene una estructura relativamente compleja, consiste de

    una jugada aleatoria y obligatoria -la elección de una carta por I- y de dos jugadas

    personales que pueden hacerse o no. Si I levanta el as, no tiene opción: sólo puede

    pedir $1.00 a II. Entonces II tiene una elección personal -creer a I o no creerle, (es

    decir, pagarle o pedirle que le muestre la carta). Si en la primera jugada aleatoria

    resulta que I levanta el dos, entonces tiene que hacer una elección -engañar o no

    engañar. Si I engaña, II tiene nuevamente la misma elección -creerle o no, (es decir,

    pagarle o pedir que le muestre la carta); si no engaña, II no tiene más que aceptar

    su $1.00.

    Las estrategias de los dos jugadores serán las reglas que adopten para determinar

    sus jugadas personales.

    Claramente I sólo tiene dos estrategias:

    • I1 -engañar; I2 -no engañar.

    Avila Garcia

  • 3.10. Solución de juegos 2 x 2 con engaño 42

    II también tiene dos estrategias:

    • II1 -creer a I; II2 -pedir que se le muestre la carta.

    Para construir la matriz del juego, se necesita calcular el valor medio de la ganancia

    para cada una de las combinaciones de estrategias.

    1. I1II1 I engaña; II le cree; se calcula la ganancia promedio.

    i) Si I extrae el as (la probabilidad de que suceda esto es 12), no tiene jugada

    personal; debe pedir $1.00 a II, y éste lo paga; la ganancia para I en pesos

    es 1.

    ii) Si I extrae el dos (la probabilidad de que suceda esto también es 12), engaña

    y pide $1.00 a II, quien lo paga; la ganancia es nuevamente 1.

    La ganancia promedio es

    a11 =

    (1

    2

    )(1) +

    (1

    2

    )(1) = 1. (3.18)

    2. I1II2 I engaña; II pide que se le muestre la carta; hay que calcular a12.

    i) Si I extrae el as, no tiene jugada personal; debe pedir $1.00 a II; II pide

    que se le muestre la carta y, como consecuencia, debe pagar $2.00 a I (la

    ganancia para I en pesos es 2).

    ii) Si I extrae el dos, engaña y pide $1.00 a II; II pide que se le muestre la

    carta y, como resultado, recibe $2.00 de I (la ganancia de I en pesos es

    −2).

    La ganancia promedio es

    a12 =

    (1

    2

    )(+2) +

    (1

    2

    )(−2) = 0. (3.19)

    3. I2II1 I no engaña; II no le reta; calculemos:

    i) Si I extrae el as, pide $1.00; II lo paga y la ganancia para I en pesos es 1.

    ii) Si I extrae el dos, le paga $1.00 a II y II tiene que aceptarlo (la ganancia

    de I en pesos es −1). La ganancia promedio es:

    a21 =

    (1

    2

    )(+1) +

    (1

    2

    )(−1) = 0. (3.20)

    Avila Garcia

  • 3.10. Solución de juegos 2 x 2 con engaño 43

    4. I2II2 I no engaña; II le reta; calculemos:

    i) Si I extrae el as, pide $1.00; II pide que se le muestre la carta y, como

    resultado, debe pagar $2.00 a I (la ganancia en pesos es +2).

    ii) Si I extrae el dos, paga $1.00 a I, quien debe aceptarlo (la ganancia es

    −1).

    La ganancia promedio es:

    a22 =

    (1

    2

    )(+2) +

    (1

    2

    )(−1) = 1

    2. (3.21)

    La matriz del juego se muestra aqúı.

    II1 II2

    I1 1 0

    I2 012

    El valor inferior del juego es 0, el valor superior es1

    2y el juego no tiene punto de

    silla. Por tanto, la solución debe consistir de estrategias mixtas. Aplicando la ecuación

    (3.11), se obtiene:

    p1 =12

    1 + 12

    =1

    3, p2 =

    2

    3, S∗I =

    (I1 I213

    23

    ).

    Es decir, I debe engañar en 13

    de las ocasiones y no engañar en 23

    de las mismas.

    Entonces podemos calcular la ganancia promedio o valor del juego:

    v =1

    3.

    El hecho de que v = 13

    > 0 significa que el juego tal y como se presenta no es equitativo

    para II. Aplicando su estrategia óptima, I siempre puede estar seguro de obtener una

    ganancia promedio de 13. Nótese que aplicando su estrategia más cautelosa (maximin)

    (en este caso, tanto I1 como I2 son maximin) I puede garantizarse una ganancia de

    0, de modo que según las reglas del juego, al aplicar una estrategia mixta, obtiene

    una ventaja sobre II.

    Hállese la estrategia óptima para II. Se tiene:

    (1) q1 + (0) q2 =1

    3; q1 =

    1

    3, q2 =

    2

    3.

    Avila Garcia

  • 3.11. Método de subjuegos para encontrar el valor del juego 44

    de aqúı que:

    S∗II =

    (II1 II2

    13

    23

    ).

    Es decir, el jugador II debe creerle al jugador I en 13

    de los casos y pedir que le

    muestre la carta en 23. Entonces perderá, en promedio, en 1

    3de las veces. Si aplica su

    estrategia pura minimax II2 (pedir que se le muestre la carta), perdeŕıa en promedio,12

    de las veces.

    3.11. Método de subjuegos para encontrar el valor

    del juego

    Este método nos facilita el encontrar el valor del juego para un juego de 2× 2,y muchos juegos más grandes pueden reducirse mediante el dominio a un juego de

    2× 2. Sin embargo, esto no incluirá todos los casos, porque esa reducción no siemprepuede hacerse. Por ejemplo, dos ĺıneas aéreas cubren la misma ruta, y ambas tratan

    de obtener la mayor porción posible del mercado. Una de las ĺıneas aéreas I, parece

    más agresiva, porque su situación financiera es muy sólida y su departamento de

    mercadotecnia conoce mejor las condiciones del mercado. La matriz de pagos de la

    siguiente tabla muestra las pérdidas y las ganancias mensuales de pasajeros, basadas

    en ciertas condiciones del mercado. La matriz se lee de este modo: los valores positivos

    favorecen a la ĺınea aérea I, mientras que los negativos favorecen a la ĺınea aérea II.

    Tabla de matriz de pagos de 2× 3 de dos ĺıneas áereas

    Ĺınea:Aereoméxico(jugador I)

    Ĺınea: Mexicana de aviación (jugador II)

    A B C

    B 300 −25 −50C 150 155 175

    A: No hace nada.

    B: Anuncia tarifas ordinarias y especiales.

    Avila Garcia

  • 3.11. Método de subjuegos para encontrar el valor del juego 45

    C: Anuncia caracteŕısticas especiales (peĺıculas cinematográficas y magńıficos ali-

    mentos.

    El juego de 2× 3 expresado en la tabla anterior, puede considerarse como tresjuegos de 2× 2.

    Subjuego 1:M

    A

    (300 −25150 155

    )columnas 1 y 2.

    subjuego 2:M

    A

    (300 −50150 175

    )columnas 1 y 3.

    Subjuego 3:M

    A

    (−25 −50155 175

    )columnas 2 y 3.

    La ĺınea aérea II, que puede escoger no jugar una de las columnas, está tratando de

    determinar la combinación de una estrategia de dos columnas que sea la mejor para

    ella. Como se hizó notar anteriormente, el jugador que tenga el mayor número de

    columnas o renglones, tiene la mayor flexibilidad, lo que generalmente da por resultado

    una estrategia mejor. Sin embargo, en este juego hay cuatro valores positivos contra

    dos negativos. A fin de obtener la solución de la mejor estrategia para la ĺınea aérea

    II, habrá que resolver las estrategias y valores del juego de los tres subjuegos de 2×2.Nótese que cuando no se juega una columna, se representa con un cero. Después puede

    usarse cualquiera de los métodos anteriormente vistos.

    Subjuego 1:

    M

    A

    (300 −25150 155

    )no se está jugando la tercera columna.

    Estrategias:

    A =1

    66,65

    66

    M =36

    66,30

    66, 0.

    Avila Garcia

  • 3.11. Método de subjuegos para encontrar el valor del juego 46

    Valor del juego: 152.27

    Subjuego 2:

    M

    A

    (300 −50150 175

    )no se está jugando la segunda columna.

    Estrategias:

    A =1

    15,14

    15

    M =9

    15, 0,

    6

    15.

    Valor del juego: 160.

    Subjuego 3:

    M

    A

    (−25 −50155 175

    )no se está jugando la primera columna.

    Estrategias:

    A = 0, 1

    M = 0, 1, 0.

    Valor del juego: 155.

    De acuerdo con los cálculos precedentes, se escoge el valor positivo más bajo,

    en este caso el subjuego 1, porque la ĺınea aérea II tiene más flexibilidad. Aunque

    la ĺınea aérea I debe jugar cualquier renglón, la ĺınea aérea II no tiene que jugar

    las tres columnas, sino dos solamente. La estrategia de la ĺınea aérea II consiste en

    jugar la primera columna del tiempo, y la segunda, del tiempo. La ĺınea aérea II no

    utilizará la tercera columna. Puede comprobarse que esta estrategia es la óptima si

    se observa detalladamente la matriz original.

    La solución (valor del juego de 152.52 en favor de la ĺınea aérea I), indica que

    I escoge su estrategia mixta de tal modo que gane (o pierda) lo mismo, independi-

    entemente de la selección de la columna de II. Como se expresó anteriormente sobre

    la forma de determinar una estrategia mixta, las expectaciones de I al jugar una

    Avila Garcia

  • 3.11. Método de subjuegos para encontrar el valor del juego 47

    estrategia mixta (entre sus renglones), son las mismas, independientemente de lo que

    juegue II. Esto puede expresarse algebraicamente haciendo que el valor del juego del

    subjuego 1, sea igual a la columna que juegue II, lo que se demuestra como sigue:

    Las ecuaciones precedentes significan que I espera ganar 152.27 clientes, inde-

    pendientemente de la selección de II. El signo ≥ significa que I podŕıa ganar más de152.27 clientes si II escogiera una estrategia incorrecta. Si las estrategias que hemos

    encontrado son óptimas, deben satisfacer las tres desigualdades anteriores. Substi-

    tuyendo los valores de I1 (1 ) y de I2 ( ), los resultados son los siguientes.

    Las tres desigualdades se satisfacen con los valores insertados para las estrate-

    gias de I. Sin embargo, cuando II juega la columna 3, I gana más de 152.27 clientes,

    porque ésa es una mala estrategia para II, y ésta es la razón de que II no juegue la

    columna 3, porque daŕıa a I una ventaja adicional en un juego que la favorece.

    Como los requerimientos de las estrategias de I se satisfacen, el paso siguiente

    es examinar las estrategias de II, para determinar si son óptimas. II ha sus escogido

    estrategias de tal modo que pueda reducir al mismo sus pérdidas, lo que puede ex-

    presarse algebraicamente haciendo que el valor del juego del subjuego 1 sea igual a

    los renglones que juegue I:

    Las desigualdades precedentes significan que II espera perder 152.27 clientes,

    independientemente de las selecciones de I. El signo ≤ indica que II puede perdermenos, Si I escoge estrategias incorrectas. De nuevo, si las estrategias que hemos en-

    contrado son óptimas, deben satisfacer las dos últimas desigualdades. Si substituimos

    los valores de II1 II2 y II3, los resultados son los siguientes.

    Columna 1:

    300

    (1

    66

    )+ 150

    (65

    66

    )≥ 152.27; 4.54 + 147.73 = 152.27

    Columna 2:

    −25(

    1

    66

    )+ 155

    (65

    66

    )≥ 152.27; −0.38 + 152.65 = 152.27

    Columna 3:

    −50(

    1

    66

    )+ 175

    (65

    66

    )≥ 152.27; −0.76 + 172.35 > 152.27

    Avila Garcia

  • 3.11. Método de subjuegos para encontrar el valor del juego 48

    Luego,

    171.59 > 152.27

    Las tres desigualdades se satisfacen con los valores insertados para las estrate-

    gias de A. Sin embargo, cuando M juega la columna 3, A gana más de 152.27 clientes,

    porque ésa es una mala estrategia para M , y ésta es la razón de que M no juegue la

    columna 3, porque daŕıa a A una ventaja adicional en un juego que la favorece.

    Avila Garcia

  • Caṕıtulo 4

    Programación Lineal

    4.1. Teorema del Mı́nimax

    Teorema 4.1.1 (Teorema del Mı́nimax)

    En todo juego bipersonal finito de suma cero, existen estrategias óptimas x∗ ∈ X,y∗ ∈ Y para cada jugador y se verifica vMI = vMII = v∗ siendo v∗ el valor del juego.

    Demostración. Considérense los siguientes Programas Lineales: Primal y

    Dual, respectivamente.

    Jugador I Jugador II

    Primal Dual

    máx−v Min v

    a11x1 + · · ·+ am1xm ≥−v a11y1 + · · ·+ a1nyn ≤ v

    · · · · · · · · · · · · · · · · · · · · · · · ·

    a1nx1 + · · ·+ amnxm ≥−v am1y1 + · · ·+ amnyn ≤ v

    x1 + · · ·+ xm = 1 y1 + · · ·+ yn = 1

    0 ≤ xi ≤ 1, i = 1, . . . ,m 0 ≤ yj ≤ 1, j = 1, . . . , n

    Obsérvese que el nivel de seguridad para una estrategia mixta x̂ ∈ X viene dado por:

    vI (x̂) = vII (x̂) = mı́ny∈Y

    x̂ tAy,

    49

  • 4.1. Teorema del Mı́nimax 50

    cuyo valor puede obtenerse por medio del dual, es decir

    Máx λ (x̂)

    sujeto a ~e λ (x̂) ≤ x̂ tA

    x̂ ∈ X, λ (x̂) ∈ R

    donde ~e = (1, . . . , 1) t

    Las estrategias que proporcionan los mejores nivel

top related