carlosivorracastillo teor´ia de conjuntos

396
Carlos Ivorra Castillo TEOR ´ IA DE CONJUNTOS

Upload: others

Post on 16-Jul-2022

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Carlos Ivorra Castillo

TEORIA DE CONJUNTOS

Page 2: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS
Page 3: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Un conjunto es un “muchos” que puede ser pensado

como uno.

Georg Cantor

Page 4: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS
Page 5: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Indice General

Introduccion ix

Capıtulo I: El lenguaje de la teorıa de conjuntos 1

1.1 Clases y conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3 Formacion de conjuntos . . . . . . . . . . . . . . . . . . . . . . . 15

1.4 La teorıa de conjuntos NBG∗ . . . . . . . . . . . . . . . . . . . . 19

1.5 Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.6 Leyes de composicion interna . . . . . . . . . . . . . . . . . . . . 27

Capıtulo II: Ordinales 39

2.1 La construccion de los ordinales . . . . . . . . . . . . . . . . . . . 39

2.2 Induccion y recursion transfinita . . . . . . . . . . . . . . . . . . 48

2.3 Ordinales y buenos ordenes . . . . . . . . . . . . . . . . . . . . . 53

2.4 Funciones normales . . . . . . . . . . . . . . . . . . . . . . . . . . 56

2.5 La aritmetica ordinal . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.6 Sumas finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

2.7 La forma normal de Cantor . . . . . . . . . . . . . . . . . . . . . 68

Capıtulo III: La teorıa de conjuntos NBG 75

3.1 Relaciones bien fundadas . . . . . . . . . . . . . . . . . . . . . . 75

3.2 El axioma de regularidad . . . . . . . . . . . . . . . . . . . . . . 81

3.3 El axioma de eleccion . . . . . . . . . . . . . . . . . . . . . . . . 86

Capıtulo IV: Cardinales 97

4.1 Equipotencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.2 Numeros cardinales . . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.3 La aritmetica cardinal . . . . . . . . . . . . . . . . . . . . . . . . 107

4.4 Conjuntos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

4.5 Sumas y productos infinitos . . . . . . . . . . . . . . . . . . . . . 119

4.6 Cofinalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

4.7 Aplicaciones sobre el axioma de eleccion . . . . . . . . . . . . . . 129

v

Page 6: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

vi INDICE GENERAL

Capıtulo V: La exponenciacion cardinal 1355.1 La exponenciacion en NBG . . . . . . . . . . . . . . . . . . . . . 1355.2 La hipotesis de los cardinales singulares . . . . . . . . . . . . . . 1415.3 Cardinales fuertemente inaccesibles . . . . . . . . . . . . . . . . . 146

Capıtulo VI: Conjuntos cerrados no acotados y estacionarios 1516.1 Conjuntos cerrados no acotados . . . . . . . . . . . . . . . . . . . 1516.2 Conjuntos estacionarios . . . . . . . . . . . . . . . . . . . . . . . 1576.3 Un teorema de Silver . . . . . . . . . . . . . . . . . . . . . . . . . 1616.4 Cardinales de Mahlo . . . . . . . . . . . . . . . . . . . . . . . . . 1656.5 Principios combinatorios . . . . . . . . . . . . . . . . . . . . . . . 1686.6 Puntos fijos de funciones normales . . . . . . . . . . . . . . . . . 182

Capıtulo VII: El sistema numerico 1917.1 Los numeros enteros . . . . . . . . . . . . . . . . . . . . . . . . . 1917.2 Los numeros racionales . . . . . . . . . . . . . . . . . . . . . . . . 1967.3 Cuerpos metricos completos . . . . . . . . . . . . . . . . . . . . . 1997.4 La construccion de R . . . . . . . . . . . . . . . . . . . . . . . . . 2137.5 Conjuntos ordenados completos . . . . . . . . . . . . . . . . . . . 2207.6 Sumas infinitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

Capıtulo VIII: Elementos de topologıa 2358.1 Espacios topologicos . . . . . . . . . . . . . . . . . . . . . . . . . 2368.2 Algunos conceptos topologicos. . . . . . . . . . . . . . . . . . . . 2478.3 Aplicaciones continuas . . . . . . . . . . . . . . . . . . . . . . . . 2548.4 Condiciones de numerabilidad . . . . . . . . . . . . . . . . . . . . 2618.5 Espacios compactos . . . . . . . . . . . . . . . . . . . . . . . . . . 267

Capıtulo IX: Arboles 2779.1 El problema de Suslin . . . . . . . . . . . . . . . . . . . . . . . . 2779.2 Conceptos basicos sobre arboles . . . . . . . . . . . . . . . . . . . 2819.3 Arboles de Aronszajn . . . . . . . . . . . . . . . . . . . . . . . . 2859.4 Arboles de Suslin . . . . . . . . . . . . . . . . . . . . . . . . . . . 2899.5 Arboles de Kurepa . . . . . . . . . . . . . . . . . . . . . . . . . . 299

Capıtulo X: Algebras de Boole 30310.1 Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . 30310.2 Algebras completas . . . . . . . . . . . . . . . . . . . . . . . . . . 30810.3 Ideales y filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32610.4 Espacios de Stone . . . . . . . . . . . . . . . . . . . . . . . . . . . 33110.5 Aplicaciones a la topologıa . . . . . . . . . . . . . . . . . . . . . . 335

Capıtulo XI: Elementos de teorıa de modelos 34511.1 Lenguajes y modelos . . . . . . . . . . . . . . . . . . . . . . . . . 34511.2 Teorıas formales . . . . . . . . . . . . . . . . . . . . . . . . . . . 35311.3 Submodelos, inmersiones . . . . . . . . . . . . . . . . . . . . . . . 36611.4 Ultraproductos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373

Page 7: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

INDICE GENERAL vii

Bibliografıa 381

Indice de Materias 382

Page 8: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS
Page 9: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Introduccion

El proposito de este libro es proporcionar una introduccion axiomatica rigu-rosa a la teorıa de conjuntos que no presuponga del lector ningun conocimientotecnico de la logica matematica mas alla de una cierta familiaridad con lastecnicas de razonamiento informal-formalizable que emplean habitualmente losmatematicos.

Naturalmente, una fundamentacion solida de la teorıa de conjuntos presu-pone la logica formal, y a este respecto podemos decir que “oficialmente” estelibro debe considerarse como la continuacion de mi libro de Logica matematica(LM), en el que, entre otras cosas, se discuten con todo el detalle y los tec-nicismos necesarios diversas teorıas axiomaticas de conjuntos, entre ellas la deZermelo-Fraenkel (ZFC) y la de von Neumann-Bernays-Godel (NBG). Sin em-bargo, aquı hemos optado por exponer la teorıa axiomatica de modo que no hasido necesario hacer ninguna referencia explıcita a LM, de tal forma que quienlea LM y continue con este libro, no solo no encontrara ninguna laguna entreambos, sino que de hecho hallara varios solapamientos, los que hemos conside-rado necesarios para que el lector familiarizado con el razonamiento matematicopueda suplir con dicha familiaridad los requisitos tecnicos que proporciona LM.

De este modo, LM y el presente libro suponen dos propuestas alternativaspara introducirse en la teorıa de conjuntos: o bien empezando por los funda-mentos logicos de LM para despues adentrarse en los contenidos matematicos delas teorıas de conjuntos allı presentadas, o bien empezar por una introduccionaxiomatica a la teorıa de conjuntos apoyada en la familiaridad del lector conel razonamiento matematico para despues (opcionalmente) profundizar en susaspectos logicos a traves de LM.

Puesto que la distincion entre conjuntos y clases propias resulta inevitable,para eliminar por completo las dificultades conceptuales que conlleva (que sediscuten con detalle en LM) hemos optado por partir de la teorıa axiomaticade von Neumann-Bernays-Godel NBG en lugar de la mas habitual, que es ZFC,puesto que ası el concepto de clase propia es un concepto formal mas que nodeberıa presentar ninguna dificultad especial al lector, en lugar de un conceptometamatematico que tiene que entenderse necesariamente en terminos de con-ceptos logicos. No obstante, ambas teorıas son equivalentes, y el lector familia-rizado con LM se dara cuenta de que, pasado el capıtulo I (en el que exponemosla axiomatica de NBG), las siglas NBG pueden ser trivial y sistematicamentesustituidas por ZFC sin necesidad de modificar absolutamente nada de lo dicho.

ix

Page 10: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

x Introduccion

Los capıtulos siguientes, desde el II hasta el V exponen los resultados fun-damentales de la teorıa de conjuntos cantoriana (principalmente la teorıa deordinales y de cardinales), sin perjuicio de que se presenten muchos resultadosmuy posteriores en el tiempo a la epoca de Cantor.

El capıtulo VI, aunque es una prolongacion natural del precedente, es bas-tante mas avanzado y puede leerse tras los capıtulos VII y VIII. El primero deestos esta dedicado a la construccion del sistema numerico, y termina de jus-tificar ası que la teorıa axiomatica presentada es suficiente para desarrollar apartir de ella todas las ramas de la matematica (algebra, analisis, geometrıa, to-pologıa, etc.) Precisamente en el capıtulo 8 introducimos los elementos basicosde la topologıa conjuntista como requisito para la exposicion de aspectos masavanzados de la teorıa de conjuntos, entre los que se cuentan varios apartadosdel capıtulo previo VI (los relativos a principios combinatorios, cardinales inac-cesibles, etc.) ası como los capıtulos posteriores sobre arboles y algebras deBoole.

El lımite principal que nos hemos impuesto al elegir los contenidos ha sidoevitar todos aquellos que requieren considerar modelos de la teorıa de conjuntos(con todos los aspectos sobre logica y metamatematica que ello requerirıa).No obstante, en el ultimo capıtulo presentamos los resultados basicos de lateorıa de modelos, pero sin entrar, segun acabamos de decir, en el estudio demodelos de la propia teorıa de conjuntos, evitando ası la necesidad de introducirdistinciones sutiles entre formulas metamatematicas y formulas definidas en lateorıa axiomatica. La mayor parte de los dos ultimos capıtulos puede verse comolos preliminares necesarios (junto con LA) para abordar temas mas avanzadosde la teorıa de conjuntos, principalmente los relativos a pruebas de consistencia,cardinales grandes, etc.

Los unicos resultados que se enuncian sin demostracion en este libro son losque afirman la consistencia y la independencia de algunas de las afirmacionesconsideradas (como la hipotesis del continuo, la existencia de cardinales inacce-sibles, etc.) En algunos casos se esbozan sin rigor los argumentos que permitenconcluir que determinados hechos no pueden ser demostrados en NBG (o, equi-valentemente, en ZFC). Naturalmente, estas observaciones no demostradas nose usan en ningun momento, salvo para relacionar unas con otras.

Page 11: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo I

El lenguaje de la teorıa de

conjuntos

En este primer capıtulo desarrollaremos el lenguaje necesario para hablarcon precision de conjuntos, de modo que hablaremos de conjuntos en generalsin hablar de ningun conjunto en particular. En el capıtulo siguiente usaremoslos conceptos introducidos aquı para construir (es decir, describir) conjuntosconcretos (como los numeros naturales) que empezaran a perfilar el objeto deestudio de la teorıa.

1.1 Clases y conjuntos

El concepto matematico de “conjunto” pretende precisar el concepto infor-mal de “coleccion de objetos”, sin embargo hay razones profundas que harıaningenuo pensar que un conjunto (en el sentido tecnico que vamos a dar a la pa-labra) es exactamente lo mismo que una “coleccion de objetos”. Ciertamente,podemos pensar tranquilamente que todo conjunto es una coleccion de objetossin que ello nos lleve a ninguna contradiccion (que se sepa), pero pensar quecualquier coleccion de objetos puede identificarse con un conjunto sı que llevainevitablemente a contradicciones. Mas concretamente: al tratar de precisarel concepto informal de conjunto nos aparecen inevitablemente colecciones deobjetos (muchas de las cuales tienen interes matematico) que no pueden consi-derarse conjuntos sin caer en contradicciones.

Por este motivo vamos a partir de un concepto mas general que el de “con-junto”, al que llamaremos “clase”. Las clases tambien seran colecciones deobjetos, y seguira siendo cierto que si intentaramos identificar cualquier co-leccion de objetos con una clase caerıamos inevitablemente en contradicciones,pero definiremos los conjuntos como un tipo particular de clases de modo quetodas las colecciones de conjuntos que necesitaremos considerar, o bien seranconjuntos, o bien seran clases, y ası habremos obtenido un marco convenientepara desarrollar la teorıa de conjuntos.

1

Page 12: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Ası pues, decimos que las clases de las que vamos a hablar seran (o podranser consideradas como) colecciones de objetos. Quiza el lector espere ahora que,en aras del rigor matematico, explicitemos que colecciones de objetos vamos aconsiderar exactamente como clases y cuales van a ser exactamente los objetosque podran aparecer en las colecciones llamadas clases, pero no vamos a hacernada parecido a esto. Por el contrario vamos a limitarnos a afirmar que las clasesson simplemente los objetos de los que vamos a hablar (sin especificar cualesson), y que dadas dos clases A y B, entre ellas puede darse o no la relacion depertenencia, que representaremos por A ∈ B cuando se de y por A /∈ B cuandono se de. En el primer caso diremos que la clase A pertenece a (o es un elementode) la clase B, y en el segundo caso diremos que A no pertenece a B o que noes un elemento de B.

Es en este sentido en el que podemos pensar que una clase B es la coleccionde todas las clases A que cumplen A ∈ B, pero ni vamos a definir que es exacta-mente una clase, ni en que consiste exactamente que una clase pertenezca o noa otra. La parte positiva es que prometemos no hacer esto nunca mas, de modoque desde aquı nos obligamos a que cualquier otro concepto que introduzcamosen adelante sea definido con total precision a partir de los conceptos de “clase”y “pertenencia”. Un logico dira que los conceptos de “clase” y “pertenencia”son los conceptos primitivos (o conceptos no definidos) de la teorıa de conjuntos.

La forma de hablar con total rigor de unos conceptos no definidos es a travesde axiomas. Vamos a postular que las clases y la pertenencia de las que nos pro-ponemos hablar (sean lo que sean) satisfacen unos axiomas y, del mismo modoque nos hemos comprometido a no introducir nuevos conceptos sin definirlos contodo rigor a partir de los conceptos primitivos de clase y conjunto (o, mas engeneral, de otros conceptos previamente definidos) nos comprometemos tambiena no afirmar nada sobre las clases y la pertenencia (o sobre los conceptos queintroduzcamos en adelante) que no pueda ser demostrado logicamente con todorigor a partir de los axiomas establecidos.

Para ilustrar estos propositos empezamos dando la definicion de conjunto:

Definicion 1.1 Diremos que una clase es un conjunto si pertenece al menos aotra clase, es decir:

ctoA ≡∨

BA ∈ B.

Notemos que en la formalizacion de esta definicion hemos escrito “existe unB tal que A pertenece a B”. No necesitamos especificar de ninguna forma queB es una clase, pues todos los objetos de los que vamos a hablar son clases.

El primer axioma que adoptamos es el siguiente:

Axioma de Extensionalidad Si dos clases tienen los mismos elementos,entonces son iguales, es decir,

AB(∧

x(x ∈ A↔ x ∈ B) → A = B).

Page 13: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.1. Clases y conjuntos 3

Es el axioma de extensionalidad el que nos legitima a pensar en las clasescomo colecciones de elementos (de clases, concretamente), pues si dos clasestienen los mismos elementos (es decir, si todo elemento de una lo es de la otray viceversa, como dice la hipotesis del axioma) entonces ambas determinanla misma coleccion de objetos, y lo que dice el axioma es que si dos clasesdeterminan la misma coleccion de objetos, entonces son una misma clase. Enotros terminos: una clase no es ni mas ni menos que la coleccion de clases quedetermina mediante la relacion de pertenencia.

Veamos una segunda definicion:

Definicion 1.2 Diremos que una clase A es una subclase de una clase B (o unsubconjunto, si es que A es un conjunto) si todo elemento de A es tambien unelemento de B, es decir,

A ⊂ B ≡∧

x(x ∈ A→ x ∈ B).

Observemos que A ⊂ B se cumple en particular si A = B. Cuando queramosindicar que A es una subclase de B distinta de la propia B escribiremos

A B ≡ A ⊂ B ∧ A 6= B.

Veamos ahora un ejemplo elemental de teorema:

Teorema 1.3 Se cumple:

a)∧

A A ⊂ A,

b)∧

AB(A ⊂ B ∧ B ⊂ A→ A = B),

c)∧

ABC(A ⊂ B ∧ B ⊂ C → A ⊂ C).

Demostracion: Observemos que los teoremas a) y c) no requieren elaxioma de extensionalidad, es decir, son teoremas logicos que se deducen delas definiciones sin necesidad de ninguna hipotesis especıfica sobre las clases.Por ejemplo, para demostrar c) suponemos A ⊂ B ∧ B ⊂ C y, para probarA ⊂ C tomamos una clase x ∈ A, de modo que, como A ⊂ B, podemos afirmarque x ∈ B y, como B ⊂ C, podemos afirmar que x ∈ C. Esto prueba quex ∈ A→ x ∈ C y, como esto vale para toda clase x, concluimos que A ⊂ C.

En cambio, el teorema b) requiere el axioma de extensionalidad (y de hechoes equivalente a el). Si suponemos que A ⊂ B ∧ B ⊂ A, entonces tenemos quetodo x ∈ A cumple x ∈ B, y viceversa, es decir, que x ∈ A↔ x ∈ B, luego porel axioma de extensionalidad A = B.

Lo importante que el lector debe extraer de este resultado, mas alla de latrivialidad de lo que afirma en sı mismo, es que en el se pone de manifiestocomo es posible razonar de forma totalmente rigurosa con unos objetos (lasclases) y una propiedad (la pertenencia) que nunca hemos definido de ningunaforma, pero no importa lo que sean las clases y la pertenencia que, mientras

Page 14: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4 Capıtulo 1. El lenguaje de la teorıa de conjuntos

cumplan el axioma de extensionalidad, tendran que cumplir necesariamente elteorema anterior. Toda demostracion matematica, por sofisticada que sea, es dela misma naturaleza, con la unica diferencia de que puede apoyarse en algunosaxiomas mas que vamos a ir introduciendo paulatinamente.

El segundo axioma es el mas delicado desde un punto de vista tecnico:

Axioma de comprension Si φ(x) es cualquier propiedad normal, existe unaclase cuyos elementos son exactamente los conjuntos x que tienen la propiedadφ(x), es decir,

A∧

x(x ∈ A↔ cto x ∧ φ(x)).

Naturalmente, aquı debemos especificar que queremos decir por “propiedadnormal”. Ante todo, cuando decimos que φ(x) es una propiedad queremos decir,mas concretamente, que es una propiedad definible exclusivamente a partir delos conceptos de clase y pertenencia mediante los conectores logicos (“y”, “o”,“si y solo si”, etc.) y los cuantificadores (“para todo” y “existe”) (o de otrosconceptos definidos previamente en estas condiciones), entendiendo que puedenaparecer mas variables ademas de la x. Enseguida veremos ejemplos. Que lapropiedad sea normal significa que los cuantificadores solo recorren conjuntos, esdecir, que en la definicion de φ(x) no se dice nunca “para toda clase A” o “existeuna clase A”, sino a lo sumo “para todo conjunto A” o “existe un conjunto A”.

Antes de discutir mas a fondo las sutilezas de este axioma, vamos a ponersobre el papel ejemplos concretos, pero primero observemos que el axioma decomprension puede ser mejorado:

Teorema 1.4 En las condiciones del axioma de comprension, se cumple

1∨A∧

x(x ∈ A↔ cto x ∧ φ(x)).

Demostracion: Se trata de probar que existe una unica clase A cuyoselementos son los conjuntos que cumplen φ(x). La existencia de tal clase laproporciona el axioma de comprension. Para probar que es unica suponemosque una clase B cumple lo mismo, es decir,

x(x ∈ A↔ cto x ∧ φ(x)) ∧∧

x(x ∈ B ↔ ctox ∧ φ(x)).

Es claro que de aquı se deduce que

x(x ∈ A↔ x ∈ B),

y el axioma de extensionalidad nos da entonces que A = B, es decir, solo puedehaber una clase que cumpla la propiedad considerada.

Cuando hay una unica clase que cumple una propiedad, la logica nos permiteintroducir un nombre para ella. En este caso:

Page 15: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.1. Clases y conjuntos 5

Definicion 1.5 x | φ(x) ≡ A|∧

x(x ∈ A↔ ctox ∧ φ(x)),

es decir, llamamos x | φ(x) a la unica clase cuyos elementos son los conjuntosx que cumplen φ(x).

Por ejemplo, ahora podemos definir la union, la interseccion, el complementoy la diferencia de clases como

A ∪B ≡ x | x ∈ A ∨ x ∈ B, A ∩B ≡ x | x ∈ A ∧ x ∈ B,

A ≡ x | x /∈ A, A \B ≡ x | x ∈ A ∧ x /∈ B,respectivamente.

Tenemos ası cuatro ejemplos de aplicacion del axioma de comprension. Enla definicion de la union estamos tomando φ(x) ≡ x ∈ A ∨ x ∈ B, que esuna propiedad definida exclusivamente en terminos de la pertenencia y un signologico (la disyuncion), en la que, ademas de la variable x, figuran las variablesauxiliares A y B. Como no aparecen cuantificadores, la propiedad es normal yel axioma es aplicable. Lo mismo vale para los otros tres ejemplos.

Definimos ahora dos ejemplos concretos de clases, la clase universal y la clasevacıa:

V ≡ x | x = x, ∅ ≡ x | x 6= x.Obviamente, como ningun conjunto es distinto de sı mismo, tenemos que

x x /∈ ∅. Mas aun, la clase vacıa es la unica clase con esta propiedad, es decir:∧

A(∧

xx /∈ A→ A = ∅).

Esto es una consecuencia del axioma de extensionalidad, pues si una claseA no tiene elementos, entonces tiene los mismos elementos que la clase vacıa(ninguno), luego ambas clases son la misma.

Respecto de la clase universal, es muy importante tener presente que, aunquetoda clase A cumple A = A, eso no significa que toda clase A cumpla A ∈ V .Recordemos que, en general, los elementos de una clase x | φ(x) no sontodas las clases que cumplen φ(x), sino todos los conjuntos que cumplen φ(x).Para pertenecer a x | φ(x) no basta con cumplir la propiedad φ(x), sino quese requiere ademas ser un conjunto. En nuestro caso, la clase universal estaformada por todos los conjuntos que cumplen x = x, es decir, se trata de “laclase de todos los conjuntos” (pero no de la clase de todas las clases). Ası pues:

x(x ∈ V ↔ ctox).

Observemos que ∅ y V son, respectivamente, la menor y la mayor de todaslas clases, en el sentido de que

A(∅ ⊂ A ∧ A ⊂ V ).

En efecto, como los elementos de cualquier clase A son conjuntos, todosellos son tambien elementos de V , luego tenemos la inclusion A ⊂ V . Por otra

Page 16: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6 Capıtulo 1. El lenguaje de la teorıa de conjuntos

parte, la clase vacıa esta contenida en cualquier otra clase, porque la implicacionx ∈ ∅ → x ∈ A se cumple trivialmente (no es posible encontrar un conjunto xque cumpla x ∈ ∅ ∧ x /∈ A).

Diremos que dos clases A y B son disjuntas si A ∩ B = ∅, es decir, si notienen elementos en comun.

Nota Los conceptos que acabamos de introducir verifican una serie de pro-piedades que se demuestran todas de forma elemental. Por ejemplo, se cumpleque

ABC(A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩C)).

Para probar este tipo de igualdades basta recurrir al axioma de extensionali-dad: tomamos un conjunto x ∈ A∩ (B ∪C) y probamos que pertenece tambienal otro miembro. En efecto, por definicion de interseccion x ∈ A y x ∈ B ∪C, ypor definicion de union, o bien x ∈ B (en cuyo caso x ∈ A∩B) o bien x ∈ C (encuyo caso x ∈ A∩C), luego en cualquiera de los dos casos x ∈ (A∩B)∪(A∩C).Esto prueba la implicacion

x ∈ A ∩ (B ∪ C) → x ∈ (A ∩B) ∪ (A ∩ C),

y la implicacion opuesta se demuestra de forma similar. Entonces el axioma deextensionalidad nos da la igualdad. Alternativamente, podemos considerar quehemos probado la inclusion

A ∩ (B ∪ C) ⊂ (A ∩B) ∪ (A ∩ C),

y que la implicacion contraria prueba la inclusion contraria:

(A ∩B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C),

y entonces concluimos mediante 1.3 b). En general una forma de probar unaigualdad entre dos clases X = Y es probar la doble inclusion X ⊂ Y ∧ Y ⊂ Xy aplicar 1.3 b).

A partir de los axiomas de extensionalidad y comprension no es posibleprobar que V 6= ∅, es decir, no es posible probar que existan conjuntos. Porello introducimos ahora un axioma que postula la existencia de un conjunto:

Axioma del conjunto vacıo cto∅.

Ası pues, a partir de aquı podemos hablar del “conjunto vacıo” en lugar de la“clase vacıa”. En particular, ahora podemos afirmar que ∅ ∈ V , luego V 6= ∅.

Podemos definir unos conceptos mas generales de union e interseccion:

⋃A ≡ x |

y ∈ A x ∈ y,⋂A ≡ x |

y ∈ A x ∈ y.

Observemos que aquı usamos la notacion∨

y ∈ Aφ(y) como abreviaturade

y(y ∈ A ∧ x ∈ y), es decir, “existe una clase y en A tal que φ(y)”.

Page 17: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.1. Clases y conjuntos 7

Ahora bien, la condicion y ∈ A supone implıcitamente que y es un conjunto(pues estamos diciendo que pertenece a otra clase), luego esto es equivalente a∨

y(cto y ∧ y ∈ A ∧ φ(y)).Similarmente,

y ∈ Aφ(y) es una abreviatura por∧

y(y ∈ A→ φ(y)), que asu vez es equivalente a

y(cto y ∧ y ∈ A→ φ(y)), luego las cuantificaciones dela forma

y ∈ A o∧

y ∈ A son cuantificaciones sobre conjuntos y determinanpropiedades normales (supuesto que lo que vaya a continuacion sea normal).

Estas consideraciones generales justifican en particular que la existencia de“gran union” y la “gran interseccion” se sigue de dos aplicaciones legıtimas delaxioma de comprension. Claramente,

⋃A resulta de reunir en una unica clase

todos los elementos de todos los elementos de A, mientras que⋂A contiene a

los elementos comunes a todos los elementos de A. Observemos que

⋃∅ = ∅,

⋃V = V,

⋂∅ = V,

⋂V = ∅.

En efecto, vamos a probar las dos ultimas igualdades:

Si x ∈ V , entonces trivialmente∧

y ∈ ∅ x ∈ y, pues no es posible encontrarun y ∈ ∅ que no cumpla x ∈ y, y esto significa que x ∈ ⋂

∅, luego tenemosla inclusion V ⊂ ⋂

∅, y ya hemos visto que la inclusion contraria se cumplesiempre.

Para la ultima igualdad requerimos el axioma del conjunto vacıo. En efecto,si x ∈ ⋂

V , entonces x pertenece a todos los elementos de V , en particular x ∈ ∅,lo cual es imposible. Por lo tanto

⋂V no tiene elementos y es el conjunto vacıo.

Veamos ahora un ejemplo que muestra la necesidad de distinguir entre clasesy conjuntos. Definimos la clase de Russell como

R ≡ x | x /∈ x,

es decir, se trata de la clase de todos los conjuntos que no se pertenecen a sımismos. La propiedad x /∈ x es normal (trivialmente, porque no tiene cuantifi-cadores) luego el axioma de comprension justifica la existencia de R.

Si no distinguieramos entre clases y conjuntos, y pretendieramos haber de-finido “el conjunto de todos los conjuntos que no se pertenecen a sı mismos”tendrıamos una contradiccion, pues cabrıa plantearse si el “conjunto” R se per-tenece o no a sı mismo, y las dos opciones resultan contradictorias: si R ∈ Rentonces R deberıa ser uno de los “conjuntos que no se pertenecen a sı mismos”,y concluirıamos que R /∈ R, en contra de lo supuesto. Si, por el contrario, su-ponemos que R /∈ R, entonces R serıa un “conjunto que no se pertenece a sımismo” y deberıamos concluir que R ∈ R, en contradiccion con lo supuesto.

Esta paradoja se conoce como la “paradoja de Russell”, y no afecta a lateorıa de conjuntos en los terminos que la estamos presentando, pues en nuestrocontexto se reduce al teorema siguiente:

Teorema 1.6 ¬ ctoR.

Page 18: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Demostracion: Observemos que R /∈ R, pues si se cumpliera R ∈ R pordefinicion de R resultarıa que R /∈ R y tendrıamos una contradiccion. Si R fueraun conjunto, entonces tendrıamos ctoR ∧ R /∈ R, es decir, R serıa un conjuntoque no se pertenece a sı mismo, y esto implicarıa R ∈ R, con lo que tendrıamosuna contradiccion. Ası pues, R no puede ser un conjunto.

Las clases que no son conjuntos se llaman clases propias. Acabamos deprobar que la clase de Russell es una clase propia, y que ademas cumple R /∈ R.Si no fuera por la distincion entre clases y conjuntos, que hace que R /∈ R noobligue necesariamente a que R ∈ R, tendrıamos una contradiccion.

Notemos que, como ∅ es un conjunto que no se pertenece a sı mismo, secumple que ∅ ∈ R, luego R 6= ∅. Ahora es claro tambien que la nocion de claseno puede identificarse con la de “coleccion de objetos”, pues, admitiendo queexistan clases que cumplen los axiomas que estamos suponiendo, tenemos que ∅y R son dos clases que forman una “coleccion de dos clases”, pero tal coleccionno se corresponde con ninguna clase, en el sentido de que no existe ningunaclase cuyos elementos sean exactamente ∅ y R, pues para que ello fuera posibleR deberıa ser un conjunto y no lo es.

Ası pues, siempre podemos pensar en colecciones de objetos (de clases, con-cretamente) que van mas alla de las colecciones que podemos expresar medianteclases. Nuestro proposito es demostrar (adoptando para ello los axiomas ade-cuados) que todas las colecciones que realmente son necesarias para desarrollarlas matematicas (y esto no incluye a la coleccion formada por ∅ y R, de la quepodemos hablar, pero tampoco pasa nada si no la tenemos en cuenta) son en sumayor parte conjuntos y, en algunos pocos casos, clases propias, pero clases alfin y al cabo.

Nota El lector se habra preguntado sin duda por que hemos impuesto lacondicion de normalidad en el axioma de comprension o, equivalentemente, queproblema habrıa en admitir que cualquier propiedad, normal o no, define unaclase. La respuesta es que no habrıa ningun problema. La teorıa axiomatica deconjuntos que resulta de aceptar los axiomas que hemos introducido hasta ahoray los que introduciremos en lo sucesivo se conoce como teorıa de conjuntos devon Neumann-Bernays-Godel, (NBG), mientras que si eliminamos la restriccionde normalidad en el axioma de comprension tenemos la teorıa de conjuntos deMorse-Kelley (MK).

La diferencia entre ambas es que en NBG la nocion de clase propia es elimina-ble, es decir, toda la teorıa puede ser reformulada para eliminar por completo elconcepto de clase propia y trabajar exclusivamente con conjuntos. El resultadoes la llamada teorıa de conjuntos de Zermelo-Fraenkel (ZF) que es totalmenteequivalente a NBG en el sentido de que un teorema que involucre exclusiva-mente conjuntos es demostrable en NBG si y solo si es demostrable en ZF. Lasclases como R, que en NBG se demuestra que son clases propias, simplementeno existen en ZF, es decir, en ZF, en lugar de “la clase de los conjuntos que nose pertenecen a sı mismos no es un conjunto”, se demuestra “no existe ningunconjunto cuyos elementos sean los conjuntos que no se pertenecen a sı mismos”.

Page 19: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.2. Funciones 9

Por el contrario, en MK las clases propias pueden usarse para demostrarresultados sobre conjuntos (incluso afirmaciones que hablan exclusivamente denumeros naturales) que no son demostrables en NBG ni, por consiguiente, en ZF.

En realidad, al restringirnos a NBG, es decir, al aceptar la restriccion delaxioma de comprension a propiedades normales, no es que estemos restringien-donos a NBG, sino mas bien estamos observando que todos los resultados quevamos a probar no requieren mas que la forma restringida del axioma de com-prension. En ningun momento nos vamos a encontrar con resultado que “nosgustarıa” poder demostrar pero no podemos por culpa de la restriccion delaxioma de comprension. Para encontrar resultados ası (que los hay) es necesa-rio ahondar mucho en las sutilezas logicas de la teorıa de conjuntos, cosa queno vamos a hacer en este libro.

1.2 Funciones

Ahora vamos a enriquecer sustancialmente el lenguaje de la teorıa de con-juntos mostrando que a partir de las meras nociones de clase y pertenencia esposible definir funciones que hagan corresponder unos conjuntos con otros. Laclave para ello es el concepto de par ordenado, que a su vez requiere definirpreviamente el concepto de par desordenado:

Definicion 1.7 Dadas dos clases x e y, definimos el par (desordenado) formadopor ellas como

x, y ≡ z | z = x ∨ z = y.Definimos tambien x ≡ x, x = z | z = x.

De este modo, x, y es la clase de todos los conjuntos que son iguales a xo a y. Esto hay que tomarlo con precaucion si x o y no son conjuntos. Porejemplo, ∅, R = ∅ y R = ∅.

Con los axiomas que hemos presentado hasta ahora no es posible demostrarque exista ningun otro conjunto, aparte de ∅. Esto cambia drasticamente sianadimos el axioma siguiente:

Axioma del par∧

xy (cto x ∧ cto y → ctox, y).

En otras palabras, el axioma del par afirma que el par definido por dosconjuntos es un conjunto. El axioma incluye el caso en que x = y, en cuyo casotenemos:

x(cto x→ ctox).

Ahora podemos probar la existencia de muchos conjuntos, como ∅, ∅,∅, ∅, ∅, etc.

Mas en general, cuando escribamos expresiones de la forma a, b, c, d, habraque entender que nos referimos a la clase

a, b, c, d ≡ x | x = a ∨ x = b ∨ x = c ∨ x = d.

Page 20: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Se dice entonces que hemos definido la clase A = a, b, c, d por extension, esdecir, especificando sus elementos uno a uno, mientras que las clases definidasespecificando una propiedad que deben cumplir sus elementos estan definidaspor comprension. Obviamente, solo es posible definir por extension clases conun numero finito de elementos. Los axiomas vistos hasta el momento no nospermiten asegurar que la clase a, b, c, d sea un conjunto aunque lo sean suselementos.

Observemos ahora que si x, y son conjuntos, se cumple que x, y = y, x,pues ambos conjuntos tienen los mismos elementos. Un hecho fundamentales que podemos definir un nuevo concepto de par en el que el orden de suselementos sea relevante:

Definicion 1.8 Definimos el par ordenado de componentes los conjuntos x e ycomo el conjunto (x, y) ≡ x, x, y.

Observemos que si x e y son conjuntos, entonces x y x, y son conjuntospor el axioma del par, y entonces (x, y) es un conjunto por una nueva aplicacionde este axioma. La definicion esta pensada para que se cumpla el teoremafundamental:

Teorema 1.9 Si x, y, u, v son conjuntos, entonces

(x, y) = (u, v) ↔ x = u ∧ y = v.

Demostracion: Una implicacion es trivial. Para probar la contraria supo-nemos que (x, y) = (u, v). Entonces, como x ∈ (x, y), tenemos tambien quex ∈ (u, v), luego x = u o bien x = u, v. Si se da el segundo caso,como u ∈ u, v = x, concluimos que u = x, y en el primer caso llegamostambien a la misma conclusion.

Ahora distinguimos otros dos casos: si x = y, entonces

(x, y) = x, x, x = x,

y como u, v ∈ (u, v) = (x, y), sera u, v = x, luego v ∈ u, v = x, luegov = x = y.

Si, por el contrario, x 6= y, no puede ser x, y = u, pues entonces serıax = u = y, y como x, y ∈ (x, y) = (u, v), tiene que ser y ∈ x, y = u, v,luego y = u ∨ y = v, pero no puede ser y = u = x, luego tiene que ser y = v.

Usaremos la notacion

(x, y) | φ(x, y) ≡ z |∨

xy(cto x ∧ cto y ∧ z = (x, y) ∧ φ(x, y)),

es decir, para referirnos a la clase de todos los pares ordenados (x, y) cuyas com-ponentes cumplen la propiedad (normal) φ(x, y). Observemos que la propiedad

xy(cto x ∧ cto y ∧ z = (x, y) ∧ φ(x, y))

Page 21: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.2. Funciones 11

es normal si φ lo es, pues los dos cuantificadores que se anaden a lo que afirmaφ estan restringidos a conjuntos, por lo que si φ es normal el axioma de com-prension asegura la existencia de la clase (x, y) | φ(x, y).

El ejemplo mas simple de clase definida de este modo es el producto carte-siano:

Definicion 1.10 El producto cartesiano de dos clases A y B se define como

A×B ≡ (x, y) | x ∈ A ∧ y ∈ B.

En otros terminos: A×B es la clase formada por todos los pares ordenadoscuya primera componente esta en A y su segunda componente esta en B. Porejemplo, V × V es la clase de todos los pares ordenados.

Definicion 1.11 Definimos el dominio y el rango de una clase F como lasclases1

DF ≡ x |∨

y (cto y ∧ (x, y) ∈ F, RF ≡ y |∨

x (cto x ∧ (x, y) ∈ F

Diremos que F es unıvoca si cumple

UnF ≡∧

xyz(ctox ∧ cto y ∧ cto z ∧ (x, y) ∈ F ∧ (x, z) ∈ F → y = z).

Notemos que en la definicion de clase unıvoca no hemos exigido que todoslos elementos de F sean pares ordenados.

Diremos que una clase F es una funcion si cumple

FnF ≡∧

z ∈ F∨

xy(cto x ∧ cto y ∧ z = (x, y)) ∧ UnF,

o, equivalentemente, si F ⊂ V ×V ∧ UnF . Mas concretamente, diremos que Fes una aplicacion (o una funcion) de una clase A en una clase B si cumple

F : A −→ B ≡ FnF ∧ DF = A ∧ RF ⊂ B.

En otras palabras, una clase F es unıvoca si para cada x ∈ DF existe ununico conjunto y (necesariamente en RF ) tal que (x, y) ∈ F . Dicho y recibe elnombre de imagen de x por F y se representa por

F (x) ≡ y | (cto y ∧ (x, y) ∈ F ).

Tambien se dice que x es una antiimagen de y por F , pero, aunque una claseF sea unıvoca, un elemento de RF puede tener varias antiimagenes por F .

Si F ⊂ V × V (en particular si F es una funcion), entonces F ⊂ DF × RF ,pero esto no es cierto si F es una clase cualquiera, pues entonces F puedecontener elementos que no sean pares ordenados.

1Notemos que los cuantificadores∨y y

∨x que aparecen en las definiciones del dominio

y el rango estan restringidas a conjuntos, por lo que la propiedad es normal y el axioma decomprension es aplicable.

Page 22: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

12 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Claramente, F : A −→ B significa que F asigna a cada x ∈ A una imagenF (x) ∈ B, y entonces F ⊂ A×B.

Observemos que si F : A −→ B y B ⊂ C, tambien se cumple F : A −→ C.

Definimos:

F : A −→ B inyectiva ≡F : A −→ B ∧∧

xy ∈ A(F (x) = F (y) → x = y),

F : A −→ B suprayectiva ≡F : A −→ B ∧∧

y ∈ B∨

x ∈ A f(x) = y,

F : A −→ B biyectiva ≡F : A −→ B inyectiva y suprayectiva.

Ası, F es inyectiva si asigna a cada elemento de A una imagen distinta en B(no hay dos elementos con la misma imagen), F es suprayectiva si todo elementode B tiene una antiimagen (o, equivalentemente, si RF = B) y F es biyectivasi a cada elemento de A le asigna un unico elemento de B y viceversa.

Usaremos a menudo el criterio siguiente de igualdad de funciones:

Teorema 1.12 Dos funciones F y G son iguales si y solo si tienen el mismodominio A y se cumple que

x ∈ AF (x) = G(x).

Demostracion: Una implicacion es trivial. Si F y G coinciden sobre sudominio comun, dado z ∈ F , por ser una funcion existen conjuntos x, y tales quez = (x, y). Entonces x ∈ A por definicion de dominio, luego y = F (x) = G(x),luego z = (x, y) ∈ G, y por lo tanto F ⊂ G. Igualmente se prueba la inclusionopuesta.

Veamos mas conceptos relacionados con las funciones:

Definicion 1.13 La restriccion de una clase F a una clase X como

F |X ≡ (x, y) | x ∈ X ∧ (x, y) ∈ F,

es decir, se trata de la clase de todos los pares ordenados de F cuya primeracomponente esta en X .

Es facil ver que si F : A −→ B y X ⊂ A, entonces F |X : X −→ B.

Definimos la clase inversa de una clase F como la clase

F−1 ≡ (y, x) | (x, y) ∈ F.

Observemos que si F ⊂ V ×V , entonces (F−1)−1 = F . Tambien es claro que siF : A −→ B biyectiva entonces F−1 : B −→ A biyectiva.

Definimos la imagen de una clase X por una clase F como

F [X ] ≡ y |∨

x ∈ X (x, y) ∈ F.

Equivalentemente, F [X ] ≡ R(F |X). Notemos que

F−1[Y ] = x |∨

y ∈ Y (x, y) ∈ F.

Page 23: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.2. Funciones 13

En particular, si F : A −→ B, X ⊂ A, Y ⊂ B, tenemos que

F [X ] = F (x) | x ∈ X ≡ y |∨

x ∈ X F (x) = y,

F−1[Y ] = x | x ∈ A ∧ F (x) ∈ Y ,de modo que F [X ] es la clase de todas las imagenes por F de elementos de Xy F−1[Y ] es la clase de todas las antiimagenes por F de los elementos de Y .

Es facil probar que si F : A −→ B, Y1, Y2 ⊂ B y X1, X2 ⊂ A, entonces

F−1[Y1 ∪ Y2] = F−1[Y1] ∪ F−1[Y2], F−1[Y1 ∩ Y2] = F−1[Y1] ∩ F−1[Y2],

F [X1 ∪X2] = F [X1] ∪ F [X2], pero F [X1 ∩X2] ⊂ F [X1] ∩ F [X1]

y en general no se da la igualdad (pero se da si F es inyectiva).

Definimos la composicion de dos clases F y G como la clase

F G ≡ (x, z) |∨

y(cto y ∧ (x, y) ∈ F ∧ (y, z) ∈ G).

En particular, si F : A −→ B y G : B −→ C, se cumple que F G : A −→ C y∧

x ∈ A (F G)(x) = G(F (x)), de modo que F G es la aplicacion que resultade “encadenar” F y G, es decir, de aplicar primero F y luego aplicar G sobreel resultado obtenido.

Tambien es facil comprobar que la composicion de aplicaciones inyectivas, su-prayectivas o biyectivas es inyectiva, suprayectiva o biyectiva, respectivamente.En el ultimo caso se cumple ademas que (F G)−1 = G−1 F−1.

Observemos que, dadas tres clases cualesquiera F , G, H , se cumple que

F (G H) = (F G) H =

(x,w) |∨

yz(cto y ∧ cto z ∧ (x, y) ∈ F ∧ (y, z) ∈ G ∧ (z, w) ∈ H).Finalmente, definimos la identidad en una clase A como la clase

IA ≡ (x, y) | x ∈ A ∧ x = y.

Equivalentemente, se trata de la aplicacion IA : A −→ A (claramente biyectiva)determinada por

x ∈ A IA(x) = x.

Si llamamos I : V −→ V a la aplicacion dada por I(x) = x, entoncesIA = I|A.

Si A ⊂ B, entonces se cumple tambien que IA : A −→ B y en este contextose la llama inclusion de A en B.

Es facil ver que si F : A −→ B, entonces IA F = F IB = F , y si F esbiyectiva entonces F F−1 = IA, F−1 F = IB .

Una forma de probar que una aplicacion es biyectiva es encontrar su inversa,de acuerdo con el teorema siguiente:

Page 24: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

14 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Teorema 1.14 Sean F : A −→ B y G : B −→ A.

a) Si F G = IA entonces F es inyectiva y G suprayectiva.

b) Si ademas G F = IB entonces F y G son biyectivas y G = F−1.

Demostracion: a) Para probar que F es inyectiva tomamos x, y ∈ A ysuponemos que F (x) = F (y), con lo que G(F (x)) = G(F (y)), pero esto equivalea (F G)(x) = (F G)(y), que por hipotesis es IA(x) = IA(y), es decir, x = y.

Para probar que la aplicacion G es suprayectiva tomamos x ∈ A y observa-mos que y = F (x) ∈ B cumple G(y) = G(F (x)) = (F G)(x) = IA(x) = x.

b) Aplicando a) con los papeles de F y G intercambiados obtenemos que Fy G son biyectivas. Ademas, F−1 F G = F−1 IA, luego IB G = F−1, luegoG = F−1.

Terminamos esta seccion discutiendo algunas notaciones habituales relacio-nadas con las funciones. Ante todo, puesto que el teorema 1.12 nos garantizaque una funcion queda completamente determinada por su dominio y por la ima-gen que asigna a cada elemento de este, habitualmente definiremos las funcionesespecificando esta informacion.

Por ejemplo, si decimos “sea F la funcion definida en la clase A tal que∧

x ∈ A F (x) = x”, nos estamos refiriendo a

F ≡ (x, y) | x ∈ A ∧ y = x.

Para que la definicion de F sea correcta es necesario comprobar que la pro-piedad y = x sea normal, para que el axioma de comprension sea aplicable, yademas que, para cada x ∈ A, su imagen pretendida (en este caso x) sea unconjunto, pues en caso contrario, es decir, si y no es un conjunto, el par (x, y)serıa simplemente

(x, y) = x, x, y = x, x = x, x, x = (x, x),

con lo que tendrıamos ciertamente la aplicacion F , pero cumplirıa F (x) = xpara todo x ∈ A cuya imagen pretendida no fuera un conjunto.2 Si se cumplenestos dos requisitos, es inmediato comprobar que F : A −→ V y que, para todox ∈ A, F (x) toma el valor pretendido.

Hay otra notacion sustancialmente distinta que conviene usar a veces pararepresentar ciertas aplicaciones. Para referirnos a una aplicacion X : I −→ Vusaremos a veces la notacion Xii∈I , y diremos entonces que Xii∈I es unafamilia de conjuntos subindicados por la clase I. En este contexto escribimos

2En general, si t(x) es un termino del lenguaje de la teorıa de conjuntos tal que la formulay = t(x) es normal y se demuestra que

∧x ∈ A cto t(x), entonces

F ≡ (x, y) | x ∈ A ∧ y = t(x),

define una funcion a la que mas habitualmente nos referiremos como “la funcion F definidasobre la clase A dada por

∧x ∈ A F (x) = t(x)”. En el ejemplo que hemos puesto, t(x) ≡ x.

Page 25: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.3. Formacion de conjuntos 15

Xi ≡ X(i) para referirnos a la imagen de i, y decimos que es el conjunto deındice i en la familia considerada.

Notemos que, desde un punto de vista logico, la expresion X : I −→ Ves la afirmacion segun la cual X es una aplicacion de dominio X , mientrasque Xii∈I no es una afirmacion, sino la forma de representar a una ciertaaplicacion de dominio I. No hay que confundir esta notacion con Xi | i ∈ I,que es una forma de denotar el rango de X , es decir, RX o X [I].

Tambien podemos usar esta notacion para definir una aplicacion en losterminos explicados anteriormente, es decir, especificando su dominio y la ima-gen de cada elemento del dominio. Por ejemplo, si tenemos dos familias Xii∈I

e Yii∈I , a partir de ellas podemos definir la familia Xi ∩ Yii∈I , que ha deentenderse como la aplicacion Z : I −→ V dada por Z(i) = Xi ∩ Yi o, masconcretamente

Z ≡ (i, y) | i ∈ I ∧ y = Xi ∩ Yi.Ahora bien, de momento no estamos en condiciones de justificar que esta defi-nicion es correcta, pues, aunque la propiedad y = Xi∩Yi es ciertamente normal,hay asegurar ademas que Xi∩Yi es un conjunto para todo i ∈ I. Esto lo justifi-caremos en la seccion siguiente, pero para ello sera necesario un nuevo axioma.

Esta notacion es util para hablar de grandes uniones e intersecciones, paralo cual introducimos ademas los convenios de notacion

i∈I

Xi ≡⋃Xi | i ∈ I, ⋂

i∈I

Xi ≡⋂Xi | i ∈ I.

De este modo∧

x(x ∈⋃

i∈I

Xi ↔∨

i ∈ I x ∈ Xi),∧

x(x ∈⋂

i∈I

Xi ↔∧

i ∈ I x ∈ Xi).

No obstante, para operar con estas uniones e intersecciones es preferiblecontar antes con algunos de los resultados sobre formacion de conjuntos queveremos en la seccion siguiente.

1.3 Formacion de conjuntos

En esta seccion demostraremos (a partir de los axiomas necesarios) quepracticamente todas las construcciones realizadas a partir de conjuntos dan lu-gar a nuevos conjuntos. Ya hemos visto dos axiomas de formacion de conjuntos(es decir, axiomas que afirman que determinadas clases son, de hecho, conjun-tos), el axioma del conjunto vacıo y el axioma del par. Aquı presentaremos otrostres. Este es el mas potente:

Axioma de reemplazo Si F : A −→ B suprayectiva y A es un conjunto,entonces B tambien es un conjunto.3

Como primera consecuencia obtenemos:

3Desde un punto de vista logico conviene que los axiomas (al menos los mas basicos dela teorıa) involucren los conceptos mas simples que sea posible, y por ello es util observar

Page 26: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

16 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Teorema 1.15 Toda subclase de un conjunto es un conjunto.

Demostracion: Sea A un conjunto y B ⊂ A. Si B = ∅, entonces B es unconjunto por el axioma del conjunto vacıo. En caso contrario existe un b ∈ B.Definimos F : A −→ B mediante

F (x) =x si x ∈ B,b si x /∈ B.

Recordemos que esto es una forma practica de definir la clase F dada por

F ≡ (x, y) | x ∈ A ∧ ((x ∈ B ∧ y = x) ∨ (x /∈ B ∧ y = b)).

Claramente F : A −→ B suprayectiva, luego B es un conjunto por el axioma dereemplazo.

Como consecuencia:

Teorema 1.16 La clase universal V es una clase propia.

Demostracion: Si V fuera un conjunto, por el teorema anterior todas lasclases serıan conjuntos, pues todas estan contenidas en V , pero sabemos queexisten clases propias, como la clase de Russell R, luego V no puede ser unconjunto.

Ahora es inmediato que la interseccion de una clase A y un conjunto B (enparticular la interseccion de dos conjuntos) es un conjunto, pues A ∩ B ⊂ B.Para probar que la union de conjuntos es un conjunto necesitamos un nuevoaxioma:

Axioma de la union∧

A(ctoA→ cto⋃A).

En particular:

Teorema 1.17 Si A y B son conjuntos, tambien lo es A ∪B.

Demostracion: Basta tener en cuenta que A∪B =⋃A,B, y que A,B

es un conjunto por el axioma del par.

En particular ahora podemos probar que cualquier clase definida por ex-tension es un conjunto, pues, por ejemplo,

a, b, c, d = a ∪ b ∪ c ∪ d,que el axioma de reemplazo es equivalente a la version siguiente, en la que solo aparecen losconceptos de conjunto, par ordenado y clase unıvoca:

∧FA(ctoA ∧ UnF →

∨B(ctoB ∧

∧v(v ∈ B ↔

∨u ∈ A (u, v) ∈ F ))).

Notemos que en esta sentencia necesariamente B = F [A], luego lo que afirma es que si F esunıvoca y A es un conjunto, entonces F [A] es un conjunto. Claramente esto implica la formaque hemos adoptado para el axioma de reemplazo y, recıprocamente, a partir de ella podemosdemostrar esta aplicandola a F |A∩DF : A ∩ DF −→ F [A] suprayectiva, teniendo en cuentaque A ∩DF es un conjunto por el teorema 1.15.

Page 27: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.3. Formacion de conjuntos 17

y las cuatro clases a, b, c, d son conjuntos por el axioma del par (o porser el conjunto vacıo si alguna de las clases a, b, c, d no es un conjunto).

Combinando el axioma de reemplazo con el de la union obtenemos que siXii∈I es una familia de conjuntos e I es un conjunto, entonces la union

i∈I

Xi

es un conjunto, pues dicha union no es sino⋃RX y RX es un conjunto por

reemplazo y la union es un conjunto por el axioma de la union.

Notemos que la interseccion⋂

i∈I

Xi es tambien un conjunto siempre que la

clase I 6= ∅, pues si existe un i ∈ I entonces⋂

i∈I

Xi ⊂ Xi y podemos aplicar

el teorema 1.15. En cambio, si I = ∅ tenemos que⋂

i∈I

Xi = V , luego no es unconjunto.

Combinando tambien el axioma de reemplazo con el de la union obtenemosque el producto cartesiano de conjuntos es de nuevo un conjunto:

Teorema 1.18 Si A y B son conjuntos, tambien lo es A×B.

Demostracion: Para cada a ∈ A, la clase a × B es un conjunto, puesla aplicacion F : B −→ a × B dada por F (b) = (a, b) es biyectiva. Esto nospermite considerar la familia de conjuntos a×Ba∈A, es decir, la aplicacionF : A −→ V dada por F (a) = a ×B. Ahora basta observar que

A×B =⋃

a∈A

a ×B

y aplicar la observacion precedente: como A es un conjunto, tambien lo es A×B.

Es costumbre escribir

x ∈ A | φ(x) ≡ x | x ∈ A ∧ φ(x)

para enfatizar que estamos definiendo una subclase de la clase A. Por 1.15sabemos que si A es un conjunto, toda clase definida ası es de hecho un conjunto.Similarmente, usaremos la notacion

(x, y) ∈ A×B | φ(x, y) ≡ (x, y) | (x, y) ∈ A×B ∧ φ(x, y),

que, por el teorema anterior, tambien da lugar a conjuntos siempre que A y Bson conjuntos.

Nota Ahora ya es facil trabajar con uniones e intersecciones de familias deconjuntos. Por ejemplo en la prueba de 1.18 hemos usado un caso particular dela primera de las propiedades siguientes, cuya prueba no ofrece dificultad:

(⋃

i∈I

Xi) × Y =⋃

i∈I

(Xi × Y ), (⋂

i∈I

Xi) × Y =⋂

i∈I

(Xi × Y ).

(El caso de la interseccion requiere suponer que I 6= ∅).

Page 28: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

18 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Obviamente lo mismo vale con uniones e intersecciones en el segundo factor.Notemos que para asegurar que los segundos miembros estan bien definidosnecesitamos saber que cada Xi × Y es un conjunto.

Otras propiedades muy utiles son las siguientes: si Xii∈I es una familiade subconjuntos de un conjunto X , entonces

X \ ⋃

i∈I

Xi =⋂

i∈I

(X \Xi), X \ ⋂

i∈I

Xi =⋃

i∈I

(X \Xi).

En principio se requiere que I 6= ∅, pero cuando se trabaja con familias de sub-conjuntos de un conjunto fijo X , es conveniente considerar que, por definicion,⋂

i∈∅

Xi = X , con lo que las igualdades anteriores valen incluso si I = ∅.

Una consecuencia sencilla de los teoremas precedentes es la siguiente:

Teorema 1.19 Si R ⊂ V × V , entonces

ctoR ↔ ctoDR ∧ ctoRR.

Demostracion: La aplicacion R −→ DR dada por4 (x, y) 7→ x es supra-yectiva, luego, por reemplazo, si R es un conjunto tambien lo es su dominio, yanalogamente se razona con el rango. Para la implicacion opuesta basta teneren cuenta que R ⊂ DR× RR.

Sin embargo, si F es una funcion la equivalencia anterior se puede simplificara ctoF ↔ ctoDF , puesto que si el dominio de F es un conjunto, puesto queF : DF → RF suprayectiva, por reemplazo tenemos que el rango tambien es unconjunto. Alternativamente, es facil definir una biyeccion entre F y DF . Asıpues:

Teorema 1.20 Una funcion es un conjunto si y solo si lo es su dominio.

Presentamos finalmente el ultimo de los axiomas de formacion de conjuntos,para lo cual definimos previamente la clase de partes de una clase dada:

PY ≡ x | x ⊂ Y

Notemos que x ⊂ Y es una propiedad normal pues equivale a que todo conjuntoque pertenezca a x pertenece tambien a Y . Hay que tener presente que PYes la clase de todos los subconjuntos (no de todas las subclases) de Y . Si Yes un conjunto no hay diferencia y PY contiene a todo x ⊂ Y , pues esto yaimplica que x es un conjunto. En cambio, si Y es una clase propia, tenemos,por ejemplo, que Y ⊂ Y , pero Y /∈ PY . Por ejemplo, es facil ver que PV = V .

4Mas concretamente, nos referimos a

F ≡ (z, x) | z ∈ R ∧∨y (cto y ∧ z = (x, y)).

En lo sucesivo, en casos similares a este no nos detendremos a explicitar como las funcionesque definamos se reducen en ultima instancia a aplicaciones del axioma de comprension.

Page 29: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.4. La teorıa de conjuntos NBG∗ 19

Axioma de partes (AP)∧

X(ctoX → ctoPX).

En otras palabras, el axioma de partes afirma que la clase de partes de unconjunto es un conjunto. A partir de aquı es facil demostrar que muchas otrasclases son conjuntos. Por ejemplo, definimos

AB ≡ f | f : B −→ A.

Si B es una clase propia, tenemos que AB = ∅, pues ninguna f : B −→ A es unconjunto que pueda pertenecer a AB . En cambio, si B es un conjunto (aunqueA no lo sea) tenemos que AB contiene a todas las aplicaciones f : B −→ A,pues todas ellas son conjuntos.

Teorema 1.21∧

AB(ctoA ∧ ctoB → ctoAB)

Demostracion: Basta observar que si f ∈ AB entonces f ⊂ B × A, luegoAB ⊂ P(B ×A), y basta aplicar los resultados que ya conocemos de formacionde conjuntos.

Mas en general, dada una familia de conjuntos Xii∈I , definimos su pro-ducto cartesiano como la clase

i∈I

Xi ≡ x | x : I −→ V ∧∧

i ∈ I xi ∈ Xi.

De este modo, cada elemento del producto cartesiano es una familia de conjuntosxii∈I con la propiedad de que cada componente xi pertenece al conjuntocorrespondiente Xi.

Observemos que

i∈I

Xi ⊂(⋃

i∈I

Xi

)I

,

luego, por los resultados precedentes, si I es un conjunto tambien lo es el pro-ducto cartesiano.

Los resultados de esta seccion bastan para demostrar que cualquier cons-truccion conjuntista usual proporciona conjuntos cuando parte de conjuntos.

1.4 La teorıa de conjuntos NBG∗

Llegados a este punto hemos presentado ya los que podemos considerar comoaxiomas basicos de la teorıa de conjuntos, aunque en los capıtulos siguientesintroduciremos otros tres mas. Por ello conviene reunirlos aquı para dejar cons-tancia de la teorıa concreta en la que estamos trabajando.

Llamaremos teorıa de conjuntos restringida de Von Neumann-Bernays-Godel(NBG∗) a la teorıa cuyo unico concepto no definido es la relacion ∈ de perte-

Page 30: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

20 Capıtulo 1. El lenguaje de la teorıa de conjuntos

nencia (entre clases) y cuyos axiomas son los siguientes:

Extensionalidad∧

AB(∧

x(x ∈ A↔ x ∈ B) → A = B)

Comprension∨

A∧

x(x ∈ A↔ cto x ∧ φ(x)) (∗)

Vacıo cto∅

Par∧

xy (ctox ∧ cto y → ctox, y)

Union∧

A(ctoA→ cto⋃A)

Reemplazo∧

FAB(F : A −→ B suprayectiva ∧ ctoA→ ctoB)

(∗) para toda propiedad normal φ(x), tal vez con mas variables, ademas de x.

Notemos que no hemos incluido el axioma de partes (AP). Ello se debe aque una parte importante de la teorıa de conjuntos puede desarrollarse sin el,y a la larga resulta util saber que axiomas (mas alla de los axiomas basicos deNBG∗) son necesarios para probar cada resultado. En lo sucesivo trabajaremosen NBG∗ salvo que indiquemos lo contrario.

Como explicabamos al final de la seccion 1.1, la teorıa NBG∗ es equivalente ala teorıa ZF∗ (la teorıa restringida de Zermelo-Fraenkel) que resulta de eliminarel axioma de comprension y reformular los restantes para evitar toda referenciaa clases que a priori no tengan por que ser conjuntos.5 Son equivalentes en elsentido de que un teorema que hable unicamente de conjuntos puede demostrarseen NBG∗ si y solo si puede demostrarse en ZF∗. Las clases propias en NBG∗

son, pues, un mero recurso tecnico no esencial para trabajar mas comodamentecon los conjuntos.

1.5 Relaciones

Continuamos ahora con el proposito principal de este capıtulo, que es pre-sentar el lenguaje basico de la teorıa de conjuntos. Ya hemos introducido elvocabulario relacionado con las funciones, y ahora vamos a hacer lo propio conlas relaciones. La definicion conjuntista de “relacion” es muy simple:

Definicion 1.22 Una relacion (binaria) en una clase A es una clase R ⊂ A×A.Si R es una relacion en A y a, b ∈ A, escribiremos

aR b ≡ (a, b) ∈ R,

y en tal caso diremos que a esta relacionado con b respecto de la relacion R.

Observemos que, trivialmente, toda relacion en un conjunto es un conjunto.

Diremos que una relacion R en una clase A es:

a) Reflexiva si∧

x ∈ A xRx,

5Por ejemplo, el axioma del par puede reformularse diciendo que para todo par de con-juntos x, y existe otro conjunto z cuyos unicos elementos son x e y. El unico axioma cuyareformulacion no es trivial es el de reemplazo.

Page 31: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.5. Relaciones 21

b) Irreflexiva si∧

x ∈ A ¬xRx,

c) Simetrica si∧

xy ∈ A (xR y → y R x),

d) Antisimetrica si∧

xy ∈ A (xR y ∧ y R x→ x = y)

e) Asimetrica si∧

xy ∈ A (xR y → ¬y R x)

f) Transitiva si∧

xyz ∈ A (xR y ∧ y R z → xR z)

g) Conexa si∧

xy ∈ A (xR y ∨ y R x)

h) Debilmente conexa si∧

xy ∈ A(xR y ∨ y R x ∨ x = y)

Relaciones de equivalencia Una relacion de equivalencia en una clase A esuna relacion reflexiva, simetrica y transitiva en A.

Si R es una relacion de equivalencia en A y a ∈ A, definimos la clase deequivalencia de a respecto de R como

[a]R ≡ b ∈ A | aR b,

es decir, como la clase de todos los elementos de A relacionados con a. Elresultado fundamental sobre clases de equivalencia es el siguiente, cuya pruebadejamos a cargo del lector:

Teorema 1.23 Sea R una relacion de equivalencia en una clase A y conside-remos a, b ∈ A. Entonces:

a) aR b↔ [a]R = [b]R,

b) ¬aR b↔ [a]R ∩ [b]R = ∅.

En particular, dos clases de equivalencia en A son iguales o disjuntas.

Diremos que una relacion de equivalencia en una clase A es conjuntista sitodas las clases de equivalencia que determina son conjuntos. Esto sucede enparticular si A es un conjunto, pues en general las clases de equivalencia sonsubclases de A, luego si A es un conjunto todas ellas lo son tambien.

Si una relacion de equivalencia R en una clase A es conjuntista, podemosdefinir la clase cociente como6

A/R ≡ [a]R | a ∈ A.

Naturalmente, tambien podemos considerar la clase cociente para una relacionno conjuntista, pero entonces puede ocurrir perfectamente que A/R = ∅, locual no significa que no haya clases de equivalencia, sino que ninguna de ellases un conjunto.

6Tecnicamente, la existencia de la clase cociente viene dada por el axioma de comprension,teniendo en cuenta que A/R ≡ y |

∨a ∈ A y = [a]R.

Page 32: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

22 Capıtulo 1. El lenguaje de la teorıa de conjuntos

En el caso en que R es conjuntista podemos definir la aplicacion canonicap : A −→ A/R dada por p(a) = [a]R.

Obviamente es suprayectiva, luego el axioma de reemplazo nos da que si Aes un conjunto, A/R tambien lo es, y hablamos entonces del conjunto cociente,en lugar de clase cociente (aunque en este caso se sigue hablando de clases deequivalencia).

Relaciones de orden Una relacion de orden parcial en una clase A es unarelacion reflexiva, antisimetrica y transitiva en A. Si ademas es conexa se diceque es una relacion de orden total.

Es costumbre usar el signo ≤ para representar relaciones de orden arbitrarias(de modo que si decimos que ≤ es una relacion de orden en una clase A hayque entender que ≤ es una clase y que ≤ ⊂ A × A). En estos terminos, laspropiedades que definen una relacion de orden se escriben ası:

a ∈ Aa ≤ a,∧

ab ∈ A(a ≤ b ∧ b ≤ a→ a = b),∧

abc ∈ A(a ≤ b ∧ b ≤ c→ a ≤ c).

La relacion es de orden total si ademas∧

ab ∈ A(a ≤ b ∨ b ≤ a).

Una relacion de orden estricto en una clase A es una relacion asimetrica ytransitiva en A. Si ademas es debilmente conexa entonces es una relacion deorden total estricto.

Notemos que, pese a la nomenclatura, una relacion de orden estricto no esuna relacion de orden. La relacion entre ambos conceptos es que si ≤ es unarelacion de orden en A, entonces la relacion dada por

a < b↔ a ≤ b ∧ a 6= b

es una relacion de orden estricto en A y, recıprocamente, si < es una relacionde orden estricto en A, entonces la relacion dada por

a ≤ b↔ a < b ∨ a = b

es una relacion de orden en A. Estas dos construcciones son mutuamente inver-sas, en el sentido de que si aplicamos una y luego la otra volvemos a la relacionde partida. Ası pues, es indistinto definir una relacion de orden o una relacionde orden estricto en una clase dada, pues de una se pasa trivialmente a la otra.Usaremos tambien la notacion a ≥ b ≡ b ≤ a y a > b ≡ b < a.

Cuando digamos que (A,≤) es una clase total o parcialmente ordenada que-rremos decir7 que ≤ es una relacion de orden (total o parcial) en A.

Sea A una clase ordenada por la relacion ≤ y sea B ⊂ A. Entonces:

7Si A es un conjunto podemos entender esto como una afirmacion sobre el par ordenado(A,≤), pero usaremos esta misma expresion incluso si A es una clase propia, aunque ahora laafirmacion “(A,≤) es una clase total o parcialmente ordenada” no puede interpretarse comouna afirmacion sobre el par ordenado (A,≤) = ∅, sino literalmente como hemos indicado:como una forma comoda de expresar que ≤ es una relacion de orden en la clase A.

Page 33: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.5. Relaciones 23

a) M ∈ A es una cota superior de B si∧

x ∈ B x ≤M ,

b) m ∈ A es una cota inferior de B si∧

x ∈ B m ≤ x,

c) M ∈ A es un maximal de B si M ∈ B y∧

x ∈ B(M ≤ x→ M = x).

d) m ∈ A es un minimal de B si m ∈ B y∧

x ∈ B(x ≤ m→ x = m).

e) M ∈ A es el supremo de B si M es una cota superior de B y∧

x ∈ A(x es una cota superior de B →M ≤ x).

f) m ∈ A es el ınfimo de B si m es una cota inferior de B y∧

x ∈ A(x es una cota inferior de B → x ≤ m).

g) M ∈ A es el maximo de B si M ∈ B y M es una cota superior de B.

h) m ∈ A es el mınimo de B si m ∈ B y m es una cota inferior de B.

Ejemplo Si A es cualquier clase, la inclusion define una relacion de ordenparcial en PA, es decir, podemos considerar en esta clase la relacion dada por

X ≤ Y ↔ X ⊂ Y.

Es inmediato comprobar que se trata de una relacion de orden parcial cuyarelacion de orden estricto asociada es la inclusion estricta X Y .

Respecto de esta relacion, PA tiene como mınimo elemento a ∅. Si A es unconjunto, entonces PA tiene como maximo elemento a A, pero si A no es unconjunto, entonces PA no tiene maximo elemento, pues dado cualquier X ∈ PA,sera X A, luego existe un x ∈ A \X , luego X X ∪ x ∈ PA, luego X noes el maximo de PA.

Si A 6= ∅, la subclase B = PA \ ∅ tiene por minimales a los elementosde la forma a, con a ∈ A, pero no tiene mınimo, salvo en el caso en queA = a, pues si A contiene al menos dos elementos a y b, entonces no secumple a ⊂ b, luego a no es mınimo de B, pero es minimal porqueningun elemento de B es menor que a.

Si B es un subconjunto de A, entonces⋃B es el supremo de B en PA, pues

todo x ∈ B cumple x ⊂ ⋃B, luego

⋃B es una cota superior de B, y si M ∈ PA

es una cota superior de B, esto significa que∧

x ∈ B x ⊂M , de donde se sigueque

⋃B ⊂M , luego

⋃B es la menor cota superior de B.

Similarmente, si B ⊂ A es no vacıo, entonces⋂B es el ınfimo de B en PA.

Ası pues, si A tiene mas de un elemento, hemos visto que B = PA \ ∅ notiene mınimo elemento, pero tiene por ınfimo a ∅.

Page 34: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

24 Capıtulo 1. El lenguaje de la teorıa de conjuntos

a, b, c

a, b b, c a, c

a b c

Mas concretamente, si A = a, b, c, donde los conjuntosa, b, c son distintos dos a dos, la relacion de orden dadapor la inclusion es la que muestra la figura. Vemos en-tonces que PA tiene por mınimo a ∅ y por maximo a A.En cambio, PA \ A no tiene maximo elemento, perotiene tres elementos maximales, los tres conjuntos condos elementos. Similarmente, PA\∅ no tiene mınimo,pero tiene tres minimales, a saber, los conjuntos a,

b, c, y tambien tiene ınfimo, concretamente∅. El conjuntoB = a, b,∅no tiene maximo, pero tiene por supremo a a, b.

Es facil ver que en un conjunto totalmente ordenado todo maximal es maxi-mo y todo minimal es mınimo. Si un conjunto tiene maximo o mınimo, supremoo ınfimo, entonces estos son unicos. El supremo (ınfimo) de una clase es maximo(mınimo) si y solo si pertenece a la clase.

Cuando tenemos una clase A ordenada por una relacion ≤ y una subclaseB ⊂ A, consideramos, aunque no se indique explıcitamente, que B esta ordenadapor la restriccion de ≤ a B, es decir, con la interseccion de ≤ con B × B, demodo que si x, y ∈ B, se cumple x ≤ y como elementos de B si y solo si secumple como elementos de A. Es inmediato comprobar que esta restriccion esun orden en B. Mas aun, B esta totalmente ordenada si A lo esta.

Diremos que F : (A,≤1) −→ (B,≤2) es monotona creciente o, simplemente,creciente si ≤1 y ≤2 son relaciones de orden parcial en A y B respectivamente,F : A −→ B y

xy ∈ A(x ≤1 y → F (x) ≤2 F (y)).

Se dice que F es monotona decreciente o decreciente si cumple∧

xy ∈ A(x ≤1 y → F (y) ≤2 F (x)).

Se dice que F es estrictamente monotona creciente o decreciente si se cum-ple esto mismo cambiando las desigualdades no estrictas ≤ por desigualdadesestrictas <.

Es facil comprobar que si F : (A,≤1) −→ (B,≤2) y G : (B,≤2) −→ (C,≤3)son ambas monotonas crecientes o decrecientes estrictas o no, lo mismo le sucedea la composicion F G : (A,≤1) −→ (C,≤3).

Diremos que F : (A,≤1) −→ (B,≤2) es una semejanza si es biyectiva ytanto F como F−1 son crecientes. El caracter creciente de F y F−1 equivale a

xy ∈ A(x ≤1 y ↔ F (x) ≤2 F (y)).

Observemos que si (A,≤1) esta totalmente ordenada, entonces toda apli-cacion biyectiva y creciente F : (A,≤1) −→ (B,≤2) es una semejanza, pues siF (x) ≤2 F (y), entonces x ≤1 y ∨ y ≤1 x, pero si se da el segundo caso entoncesF (y) ≤2 F (x) por la monotonıa, luego F (x) = F (y), por la antisimetrıa, luegox = y por la biyectividad, luego igualmente x1 ≤1 y por la reflexividad.

Las propiedades siguientes son inmediatas:

Page 35: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.5. Relaciones 25

a) Para toda clase parcialmente ordenada (A,≤), se cumple que la identidadIA : (A,≤) −→ (A,≤) es una semejanza.

b) Si F : (A,≤1) −→ (B,≤2) es una semejanza, entonces la aplicacion inversaF−1 : (B,≤2) −→ (A,≤1) tambien lo es.

c) Si F : (A,≤1) −→ (B,≤2) y G : (B,≤2) −→ (C,≤3) son semejanzas,entonces la composicion F G : (A,≤1) −→ (C,≤3) tambien lo es.

Diremos que dos clases parcialmente ordenadas (A,≤1) y (B,≤2) son se-mejantes, y lo representaremos por (A,≤1) ∼= (B,≤2), si existe una semejanzaF : (A,≤1) −→ (B,≤2).

Las propiedades anteriores de las semejanzas se traducen inmediatamente enlas propiedades siguientes de la semejanza entre clases parcialmente ordenadas:

a) Para toda clase parcialmente ordenada (A,≤), se cumple (A,≤) ∼= (A,≤).

b) Si (A,≤1) ∼= (B,≤2), entonces (B,≤2) ∼= (A,≤1).

c) Si (A,≤1) ∼= (B,≤2) y (B,≤2) ∼= (C,≤3), entonces (A,≤1) ∼= (C,≤3).

La idea subyacente en estos conceptos es que, al conservar las relaciones deorden, una semejanza F : (A,≤1) −→ (B,≤2) conserva todas las propiedadesrelacionadas con el orden. Por ejemplo, si X ⊂ A y m es el maximo, o elmınimo, o el supremo, o el ınfimo, o una cota superior/inferior de X , entoncesF (m) es lo mismo de F [X ]. En general, toda propiedad que cumplan unoselementos y subconjuntos de A la cumpliran tambien las imagenes por F deestos elementos o conjuntos, y esto hace que dos clases semejantes tengan lasmismas propiedades de orden (una esta totalmente ordenada si y solo si lo estala otra, una tiene maximo si y solo si lo tiene la otra, etc.).

Clases bien ordenadas Un buen orden en una clase A es una relacion deorden parcial respecto a la cual todas subclase8 no vacıa de A tiene mınimoelemento. Decimos que (A,≤) es una clase bien ordenada si ≤ es un buen ordenen A.

En el capıtulo siguiente veremos que las buenas relaciones de orden desempe-nan un papel central en la teorıa de conjuntos, pero de momento presentaremosaquı unicamente las consecuencias inmediatas de la definicion.

Ante todo, aunque hemos definido un buen orden como una relacion de ordenparcial, lo cierto es que la existencia de mınimos implica que es total, pues si(A,≤) es una clase bien ordenada y x, y ∈ A, el conjunto x, y debe tener unmınimo elemento m, y entonces se cumple x ≤ y o bien y ≤ x segun que seam = x o m = y.

8Observemos que la propiedad “(A,≤) es una clase bien ordenada” no es normal, porquecontiene una cuantificacion sobre todas las subclases de A, pero “(A,≤) es un conjunto bienordenado” sı que lo es, porque ahora la existencia de mınimo se requiere para todos lossubconjuntos no vacıos de A, luego el cuantificador esta restringido a conjuntos.

Page 36: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

26 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Tambien es evidente que toda subclase de una clase bien ordenada esta bienordenada.

En general, si (A ≤) es un conjunto bien ordenado y x ∈ A, usaremos lanotacion

A≤x ≡ a ∈ A | a ≤ x, A<

x ≡ a ∈ A | a < x.

Nos referiremos a ellos como la seccion inicial no estricta (o estricta, respecti-vamente) determinada por x, que no es sino la clase de todos los elementos deA anteriores (o estrictamente anteriores) a x.

Una de las razones por las que las clases bien ordenadas son importantes esporque permiten razonar por induccion en el sentido del teorema siguiente:

Teorema 1.24 (Principio de induccion para clases bien ordenadas) Si(A,≤) es una clase bien ordenada y B ⊂ A cumple

x ∈ A(A<x ⊂ B → x ∈ B),

entonces B = A.

Demostracion: Si B 6= A, entonces A \ B 6= ∅, luego por la buena orde-nacion esta clase tiene un mınimo elemento x. Eso quiere decir que si a < xentonces a /∈ A \ B, luego a ∈ B. Equivalentemente, A<

x ⊂ B, y por hipotesis,esto implica x ∈ B, con lo que tenemos una contradiccion, pues hemos tomadox ∈ A \B.

En la practica esto significa que si queremos probar que todo elemento deuna clase bien ordenada (A,≤) cumple una determinada propiedad normal φ(x),podemos fijar un x ∈ A arbitrario y tomar como hipotesis de induccion que todoslos elementos a < x cumplen φ(a), y demostrar a partir de ahı φ(x). Si logramosesto, el teorema anterior aplicado a la clase B = a ∈ A | φ(a) implica queB = A, luego todo elemento de A cumple φ(x).

Veamos ahora una propiedad elemental que, no obstante, resulta de granutilidad:

Teorema 1.25 Si F : (A,≤) −→ (A,≤) es una aplicacion estrictamente cre-ciente en una clase bien ordenada, entonces

a ∈ A a ≤ F (a).

Demostracion: Supongamos que existe un a ∈ A tal que F (a) < a. En-tonces la clase B = a ∈ A | F (a) < a no es vacıa, luego tiene un mınimoelemento m. En particular F (m) < m y, como F es estrictamente creciente,F (F (m)) < F (m), pero entonces a = F (m) cumple a ∈ B y a < m, en contra-diccion con que m era el mınimo de B.

De aquı extraemos dos consecuencias de interes:

Teorema 1.26 Una clase bien ordenada no puede ser semejante a una de sussecciones iniciales estrictas.

Page 37: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.6. Leyes de composicion interna 27

Demostracion: Sea (A,≤) una clase bien ordenada, y supongamos queexiste x ∈ A tal que existe una semejanza9 F : (A,≤) −→ (A<

x ,≤). En parti-cular F : (A,≤) −→ (A,≤) es estrictamente creciente, pero F (x) ∈ A<

x , luegoF (x) < x, en contradiccion con el teorema anterior.

Teorema 1.27 Si dos clases bien ordenadas son semejantes, entonces existeuna unica semejanza entre ellas.

Demostracion: Supongamos que F,G : (A,≤1) −→ (B,≤2) son dos se-mejanzas entre las mismas clases bien ordenadas. Entonces la composicionF G−1 : (A,≤1) −→ (A,≤1) es tambien una semejanza, luego por 1.25 tene-mos que

a ∈ A a ≤1 G−1(F (a)), y aplicando G resulta

a ∈ A G(a) ≤1 F (a).Pero las hipotesis son las mismas para F y G, luego igualmente podemos probarla desigualdad opuesta, y concluimos que

a ∈ A F (a) = G(a), luego F = G.

No vamos a probar aquı mas resultados sobre clases bien ordenadas porqueen el capıtulo siguiente estaremos en condiciones de razonar mas comodamentesobre ellas.

1.6 Leyes de composicion interna

Para terminar con la presentacion de los conceptos conjuntistas basicos nosocupamos ahora de las operaciones definidas sobre una clase.

Definicion 1.28 Una ley de composicion interna u operacion en una clase Aes una aplicacion ∗ : A×A −→ A. En este contexto, si a, b ∈ A, escribiremos

a ∗ b ≡ ∗(a, b).

Ası pues, una operacion en A es una funcion que a cada par de elementos ay b de A (en un cierto orden) les asigna un nuevo elemento a ∗ b ∈ A.

Diremos que una operacion en una clase A

a) es asociativa si∧

abc ∈ A (a ∗ b) ∗ c = a ∗ (b ∗ c)

b) es conmutativa si∧

ab ∈ A a ∗ b = b ∗ a

c) tiene por elemento neutro a e ∈ A si∧

a ∈ A a ∗ e = e ∗ a = a

Observemos que una operacion en una clase A puede tener a lo sumo unelemento neutro, pues si tuviera dos, digamos e y e′, serıa e = e ∗ e′ = e′.

Si una operacion ∗ en una clase A tiene elemento neutro e, se dice que unelemento b ∈ A es el inverso de un elemento a ∈ A si a ∗ b = b ∗ a = e. Sila operacion es asociativa y a tiene inverso, este es unico, pues si tuviera dos,digamos b y b′, entonces b = b ∗ e = b ∗ (a ∗ b′) = (b ∗ a) ∗ b′ = e ∗ b′ = b′.

9Tecnicamente junto a A<x no deberıamos escribir ≤, sino la restriccion de ≤ a A<

x , perono pasa nada por relajar la notacion en estos contextos.

Page 38: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

28 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Anillos y cuerpos Para presentar los conceptos siguientes nos restringimospor comodidad a operaciones sobre conjuntos, pues es el unico contexto en elque los vamos a encontrar:

Un anillo es una terna10 (A,+, ·), donde + y · son operaciones en A (a lasque llamaremos suma y producto, respectivamente, de modo que se cumplen laspropiedades siguientes:

a) La suma es asociativa y conmutativa, tiene un elemento neutro, necesa-riamente unico, que representaremos por 0, y cada a ∈ A tiene un inverso,necesariamente unico, que representaremos por −a.

b) El producto es asociativo y satisface la propiedad distributiva respecto dela suma, es decir,

abc ∈ A a(b + c) = ab+ ac y∧

abc ∈ A (b + c)a = ba+ ca.

Nota En la practica escribiremos A en lugar de (A,+, ·), de modo que cuandodigamos que “A es un anillo” querremos decir que estamos considerando unconjunto A con dos operaciones prefijadas + y · con las cuales (A,+, ·) es unanillo.

Tambien es costumbre (tal y como hemos hecho ya al enunciar la propiedaddistributiva) escribir ab ≡ a · b cuando ello no induce a confusion, ası comoabreviar a+ (−b) ≡ a− b.

Por ultimo la propiedad asociativa de la suma y el producto hace que no seanecesario agrupar sumandos o factores con parentesis, de modo que podemosescribir a+ b+ c = (a+ b) + c = a+ (b + c).

Si el producto de un anillo tiene elemento neutro se dice que el anillo esunitario, y dicho neutro se representa por 1.

Si el producto es conmutativo se dice que el anillo es conmutativo.

Si un elemento a de un anillo tiene inverso para el producto se dice que esinversible, y su inverso se representa por a−1.

El producto de dos elementos inversibles es inversible, pues es facil ver que(ab)−1 = b−1a−1. Ademas, el inverso de un elemento inversible es inversible,pues trivialmente (a−1)−1 = a. Puesto que 1 ·1 = 1, tenemos que 1 es inversibley 1−1 = 1.

Observemos que estos hechos se demuestran igualmente para la suma, dondela existencia de inverso esta garantizada. Concretamente:

−(a+ b) = −a− b, −(−a) = a, −0 = 0.

Los inversos (si existen) permiten despejar en ecuaciones, es decir:

a+ b = c→ a = c− b, ab = c→ a = cb−1.

10En general, podemos definir una terna de conjuntos como (a, b, c) ≡ ((a, b), c), e igualmenteuna cuadrupla es (a, b, c, d) ≡ (((a, b), c), d), etc.

Page 39: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.6. Leyes de composicion interna 29

En todo anillo A se cumple que∧

a ∈ A a · 0 = 0 · a = 0. En efecto:

a · 0 = a · (0 + 0) = a · 0 + a · 0,

y sumando −(a · 0) a ambos miembros concluimos que a · 0 = 0. Igualmentesucede si multiplicamos el 0 por la izquierda.

Esto tiene varias consecuencias. Por ejemplo, podemos suprimir los parentesisen expresiones de la forma

−(ab) = (−a)b = a(−b).

En efecto: ab + (−a)b = (a − a)b = 0b = 0, luego (−a)b = −(ab), y la otraigualdad se prueba analogamente.

En un anillo unitario se cumple que (−1)a = a(−1) = −a, pues

a+ (−1)a = 1a+ (−1)a = (1 − 1)a = 0 · a = 0.

En particular (−1)(−1) = −(−1) = 1. Ası pues, tanto 1 como −1 soninversibles y cada uno es su propio inverso.

Salvo en el caso trivial en que 1 = 0, en un anillo unitario el 0 no puedetener inverso para el producto, pues, para todo a ∈ A, se cumple 0 · a = 0 6= 1.

Un dominio ıntegro es un anillo conmutativo y unitario A en el que 1 6= 0 yademas

ab ∈ A(ab = 0 → a = 0 ∨ b = 0)

Esto implica en particular que los elementos no nulos son simplificables, esdecir, que

abc ∈ A(a 6= 0 ∧ ab = ac→ b = c).

En efecto: si ab = ac, entonces a(b − c) = 0 y, como a 6= 0, tiene que serb − c = 0, luego b = c. (Y lo mismo vale si a multiplica por la derecha.)

Observemos que esta propiedad es trivialmente cierta para la suma en cual-quier anillo:

abc ∈ A(a+ b = a+ c→ b = c).

Para probarlo basta sumar −a a ambos miembros.

Un cuerpo es un anillo conmutativo y unitario en el que 1 6= 0 y todo elementodistinto de 0 tiene inverso para el producto.

Un cuerpo es siempre un dominio ıntegro, pues si ab = 0 y a 6= 0, entoncesa−1ab = a−10 = 0, luego b = 1b = 0.

Si (A,+, ·) es un cuerpo y a, b ∈ A, con b 6= 0, es frecuente representar

a

b= ab−1 = b−1a.

Page 40: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

30 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Se dice entonces que la expresion a/b es una fraccion de numerador a y deno-minador b. Es inmediato entonces que

a

b=c

d↔ ad = bc.

Ademas, si c 6= 0, se cumple que

a

b=ac

bc, c · a

b=ca

b, −a

b=

−ab

=a

−b ,

y tambien se comprueba sin dificultad (suponiendo siempre que los denomina-dores son no nulos) que

a

b+c

d=ad+ bc

bd,

a

b· cd

=ac

bd,

a/b

c/d=ad

bc.

Anillos ordenados Un anillo ordenado es una cuadrupla (A,+, ·,≤) donde(A,+, ·) es un anillo conmutativo y (A,≤) es un conjunto totalmente ordenado,de modo que se cumplan ademas las dos siguientes propiedades de compatibili-dad:

a)∧

abc ∈ A (a ≤ b→ a+ c ≤ b+ c)

b)∧

ab ∈ A (a ≥ 0 ∧ b ≥ 0 → ab ≥ 0)

Diremos que un elemento a de un anillo ordenado es

a) positivo si a ≥ 0,

b) estrictamente positivo si a > 0,

c) negativo si a ≤ 0,

d) estrictamente negativo si a < 0.

Representaremos por

A+ ≡ a ∈ A | a > 0, A− ≡ a ∈ A | a < 0,

los conjuntos de elementos estrictamente positivos y estrictamente negativos,respectivamente, de un anillo ordenado A. De este modo, A se descompone enunion disjunta A = A− ∪ 0 ∪A+.

La primera propiedad de compatibilidad nos permite despejar sumas:

a+ b ≤ c→ a ≤ c− b.

En particular, 0 ≤ a ↔ −a ≤ 0, de modo que el inverso de un elemento(estrictamente) positivo es (estrictamente) negativo, y viceversa.

La segunda propiedad de compatibilidad implica que la multiplicacion porelementos positivos conserva las desigualdades:

abc ∈ A(a ≤ b ∧ c ≥ 0 → ac ≤ bc).

Page 41: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.6. Leyes de composicion interna 31

En efecto, como b− a ≥ 0, resulta que (b− a)c = bc− ac ≥ 0, luego ac ≤ bc.

En cambio, la multiplicacion por elementos negativos invierte las desigual-dades:

abc ∈ A(a ≤ b ∧ c ≤ 0 → ac ≥ bc).

En efecto, como −c ≥ 0, tenemos que −ac ≤ −bc, de donde, despejando dosveces, bc ≤ ac.

De estas dos propiedades se sigue en particular que el producto de dos ele-mentos positivos o dos elementos negativos es positivo, mientras que el productode un positivo por un negativo es negativo. En particular, todo cuadrado (todoproducto de un elemento por sı mismo) es positivo.

En particular, en un anillo unitario ordenado en el que 1 6= 0 se cumple que−1 < 0 < 1. En efecto, basta tener en cuenta que 1 = 1 · 1 > 0.

Ademas, la igualdad a · a−1 = 1 > 0 implica que el inverso de un elementopositivo (resp. negativo) es positivo (resp. negativo).

En todo anillo ordenado A podemos definir la funcion valor absoluto

| | : A −→ A+ ∪ 0

dada por

|a| =

a si a ≥ 0,

−a si a ≤ 0.

Se cumplen las propiedades siguientes:

a) |a| = 0 ↔ a = 0,

b) |a+ b| ≤ |a| + |b|,

c) |ab| = |a||b|,

d) | − a| = |a|,

e) ||a| − |b|| ≤ |a− b|.

En efecto, la propiedad a) es evidente, para probar b) conviene observar que

|a| ≤ b↔ −b ≤ a ≤ b.

Las dos implicaciones se prueban trivialmente distinguiendo dos casos, segun sia es positivo o negativo. En particular, como |a| ≤ |a| y |b| ≤ |b|, tenemos que

−|a| ≤ a ≤ |a|, −|b| ≤ b ≤ |b|,

de donde, aplicando varias veces las propiedades de compatibilidad,

−|a| − |b| ≤ a+ b ≤ |a| + |b|,

Page 42: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

32 Capıtulo 1. El lenguaje de la teorıa de conjuntos

lo que a su vez implica que |a+b| ≤ |a|+ |b|. Las propiedades c) y d) se obtienenfacilmente distinguiendo casos. Para probar e) observamos que

|a| = |a− b+ b| ≤ |a− b| + |b| ⇒ |a| − |b| ≤ |a− b|.

Invirtiendo los papeles probamos que |b| − |a| ≤ |b− a| = | − (a− b)| = |a− b|,luego

−|a− b| ≤ |a| − |b| ≤ |a− b|,y hemos visto que esto equivale a ||a| − |b|| ≤ |a− b|.

Cuerpos de cocientes Como muestra de que NBG∗ es suficiente para forma-lizar los razonamientos conjuntistas elementales vamos a demostrar un resultadoalgebraico, segun el cual todo dominio ıntegro puede extenderse hasta un cuerpo.

En todo este apartado (D,+, ·) sera un dominio ıntegro prefijado. DefinimosD∗ = D \ 0 y consideramos en D ×D∗ la relacion de equivalencia dada por

(a, b) ∼ (c, d) ↔ ad = bc.

Es facil ver que ciertamente es una relacion de equivalencia. Por ejemplo,para probar la transitividad partimos de que (a, b) ∼ (c, d) ∼ (e, f), lo quesignifica que ad = bc y cf = de, de donde adcf = bcde y, como los elementosno nulos son simplificables, si c 6= 0 podemos concluir af = be, mientras que sic = 0 tenemos que ad = 0 = de, luego a = e = 0, luego af = be igualmente.

Representamos por KD = (D×D∗)/ ∼ el conjunto cociente. Para cada par(a, b) ∈ D×D∗, representaremos por a/b su clase de equivalencia. Claramente,el teorema 1.23 a) se traduce en este caso en la equivalencia

a

b=c

d↔ ad = bc.

Definimos en KD las operaciones + y · dadas por

a

b+c

d=ad+ bc

bd,

a

b· cd

=ac

bd.

Observemos que, desde un punto de vista conjuntista,

+ ≡ ((x, y), z) ∈ (KD ×KD) ×KD |∨

abcd ∈ D(x = a/b ∧ y = c/d

∧ z = (ad+ bc)/bd).La definicion es correcta, en el sentido de que determina un conjunto +, perono podemos asegurar a priori que sea una funcion + : KD ×KD −→ KD.

En primer lugar, el hecho de que todo par (x, y) tenga al menos una imagenz se debe a que, por definicion de cociente, siempre podemos expresar x = a/b,y = c/d y, como bd 6= 0 (ya que D es un dominio ıntegro), podemos formar lafraccion z = (ad+ bc)/bd, con lo que ((x, y), z) ∈ +.

Page 43: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.6. Leyes de composicion interna 33

Por otra parte, debemos probar que la imagen z es unica. Para ello supone-mos que ((x, y), x), (x, y), z′) ∈ +, lo cual significa que podemos expresar

x =a

b=a′

b′, y =

c

d=c′

d′,

y que

z =ad+ bc

bd, z′ =

a′d′ + b′c′

b′d′,

y debemos demostrar que z = z′. Esto equivale a que

(ad+ bc)b′d′ = (a′d′ + b′c′)bd,

o tambien a que (ab′)(dd′) + (cd′)(bb′) = (a′b)(dd′) + (c′d)(bb′), y esto se sigueinmediatamente de las igualdades de las expresiones para x e y.

El hecho que acabamos de comprobar suele enunciarse diciendo que la sumaesta bien definida. En general, cuando definimos una aplicacion f y uno o variosde sus argumentos son clases de equivalencia de uno o varios conjuntos cociente yen la definicion de f usamos un elemento concreto de cada clase de equivalencia,decimos que f esta bien definida cuando comprobamos que la imagen de unosargumentos dados no depende del representante concreto elegido en cada clasede equivalencia.

Por ejemplo, la forma habitual de tratar las situaciones como la que esta-mos considerando sin entrar en detalles conjuntistas que podrıamos calificar depedantes es decir, en el caso del producto, “vamos a comprobar que el productoesta bien definido”, lo cual supone comprobar que

sia

b=a′

b′y

c

d=d′

d′, entonces

ac

bd=a′c′

b′d′,

es decir, que el producto definido con unos representantes de las fracciones esel mismo que el definido con otros. (Aparte de esto, hay que observar que elproducto es realmente una fraccion porque bd 6= 0.)

Omitimos la comprobacion, que es mas sencilla que la de la suma, ası comola comprobacion rutinaria de que la suma y el producto de fracciones cum-plen todas las propiedades requeridas por la definicion de anillo. Indiquemosunicamente que el neutro para la suma es la fraccion 0 = 0/1 y que el opuestode una fraccion es −(a/b) = (−a)/b.

En cuanto al producto, es inmediato comprobar que tiene por neutro a lafraccion 1 = 1/1 y que todo elemento no nulo tiene inverso, pues si a/b 6= 0/1,entonces a 6= 0, luego podemos considerar la fraccion b/a, que claramente es lainversa de a/b, es decir:

(a

b

)−1

=b

a.

Por lo tanto, KD es un cuerpo con las operaciones que hemos definido.Consideramos ahora la aplicacion iD : D −→ KD dada por iD(a) = a/1. Estrivial comprobar que es inyectiva, ası como que

iD(a+ b) = iD(a) + iD(b), iD(ab) = iD(a)iD(b).

Page 44: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

34 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Conviene introducir algunos conceptos para describir esta situacion:

Definicion 1.29 Una aplicacion f : A −→ B entre dos anillos es un homomor-fismo de anillos si cumple11

xy ∈ A f(x+ y) = f(x) + f(y),∧

xy ∈ A f(xy) = f(x)f(y).

Si ademas es inyectiva, suprayectiva o biyectiva se dice que es un monomor-fismo, epimorfismo o isomorfismo de anillos, respectivamente. Dos anillos sonisomorfos si existe un isomorfismo de anillos entre ellos.

Si dos anillos A y B cumplen que A ⊂ B y las operaciones de A son lasrestricciones de las de B (es decir, que x+ y y xy significa lo mismo en A y enB) entonces se dice que A es un subanillo de B.

En estos terminos, lo que hemos probado es que iD : D −→ K es un mono-morfismo de dominios ıntegros.

En general, si f : A −→ B es un homomorfismo de anillos, entonces f [A] esun subanillo de B con la suma y el producto de B, pues dos elementos de f [A]son de la forma f(x) y f(y), para ciertos x, y ∈ A, luego su suma y su productoson f(x) + f(y) = f(x + y) ∈ f [A], f(x)f(y) = f(xy) ∈ f [A], luego al sumary multiplicar con las operaciones de B no nos salimos de f [A], y tenemos, porconsiguiente, dos leyes de composicion interna en i[A], que obviamente cumplentodas las propiedades requeridas para formar un anillo.

Si ademas f es un monomorfismo, entonces f : A −→ f [A] es por definicionun isomorfismo de anillos, por lo que podemos decir que A es isomorfo a unsubanillo de B.

Por ultimo, si dos anillos son isomorfos, esto significa que tienen las mismaspropiedades que dependan unicamente de la suma y del producto.

En nuestro contexto, si llamamos D = iD[D] ⊂ KD, resulta que D, conlas operaciones de KD es un anillo y iD : D −→ D es un isomorfismo deanillos, pero D cumple ademas que esta contenido en un cuerpo. En definitiva,hemos probado que todo dominio ıntegro puede reemplazarse por otro isomorfocontenido en un cuerpo. El cuerpo KD que hemos construido se llama cuerpode cocientes o cuerpo de fracciones de D.

Mas aun, si D es un anillo ordenado, podemos transportar la relacion deorden a KD definiendo

x ≤ y ≡∨

abcd ∈ D(c > 0 ∧ d > 0 ∧ x =a

b∧ y =

c

d∧ ad ≤ bc).

En primer lugar observamos que, puesto que

a

b=

−a−b ,

11Estas propiedades implican que f(0) = 0, pues f(0) = f(0 + 0) = f(0) + f(0), luegof(0) = 0, y si f es un monomorfismo y A y B son dominios ıntegros entonces f(1) = 1, puesigualmente f(1) = f(1)f(1), luego f(1)(1 − f(1)) = 0 y f(1) 6= f(0) = 0, luego f(1) = 1.

Page 45: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.6. Leyes de composicion interna 35

toda fraccion admite un representante con denominador positivo. Y si tomamosdos fracciones a/b y c/d con denominador positivo, entonces

a

b≤ c

d↔ ad ≤ bc.

Una implicacion se cumple por la definicion que hemos dado de ≤, perola otra no es inmediata, pues, en principio, que se cumpla la parte izquierdasignifica que

a

b=a′

b′,

c

d=c′

d′,

con b′, d′ > 0 y a′d′ ≤ b′c′. Vamos a probar que esto implica ad ≤ bc. Enprincipio tenemos que ab′ = ba′ y cd′ = dc′. Notemos tambien que c es positivosi y solo si lo es cd′, si y solo si lo es c′d si y solo si lo es c′. Hay que distinguir doscasos, segun si c y c′ son ambos positivos o son ambos negativos. Trataremos elcaso en que ambos son negativos y dejamos el otro a cargo del lector:

a′d′ ≤ b′c′ ⇒ a′bd′c ≥ b′c′bc⇒ b′c′ad ≥ b′c′bc⇒ b′d′(ad− bc) ≥ 0

⇒ ad− bc ≤ 0 ⇒ ad ≤ bc.

Observemos que, dadas tres fracciones cualesquiera se pueden expresar en laforma

a

d,

b

d,

c

d

con d > 0. En efecto, si en principio las fracciones son a/b, a′/b′, a′′/b′′, dondepodemos suponer que los denominadores son positivos, y entonces

a

b=ab′b′′

bb′b′′,

a′

b′=ba′b′′

bb′b′′,

a′′

b′′=bb′a′′

bb′b′′,

con denominador positivo.

Para fracciones con denominador comun positivo la relacion que hemos de-finido se reduce a

a

d≤ c

d↔ a ≤ c.

Teniendo esto en cuenta es inmediato comprobar que la relacion ≤ es unarelacion de orden en KD y que es compatible con la estructura de anillo, esdecir, que convierte a KD es un cuerpo ordenado.

Definicion 1.30 Un homomorfismo (resp. monomorfismo, epimorfismo, iso-morfismo) de anillos ordenados es un homomorfismo (resp. monomorfismo, epi-morfismo, isomorfismo) de anillos f : A −→ B que ademas cumpla la relacion

xy ∈ A(x ≤ y → f(x) ≤ f(y)).

Equivalentemente, un isomorfismo de anillos ordenados es un isomorfismode anillos que ademas es una semejanza, lo cual hace que ambos anillos seanindistinguibles respecto de todas las propiedades definibles en terminos de lasuma, el producto o la relacion de orden.

Page 46: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

36 Capıtulo 1. El lenguaje de la teorıa de conjuntos

En nuestro contexto, es claro que iD : D −→ KD es un monomorfismo deanillos ordenados, es decir, que

ab ∈ D (a ≤ b↔ iD(a) ≤ iD(b)).

Por lo tanto iD : D −→ D es una semejanza cuando consideramos en D el ordende KD. Ası pues, sustituyendo D por una “copia” isomorfa, tenemos que tododominio ıntegro ordenado puede extenderse a un cuerpo ordenado.

Terminamos este apartado insistiendo en que lo importante en nuestro con-texto de los argumentos que acabamos de dar es que todos ellos son demostrablesa partir de los axiomas de NBG∗. Observemos que los resultados que hemosvisto sobre formacion de conjuntos nos garantizan que todos los objetos quehemos construido son conjuntos. Por ejemplo, si D es un conjunto, D∗ lo espor ser un subconjunto de D, y D ×D∗ lo es porque el producto cartesiano deconjuntos es un conjunto, y KD lo es porque todo cociente de un conjunto esun conjunto, y las operaciones en KD son conjuntos porque son funciones cuyodominio es un conjunto, etc.

En general, todas las construcciones que realizan los matematicos para cons-truir unos conjuntos a partir de otros pueden ser justificadas en NBG. Para lasmas elementales (como la que acabamos de ver) basta con NBG∗, aunque otraspueden requerir AP o incluso los axiomas de infinitud y eleccion que todavıa nohemos presentado.

Ideales y anillos cociente Presentamos algunos elementos mas de la teorıade anillos que nos seran utiles mas adelante:

Definicion 1.31 Sea A un anillo conmutativo y unitario. Un ideal de A es unconjunto I ⊂ A tal que:

a) 0 ∈ I,

b)∧

xy ∈ I x+ y ∈ I,

c)∧

a ∈ A∧

b ∈ I ab ∈ I.

Por ejemplo, si x ∈ A el conjunto (x) = ax | a ∈ A de los multiplosde x es claramente un ideal12 de A. Los ideales de esta forma se llaman idealesprincipales de A.

Tambien es claro que 0 y A son ideales de A. El ideal 0 se llama idealtrivial. Un ideal I es propio si I 6= A e I 6= 0.

Observemos que un ideal I cumple I = A si y solo si contiene un elementoinversible, pues si es propio contiene a 1 y, si contiene a un elemento inversible

12De hecho, historicamente el concepto de ideal surgio como una abstraccion de los conjuntosde multiplos, de modo que I puede verse como el conjunto de los multiplos de un “elementoideal” de A, que sera un elemento real de A si I es de la forma I = (x).

Page 47: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

1.6. Leyes de composicion interna 37

x, entonces contiene a 1 = x−1x por c) y, dado a ∈ A, tenemos que a = a · 1 ∈ Ide nuevo por c).

Esto implica que un anillo conmutativo y unitario A es un cuerpo si y solosi no tiene ideales propios. En efecto, si A es un cuerpo, todo ideal no trivialcontiene un elemento inversible, luego es impropio. Recıprocamente, si A noes un cuerpo, tiene un elemento no nulo no inversible x, y entonces (x) es unideal propio (porque si fuera (x) = A tendrıamos que 1 ∈ (x), y entonces x serıainversible).

Si I es un ideal en un anillo A, definimos la relacion de congruencia modulo Icomo la relacion en A dada por

x ≡ y (mod I) ↔ x− y ∈ I.

Se trata de una relacion de equivalencia: es reflexiva por la propiedad a), essimetrica por c) (pues y − x = (−1)(x− y)) y es transitiva por b).

Representaremos por A/I el conjunto cociente de A respecto de la congruen-cia modulo I. El resultado fundamental es el siguiente:

Teorema 1.32 Si A es un anillo conmutativo y unitario e I es un ideal de A,entonces A/I se convierte en un anillo conmutativo y unitario con las operacio-nes dadas por [a] + [b] = [a+ b] y [a][b] = [ab].

Demostracion: Lo unico que no es inmediato es que las operaciones estanbien definidas, es decir, que si [a] = [a′] y [b] = [b′] entonces [a+ b] = [a′ + b′] y[ab] = [a′b′]. Ahora bien, tenemos que

a− a′ = u ∈ I, b− b′ = v ∈ I,

luego a+ b− (a′ + b′) = u+ v ∈ I y

ab− a′b′ = ab− ab′ + ab′ − a′b′ = a(b− b′) + (a− a′)b′ = av + ub′ ∈ I.

A partir de aquı, cada propiedad de la suma y el producto de A implica trivial-mente la propiedad correspondiente en A/I.

En vista del teorema anterior, A/I se conoce como el anillo cociente de Adeterminado por I.

Definicion 1.33 Un ideal M de un anillo A es maximal si M A y no existeningun ideal M I A. Un ideal P de A es primo si P 6= A y

xy ∈ A (xy ∈ P → x ∈ P ∨ y ∈ P ).

Estos conceptos son muy importantes en el estudio de la aritmetica de unanillo, pero aquı solo necesitaremos el resultado siguiente:

Teorema 1.34 Si A es un anillo conmutativo y unitario, entonces un ideal Ide A es maximal si y solo si A/I es un cuerpo. A su vez, I es primo si y solosi A/I es un dominio ıntegro.

Page 48: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

38 Capıtulo 1. El lenguaje de la teorıa de conjuntos

Demostracion: Si I es maximal, observamos en primer lugar que 1 /∈ I,luego [1] 6= [0], que es uno de los requisitos que debe cumplir A/I para sercuerpo. Tomemos [x] ∈ A/I tal que [x] 6= 0, lo cual equivale a que x /∈ I. Esfacil ver que

J = u+ ax | u ∈ I ∧ a ∈ Aes un ideal de A que contiene a I y a x, luego I J ⊂ A. Por la maximalidadde I tiene que ser J = A, luego 1 ∈ J , luego 1 = u + ax, para cierto u ∈ I ycierto a ∈ A, luego 1 = [1] = [a][x], luego [x] tiene inverso y por lo tanto A/I esun cuerpo.

Si A/I es un cuerpo entonces [1] 6= [0], luego 1 /∈ I, luego I 6= A. Si un idealcumple I J ⊂ A, tomemos x ∈ J \ I, entonces [x] 6= 0, luego existe un a ∈ Atal que [a][x] = [1], luego 1 = ax + u, para cierto u ∈ I, luego 1 ∈ J , luegoJ = A. Esto prueba que I es maximal.

Si I es primo, como el en caso anterior vemos que [1] 6= [0], lo cual es parte dela definicion de dominio ıntegro. Sean x, y ∈ A tales que [x][y] = [0]. Entoncesxy ∈ I, luego x ∈ I o bien y ∈ I, luego [x] = 0 o [y] = 0. Esto prueba que A/Ies un dominio ıntegro.

Recıprocamente, si A/I es un dominio ıntegro entonces, como antes, I 6= A,y si xy ∈ I, entonces [x][y] = 0, luego [x] = 0 o bien [y] = 0, luego x ∈ I o bieny ∈ I. Esto prueba que I es primo.

En particular, como todo cuerpo es un dominio ıntegro, concluimos que todoideal maximal es primo.

Page 49: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo II

Ordinales

En el capıtulo precedente hemos presentado el vocabulario basico de la teorıade conjuntos, pero sin presentar realmente ningun conjunto “interesante” al queaplicar dicho vocabulario. El lector puede pensar provisionalmente a modo demotivacion que el proposito de este capıtulo es construir los numeros naturales,pero lo cierto es que el proceso de construccion que vamos a presentar nosproporcionara un concepto mucho mas potente, el de numero ordinal, de modoque los numeros naturales resultaran ser los ordinales finitos. Los ordinalesrepresentan el mismo papel respecto a conjuntos arbitrarios que los numerosnaturales representan respecto de los conjuntos finitos y, bajo el axioma deregularidad, que presentaremos mas adelante, se convierten en el “esqueleto” oel “armazon” de la clase universal V .

2.1 La construccion de los ordinales

Nos marcamos, pues, como objetivo provisional construir los numeros na-turales en el seno de NBG∗. Tienen que ser ciertos conjuntos, de modo queel problema es realmente definir una sucesion de conjuntos a los que podamosllamar 0, 1, 2, 3, etc. Hay una eleccion muy natural: como 0 podemos tomarun (el) conjunto con cero elementos, de modo que 0 ≡ ∅, como 1 podemostomar un conjunto con un elemento, y la eleccion mas simple es 1 ≡ 0, como2 podemos tomar un conjunto con dos elementos, y la eleccion mas simple es2 = 0, 1, y ası:

0 = ∅, 6 = 0, 1, 2, 3, 4, 5,1 = 0, 7 = 0, 1, 2, 3, 4, 5, 6,2 = 0, 1, 8 = 0, 1, 2, 3, 4, 5, 6, 7,3 = 0, 1, 2, 9 = 0, 1, 2, 3, 4, 5, 6, 7, 8,4 = 0, 1, 2, 3, · · ·

El primer paso para formalizar esta idea es el siguiente:

39

Page 50: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

40 Capıtulo 2. Ordinales

Definicion 2.1 Llamaremos 0 ≡ ∅ y, para toda clase x, definimos

x′ ≡ x ∪ x.

Definimos 1 ≡ 0′ = 0, 2 ≡ 1′ = 0, 1, 3 ≡ 2′ = 0, 1, 2, etc.

El etcetera final significa que, prosiguiendo del mismo modo, podemos definirel 4 y el 5 y el 10 472, pero por mucho que prolonguemos las definiciones denumeros naturales particulares, eso no nos va a proporcionar una definicion de“numero natural”, es decir, una propiedad definida exclusivamente a partir de∈ y los signos logicos (o de propiedades definidas previamente a partir de estossignos basicos) que nos permita definir por comprension la clase de los numerosnaturales. Para ello “etc.” resulta inadmisible porque no esta definido a partirde ∈ y de los signos logicos.

Presentamos a continuacion una lista de propiedades comunes a todos losnumeros naturales que sabemos definir individualmente:

Una clase Y es transitiva si cumple

Y transitiva ≡∧

x ∈ Y x ⊂ Y

o, equivalentemente (y de aquı el nombre)∧

uv(u ∈ v ∧ v ∈ Y → u ∈ Y ).

Una clase Y es ∈-conexa si cumple

∈ -conexa Y ≡∧

uv ∈ Y (u ∈ v ∨ v ∈ u ∨ u = v).

Una clase Y esta bien fundada si cumple

Y bien fundada ≡∧

X(X ⊂ Y ∧ X 6= ∅→∨

u ∈ X u ∩X = ∅).

Un conjunto u que cumpla u ∈ X ∧ u ∩ X = ∅ se llama un ∈-minimal de X ,de modo que la buena fundacion afirma que toda subclase no vacıa de Y tieneal menos un ∈-minimal. Observemos que u es un ∈-minimal de X si u ∈ X yningun v ∈ u cumple v ∈ X .

Ciertamente, los numeros naturales que queremos definir cumplen estas pro-piedades. Son transitivos, pues, si, por ejemplo, 4 ∈ 7, se cumple tambien que4 = 0, 1, 2, 3 ⊂ 0, 1, 2, 3, 4, 5, 6 = 7, y esto no se cumple casualmente en esteejemplo, sino que vale en todos los casos.1

En cuanto a la conexion, si por ejemplo tomamos 3, 7 ∈ 9, ciertamente secumple que 3 ∈ 7 y, en general, si tomamos dos elementos distintos de un numeronatural, el menor pertenecera al mayor. Por lo tanto, los numeros naturales son∈-conexos.

1No vamos a demostrar que todo numero natural es transitivo, en parte porque para ellonecesitarıamos una definicion de numero natural que no tenemos, y en parte porque usaremosla transitividad como parte de la definicion de numero natural. Lo mismo vale para las otrasdos propiedades que estamos considerando.

Page 51: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.1. La construccion de los ordinales 41

Tambien estan bien fundados, pues si tomamos un numero natural, porejemplo 8 y un subconjunto no vacıo, por ejemplo X = 3, 5, 6, se cumple queX tiene un ∈-minimal, concretamente u = 3, pues ciertamente 3 ∈ X , peroningun v ∈ 3 cumple v ∈ X . De hecho, vemos que cada subconjunto no vacıode un numero natural tiene un unico ∈-minimal, a saber, el mınimo numeronatural que contiene.

El lector debe entender que la cuestion aquı no es demostrar si realmente,lo que hemos constatado con ejemplos particulares vale para todos los numerosnaturales, sino mas bien si podemos definir un numero natural como un conjuntotransitivo, ∈-conexo y bien fundado, o si, por el contrario, existen conjuntos conestas tres propiedades que no tienen nada que ver con los conjuntos 0, 1, 2, . . . ,de modo que necesitamos introducir mas propiedades para quedarnos unica-mente con los numeros naturales. Como respuesta provisional damos una nuevadefinicion:

Definicion 2.2 Una clase Y es un ordinal si es transitiva, ∈-conexa y bienfundada. Llamaremos Ω a la clase de todos los (conjuntos) ordinales.

Observemos que la propiedad “Y es un conjunto y es un ordinal” es normal.El unico punto problematico es la definicion de clase bien fundada, que incluyeuna cuantificacion sobre toda subclase de Y , pero si Y es un conjunto, es lomismo decir “para toda clase X , si X ⊂ Y · · · ” que decir “para todo conjuntoX , si X ⊂ Y · · · ”, porque toda subclase de un conjunto es un conjunto. Porconsiguiente

Ω ≡ α | ctoα ∧ ordinalα

es una aplicacion valida del axioma de comprension.

Ası pues, en estos terminos la pregunta que nos hacıamos es si existen ordi-nales que no sean (o no deban ser considerados como) numeros naturales. Encualquier caso, lo cierto es que los numeros naturales que pretendemos definirson ordinales, luego al estudiar los ordinales estamos estudiando en particu-lar los numeros naturales, con la diferencia de que los ordinales los tenemoscorrectamente definidos mediante una propiedad del lenguaje de la teorıa deconjuntos.

Empezamos observando que, trivialmente, toda subclase de una clase ∈-conexa o bien fundada es tambien ∈-conexa o bien fundada, pero no podemosdecir lo mismo de las clases transitivas (pensemos, por ejemplo, en 3, 5 ⊂ 7).Veamos ahora un resultado tecnico sencillo sobre clases bien fundadas:

Teorema 2.3 Si x es una clase bien fundada entonces2 x /∈ x.

2Quiza el lector se pregunte si es posible que una clase (necesariamente un conjunto) cumplax ∈ x. Nos falta presentar tres axiomas de NBG, uno de los cuales, el axioma de regularidad,afirma precisamente que toda clase esta bien fundada, luego, bajo dicho axioma, no puededarse el caso. No obstante, en su momento discutiremos debidamente la situacion.

Page 52: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

42 Capıtulo 2. Ordinales

Demostracion: Si x ∈ x entonces x es un conjunto y x ⊂ x ∧ x 6= ∅.Sea u un elemento ∈-minimal de x. Necesariamente, u = x, pero x ∈ x∩x,contradiccion.

Con esto podemos probar:

Teorema 2.4 0 ∈ Ω ∧∧

x ∈ Ω x′ ∈ Ω.

Demostracion: Notemos que 0 = ∅ cumple trivialmente las tres condi-ciones de la definicion de ordinal (es transitivo porque no existe ningun u ∈ ∅que pueda incumplir la definicion, es ∈-conexo porque no existen u, v ∈ ∅ quepuedan incumplir la definicion, y esta bien fundado porque no existe ningunu ⊂ ∅, u 6= ∅ que pueda incumplir la definicion).

Supongamos ahora que x es un ordinal. Si u ∈ x′ = x ∪ x, entoncesu ∈ x ∨ u = x, pero en ambos casos u ⊂ x, en el primero porque x es transitivo.Esto prueba que x′ es transitivo.

Si u, v ∈ x′, entonces u ∈ x ∨ u = x y v ∈ x ∨ v = x. Esto nos da cuatrocasos: u ∈ x ∧ v ∈ x o bien u ∈ x ∧ v = x, o bien u = x ∧ v ∈ x, o bienu = x = v. En el primero tenemos que u ∈ v ∨ v ∈ u ∨ u = v porque x es∈-conexo, y en los otros tres tenemos u ∈ v, v ∈ u, u = v respectivamente. Estoprueba que x′ es ∈-conexo.

Tomemos u ⊂ x′ ∧ u 6= ∅ y veamos que tiene ∈-minimal. Tratemos aparteel caso en que u = x. Entonces v = x es un ∈-minimal de u, pues x∩x = ∅.En efecto, si existiera w ∈ x ∩ x, serıa x = w ∈ x, en contradiccion con elteorema anterior.

Como u ⊂ x ∪ x, si no se da la igualdad u = x es porque u ∩ x 6= ∅,y tenemos ası un subconjunto no vacıo de x. Como x esta bien fundado existeun v ∈ u ∩ x que es ∈-minimal para esta interseccion. Vamos a ver que es∈-minimal de u.

En efecto, si w ∈ v ∩ u, entonces w ∈ x′, luego w ∈ x ∨ w = x. En el primercaso w ∈ u ∩ x y w ∈ v, lo que contradice que v sea ∈-minimal de u ∩ x. En elsegundo caso x = w ∈ v ∈ x, luego, por la transitividad de x, resulta que x ∈ x,en contradiccion con el teorema anterior.

En vista de este teorema resulta que 0 es un ordinal, luego 1 = 0′ es unordinal, luego 2 = 1′ es un ordinal y, en definitiva, todos los numeros naturalesson ordinales, pero no podemos demostrar tal cosa porque no tenemos unadefinicion de numero natural.

Observemos que los elementos de los numeros naturales (que pretendemosdefinir) son tambien numeros naturales. De momento podemos probar que estoes cierto para ordinales:

Teorema 2.5 Los elementos de los ordinales son ordinales.

Page 53: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.1. La construccion de los ordinales 43

Demostracion: Sea Y un ordinal y sea x ∈ Y . Por transitividad x ⊂ Y ypor consiguiente x es conexo y bien fundado. Falta probar que es transitivo, esdecir, que

uv(u ∈ v ∧ v ∈ x→ u ∈ x).Si u ∈ v ∧ v ∈ x, tenemos v ∈ x ∧ x ∈ Y , y como la clase Y es transitiva,

v ∈ Y , e igualmente u ∈ Y . Ası pues, u, v, x ⊂ Y . Como Y esta bien fundadase cumplira uno de los tres elementos del subconjunto tiene que ser ∈-minimal,es decir,

u ∩ u, v, x = ∅ ∨ v ∩ u, v, x = ∅ ∨ x ∩ u, v, x = ∅,

pero u ∈ v ∩ u, v, x y v ∈ x ∩ u, v, x, luego ha de ser u ∩ u, v, x = ∅.Como Y es conexa ha de ser u ∈ x ∨ x ∈ u ∨ u = x, pero si x ∈ u entoncesx ∈ u∩ u, v, x = ∅, y si x = u entonces v ∈ u∩ u, v, x = ∅. Ası pues, se hade cumplir u ∈ x, como querıamos.

En particular vemos que

αβ(α ∈ β ∧ β ∈ Ω → α ∈ Ω),

pero esto es tanto como decir que la clase Ω es transitiva.

Nuestra observacion siguiente es que, para los numeros naturales que pre-tendemos definir, la relacion de orden usual se corresponde con la inclusion, esdecir, es lo mismo 3 ≤ 7 que 3 ⊂ 7. Veamos ahora que la inclusion define unbuen orden en cualquier ordinal:

Teorema 2.6 Si Y es un ordinal, entonces la relacion de inclusion es un buenorden en Y .

Demostracion: Sea Y un ordinal, y consideramos la relacion en Y dadapor u ≤ v ↔ u ⊂ v. Sabemos que, en general, se trata de una relacion deorden parcial. Vamos a probar que toda subclase X ⊂ Y no vacıa tiene mınimoelemento. Mas concretamente, tomamos un ∈-minimal u ∈ X cualquiera yvamos a ver que es el mınimo de X (lo que, en particular, implica que cadasubclase no vacıa de un ordinal tiene un unico ∈-minimal).

Si tomamos cualquier otro v ∈ X , tenemos que u, v ∈ Y , luego por laconexion tiene que ser u ∈ v ∨ v ∈ u ∨ u = v, pero el caso v ∈ u contradicela minimalidad de u, luego nos queda u ∈ v ∨ u = v, y en ambos casos u ⊂ v(en el primero porque v es un ordinal, luego es transitivo). Ası pues u ≤ v paratodo v ∈ X . Esto es lo que significa que u sea el mınimo de X .

A continuacion notamos que la relacion de orden estricto en los numerosnaturales se corresponde con la pertenencia, es decir, que 3 < 7 es lo mismo que3 ∈ 7. El teorema siguiente demuestra este hecho para ordinales:

Teorema 2.7 Si X, Y son ordinales, entonces X ⊂ Y ↔ X ∈ Y ∨ X = Y .

Demostracion: Una implicacion es trivial, pues si X ∈ Y entonces X ⊂ Ypor transitividad. Supongamos ahora que X ⊂ Y pero X 6= Y y veamos queX ∈ Y .

Page 54: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

44 Capıtulo 2. Ordinales

Tenemos que Y \X 6= ∅, luego por la buena fundacion esta clase tiene un∈-minimal u ∈ Y \X . Basta probar que u = X .

Si z ∈ u, entonces z /∈ Y \ X (por la minimalidad de u) y z ∈ Y (portransitividad, pues z ∈ u ∈ Y ), luego z ∈ X . Por lo tanto u ⊂ X .

Si z ∈ X , entonces tenemos z, u ∈ Y , luego z ∈ u ∨ u ∈ z ∨ z = u. Si u ∈ z,entonces u ∈ z ∈ X , luego u ∈ X , contradiccion (pues u ∈ Y \ X). Si z = uentonces de nuevo u ∈ X , contradiccion. Por lo tanto z ∈ u, y ası X ⊂ u. Endefinitiva, tenemos la igualdad u = X .

Ahora necesitamos un sencillo resultado tecnico:

Teorema 2.8 La interseccion de dos ordinales es un ordinal.

Demostracion: Sean X , Y ordinales. Como X ∩ Y ⊂ X , trivialmente laclase X ∩Y es conexa y bien fundada. Falta ver que es transitiva, pero es ciertoen general que la interseccion de clases transitivas es transitiva:

Si u ∈ X ∩ Y , entonces u ∈ X ∧ u ∈ Y , u ⊂ X ∧ u ⊂ Y , luego u ⊂ X ∩ Y .

De aquı deducimos una propiedad nada trivial:

Teorema 2.9 Si X e Y son ordinales, entonces X ∈ Y ∨ Y ∈ X ∨ X = Y .

Demostracion: X ∩ Y es un ordinal, X ∩ Y ⊂ X y X ∩ Y ⊂ Y . Por elteorema 2.7 tenemos (X ∩ Y ∈ X ∨ X ∩ Y = X) ∧ (X ∩ Y ∈ Y ∨ X ∩ Y = Y ).Esto nos da cuatro casos:

(X ∩ Y ∈ X ∧ X ∩ Y ∈ Y ) ∨ (X ∩ Y ∈ X ∧ X ∩ Y = Y )

∨ (X ∩ Y = X ∧ X ∩ Y ∈ Y ) ∨ (X ∩ Y = X ∧ X ∩ Y = Y ),

o sea X ∩ Y ∈ X ∩ Y ∨ Y ∈ X ∨ X ∈ Y ∨ X = Y . El primer caso sedescarta por el teorema 2.3.

Notemos que, en principio, la definicion de ordinal dice que dos elementosde un mismo ordinal estan conectados por la relacion de pertenencia, pero loque acabamos de probar es que dos ordinales cualesquiera, que en principio notienen ninguna relacion entre sı, tambien estan conectados por la relacion depertenencia, y uno tiene que ser un elemento del otro salvo que sean el mismo.En particular,

αβ ∈ Ω (α ∈ β ∨ β ∈ α ∨ α = β),

luego la clase Ω es ∈-conexa (y ya habıamos probado que era transitiva). Dehecho, se cumple algo mas fuerte:

Teorema 2.10 Ω es un ordinal.

Demostracion: Ya hemos probado que Ω es transitiva y ∈-conexa. Solofalta probar que esta bien fundada. Para ello tomamos una clase X ⊂ Ω novacıa, y vamos a encontrarle un ∈-minimal. Tomemos cualquier u ∈ X . Si ya

Page 55: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.1. La construccion de los ordinales 45

es un ∈-minimal, no hay nada que probar. En caso contrario u ∩ X 6= ∅ yu ∩X ⊂ u. Como u ∈ Ω, es un ordinal y esta bien fundado, luego u ∩X tieneun ∈-minimal v, es decir, v ∈ u ∩X y v ∩ u ∩X = ∅.

Ahora bien, como v ∈ u, por transitividad v ⊂ u, de donde concluimos quev ∩X = v ∩ u ∩X = ∅. Ademas v ∈ X , luego v es un ∈-minimal de X .

Con esto termina el “trabajo duro” de la construccion de los ordinales, ypodemos empezar a extraer consecuencias:

Teorema 2.11 Ω es una clase propia.

Demostracion: Si Ω fuera un conjunto, puesto que es un ordinal, tendrıamosque Ω ∈ Ω, en contradiccion con el teorema 2.3.

Ası pues, la clase de todos los (conjuntos) ordinales es un ordinal que no esun conjunto. Seguidamente probamos que es el unico caso:

Teorema 2.12 Si Y es un ordinal, o bien Y ∈ Ω, o bien Y = Ω.

Demostracion: Basta aplicar el teorema 2.9, que nos da en principio lasopciones Y ∈ Ω ∨ Ω ∈ Y ∨ Y = Ω, pero la segunda es imposible, pues implicaque Ω es un conjunto.

Definicion 2.13 Llamaremos numeros ordinales a los elementos de Ω, es de-cir, a los conjuntos que son ordinales. En lo sucesivo usaremos letras griegasminusculas para referirnos a los numeros ordinales, de modo que

α o∨

αdebera entenderse como

α ∈ Ω o∨

α ∈ Ω, respectivamente.

Llamaremos ≤ a la inclusion en Ω, de modo que, segun el teorema 2.6,sabemos que (Ω,≤) es una clase bien ordenada. Ası pues, α ≤ β es equivalentea α ⊂ β.

El teorema 2.7 implica que la relacion de orden estricto asociada a ≤ esequivalente a la pertenencia, es decir, que α < β es equivalente a α ∈ β. (Aquıhay que tener en cuenta que no puede suceder a un tiempo α ∈ β y α = β, puesentonces tendrıamos α ∈ α.)

El teorema siguiente recoge los hechos basicos sobre el buen orden de losordinales:

Teorema 2.14 Se cumple:

a) 0 es el mınimo ordinal.

b) Si α es un ordinal, entonces α′ tambien lo es, y es el mınimo ordinalmayor que α (es decir,

β ∈ Ω (α < β → α′ ≤ β).

c) Todo conjunto de ordinales A ⊂ Ω tiene supremo σ =⋃A.

Page 56: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

46 Capıtulo 2. Ordinales

Demostracion: a) ya hemos probado que 0 es un ordinal, y es el mınimoporque el conjunto vacıo esta contenido en cualquier conjunto.

b) Ya hemos probado que α′ ∈ Ω. Si α < β entonces α ∈ β, luego α ⊂ β,luego α′ = α ∪ α ⊂ β, luego α′ ≤ β.

c) Como todo α ∈ A esta contenido en Ω, es claro que σ ⊂ Ω, luego es unconjunto conexo y bien fundado. Hemos de probar que es transitivo, pero siβ ∈ σ, entonces existe un α ∈ A tal que β ∈ α, luego por la transitividad de αes β ⊂ α ⊂ σ. Por consiguiente σ ∈ Ω. Teniendo en cuenta que el orden es lainclusion, es inmediato que σ es el supremo de A.

Volvemos ahora a la cuestion de si hay ordinales que no sean numeros natu-rales (aparte de Ω). Para ello introducimos los conceptos siguientes:

Definicion 2.15 Un ordinal α ∈ Ω es un ordinal sucesor si∨

β < α α = β′, yes un ordinal lımite si no es 0 ni un ordinal sucesor, es decir, si cumple

α lımite ≡ 0 ∈ α ∧∧

δ ∈ α δ′ ∈ α.

Trivialmente entonces, todo α ∈ Ω esta en uno (y solo uno) de los tres casossiguientes: o bien es α = 0, o bien es un ordinal sucesor, o bien es un ordinallımite. Usaremos la letra λ para referirnos a ordinales lımite, de modo que

λy∨

λ significaran, respectivamente, “para todo ordinal lımite λ” y “existe unordinal lımite λ”.

Ahora bien, ¿existen ordinales lımite? Ciertamente, los numeros naturalesdistintos de 0 son ordinales sucesores, luego la existencia de un ordinal lımiteimplica la existencia de un numero ordinal que no es un numero natural. Antesde entrar en este asunto observamos que ya podemos cumplir el objetivo quenos habıamos marcado:

Definicion 2.16 Diremos que un conjunto n es un numero natural si

n ∈ Ω ∧∧

m ∈ Ω(m ≤ n→ m = 0 ∨∨

r ∈ m m = r′).

Llamaremos ω a la clase de todos los numeros naturales.

Ası pues, hemos definido un numero natural como un ordinal tal que los or-dinales no nulos menores o iguales son todos sucesores. Enseguida discutiremossi la definicion es razonable, pero antes observamos lo siguiente:

Teorema 2.17 ω es un ordinal.

Demostracion: Como ω ⊂ Ω, es trivialmente una clase ∈-conexa y bienfundada, y basta ver que es transitiva. Si u ∈ v ∧ v ∈ ω, entonces v es unnumero natural y u es un ordinal u < v, luego todos los ordinales no nulosm ≤ u son ordinales no nulos m ≤ v, luego, al ser v un numero natural, todosellos son sucesores, lo que significa que u tambien es un numero natural, luegou ∈ ω.

Nuestra definicion de numero natural esta justificada por el teorema si-guiente:

Page 57: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.1. La construccion de los ordinales 47

Teorema 2.18 (Axiomas de Peano) Se cumple:

1) 0 ∈ ω,

2)∧

n ∈ ω n′ ∈ ω,

3)∧

n ∈ ω n′ 6= 0,

4)∧

mn ∈ ω (m′ = n′ → m = n),

5)∧

A(A ⊂ ω ∧ 0 ∈ A ∧∧

n ∈ A n′ ∈ A→ A = ω).

Demostracion: 1) es trivial.

2) Si n ∈ ω y α ≤ n′, entonces, o bien α ∈ n′ o bien α = n′. En el primercaso α ≤ n, luego α = 0 ∨

β ∈ αα = β′, porque n ∈ ω. Esto tambien secumple en el segundo caso, tomando β = n. Por consiguiente n′ ∈ ω.

Las propiedades 3) y 4) son trivialmente validas para ordinales cualesquiera,pues 0 ≤ n < n′, luego 0 ∈ n′, luego n′ 6= 0. Por otra parte, si m′ = n′, tieneque ser m = n, ya que si fuera m < n entonces m′ ≤ n < n′, luego m′ 6= n′, eigualmente si n < m.

5) Si A ⊂ ω ∧ 0 ∈ A ∧∧

n ∈ A n′ ∈ A pero A 6= ω, entonces, como hemosprobado que Ω es un ordinal, existe un ∈-minimal n ∈ ω \ A. No puede sern = 0, pues 0 ∈ A, n /∈ A. Como n es un numero natural, por definicion existeun m ∈ n tal que n = m′. Como n es minimal, no puede ser que m ∈ ω \ A,pues entonces m ∈ n ∩ (ω \ A). Por lo tanto m ∈ A (notemos que m ∈ n ∈ ω,luego m ∈ ω, por transitividad). Pero estamos suponiendo que m ∈ A implican = m′ ∈ A, contradiccion.

Esta claro que los axiomas de Peano son propiedades que los matematicosusan cuando tratan con numeros naturales, luego cualquier definicion de numeronatural aceptable para un matematico debe dar lugar a un conjunto (o, al menos,a una clase) que, con un cero y una operacion “siguiente” definidos adecuada-mente satisfaga los axiomas de Peano. En la seccion siguiente (teorema 2.24)demostraremos que los elementos de cualquier clase que satisfaga los axiomasde Peano se corresponden biunıvocamente con los numeros naturales que hemosdefinido, de modo que dos definiciones alternativas de los numeros naturales(aceptables, en cuanto que cumplan los axiomas de Peano) corresponden sim-plemente a elecciones distintas de los conjuntos concretos con los que estamosrepresentando cada numero natural. Por ejemplo, en lugar de haber tomado0 = ∅, 1 = 0, 2 = 0, 1, 3 = 0, 1, 2, etc., podrıamos haber optado por0 = ∅, 1 = 0, 2 = 1, 3 = 2, etc. y ası tendrıamos otra clase de numerosnaturales, distinta, pero equivalente a la que hemos elegido.

El hecho de que ω sea un ordinal solo nos deja dos posibilidades: o bienω = Ω, en cuyo caso no hay mas ordinales que los numeros naturales y Ω y noexisten ordinales lımite, o bien ω ∈ Ω, en cuyo caso ω es un ordinal lımite, porel segundo axioma de Peano. Mas precisamente:

Page 58: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

48 Capıtulo 2. Ordinales

Teorema 2.19 Las afirmaciones siguientes son equivalentes:

a)∨

x(cto x ∧ 0 ∈ x ∧∧

u ∈ x u′ ∈ x),

b) ctoω,

c) ω ∈ Ω,

d) ω es un ordinal lımite,

e) Existe un ordinal lımite.

Demostracion: Si x es un conjunto que cumple a), entonces y = x ∩ ωesta en las condiciones del quinto axioma de Peano, que nos da que x ∩ ω = ω,es decir, que ω ⊂ x, luego ω es un conjunto y tenemos b). A su vez, b)implica trivialmente c), que a su vez implica d), por el segundo axioma depeano. Obviamente d) implica e), y un ordinal lımite cumple lo requerido parax en a).

Las afirmaciones del teorema anterior no pueden demostrarse a partir delos axiomas que hemos considerado hasta ahora, lo que nos lleva a un nuevoaxioma:

Axioma de infinitud (AI) ctoω.

Naturalmente, cualquiera de las afirmaciones del teorema anterior sirve comoversion alternativa del axioma de infinitud. De momento seguiremos trabajandoen NBG∗, es decir, sin suponer AP o AI salvo que lo indiquemos explıcitamente.

2.2 Induccion y recursion transfinita

Los ordinales son una poderosa herramienta fundamental en el estudio delos conjuntos gracias a los teoremas que vamos a demostrar en esta seccion.Empezamos con el principio de induccion, que no es sino un caso particular delteorema 1.24:

Teorema 2.20 (Induccion transfinita)∧

A(∧

α(α ⊂ A→ α ∈ A) → Ω ⊂ A).

Es decir: si bajo la hipotesis de induccion de que todos los ordinales β < αpertenecen a una clase A podemos probar que α ∈ A, entonces todo numeroordinal esta en A. La prueba es la misma que la de 1.24:

Demostracion: Si no se cumpliera Ω ⊂ A, entonces Ω \ A 6= ∅, y debeexistir un mınimo elemento α ∈ Ω \ A, pero esto significa que todo ordinalmenor que α esta en A, es decir, α ⊂ A, luego la hipotesis nos da que α ∈ A,contradiccion.

En la practica aplicaremos este teorema a clases de la forma

A = α ∈ Ω | φ(α),

Page 59: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.2. Induccion y recursion transfinita 49

para cierta propiedad (normal) φ(x), de modo que lo que estamos afirmando esque si el hecho de que todos los ordinales menores que un α tienen la propiedadφ implica que α tambien la tiene, entonces todos los numeros ordinales tienenla propiedad φ.

A menudo el planteamiento de la induccion se simplifica si distinguimoscasos segun si α = 0 (en cuyo caso la hipotesis de induccion es vacıa), si α esun sucesor (en cuyo caso a menudo basta aplicar la hipotesis de induccion a suanterior) o si es un lımite. Esto nos lleva al enunciado siguiente:

Teorema 2.21 (Induccion transfinita)

A(0 ∈ A ∧∧

α(α ∈ A→ α′ ∈ A)

∧∧

λ(∧

δ(δ < λ→ δ ∈ A) → λ ∈ A) → Ω ⊂ A).

En otras palabras, una forma alternativa de probar que todos los ordinalestienen una propiedad (cosa que puede expresarse como la pertenencia a una claseA) es probar que 0 la tiene, que si un ordinal α la tiene entonces tambien latiene α′, y que si todos los ordinales menores que un lımite λ la tienen, tambienla tiene λ.

La prueba sigue el mismo argumento: si no fuera Ω ⊂ A la clase Ω\A deberıatener un mınimo elemento β, pero no puede ser β = 0 por la primera parte dela hipotesis, ni β = α′ por la segunda (porque α < β estarıa en A y entoncesβ tambien deberıa cumplir β ∈ A) ni puede ser un lımite por la tercera, luegotenemos una contradiccion.

Vemos ası que los resultados de induccion son poco menos que triviales.La parte delicada es demostrar el teorema de recursion transfinita. Se tratade probar que para definir una funcion F : Ω −→ A podemos definir F (α)suponiendo que F ya esta definida para los ordinales menores que α, es decir,usando los valores F (δ) con δ < α para definir F (α) o, mas precisamente, usandoF |α para definir F (α). Con exactitud:

Teorema 2.22 (Recursion transfinita) Sea A una clase cualquiera, sea

X ≡ f |∨

α f : α −→ A

y sea G : X −→ A. Entonces existe una unica funcion F : Ω −→ A caracteri-zada por que

αF (α) = G(F |α).

Demostracion: Diremos que f : β −→ A es una β-aproximacion si paratodo α < β se cumple f(α) = G(f |α). Es claro que si existe una β-aproximacionentonces es unica. En efecto, supongamos que f y g son dos β-aproximaciones.Entonces sea α < β el mınimo ordinal en el que difieran (si es que existe). Estosignifica que f |α = g|α, pero que f(α) 6= g(α). Ahora bien, esto es absurdo,pues f(α) = G(f |α) = G(g|α) = g(α).

Ahora veamos por induccion que existen β-aproximaciones para todo β.

Page 60: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

50 Capıtulo 2. Ordinales

Es claro que ∅ es trivialmente una 0-aproximacion. Si f : α −→ A es una α-aproximacion, entonces g = f ∪ (α,G(f)) es una α′-aproximacion. En efecto,tenemos que g : α′ −→ A y si β < α′, o bien β < α, en cuyo caso g(β) = f(β) =G(f |β) = G(g|β), o bien β = α, en cuyo caso g(β) = G(f) = G(g|β).

Finalmente, supongamos que existen δ-aproximaciones para todo δ < λ yveamos que existe una λ-aproximacion.

Por la unicidad que hemos probado, para cada δ < λ existe una unica δ-aproximacion, a la que podemos dar nombre. Definimos:

fδ ≡ f |f es una δ-aproximacion,

y ası∧

δ(δ < λ→ fδ es una δ-aproximacion).

De la definicion se sigue inmediatamente que si δ < ǫ < λ entonces fǫ|δ esuna δ-aproximacion, luego la unicidad implica que fǫ|δ = fδ. Esto implica que

f =⋃

δ<λ

fδ : λ −→ A,

y f es una λ-aproximacion, pues si δ < λ entonces

f(δ) = fδ′(δ) = G(fδ′ |δ) = G(f |δ).

Con esto hemos probado que existen α-aproximaciones para todo ordinal α.Por el mismo argumento que en el caso lımite de la induccion podemos definirfα : α −→ A como la unica α aproximacion y, de nuevo, la unicidad nos da quesi α < β entonces fβ |α = fα, lo cual nos permite definir

F =⋃

α∈Ω

fα : Ω −→ A.

Claramente F cumple lo pedido, y el mismo argumento que probaba launicidad de las aproximaciones prueba que F es unica.

En realidad el teorema de recursion transfinita puede usarse para definirfunciones sobre un ordinal γ cualquiera, no necesariamente Ω. En tal caso nosbasta con que la funcion G este definida sobre la clase

Xγ ≡ f |∨

α < γ f : α −→ A.

Dada G : Xγ −→ A, podemos extenderla a G∗ : X −→ A sin mas que definirG∗(f) = 0 si f /∈ Xγ , obtener F ∗ : Ω −→ A por el teorema anterior, y tomarF = F ∗|γ : γ −→ A. Es facil ver que F es la unica funcion que cumple

α < γ F (α) = G(F |α).

Enunciamos ahora un caso particular del teorema de recursion que nos serautil para construir la aritmetica ordinal:

Page 61: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.2. Induccion y recursion transfinita 51

Teorema 2.23 Sea β ∈ Ω y H : Ω −→ Ω. Entonces existe una unica aplicacionF : Ω −→ Ω caracterizada por:

F (0) = β ∧∧

αF (α′) = H(F (α)) ∧∧

λF (λ) =⋃

δ<λ

F (δ).

Demostracion: Basta tomar como G : X −→ Ω la funcion dada por

G(f) =

β si Df = 0,H(f(α)) si Df = α′,⋃

δ<λ

f(δ) si Df = λ.

La funcion F : Ω −→ Ω dada por el teorema de recursion cumple lo pedido,pues

F (0) = G(F |0) = β,

F (α′) = G(F |α′ ) = H(F |α′(α)) = H(F (α)),

F (λ) = G(F |λ) =⋃

δ<λ

F |λ(δ) =⋃

δ<λ

F (δ).

La unicidad se debe a que si F ∗ cumple lo mismo, entonces una simple induccionprueba que

α F (α) = F ∗(α). En efecto, se cumple que F (0) = β = F ∗(0),supuesto que F (α) = F ∗(α) se cumple que

F (α′) = H(F (α)) = H(F ∗(α)) = F ∗(α′)

y si se cumple∧

δ < λ F (δ) = F ∗(δ), entonces

F (λ) =⋃

δ<λ

F (δ) =⋃

δ<λ

F ∗(δ) = F ∗(λ).

Los numeros naturales y los axiomas de Peano Ahora estamos en con-diciones de justificar que los axiomas de Peano caracterizan a los numeros na-turales. El resultado basico es el siguiente:

Teorema 2.24 Sea N una clase, sea n0 ∈ N y sea s : N −→ N una aplicacionde modo que se cumplan los axiomas de Peano, es decir:

1) n0 ∈ N,

2)∧

n ∈ N s(n) ∈ N,

3)∧

n ∈ N s(n) 6= n0,

4)∧

mn ∈ N (s(m) = s(n) → m = n),

5)∧

A(A ⊂ N ∧ n0 ∈ A ∧∧

n ∈ A s(n) ∈ A→ A = N).

Entonces existe una unica aplicacion F : ω −→ N biyectiva tal que F (0) = n0 y

n ∈ ω F (n′) = s(F (n)).

Page 62: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

52 Capıtulo 2. Ordinales

Demostracion: La existencia de F : ω −→ N viene dada por el teoremade recursion, sin mas que tomar

G(f) =

n0 si Df = 0,s(f(n)) si Df = n+ 1.

Para probar que F es inyectiva, suponemos por reduccion al absurdo que nolo es, de modo que existe un n ∈ ω tal que

m < n F (m) = F (n). Tomemos elmınimo n posible y sea m < n tal que F (m) = F (n).

Como 0 ≤ m < n, tiene que ser n = v′, para cierto u ∈ ω, con lo queF (n) = s(F (v)) 6= n0, por el tercer axioma de Peano. Por lo tanto m 6= 0,pues F (m) = F (n) 6= n0, luego m = u′, para cierto u ∈ ω, luego tenemos ques(F (u)) = F (m) = F (n) = s(F (v)), luego F (u) = F (v), por el cuarto axiomade Peano. Como u′ < v′, tambien se cumple u < v, luego

u < v F (u) = F (v)y por lo tanto v < n cumple la misma propiedad que, supuestamente, n era elmınimo en cumplir, contradiccion.

Ası pues, F es inyectiva. Para probar que es suprayectiva observamos queA = F [ω] ⊂ N cumple n0 ∈ A y

n ∈ A s(n) ∈ A, pues si n ∈ A, existe unm ∈ ω tal que n = F (m), luego s(n) = s(F (m)) = F (m′) ∈ A. Por el quintoaxioma de Peano (para N), tenemos que F [ω] = N.

Concluimos que F es biyectiva. La unicidad la da el teorema de recursion.

En definitiva, lo que afirma el teorema anterior es que si N es cualquier claseque cumpla los axiomas de Peano, sus elementos forman una sucesion nii∈ω,donde aquı estamos llamando ni ≡ F (i), y de forma que n0 es el “cero” de N.

Por lo tanto, tal y como explicabamos tras el teorema 2.18, tomar una claseu otra como clase de los numeros naturales solo supone elegir unos conjuntosconcretos u otros como representacion de los numeros naturales.

Otra consecuencia del teorema anterior es que el axioma de infinitud esequivalente a la existencia de un conjunto N que (con un cierto n0 y una ciertafuncion s) cumple los axiomas de Peano, pues si existe tal conjunto, el teoremaanterior nos da una biyeccion F : ω −→ N que implica, por reemplazo, que ω esun conjunto. Mas aun:

Teorema 2.25 El axioma de infinitud equivale a que exista un conjunto N conuna aplicacion s : N −→ N inyectiva y no suprayectiva.

Demostracion: Ciertamente, si se cumple el axioma de infinitud bastatomar N = ω y s(n) = n′. Recıprocamente, si existe N , la no suprayectividadde s significa que existe un n0 ∈ N tal que

n ∈ N s(n) 6= n0. Por lo tanto Ncumple claramente los cuatro primeros axiomas de Peano.

Ahora basta observar que en la prueba del teorema 2.24 solo hemos usadoque N cumple el quinto axioma de Peano para probar que F es suprayectiva,luego, en nuestro contexto podemos concluir que existe una aplicacion inyectivaF : ω −→ N , y esto implica que ω es un conjunto.

Page 63: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.3. Ordinales y buenos ordenes 53

2.3 Ordinales y buenos ordenes

En principio, la definicion que hemos dado de numero ordinal como conjuntotransitivo ∈-conexo y bien fundado es arbitraria, pero vamos a probar que elconcepto que obtenemos con ella tiene un significado intrınseco que no dependede la forma en que hemos elegido definirlo. Vamos a probar que los ordinalesrepresentan todas las formas posibles de ordenar bien un conjunto:

Teorema 2.26 Todo conjunto bien ordenado es semejante a un unico ordinal.

Demostracion: La unicidad se debe a que si un mismo conjunto bienordenado fuera semejante a dos ordinales, estos serıan semejantes entre sı, luegobasta probar que dos ordinales semejantes tienen que ser iguales. Ello se debea que si α < β, entonces α = β<

α , y el teorema 1.26 implica que α y β no sonsemejantes.

Consideremos ahora un conjunto bien ordenado (A,≤) y vamos a ver que essemejante a un ordinal. Si A = ∅ el resultado es trivial, pues de hecho A esun ordinal. Supongamos que A 6= ∅ y sea m el mınimo de A. Definimos unaaplicacion G : X −→ A mediante

G(f) =

mın(A \ Rf) si A \ Rf 6= ∅,m si A = Rf .

Sea F : Ω −→ A la aplicacion dada por el teorema de recursion, de modo que3

α F (α) =

mın(A \ F [α]) si F [α] A,m si F [α] = A.

La aplicacion F no puede ser inyectiva, pues en tal caso A serıa una clasepropia. Por consiguiente, existen ordinales β < α tales que F (β) = F (α).Podemos tomar el mınimo ordinal α para el cual existe un β < α con la mismaimagen. De este modo, f = F |α : α −→ A inyectiva.

Ademas f es suprayectiva, ya que si F [α] 6= A serıa F (α) ∈ A\F [α], cuandoestamos suponiendo que F (α) = F (β) ∈ F [α]. Ası pues, f es biyectiva.

Para probar que es una semejanza basta ver que para todo γ < α se cumpleque f [γ] = u ∈ A | u < f(γ), pues entonces, si si δ < γ < α tenemos quef(δ) ∈ f [γ], luego se cumple f(δ) < f(γ) y ası f es una semejanza.

Lo probamos por induccion. Supongamos que se cumple para todo δ < γ.Entonces, si u < f(γ), por definicion de f ha de ser u ∈ f [γ]. Recıprocamente,si u ∈ f [γ], entonces u = f(δ), para un δ < γ. Todo v < u cumple v < f(δ)luego, por hipotesis de induccion, v ∈ f [δ] ⊂ f [γ]. Vemos, pues, que todo v ≤ ucumple v ∈ f [γ] y, como f(γ) /∈ f [γ], ha de ser u < f(γ).

3En lo sucesivo no explicitaremos la funcion G con la que aplicamos el teorema de recursion,sino que nos limitaremos a definir F (α) en terminos de F |α, o de cualquier concepto deduciblede F |α, como es en este caso F [α] = RF |α. La funcion G considerada siempre se puede deducirde la definicion recurrente.

Page 64: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

54 Capıtulo 2. Ordinales

Definicion 2.27 Llamaremos ordinal de un conjunto bien ordenado (A,≤) alunico ordinal al cual es semejante. Lo representaremos por ord(A,≤).

Conviene recordar que, por el teorema 1.26, si ord(A,≤) = α, existe unaunica semejanza f : (A,≤) −→ α. Otra observacion elemental es la siguiente:

Teorema 2.28 Si B es un conjunto bien ordenado y A ⊂ B, entonces se cumpleque ordA ≤ ordB.

Demostracion: Sean α = ordA, β = ordB y consideremos las semejanzasf : A −→ α y g : B −→ β. Si fuera β < α tendrıamos que f−1 g : α −→ βserıa estrictamente creciente, en contradiccion con 1.26.

Si una clase propia bien ordenada es semejante a un ordinal, ha de sersemejante a Ω, pues es el unico ordinal que es una clase propia, pero esto notiene por que ser cierto. El teorema siguiente nos da una condicion necesaria ysuficiente para que ası sea:

Teorema 2.29 Una clase propia A bien ordenada es semejante a Ω si y solosi, para todo u ∈ A, la seccion inicial A<

u es un conjunto.

Demostracion: La condicion es claramente necesaria: si existe una seme-janza F : A −→ Ω y F (u) = α, entonces F [A<

u ] = Ω<α = α, luego A<

u ha deser un conjunto, pues toda clase biyectable con un conjunto es un conjunto, porreemplazo.

Si se cumple la condicion, para cada u ∈ A tenemos que A<u es un conjunto

bien ordenado, luego podemos considerar su ordinal αu. Sea fu : A<u −→ αu la

(unica) semejanza entre ellos.Si u < v es facil ver que4 fv[A<

u ] = (αv)<fv(u) = fv(u). Ası pues, tenemos

que fv|A<u

: A<u −→ fv(u) es una semejanza y, por la unicidad, αu = fv(u) y

fv|A<u

= fu. Esto significa que dos funciones fu y fv coinciden en su dominiocomun.

Observemos ahora que A no puede tener un maximo elemento, pues si Mfuera el maximo de A, entonces A<

M = A \ M serıa un conjunto, luego Atambien serıa un conjunto. Esto implica que

A =⋃

v∈A

A<v

y, por consiguiente, si definimos F =⋃

v∈A

Fv, se cumple que F : A −→ Ω.

Notemos que F es simplemente la funcion que a cada u ∈ A le asigna su imagenpor cualquiera de las funciones fv definidas sobre u. No importa cual tomemos,pues todas dan el mismo valor.

Se cumple que F es inyectiva y creciente, pues si u < u′ son elementos de A,como no hay maximo, existe un v ∈ A tal que u < u′ < v, luego se cumple que

4En general, si F : A −→ B es una semejanza entre clases parcialmente ordenadas y a ∈ A,es facil ver que F [A<

a ] = B<F (a)

. Esto es un caso particular del hecho de que las semejanzas

conservan todas las propiedades relacionadas con los ordenes implicados.

Page 65: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.3. Ordinales y buenos ordenes 55

F (u) = fv(u) < fv(u′) = F (u′). Por ultimo, F es suprayectiva, pues claramenteF [Ω] =

v∈A

αv, que es claramente un ordinal (es una subclase transitiva de Ω),

pero no puede ser un conjunto, ya que entonces A serıa un conjunto, luegoF [Ω] = Ω. Concluimos que F es una semejanza.

Ejemplo Sea M un conjunto que no sea un ordinal (por ejemplo, M = 1),sea Ω∗ = Ω ∪ M y consideremos el orden en Ω∗ dado por

x ≤∗ y ↔ (x, y ∈ Ω ∧ x ≤ y) ∨ y = M.

Es facil ver que (Ω∗,≤∗) es una clase bien ordenada con M como maximoelemento. Esto implica a su vez que (Ω∗)<M = Ω, luego, por el teorema anteriorno es semejante a Ω (ni mucho menos a un numero ordinal).

La antinomia de Burali-Forti Del mismo modo que el hecho de que la clasede Russell R no es un conjunto “resuelve” la paradoja de Russell en NBG, elhecho de que la clase Ω no sea un conjunto “resuelve” la llamada antinomiade Burali-Forti, que es otra de las paradojas a las que daba lugar la teorıa deconjuntos cantoriana.

Cantor concebıa los ordinales de forma distinta a como los hemos construido,pero demostraba el “conjunto” O de todos los ordinales estaba bien ordenado,y si α era un ordinal cualquiera, entonces ordO<

α = α. El problema surgıa alconsiderar Ω = ordO, es decir, el ordinal del “conjunto” de todos los ordinales,pues la propiedad anterior implicaba que todo ordinal α cumple α < Ω, pero enparticular, tendrıa que ser Ω < Ω. Mas aun, tambien podıa probarse que todoordinal tiene un siguiente, de modo que, por una parte, deberıa ser Ω < Ω′ y,por otra, como todo ordinal, Ω′ deberıa cumplir Ω′ < Ω.

En nuestro contexto no hay contradiccion alguna, porque todo conjuntobien ordenado (no toda clase) es semejante a un ordinal, y esto no se aplica a laclase Ω de todos los conjuntos. La clase bien ordenada Ω∗ del ejemplo anterior“deberıa” tener por ordinal al ordinal siguiente de Ω, pero no existe tal ordinal,y no hay contradiccion en ello, pues ningun teorema afirma que deba existir.

Ejemplo Consideremos en Ω × Ω el orden lexicografico, es decir, el dado por

(α, β) ≤ (γ, δ) ↔ β < δ ∨ (β = δ ∧ α ≤ γ).

Es facil ver que Ω×Ω es una clase bien ordenada, pero no es semejante a Ω,ya que todos los pares (α, 0) son menores que el par (0, 1), luego tenemos unaaplicacion inyectiva Ω −→ (Ω × Ω)(0,1), luego esta seccion no es un conjunto.

En cambio, con una ligera modificacion del orden obtenemos otro que sı quees semejante a Ω:

Page 66: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

56 Capıtulo 2. Ordinales

Definicion 2.30 Definimos el orden canonico en Ω×Ω como el orden dado por

(α, β) ≤ (γ, δ) ↔ maxα, β < maxγ, δ ∨

(maxα, β = maxγ, δ ∧ β < δ) ∨(maxα, β = maxγ, δ ∧ β = δ ∧ α ≤ γ).

Es decir, para comparar dos pares, primero comparamos sus maximas com-ponentes, en caso de empate comparamos las de la derecha y si de nuevo hayempate comparamos las de la izquierda. Es facil comprobar que es un buenorden, y sus secciones iniciales son conjuntos, ya que la clase de pares menoresque (γ, δ) esta contenida en el conjunto maxγ′, δ′ × maxγ′, δ′. Por 2.29existe una (unica) semejanza F : Ω × Ω −→ Ω.

2.4 Funciones normales

Presentamos aquı unos resultados generales sobre una clase de funciones quesimplificaran considerablemente los argumentos de la seccion siguiente, en la queintroduciremos la aritmetica ordinal.

Definicion 2.31 Sea Λ un ordinal lımite o bien Λ = Ω. Diremos que unafuncion F : Λ −→ Ω es normal si

α ∈ ΛF (α) < F (α′) ∧∧

λ ∈ ΛF (λ) =⋃

δ<λ

F (δ).

Por ejemplo, si aplicamos el teorema 2.23 a una funcion H que cumpla lapropiedad

αα < H(α), entonces la funcion F que obtenemos es normal.

La normalidad es facil de comprobar y tiene varias consecuencias utiles:

Teorema 2.32 Toda funcion normal F es estrictamente monotona, es decir,si α < β entonces F (α) < F (β). En particular F es inyectiva.

Demostracion: Sea Λ el dominio de F . Fijado α ∈ Λ, veamos que

β ∈ Λ(α < β → F (α) < F (β))

por induccion sobre β. Para β = 0 es trivialmente cierto. Si vale para β ytenemos α < β′, entonces α < β o α = β. Por hipotesis de induccion en elprimer caso y trivialmente en el segundo, F (α) ≤ F (β) y como F es normalF (α) < F (β′).

Si es cierto para todo δ < λ y α < λ ∈ Λ, entonces α < α′ < λ y, porhipotesis de induccion F (α) < F (α′). De nuevo por la normalidad de F esF (α) < F (λ).

En particular, las funciones normales cumplen el teorema 1.26, es decir, siF : Λ −→ Λ es normal, entonces

α ∈ Λα ≤ F (α).

Page 67: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.5. La aritmetica ordinal 57

Teorema 2.33 Si F : Λ −→ Ω es una funcion normal y λ ∈ Λ, entonces F (λ)es un ordinal lımite.

Demostracion: Como 0 < λ, es 0 ≤ F (0) < F (λ), luego F (λ) 6= 0.Si α < F (λ), por la normalidad α < F (δ), para un cierto δ < λ. Entoncesδ < δ′ < λ, luego α′ ≤ F (δ) < F (δ′) ≤ F (λ). Ası pues, F (λ) 6= α′ para todo α.

Teorema 2.34 Si F , G : Λ −→ Λ son funciones normales, entonces F Gtambien lo es.

Demostracion: Claramente, si α ∈ Λ tenemos que F (α) < F (α′), luegoG(F (α)) < G(F (α′)). Tomemos ahora un ordinal lımite λ ∈ Λ. Hemos deprobar que

G(F (λ)) =⋃

δ<λ

G(F (δ)).

Si α ∈ G(F (λ)), como F (λ) es un ordinal lımite tenemos que α < G(η), paraun η ∈ F (λ). A su vez, η ∈ F (δ) con δ < λ. En total α < G(η) < G(F (δ)),luego α esta en el miembro derecho de la igualdad.

Recıprocamente, si α ∈ G(F (δ)), con δ < λ, entonces F (δ) < F (λ), luegoα < G(F (δ)) < G(F (λ)).

2.5 La aritmetica ordinal

Vamos a definir una suma, un producto y una exponenciacion entre ordinalesque generalizan a las operaciones analogas sobre los numeros naturales. Estasoperaciones resultan utiles para definir ordinales y aplicaciones entre ordinales.

Suma de ordinales Si A y B son dos conjuntos ordenados, podemos definirsu suma como el conjunto A ⊕ B = A × 0 ∪ B × 1 con el orden dado por(u, v) < (w, x) ↔ v < x ∨ (v = x ∧ u ≤ w).

En definitiva, A ⊕ B consta de un primer tramo semejante a A seguido deun segundo tramo semejante a B. Es facil ver que la suma de conjuntos bienordenados esta bien ordenada. Podrıamos definir la suma de dos ordinales comoα + β = ord(α ⊕ β), es decir, el ordinal que representa el orden que empiezacomo α y termina como β. Por ejemplo (suponiendo (AI)), ω + 1 es el ordinaldel conjunto

(0, 0) < (1, 0) < (2, 0) < · · · (0, 1).

Es claro que este conjunto es semejante a ω′ = 0, 1, 2, . . . , ω. Ası pues,ω + 1 = ω′. En cambio, 1 + ω es el ordinal del conjunto

(0, 0) < (0, 1) < (1, 1) < (2, 1) < · · ·

y es claro entonces que 1 + ω = ω. Ası pues, ω + 1 6= 1 + ω, luego vemos que lasuma de ordinales no es conmutativa. En otras palabras, lo que sucede es que

Page 68: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

58 Capıtulo 2. Ordinales

si anadimos un elemento a la sucesion de los numeros naturales por la izquierda“no se nota”, pero si lo anadimos por la derecha sı.

Por comodidad vamos a introducir la suma con una definicion recurrentemas manejable. De todos modos, cuando contemos con las propiedades basicassera facil ver que se trata de la misma operacion que acabamos de considerar.

Definicion 2.35 Para cada ordinal α ∈ Ω definimos (α+) : Ω −→ Ω como launica aplicacion que cumple

(α+)(0) = α ∧∧

β (α+)(β′) = (α+)(β)′ ∧∧

λ (α+)(λ) =⋃

δ<λ

(α+)(δ).

Naturalmente, esta definicion es correcta por el teorema 2.23. Estas aplica-ciones nos permiten definir la operacion + : Ω × Ω −→ Ω dada por

α+ β = (α+)(β).

Observemos ademas que, teniendo en cuenta que 1 ≡ 0′, se cumple que

α+ 1 = (α+)(0′) = (α+)(0)′ = α′.

En vista de esto, en lo sucesivo ya nunca escribiremos α′, sino que escribi-remos α+ 1 en su lugar. En estos terminos, las propiedades que caracterizan ala suma de ordinales se expresan ası:

α+ 0 = α ∧∧

β α+ (β + 1) = (α+ β) + 1 ∧∧

λα+ λ =⋃

δ<λ

(α+ δ).

Puesto que α+ β < (α+ β) + 1, es inmediato que la funcion α+ es normal.Esto nos da ya algunas propiedades de la suma, como la monotonıa:

αβγ(β < γ → α+ β < α+ γ),∧

αβ β ≤ α+ β.

o el hecho de que los ordinales α+ λ son ordinales lımite.

Todas las propiedades de la suma se demuestran por induccion. Por ejemplo,es inmediato comprobar que

α 0 + α = α. Veamos un ejemplo detallado:

Teorema 2.36∧

αβγ(α ≤ β → α+ γ ≤ β + γ).

Demostracion: Lo probamos por induccion sobre γ. Para γ = 0 es obvio.Si vale para γ, entonces

α+ (γ + 1) = (α+ γ) + 1 ≤ (β + γ) + 1 = β + (γ + 1).

Si es cierto para todo δ < λ, entonces α+ δ ≤ β + δ ≤ β + λ y, tomando elsupremo en δ, queda α+ λ ≤ β + λ.

De las desigualdades que hemos probado se sigue sin dificultad (sin necesidadde mas inducciones) el siguiente resultado general de monotonıa:

αβγδ(α ≤ β ∧ γ < δ → α+ γ < β + δ),

Page 69: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.5. La aritmetica ordinal 59

del cual se sigue, obviamente, el caso en que todas las desigualdades son noestrictas.

Una simple induccion demuestra que la suma de numeros naturales es unnumero natural, por lo que la suma de ordinales se restringe a una operacion+ : ω × ω −→ ω de numeros naturales.

Suponiendo el axioma de infinitud (para que tenga sentido operar con ω)vemos que si n ∈ ω entonces

ω ≤ n+ ω =⋃

m∈ωn+m ≤ ω,

luego∧

n ∈ ω n+ ω = ω, como ya habıamos anticipado.

Pasemos ahora a las propiedades algebraicas de la suma. Como las funcionesα+ son normales —luego inyectivas— los sumandos son simplificables por laizquierda:

αβγ(α + β = α+ γ → β = γ).

En cambio (suponiendo AI), tenemos que 5 + ω = 8 + ω y no podemossimplificar. El teorema siguiente ilustra el uso de la normalidad en el casolımite de una induccion:

Teorema 2.37∧

αβγ ((α+ β) + γ = α+ (β + γ)).

Demostracion: Por induccion sobre γ. Para γ = 0 es trivial. Si valepara γ, entonces

(α+ β) + (γ + 1) = ((α+ β) + γ) + 1 = (α+ (β + γ)) + 1

= α+ ((β + γ) + 1) = α+ (β + (γ + 1)).

Si vale para todo δ < λ, entonces

(α+ β) + λ =⋃

δ<λ

(α+ β) + δ =⋃

δ<λ

α+ (β + δ)

=⋃

δ<λ

((β+) (α+))(δ) = ((β+) (α+))(λ) = α+ (β + λ),

donde en el penultimo paso hemos usado la normalidad de la composicion delas dos sumas.

Ası pues, la suma de numeros naturales es una operacion asociativa en Ω.A partir de aquı ya no sera necesario escribir parentesis entre sumandos.

Hemos visto que, bajo AI, la suma de ordinales no es conmutativa, pues, porejemplo, 1 + ω = ω 6= ω + 1, sin embargo, la suma de numeros naturales sı quelo es:

Teorema 2.38∧

mn ∈ ω m+ n = n+m.

Page 70: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

60 Capıtulo 2. Ordinales

Demostracion: Una simple induccion prueba que∧

n ∈ ω 1+n = n+1, yesto se usa a su vez para, fijado un m ∈ ω, demostrar por induccion sobre n que∧

n ∈ ω m+ n = n+m. En efecto: para 0 es claro y, si vale para n, tenemos

m+ (n+ 1) = m+ n+ 1 = n+m+ 1 = n+ 1 +m = (n+ 1) +m.

Teorema 2.39∧

αβ(α ≤ β →1∨γ α+ γ = β).

Demostracion: Sabemos que β ≤ α+β < α+β+1, luego podemos tomarel mınimo ordinal η tal que β < α + η. Obviamente no puede ser η = 0 y si ηfuera un lımite existirıa δ < η tal que β < α + δ, en contra de la minimalidadde η. Ası pues, η = γ+1 para cierto γ tal que α+γ ≤ β < α+γ+1. Claramenteβ = α+γ. La unicidad se sigue de que la suma es simplificable por la izquierda.

En particular, si δ < α+ β, o bien δ < α, o bien α ≤ δ, en cuyo caso, por elteorema anterior, existe un γ tal que δ = α+ γ < α+ β, luego γ < β. Ası pues:

Teorema 2.40∧

αβδ(δ < α+ β ↔ δ < α ∨∨

γ < β δ = α+ γ).

Ahora es facil probar que si A y B son dos conjuntos bien ordenados yf1 : A −→ α, f2 : B −→ β son las semejanzas en sus ordinales, entonces, laaplicacion f : A⊕B −→ α+ β dada por

f(u, v) =

f1(u) si v = 0,α+ f2(u) si v = 1,

es una semejanza, luego ord(A ⊕ B) = ordA + ordB y, en particular, la sumade ordinales que hemos definido es equivalente a la definida al principio de laseccion.

Producto de ordinales Aunque vamos a definir el producto mediante unarelacion recurrente analoga a la de la suma, tambien en este caso podrıamos daruna definicion en terminos de buenos ordenes. Concretamente, si A y B son dosconjuntos ordenados, podemos considerar A × B con el orden lexicografico, esdecir, el orden dado por

(u, v) ≤ (w, x) ↔ v < x ∨ (v = x ∧ u ≤ w).

Es facil ver que el producto de dos conjuntos bien ordenados esta bien orde-nado, lo que nos permitirıa definir α · β = ord(α × β). Por ejemplo (bajo AI),ω · 2 serıa el ordinal de

(0, 0) < (1, 0) < (2, 0) < · · · (0, 1) < (1, 1) < (2, 1) < · · ·

y es claro que este conjunto es semejante a

ω + ω = 0, 1, 2, . . . , ω, ω + 1, ω + 2, . . ..

Page 71: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.5. La aritmetica ordinal 61

En cambio, 2 · ω es el ordinal de

(0, 0) < (1, 0) < (0, 1) < (1, 1) < (0, 2) < (1, 2) < · · ·

por lo que 2 · ω = ω.

Definicion 2.41 Para cada ordinal α ∈ Ω definimos α· : Ω −→ Ω como launica aplicacion que cumple

α · 0 = 0 ∧∧

β α · (β + 1) = (α · β) + α ∧∧

λ α · λ =⋃

δ<λ

(α · δ).

Nuevamente, las funciones α· se combinan para definir una ley de compo-sicion interna · : Ω × Ω −→ Ω.

Es claro que si α 6= 0 entonces α· es una funcion normal, mientras que unasimple induccion prueba que

α 0 · α = 0 (luego el producto por cero no esnormal, ya que no es estrictamente creciente). Tampoco ofrece dificultad algunademostrar que

α(α · 1 = 1 · α = α).

Como consecuencia inmediata de la normalidad tenemos la monotonıa:

αβγ(α < β ∧ γ 6= 0 → γ · α < γ · β)

Si multiplicamos por la derecha la desigualdad tiene que ser no estricta:

αβγ(α ≤ β → α · γ ≤ β · γ).

Esto se prueba exactamente igual que el resultado analogo para la suma.Combinando estas desigualdades tenemos:

αβγδ(α ≤ β ∧ γ < δ ∧ β 6= 0 → α · γ < β · δ).

De aquı se sigue, en particular, que∧

αβ(α · β = 0 ↔ α = 0 ∨ β = 0), puessi 1 ≤ α y 1 ≤ β, entonces 1 ≤ αβ.

Tambien es claro que los factores no nulos se simplifican por la izquierda enlas igualdades (por normalidad).

Una simple induccion demuestra que el producto de numeros naturales es unnumero natural, con lo que el producto de ordinales se restringe a un producto· : ω × ω −→ ω.

Ejercicio: (AI) Probar que∧n ∈ ω(n 6= 0 → nω = ω).

Veamos ahora las propiedades algebraicas:

Teorema 2.42∧

αβγ α(β + γ) = αβ + αγ.

Demostracion: Podemos suponer α 6= 0. Lo probamos por induccionsobre γ. Para γ = 0 es obvio. Si vale para γ, entonces

α(β + γ + 1) = α(β + γ) + α = αβ + αγ + α = αβ + α(γ + 1).

Page 72: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

62 Capıtulo 2. Ordinales

Si vale para todo δ < λ, entonces, usando que la composicion de funcionesnormales es normal,

α(β + λ) = ((β+) (α·))(λ) =⋃

δ<λ

((β+) (α·))(δ) =⋃

δ<λ

(α(β + δ))

=⋃

δ<λ

(αβ + αδ) =⋃

δ<λ

((α·) (αβ+))(δ) = ((α·) (αβ+))(λ) = αβ + αλ.

Exactamente igual se demuestra:

Teorema 2.43∧

αβγ (αβ)γ = α(βγ).

Por lo tanto, no necesitamos escribir parentesis entre factores. SuponiendoAI, el producto no es conmutativo, pues, por ejemplo,

ω · 2 = ω(1 + 1) = ω + ω > ω + 0 = ω,

mientras que 2 · ω = ω. De aquı se sigue tambien que la propiedad distributivapor la derecha es falsa, ası como que no se pueden simplificar factores por laizquierda. En cambio, el producto de numeros naturales es conmutativo:

Teorema 2.44∧

mn ∈ ω mn = nm.

Demostracion: Primero probamos por induccion sobre r que

r ∈ ω(m+ n)r = mr + nr.

En efecto, para r = 0 es trivial y si vale para r

(m+ n)(r + 1) = (m+ n)r +m+ n = mr + nr +m+ n

= (mr +m) + (nr + n) = m(r + 1) + n(r + 1).

Y con esto ya podemos probar el enunciado por induccion sobre n. Paran = 0 es trivial y, si vale para n,

m(n+ 1) = mn+m = nm+m = (n+ 1)m.

La division euclıdea es valida para ordinales cualesquiera:

Teorema 2.45∧

αβ(β 6= 0 →1∨γδ(α = βγ + δ ∧ δ < β)).

Demostracion: Como 1 ≤ β, tenemos que α ≤ βα < βα + β = β(α + 1).Sea η el mınimo ordinal tal que α < βη. Obviamente no puede ser η = 0 ytampoco puede ser un ordinal lımite, ya que entonces serıa α < βǫ, para ǫ < η,en contra de la minimalidad de η. Ası pues, η = γ + 1, para cierto γ. Tenemosque

βγ ≤ α < β(γ + 1) = βγ + β.

Page 73: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.5. La aritmetica ordinal 63

Por el teorema 2.39 existe un δ tal que α = βγ + δ. Como βγ + δ < βγ + β,por la normalidad de βγ+ concluimos que δ < β.

Veamos la unicidad. Si tenemos dos soluciones γ1, γ2, δ1, δ2 y γ1 < γ2,entonces

α = βγ1 + δ1 < βγ1 + β = β(γ1 + 1) ≤ βγ2 ≤ βγ2 + δ2 = α,

lo cual es contradictorio. Similarmente es imposible que γ2 < γ1, luego γ1 = γ2.Por consiguiente, βγ1 + δ1 = βγ1 + δ2, de donde δ1 = δ2.

Como consecuencia:

Teorema 2.46∧

αβǫ (ǫ < αβ ↔∨

γ < β∨

δ < α ǫ = αγ + δ)

Demostracion: Si ǫ < αβ, podemos expresarlo como ǫ = αγ+δ, con δ < α,y tambien tiene que ser γ < β, pues si β ≤ γ, entonces αβ ≤ αγ ≤ αγ + δ = ǫ.Recıprocamente, si ǫ = αγ + δ con γ < β y δ < α, entonces

ǫ = αγ + δ < αγ + α = α(γ + 1) ≤ αβ.

Ahora, si f1 : A −→ α y f2 : B −→ β son semejanzas de dos conjuntosbien ordenados en sus ordinales correspondientes, es facil ver que5 la aplicacionf : A×B −→ αβ dada por

f(a, b) = αf2(b) + f1(a)

es una semejanza cuando en A×B consideramos el orden lexicografico descritoen la pagina 60, con lo que

ord (A×B) = (ordA)(ordB)

y, en particular, el producto de ordinales que hemos considerado coincide con eldefinido en terminos del producto lexicografico de buenos ordenes.

Exponenciacion de ordinales Para caracterizar la exponenciacion de ordi-nales en terminos de conjuntos ordenados necesitamos el concepto de conjuntofinito, que aun no hemos introducido, ası que de momento nos limitaremos adar la definicion por recurrencia y mas adelante (teorema 4.43) veremos la ca-racterizacion correspondiente.

5Notemos que si γ1 < γ2 < β y δ1, δ2 < α, entonces

αγ1 + δ1 < αγ1 + α = α(γ1 + 1) ≤ αγ2 ≤ αγ2 + δ2.

Por lo tanto, siempre suponiendo γ1, γ2 < β, δ1, δ2 < α, se cumple

γ1 < γ2 ∨ (γ1 = γ2 ∧ δ1 < δ2) → αγ1 + δ1 < αγ2 + δ2.

Esto implica a su vez que (a1, b1) < (a2, b2) → f(a1, b1) < f(a2, b2).

Page 74: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

64 Capıtulo 2. Ordinales

Definicion 2.47 Para cada ordinal α 6= 0 definimos α( ) : Ω −→ Ω como launica funcion que cumple

α0 = 1 ∧∧

β αβ+1 = αβ · α ∧∧

λ αλ =⋃

δ<λ

αδ.

Convenimos en que 0α =

1 si α = 00 en otro caso.

Una simple induccion nos da que∧

αβ(α 6= 0 → αβ 6= 0), de donde se sigueque si α > 1 entonces α( ) es una funcion normal.

Omitimos las demostraciones de las propiedades siguientes, pues todas ellasson similares a los resultados analogos para la suma y el producto. (A menudohay que tratar aparte los casos en los que la base es 0 o 1.)

a)∧

α 1α = 1,

b)∧

α α1 = α,

c)∧

αβγ(α < β ∧ 1 < γ → γα < γβ),

d)∧

αβγ(α ≤ β → αγ ≤ βγ),

e)∧

αβγ(α ≤ β ∧ 1 < γ ∧ γα = γβ → α = β),

f)∧

αβγ αβ+γ = αβ · αγ ,

g)∧

αβγ (αβ)γ = αβ·γ .

Como siempre, una simple induccion prueba que la exponenciacion de nu-meros naturales sea un numero natural.

Ejercicio: (AI) Probar que∧n ∈ ω(1 < n → nω = ω).

La no conmutatividad del producto hace que, en general, (αβ)γ 6= αγβγ .Por ejemplo,

(2 · 2)ω = ω 6= ω2 = 2ω · 2ω.

Ahora bien, una simple induccion sobre r prueba que

mnr ∈ ω (mn)r = mrnr.

2.6 Sumas finitas

Consideremos una clase A en la que hay definida una ley de composicioninterna + : A × A −→ A con elemento neutro 0. En particular esto lo cumpleA = Ω con la suma de ordinales (pero no suponemos que en general 0 sea elordinal 0).

Page 75: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.6. Sumas finitas 65

Para cada sucesion6 aii<n en A, con n ∈ ω, consideramos la unica apli-cacion n −→ A que cumple

i<0

ai = 0,∑

i<k+1

ai =∑

i<k

ai + ak.

En particular, ası queda definida la suma∑

i<n

ai ∈ A.

Un poco mas en general, si tenemos una sucesion aii∈I en A con I ⊂ n,para cierto n ∈ ω, consideramos en I el orden usual de los ordinales, de modoque ord I = m ≤ n (teorema 2.28). Tomamos entonces la (unica) semejanzas : m −→ I y consideramos la sucesion as(j)j<m. Definimos

i∈I

ai =∑

j<m

as(i).

Es facil ver que si I = ∅, entonces∑

i∈I

ai = 0, y si I = J ∪ m, donde, m

es el maximo de I (que existe, porque el ordinal de I es un numero natural nonulo, y todo numero natural no nulo tiene por maximo a su anterior), entonces

i∈I

ai =∑

i∈J

ai + am.

A partir de aquı podemos probar que si + es asociativa y partimos I = I1∪I2de modo que todo elemento de I1 es menor que todo elemento de I2, entonces

i∈I

ai =∑

i∈I1

ai +∑

i∈I2

ai.

En efecto, razonamos por induccion sobre el ordinal de I2. Si es 0 es queI2 = ∅ e I = I1, con lo que la igualdad es trivial. Supuesto cierto cuandoI2 tiene ordinal k, supongamos que su ordinal es k + 1. Entonces I2 tiene unmaximo elemento m, que sera tambien el maximo de I. Sea I ′2 = I2 \ m.Entonces (y aquı usamos la asociatividad de +):

i∈I

ai =∑

i∈I1∪I′2

ai + am =∑

i∈I1

ai +∑

i∈I′2

ai + am =∑

i∈I1

ai +∑

i∈I2

ai.

A su vez podemos probar la generalizacion siguiente:

Teorema 2.48 (Propiedad asociativa generalizada) Sea A una clase enla que hay definida una operacion + asociativa y con elemento neutro. SeaIii<k una familia de subconjuntos de un numero natural n de manera que, sii < j < k, todo elemento de Ii es menor que todo elemento de Ij, sea I =

i<k

Iiy sea aii∈I una sucesion en A. Entonces,

j∈I

aj =∑

i<k

j∈Ii

aj.

6Recordemos que esto significa simplemente que a : n −→ A.

Page 76: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

66 Capıtulo 2. Ordinales

Demostracion: Razonamos por induccion sobre m ≤ k que

j∈ ∪i<m

Ii

aj =∑

i<m

j∈Ii

aj .

Para m = 0 ambos terminos valen 0. Si vale para m, entonces, como⋃

i<m+1

Ii =⋃

i<m

Ii ∪ Im esta en las hipotesis del caso considerado antes del enun-

ciado, tenemos que

j∈ ∪i<m+1

Ii

aj =∑

j∈ ∪i<m

Ii

aj +∑

j∈Im

aj =∑

i<m

j∈Ii

aj +∑

j∈Im

aj =∑

i<m+1

j∈Ii

aj .

En la practica, si I = i | m ≤ i ≤ n, usaremos las notaciones alternativas

am + · · · + an ≡n∑

i=m

ai ≡∑

i∈I

ai.

En estos terminos, por ejemplo, hemos probado que si m ≤ k < n, se cumple

am + · · · + an = (am + · · · + ak) + (ak+1 + · · · + an).

Las sumas finitas que acabamos de definir verifican una serie de propiedadesque generalizan de forma obvia las propiedades de las sumas de dos sumandosy que se demuestran mediante inducciones rutinarias. No vamos a entrar enello, sino que usaremos estas propiedades segun vayan siendo necesarias sin masadvertencia.

Por ejemplo, si tenemos dos sucesiones de ordinales αii∈I y βii∈I talesque

i ∈ I αi ≤ βi, entonces∑

i∈I

αi ≤∑

i∈I

βi. O tambien, si α es cualquier

ordinal, se cumple α∑

i∈I

αi =∑

i∈I

ααi, etc.

Veamos una aplicacion de estas sumas finitas:

Teorema 2.49 Si k > 1 es un numero natural, para cada m ∈ ω no nulo existeuna unica sucesion cii≤n de numeros menores que k tal que cn 6= 0 y

m =n∑

i=0

ciki.

Demostracion: Observemos en primer lugar que, como la funcion k() esnormal (y aquı usamos que k > 1) se cumple que m ≤ km < km+1, luego hayun mınimo n∗ ≤ m + 1 tal que m < kn

. No puede ser n∗ = 0, pues entoncesserıa m = 0, luego n∗ = n+ 1 y se cumple kn ≤ m < kn+1. Observemos que launicidad de n∗ implica la de n, es decir, hemos probado que para todo naturalm > 0 existe un unico natural n tal que kn ≤ m < kn+1. Llamaremos o(m) aeste unico n.

Si dividimos m = knc + m′, con m′ < kn, tiene que ser c < k, ya que sifuera c ≥ k, tendrıamos m ≥ knk = kn+1. Ademas c > 0, o de lo contrario

Page 77: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.6. Sumas finitas 67

m = m′ < kn. Ası pues, todo numero natural m > 0 puede expresarse en laforma

m = ckn +m′, 0 < c < k, m′ < kn ≤ m.

Observemos que esta expresion es unica, pues necesariamente n = o(m) (yaque m < (k − 1)kn + kn = kkn = kn+1) y entonces c y m′ estan unıvocamentedeterminados como cociente y resto de la division euclıdea. Vamos a probarque todo natural m no nulo admite una descomposicion como la que indica elenunciado con n = o(m).

Razonamos por induccion sobre m. Supuesto cierto para todo m′ < m,consideramos la expresion m = ckn +m′. Si m′ = 0 entonces m = ckn ya tienela forma deseada. En caso contrario, por hipotesis de induccion

m′ =n′∑

i=0

ciki,

donde n′ = o(m′) < n (porque m′ < kn) y, definiendo ci = 0 para n′ < i < n ycn = c, tenemos que

m =n′∑

i=0

ciki +

n−1∑

i=n′+1

ciki + cnk

n =n∑

i=0

ciki.

Para probar la unicidad observamos que

kn ≤n∑

i=0

ciki < kn+1.

En efecto, la primera desigualdad se sigue de que cn 6= 0 separando el ultimosumando, y la segunda se prueba por induccion sobre n. Si vale para n, entonces

n+1∑

i=0

ciki =

n∑

i=0

ciki + cn+1k

n+1 < kn+1 + (k − 1)kn+1 = kn+2.

Por lo tanto, razonando por induccion sobre m, si tenemos dos descomposi-ciones

m =n∑

i=0

ciki =

n′∑

i=0

c′iki

en las condiciones del enunciado, necesariamente n = n′ = o(n), con lo que, porla unicidad de la descomposicion

cnkn +

n−1∑

i=0

ciki = c′nk

n +n−1∑

i=0

c′iki

(notemos que hemos probado que los segundos sumandos son < kn), tenemosque cn = c′n y

n−1∑

i=0

ciki =

n−1∑

i=0

c′iki.

Page 78: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

68 Capıtulo 2. Ordinales

Llamamos n y n′ a los maximos naturales tales que cn 6= 0 y c′n′ 6= 0, respecti-vamente, de modo que

n∑

i=0

ciki =

n′∑

i=0

c′iki.

Por hipotesis de induccion n = n′ y ci = c′i para todo i < n, lo que implica quelas dos sucesiones cii≤n y c′ii≤n son iguales.

Definicion 2.50 La sucesion cii≤n dada por el teorema anterior se llamarepresentacion en base k del numero m. Es habitual usar la notacion

cn · · · c0(k) ≡n∑

i=0

ciki,

de modo que, por ejemplo, k = 0 · k0 + 1 · k = 10(k).

Cuando no se especifica la base se entiende que es k = 9′, donde

1 ≡ 0′, 2 ≡ 1′, 3 ≡ 2′, 4 ≡ 3′, 5 ≡ 4′, 6 ≡ 5′, 7 ≡ 6′, 8 ≡ 7′, 9 ≡ 8′,

de modo que la notacion usual para 9′ es 10 y, en general,

cn · · · c0 ≡n∑

i=0

ci10i.

De este modo, todo numero natural tiene un nombre canonico en terminos delas diez cifras 0, . . . , 9, aunque la eleccion del numero 10 es puramente arbitraria.En principio, la menor base admisible es k = 2, de modo que, por ejemplo, esfacil ver que 10 = 2 + 23 = 1010(2). Por lo tanto, todo numero natural admiteun nombre canonico en terminos unicamente de las cifras 0 y 1.

2.7 La forma normal de Cantor

En esta seccion probaremos un resultado analogo al teorema 2.49 tomandocomo base k = ω y que resulta ser valido para todos los ordinales. Trabajaremosen NBG∗ + AI. En primer lugar conviene que nos formemos una idea orientativade como son los primeros ordinales. Si no se cumple el axioma de infinitud, losordinales coinciden con los numeros naturales:

0, 1, 2, 3, . . .

Con el axioma de infinitud, por encima de ellos tenemos ω y sus sucesores:

0, 1, 2, 3, . . . ω, ω + 1, ω + 2, . . .

Pero la sucesion de ordinales no acaba ahı, sino que por encima de todos estosesta ω + ω = ω · 2 y sus sucesores:

0, 1, . . . ω, ω + 1, . . . ω · 2, ω · 2 + 1, ω · 2 + 2, . . .

Page 79: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.7. La forma normal de Cantor 69

pero por encima de los ordinales ω ·2+n esta ω ·2+ω = ω ·3, y ası sucesivamente:

0, 1, . . . ω, ω+ 1, . . . ω · 2, ω · 2 + 1, . . . ω · 3, . . . ω · 4, . . .

pero por encima de ω · 1, ω · 2, ω · 3, ω · 4, . . . esta ω · ω = ω2.

Pero por encima de ω2 estan ω2 + 1, ω2 + 2, . . . y, en general, todos losordinales de la forma ω2 +ω ·n+m, con m, n ∈ ω. Y por encima de todos ellosesta ω2 +ω2 = ω2 ·2, y ası podemos ir ascendiendo hasta ω2 ·3, ω2 ·4, . . . , y porencima de todos ellos esta ω2 ·ω = ω3, y si vamos formando ω3, ω4, ω5, . . . , conese patron tampoco agotamos los ordinales, pues por encima de todos ellos estaωω, con lo que podemos volver a empezar con ωω + 1, ωω + 2, . . . hasta llegar aωω +ωω = ωω ·2. Pero si vamos formando los ordinales ωω ·2, ωω ·3, ωω ·4, . . .,por encima de todos ellos esta ωω · ω = ωω+1. Ası podemos llegar hasta ωω2

yhasta ωω3

, . . . hasta llegar a ωωω

.

Quiza en este punto el lector deberıa reconsiderar el teorema 2.14 c): dadocualquier conjunto A de ordinales, como pueda ser la sucesion

ω, ωω, ωωω

, ωωωω

, . . .

existe su supremo en Ω, es decir, hay un ordinal σ por encima de todos loselementos de A (en particular, por encima de todos los elementos de la sucesionanterior), a partir del cual podemos empezar a sumar de nuevo σ, σ+1, σ+2, . . .

En realidad, con todos los ordinales que hemos escrito aquı, apenas he-mos ascendido nada en Ω. Con el teorema de Cantor que vamos a demostrarpondremos “un poco de orden” en esta “jungla” de los “primeros ordinales”.Necesitamos algunos resultados previos:

Teorema 2.51 Si αω ≤ β entonces α+ β = β.

Demostracion: Sabemos que existe un γ tal que β = αω + γ, por lo que

α+ β = α+ αω + γ = α(1 + ω) + γ = αω + γ = β.

Informalmente, la hipotesis del teorema anterior afirma que β empieza por“infinitas copias” de α, es decir, por α+α+α+ · · ·, por lo que si anadimos unα mas “no se nota”.

Ejercicio: Probar el recıproco del teorema anterior.

Teorema 2.52 Si α < β entonces ωα + ωβ = ωβ.

Demostracion: Es un caso particular del teorema anterior, puesto que secumple ωαω = ωα+1 ≤ ωβ .

Teorema 2.53 Si α 6= 0 existen unos unicos η y β tales que α = ωη + β, conβ < α. Ademas η es concretamente el unico ordinal que cumple ωη ≤ α < ωη+1.

Page 80: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

70 Capıtulo 2. Ordinales

Demostracion: Como la funcion ω( ) es normal, α ≤ ωα < ωα+1, luegopodemos tomar el mınimo γ tal que α < ωγ . No puede ser γ = 0 ni tampocoque sea un lımite, luego γ = η + 1 y tenemos ωη ≤ α < ωη+1.

Es claro que η es unico. Existe un β ≤ α tal que α = ωη + β, pero ha de serβ < α, pues si se da la igualdad

α = ωη + α = ωη + ωη + α = ωη + ωη + ωη + α = · · ·

y, en general, ωη · n ≤ α, para todo n ∈ ω. Por consiguiente, ωηω = ωη+1 ≤ α,contradiccion.

Recıprocamente, si α = ωη + β con β < α, ha de ser ωη ≤ α < ωη+1 o, delo contrario, por 2.51 tendrıamos que α = ωη + α = ωη + β y serıa β = α. Deaquı se sigue la unicidad de η, que a su vez implica la de β.

Teorema 2.54 Si α 6= 0 existe una unica sucesion finita decreciente de ordi-nales η0 ≥ η1 ≥ · · · ≥ ηn tal que α = ωη0 + · · · + ωηn .

Demostracion: Aplicamos el teorema anterior repetidamente, con lo queexpresamos α = ωη0 + α1, con α1 < α, luego α1 = ωη1 + α2, con α2 < α1,etc. Como no podemos tener una sucesion decreciente de ordinales (no tendrıamınimo), algun αn = 0, lo que nos da la expresion buscada.

Si fuera ηi < ηi+1 para algun i, entonces

αi = ωηi + αi+1 = ωηi + ωηi+1 + αi+2 = ωηi+1 + αi+2 = αi+1,

contradiccion.Para probar la unicidad observamos que si α = ωη0 + · · · + ωηn y los expo-

nentes son decrecientes, entonces

α = ωη0 + · · · + ωηn ≤ ωη0 + · · · + ωη0 = ωη0 · n < ωη0ω = ωη0+1,

es decir, ωη0 ≤ α < ωη0+1, luego η0 esta unıvocamente determinado por α. Situvieramos dos expresiones distintas, ambas tendrıan el mismo primer termino,luego podrıamos cancelarlo y de aquı deducirıamos que tendrıan el mismo se-gundo termino, y ası sucesivamente. En definitiva, ambas serıan la misma.

El teorema de Cantor se sigue del que acabamos de probar sin mas queagrupar los terminos con el mismo exponente (por la propiedad asociativa ge-neralizada):

Teorema 2.55 (Forma normal de Cantor) Si α 6= 0 existe una unica su-cesion finita estrictamente decreciente de ordinales η0 > η1 > · · · > ηn yuna unica sucesion finita k0, . . . , kn de numeros naturales no nulos tal queα = ωη0k0 + · · · + ωηnkn.

La forma normal de Cantor es especialmente descriptiva para ordinales pe-quenos. Por ejemplo, si α < ωω entonces es claro que η0 ha de ser un numero

Page 81: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.7. La forma normal de Cantor 71

natural, luego tenemos que los ordinales menores que ωω se expresan de formaunica como polinomios en ω con coeficientes naturales.

Podemos ir algo mas lejos, para lo cual conviene definir

ω(0) = 1, ω(n+1) = ωω(n)

, ǫ0 =⋃

n∈ωω(n).

Ası, ω(1) = ω, ω(2) = ωω, ω(3) = ωωω

, etc. y ǫ0 es el supremo de estasucesion.7

Si δ < ǫ0, entonces se cumple δ < ω(n) para cierto n ∈ ω, luego tenemos que

ωδ ≤ ωω(n)

= ω(n+1) ≤ ǫ0. Tomando el supremo en δ concluimos que ωǫ0 ≤ ǫ0.El recıproco es obvio, luego ωǫ0 = ǫ0.

Definicion 2.56 Un numero epsilon es un ordinal ǫ ∈ Ω tal que ωǫ = ǫ.

Acabamos de probar que existen numeros ǫ. De hecho, vamos a ver que elnumero ǫ0 que hemos construido es el menor numero ǫ. Para ello, para cadaα < ǫ0 no nulo, llamamos o(α) al unico n ∈ ω tal que ω(n) ≤ α < ω(n+1).

Es claro que entonces ω(n+1) ≤ ωα < ω(n+2), es decir, tenemos que

o(ωα) = 1 + o(α).

En particular ωα 6= α, luego α no es un numero ǫ.

Los numeros naturales (no nulos) son los ordinales de rango 0, los numerosentre ω y ωω son los ordinales de rango 1 (y son, como hemos visto, los polino-mios en ω con coeficientes naturales).

Observemos ahora lo siguiente:

Teorema 2.57 Si ξ es un ordinal, se cumple:

a)∧

αβ < ξ α+ β < ξ y solo si ξ = 0 ∨∨

η ξ = ωη.

b)∧

αβ < ξ α · β < ξ si y solo si ξ = 0, 1, 2 ∨∨

η ξ = ωωη

.

c)∧

αβ < ξ αβ < ξ si y solo si ξ = 0, 1, 2, ω ∨ ξ es un numero epsilon.

Demostracion: a) Veamos por induccion sobre η que ωη cumple la propiedadindicada: para η = 0 es trivial. Si vale para η y α, β < ωη+1 = ωη · ω, entoncesexiste un n < ω tal que α, β < ωη · n, luego

α+ β < ωη(n+ n) < ωη · ω = ωη+1.

Si vale para todo δ < λ y α, β < ωλ, entonces existe un δ < λ tal que α, β < ωδ,luego α+ β < ωδ < ωλ.

7Es el ordinal que hemos “rozado” en nuestra “escalada” por Ω al principio de esta seccion.

Page 82: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

72 Capıtulo 2. Ordinales

Recıprocamente, si ξ > 0 tiene la propiedad, consideramos la expresionξ = ωη + β dada por el teorema 2.53. Como β < ξ y ωη ≤ ξ, tiene que serξ = ωη.

b) Claramente ωω0

= ω cumple lo pedido. Si α, β < ωωη

, con η > 0, entoncesexiste un δ < ωη tal que α, β < ωδ, luego αβ < ωδ+δ < ωωη

, donde hemos usadoel apartado anterior.

Recıprocamente, si ξ > 2 cumple la propiedad indicada, entonces tambiencumple la del apartado a), porque si α, β < ξ, tenemos que

α+ β ≤ maxα, β · 2 < ξ.

Por lo tanto ξ = ωδ. Ademas, si α, β < δ, entonces ωα, ωβ < ξ, luego se cumpletambien que ωα+β < ξ = ωδ, luego α + β < δ, luego δ = 0 ∨ δ = ωη por elapartado anterior. En el primer caso resulta el caso trivial ξ = 1.

c) Si ξ es un numero epsilon y α, β < ξ = ωξ, entonces existe un δ < ξ talque α < ωδ, luego

αβ < (ωδ)β = ωδβ < ωξ = ξ,

donde hemos usado que ξ = ωωξ

cumple el apartado b).

Recıprocamente, si ξ > 2 cumple la propiedad indicada, entonces cumple lapropiedad del apartado b), pues si α, β < ξ, entonces αβ ≤ maxα, β2 < ξ,luego en particular ξ = ωη. Si η = 0 queda ξ = 1, si η = 1 queda ξ = ω y siη > 1, como ω < ξ ∧ η ≤ ωη = ξ, por la hipotesis tiene que ser η = ωη = ξ,luego ξ = ωξ es un numero epsilon.

Notemos que un numero epsilon cumple de hecho los tres apartados delteorema anterior.

De este modo, ω2 es el menor ordinal que no puede expresarse en terminosde sumas de numeros naturales y ω. A su vez, ωω es el menor ordinal que nopuede expresarse en terminos de sumas y productos de numeros naturales y deω, mientras que ǫ0 es el menor ordinal que no puede expresarse en terminosde sumas, productos y potencias de numeros naturales y de ω. Dicho de otromodo, todos los ordinales que podemos construir mediante las tres operacionesaritmeticas a partir de los numeros naturales y ω son necesariamente menoresque ǫ0.

Teorema 2.58 Si α, β < ǫ0 son ordinales no nulos, entonces

o(α+ β) = o(αβ) = maxo(α), o(β).

Demostracion: Veamos por induccion sobre n que si α, β < ω(n) entonces

αβ < ω(n). Para n = 0 es trivial. Si vale para n y α, β < ω(n+1) = ωω(n)

,tenemos que existe un δ < ω(n) tal que α, β < ωδ, luego αβ < ωδ·2. Por hipotesisde induccion (si n > 0, pues entonces 2 < ω(n), y trivialmente si n = 0, pues

entonces δ = 0), tenemos que δ · 2 < ω(n), luego αβ < ωω(n)

= ω(n+1).

Page 83: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

2.7. La forma normal de Cantor 73

Ası pues, si o(α) = m, o(β) = n y r = maxm,n, tenemos que

ω(m) ≤ α < ω(m+1), ω(n) ≤ α < ω(n+1).

Entonces, por lo que acabamos de probar,

ω(r) ≤ α+ β ≤ maxα, β · 2 < ω(r+1), ω(r) ≤ αβ < ω(r+1),

luego o(α + β) = o(αβ) = r.

Por otra parte, ya hemos visto que o(ωα) = 1 + o(α). Tambien es obvio quesi α ≤ β < ǫ0, entonces o(α) ≤ o(β). Teniendo todo esto en cuenta es claro que,en las condiciones del teorema 2.55,

o(ωηiki) = o(ωηi) = 1 + o(ηi) ≤ 1 + o(η0),

luego o(α) = 1 + o(η0).

Por consiguiente, si tomamos un ordinal 0 < α < ǫ0 con o(α) = n y loexpresamos en forma normal de Cantor, sus exponentes tendran orden a losumo n− 1, luego pueden ponerse en forma normal de Cantor con exponentesde orden a lo sumo n−2, y ası, tras n pasos, habremos expresado α en terminosde un numero finito de numeros naturales, sumas, productos y potencias debase ω.

En resumen: los ordinales menores que ǫ0 son exactamente los ordinales quepueden construirse a partir de los numeros naturales y ω mediante sumas, pro-ductos y potencias, y cada uno de ellos se puede expresar mediante un numerofinito de sumas, productos y potencias de base ω. De hecho, la expresion esunica si exigimos que corresponda a una forma normal de Cantor, con exponen-tes desarrollados a su vez en forma normal de Cantor, y ası sucesivamente.

Esto ya no es cierto para ordinales mayores. Por ejemplo, la forma normalde Cantor de ǫ0 es ǫ0 = ωǫ0 , lo cual no dice mucho.

Supongamos que tenemos dos ordinales en forma normal de Cantor:

α = ωη0k0 + · · · + ωηnkn, α′ = ωη′0k′0 + · · · + ωη′

n′k′n′ .

Entonces ωη0 ≤ α < ωη0+1, ωη′0 ≤ α′ < ωη′

0+1, luego si η0 < η′0, y porconsiguiente η0 + 1 ≤ η′0, se cumple que α < α′. Supongamos, por el contrario,que η0 = η′0. Si k0 < k′0, entonces podemos descomponer α′ como

α′ = ωη0k0 + ωη′0(k′0 − k0) + · · · + ωη′

n′k′n′

y, como, segun acabamos de ver, η0 < η′1 implica que

ωη1k1 + · · · + ωηnkn < ωη′0(k′0 − k0) + · · · + ωη′

n′k′n′ ,

concluimos que α < α′ (aquı suponemos n > 0, pero si n = 0 se llega trivial-mente a la misma conclusion). En el supuesto de que η0 = η′0 y k0 = k′0, secumplira α < α′ si y solo si

ωη1k1 + · · · + ωηnkn < ωη′1k′1 + · · · + ωη′

n′k′n′ ,

donde cualquiera de los dos miembros puede ser 0.

Page 84: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

74 Capıtulo 2. Ordinales

En definitiva: para determinar cual de dos ordinales en forma normal deCantor es el menor, comparamos η0 y η′0, y el ordinal para el que este valorsea menor sera el menor. En caso de empate comparamos k0 y k′0, en casode empate pasamos a comparar η1 y η′1, y en caso de empate k1 y k′1. Si semantiene el empate hasta que una de las dos expresiones “se acaba”, dichaexpresion corresponde al ordinal menor. Si las dos se acabaran a la vez (sinhaber encontrado un desempate) es que las dos expresiones eran la misma,luego los ordinales eran iguales.

Ejercicio: Explicar como puede calcularse la suma y el producto de dos ordinales enforma normal de Cantor en funcion de los exponentes y coeficientes de los sumandos.

Page 85: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo III

La teorıa de conjuntos NBG

Presentamos ahora los dos axiomas que nos faltan para completar la teorıade conjuntos NBG: el axioma de regularidad y el axioma de eleccion. En granmedida, su papel consiste en estrechar la relacion entre la clase universal V y laclase Ω de todos los ordinales: el axioma de regularidad nos estructurara V enuna jerarquıa transfinita de conjuntos, mientras que el axioma de eleccion nospermitira enumerar con ordinales un conjunto arbitrario. Como paso previo ala discusion del axioma de regularidad dedicaremos una seccion a generalizarlos teoremas de induccion y recursion que hemos probado para ordinales al casode relaciones mucho mas generales que los buenos ordenes.

3.1 Relaciones bien fundadas

Aunque podrıamos trabajar en NBG∗, por comodidad, en esta seccion su-pondremos el axioma de infinitud. Las relaciones bien fundadas son la clase masgeneral de relaciones sobre las que es posible justificar argumentos de inducciony recursion:

Definicion 3.1 Una relacion R esta bien fundada en una clase A si

X(X ⊂ A ∧ X 6= ∅→∨

y ∈ X∧

z ∈ X ¬xR y).

En estas condiciones diremos que y es un elemento R-minimal de X .

Por ejemplo, si ≤ es un buen orden en una clase A, es claro que la relacionde orden estricto < esta bien fundada en A, pues si x es un subconjunto novacıo de A, el mınimo de x es un minimal para <.

Observemos tambien que A es una clase bien fundada en el sentido de ladefinicion 2.1 si y solo si la relacion de pertenencia E esta bien fundada en A,en el sentido que acabamos de introducir.

De la propia definicion se sigue un sencillo teorema de induccion, aunque noes el mas general que vamos a demostrar:

75

Page 86: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

76 Capıtulo 3. La teorıa de conjuntos NBG

Teorema 3.2 (Teorema general de induccion transfinita) Sea R una re-lacion bien fundada en una clase A y sea B una clase cualquiera. Entonces

x ∈ A(ARx ⊂ B → x ∈ B) → A ⊂ B.

Demostracion: Si no se cumple A ⊂ B, entonces A \ B es una subclaseno vacıa de A, luego tiene un R-minimal x, de modo que AR

x ⊂ B, pero x /∈ B,contradiccion.

Lo que afirma el teorema anterior es que para demostrar que todo elementox ∈ A tiene una propiedad (estar en B), podemos suponer como hipotesis deinduccion que todos los elementos de uRx la tienen.

Para manejar relaciones bien fundadas sobre clases propias vamos a necesitaruna propiedad adicional que se vuelve trivial si las clases son conjuntos:

Definicion 3.3 Una relacion R es conjuntista en una clase A si para todo x ∈ Ala clase de los anteriores de x

ARx = y ∈ A | y R x

es un conjunto.

Obviamente toda relacion es conjuntista en todo conjunto. La relacion depertenencia E es conjuntista en cualquier clase, pues AE

x = x ∩ A.Observemos que ya nos hemos encontrado con esta restriccion en una ocasion:

en el capıtulo anterior hemos demostrado que una clase propia bien ordenadaes semejante a Ω si y solo si su relacion de orden es conjuntista.

Definicion 3.4 Sea R una relacion definida sobre una clase A. Diremos queuna subclase B ⊂ A es R-A-transitiva si

xy ∈ A(x R y ∧ y ∈ B → x ∈ B).

Es decir, B es R-A-transitiva si cuando partimos de elementos de B y vamostomando anteriores nunca salimos de B. Las clases transitivas en el sentido dela definicion 2.1 son precisamente las clases E-V -transitivas.

Si R es una relacion definida sobre una clase A y x es un subconjunto de A,es claro que al considerar los anteriores de x y los anteriores de los anteriores,etc. obtenemos un conjunto R-A-transitivo. En realidad, para que la definicionrecurrente de este proceso sea correcta hemos de exigir que R sea conjuntista.Veamoslo con detalle:

Definicion 3.5 Sea R una relacion conjuntista en una clase A y x ∈ A. Elteorema de recursion nos da una aplicacion clRA(x)[ ] : ω −→ PA determinadapor1

clRA(x)[0] = ARx ∧

n ∈ ω clRA(x)[n + 1] =⋃

u∈clRA(x)[n]

ARu .

1Notemos que esta construccion requiere que la relacion sea conjuntista para que podamosasegurar que cada termino de la sucesion es un conjunto. Si no, la sucesion no estarıa biendefinida.

Page 87: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.1. Relaciones bien fundadas 77

A su vez definimos la clausura de x respecto de R en A como el conjunto

clRA(x) ≡ ⋃

n∈ωclRA(x)[n].

Ası ARx ⊂ clRA(x) ⊂ A.

Cuando E es la relacion de pertenencia y A = V, la clausura clEA(x) se conocecomo la clausura transitiva de x y se representa por ctx. Es claro que admiteuna definicion mas sencilla (puesto que ahora AE

x = x):

ct0x = x,∧

n ∈ ω ctn+1x =⋃

y∈ctnxy, ct x =

n∈ωctnx.

Ası, ct x esta formada por los elementos de x, los elementos de los elementosde x, etc.

Nuestra intencion al definir la clausura de un elemento era formar un con-junto R-A-transitivo. Vamos a ver que, efectivamente, ası es. Mas concreta-mente, clRA(x) es el menor conjunto R-A-transitivo que contiene a AR

x :

Teorema 3.6 Sea R una relacion conjuntista en una clase A y sea x ∈ A. Secumple

a) ARx ⊂ clRA(x).

b) clRA(x) es un conjunto R-A-transitivo.

c) Si ARx ⊂ T y T ⊂ A es una clase R-A-transitiva, entonces clRA(x) ⊂ T .

d) clRA(x) = ARx ∪ ⋃

y∈ARx

clRA(y).

Demostracion: Demostracion: a) ARx = clRA(x)[0] ⊂ clRA(x).

b) Supongamos que u, y ∈ A cumplen u R y ∧ y ∈ clRA(x). Entonces existeun n ∈ ω tal que y ∈ clRA(x)[n], con lo que u ∈ AR

y ⊂ clRA(x)[n + 1] ⊂ clRA(x).

c) Una simple induccion prueba que clRA(x)[n] ⊂ T . En efecto, para 0 lotenemos por hipotesis y, si vale para n, entonces todo u ∈ clRA(x)[n+ 1] cumpleu ∈ AR

y , para cierto y ∈ clRA(x)[n], con lo que u R y ∧ y ∈ T . Por transitividad

u ∈ T . Por definicion de clausura concluimos que clRA(x) ⊂ T .

d) Si y ∈ ARx , entonces AR

y ⊂ clRA(x)[1] ⊂ clRA(x), luego por b) y c) obtenemos

que clRA(y) ⊂ clRA(x). Por consiguiente el conjunto T = ARx ∪ ⋃

y∈ARx

clRA(y) estacontenido en clRA(x).

Para demostrar la otra inclusion basta probar T es transitivo y aplicar c).Sean, pues, u, v ∈ A tales que u R v ∧ v ∈ T . Si v ∈ clRA(y) para un y ∈ AR

x ,entonces, por la transitividad de la clausura u ∈ clRA(y), luego u ∈ T .

Si v ∈ ARx , entonces u ∈ clRA(v) ⊂ T .

Conviene observar la particularizacion de este teorema al caso de la relacionde pertenencia sobre la clase universal:

Page 88: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

78 Capıtulo 3. La teorıa de conjuntos NBG

Teorema 3.7 Sea x un conjunto arbitrario. Entonces

a) x ⊂ ct x.

b) ct x es un conjunto transitivo.

c) Si x ⊂ T y T es una clase transitiva, entonces ct x ⊂ T .

d) ct x = x ∪ ⋃

y∈xct y.

e) x es transitivo si y solo si x = ct x.

La ultima propiedad es consecuencia inmediata de las anteriores. Comoprimera aplicacion del concepto de clausura demostramos un resultado tecnico:

Teorema 3.8 Sea R una relacion conjuntista en una clase A. Entonces Resta bien fundada en A si y solo si todo subconjunto no vacıo de A tiene unR-minimal.

Demostracion: Una implicacion es obvia. Para la otra, suponemos quetodo subconjunto no vacıo tiene un R-minimal y hemos de probar que lo mismovale para toda subclase no vacıa B. Tomemos un x ∈ B. Si x no es ya un R-minimal de B, entonces existe un y ∈ B tal que yRx, luego y ∈ B∩ clRA(x), quees un subconjunto no vacıo de A. Por hipotesis tiene un R-minimal, digamos z.

Vamos a ver que z es un R-minimal de B. En efecto, si existiera un v ∈ Btal que v R z, entonces, por la transitividad de la clausura, v ∈ B ∩ clRA(x), peroesto contradice la minimalidad de z.

Esto implica que el concepto de relacion bien fundada es, pese a lo que enprincipio podrıa parecer, una formula normal (pues el cuantificador “para todasubclase no vacıa” puede sustituirse por “para todo subconjunto no vacıo”).

Con esto estamos en condiciones de demostrar el teorema de recursion. Enesencia afirma que para definir una funcion F : A −→ B, si en A tenemos defi-nida una relacion conjuntista y bien fundada, podemos definir F (x) suponiendoque F esta ya definida sobre los elementos de AR

x :

Teorema 3.9 (Teorema general de recursion transfinita) Sea R unarelacion conjuntista y bien fundada en una clase A y sea G : A × V −→ Buna aplicacion arbitraria. Entonces existe una unica funcion F : A −→ B talque

x ∈ AF (x) = G(x, F |ARx

).

Demostracion: Por abreviar, a lo largo de esta prueba, “transitivo” sig-nificara R-A-transitivo.

Si d ⊂ A es un conjunto transitivo, diremos que h : d −→ B es una d-aproximacion si

x ∈ d h(x) = G(x, h|ARx

).

Page 89: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.1. Relaciones bien fundadas 79

Para cada x ∈ A, definimos

x = x ∪ clRA(x).

Es claro que x es transitivo y x ∈ x (de hecho, es el menor conjunto transitivoque contiene a x). Dividimos la prueba en varios pasos:

1) Si h es una d-aproximacion y h′ es una d′-aproximacion, entonces secumple h|d∩d′ = h′|d∩d′ . En particular, para cada conjunto transitivo d ⊂ Aexiste a lo sumo una d-aproximacion.

Lo probamos por induccion en d ∩ d′, es decir, vamos a probar que todoelemento de d ∩ d′ esta en u ∈ d ∩ d′ | h(u) = h′(u). Para ello tomamosx ∈ d∩d′ y suponemos que h(u) = h(u′) siempre que u ∈ (d∩d′)Rx . Ahora bien,es inmediato que d∩d′ es transitivo, de donde se sigue que (d∩d′)Rx = AR

x . Porconsiguiente tenemos que h|AR

x= h′|AR

x, luego

h(x) = G(x, h|ARx

) = G(x, h′|ARx

) = h′(x).

2) Para todo x ∈ A existe una x-aproximacion.

Lo probamos por induccion sobre x, es decir, suponemos que para todou ∈ AR

x existe una u-aproximacion. Por 1) es unica, luego podemos definirhu ≡ h|h es una u-aproximacion. Definimos h =

u∈ARx

hu. De nuevo por 1)tenemos que h es una funcion y su dominio es

u∈ARx

u =⋃

u∈ARx

(u ∪ clRA(u)) = ARx ∪ ⋃

u∈ARx

clRA(u) = clRA(x),

donde hemos aplicado el teorema 3.6.Si v ∈ clRA(x), entonces h(v) = hu(v), para cierto u ∈ AR

x tal que v ∈ u.Puesto que hu ⊂ h y AR

v ⊂ u (por ser u transitivo) tenemos que hu|ARv

= h|ARv

.Como hu es una u-aproximacion,

h(v) = hu(v) = G(v, hu|ARv

) = G(v, h|ARv

),

con lo que h resulta ser una clRA(x)-aproximacion.Puede probarse que x /∈ clRA(x), pero no es necesario, en cualquier caso

podemos definirh′ = h ∪ (x,G(x, h|AR

x)),

de modo que h : x −→ V y es inmediato que para todo v ∈ x se cumpleh′|AR

v= h|AR

v, de donde se sigue claramente que h′ es una x-aproximacion.

3) Definimos F =⋃

x∈A

hx, donde hx ≡ h|h es una x-aproximacion.

La unicidad de 1) hace que F : A −→ B, y los mismos razonamientos quehemos aplicado a h en el paso anterior prueban que para todo x ∈ A se cumpleF (x) = G(x, F |AR

x).

4) La unicidad de F se prueba igual que 1)

Page 90: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

80 Capıtulo 3. La teorıa de conjuntos NBG

Como primera aplicacion de este teorema, dada una clase con una relacionconjuntista y bien fundada, vamos a asociar a cada uno de sus elementos unordinal que exprese su “altura” en la relacion, entendiendo que un elemento esmas alto cuantos mas elementos tiene por debajo.

Definicion 3.10 Sea R una relacion conjuntista y bien fundada en una clase A.Definimos rang : A −→ Ω como la unica aplicacion que cumple

x ∈ A rangRA(x) =⋃

y∈ARx

(rangRA(y) + 1),

donde estamos representando por α+ 1 el ordinal siguiente a α.

Observemos que hemos definido el rango de un elemento supuesto definidoel rango de los elementos anteriores a el. Mas concretamente, estamos aplicandoel teorema anterior a la funcion G : V −→ Ω dada por

G(z) =

y∈ARx

(s(y) + 1) si z = (x, s), con x ∈ A ∧ s : ARx −→ Ω,

0 en otro caso.

Recordemos que la union de un conjunto de ordinales no es mas que susupremo. Hemos de entender que el supremo del conjunto vacıo es 0 (lo cuales cierto, pues 0 es la menor cota superior de ∅). De este modo, los minimalesde A tienen todos rango 0 y, en general, el rango de un elemento es el mınimoordinal estrictamente mayor que los rangos de todos sus anteriores.

Teorema 3.11 Sea R una relacion conjuntista y bien fundada en una clase A.Sean x, y ∈ A. Si x ∈ clRA(y), entonces rangRA x < rangRA y.

Demostracion: Por induccion sobre y, es decir, suponemos que el resul-tado es cierto para todo u ∈ AR

y y suponemos que x ∈ clRA(y). Entonces hay dos

posibilidades, o bien x ∈ ARy , en cuyo caso rangRA(x) < rangRA(y) por definicion

de rango, o bien x ∈ clRA(u), para cierto u ∈ ARy . Entonces aplicamos la hipotesis

de induccion: rangRA(x) < rangRA(u) < rangRA(y).

Con la ayuda del rango podemos demostrar teoremas de induccion y re-cursion aun mas potentes. En el caso de la induccion, vamos a ver que podemostomar como hipotesis de induccion, no ya que todos los elementos anterioresa uno dado cumplen lo que queremos probar, sino que todos los elementos desu clausura lo cumplen (o sea, los anteriores, y los anteriores de los anteriores,etc.).

Teorema 3.12 (Teorema general de induccion transfinita) Sea R unarelacion conjuntista y bien fundada sobre una clase A y sea B una clase cual-quiera. Entonces

x ∈ A(clRA(x) ⊂ B → x ∈ B) → A ⊂ B.

Page 91: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.2. El axioma de regularidad 81

Demostracion: Si no se da la inclusion podemos tomar un x ∈ A \ B derango mınimo. Si u ∈ clRA(x), entonces rangRA u < rangRA x, luego por minima-lidad u ∈ B. Pero entonces la hipotesis nos da que x ∈ B, lo cual es absurdo.

Similarmente, para definir una funcion sobre x podemos suponer que estaya definida sobre clRA(x):

Teorema 3.13 (Teorema general de recursion transfinita) Sea R unarelacion conjuntista y bien fundada en una clase A y sea G : A × V −→ Buna aplicacion arbitraria. Entonces existe una unica funcion F : A −→ B talque

x ∈ AF (x) = G(x, F |clRA(x)).

La prueba de este teorema es identica a la de 3.9, salvo que el paso 1) y launicidad de F se demuestran usando la version fuerte del teorema general deinduccion transfinita en lugar de la debil.

Es claro que los teoremas que acabamos de probar generalizan a los quedemostramos en el capıtulo anterior para ordinales. Observemos que la relacionde pertenencia E es conjuntista y bien fundada en Ω. Ademas, como Ω estransitiva, las clases E-Ω-transitivas son simplemente las subclases transitivasde Ω y clEΩ(α) = α.

3.2 El axioma de regularidad

¿Puede existir un conjunto x con la propiedad de que x = x? Ciertamente,un conjunto ası contradice la idea intuitiva que tenemos de lo que es (o debe ser)un conjunto, pero lo cierto es que los axiomas que hemos considerado hasta ahorano contradicen que pueda existir un conjunto ası. El axioma de regularidad, quepresentaremos aquı, tiene como finalidad erradicar posibilidades “patologicas”como esta.

Pero no se trata de prohibir meramente la existencia de conjuntos que cum-plan x = x, pues con eso no impedirıamos que pudiera existir, por ejemplo,un conjunto x = y, con y 6= x, pero de modo que y = x. Una parejade conjuntos x = y, y = x no es menos patologica, pero es una patologıadistinta. Un tercer tipo de patologıa serıa la existencia de una sucesion de con-juntos xnn∈ω tal que

n ∈ ω xn = xn+1. Lo que tienen en comun estosejemplos es que todos ellos dan lugar a una sucesion decreciente

· · · ∈ x4 ∈ x3 ∈ x2 ∈ x1 ∈ x0.

En el primer ejemplo, todos los terminos de la sucesion serıan iguales a x, mien-tras que en el segundo alternarıan x e y. Y si tenemos una sucesion decrecientede este tipo, el conjuntoA = xn | n ∈ ω es un conjunto no vacıo sin ∈-minimal,pues ningun xn es ∈-minimal, ya que xn+1 ∈ A ∩ xn.

Page 92: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

82 Capıtulo 3. La teorıa de conjuntos NBG

Por consiguiente, una forma de librarnos de todas estas patologıas es tomarcomo axioma que todo conjunto esta bien fundado. Eso es, ciertamente, loque afirma el axioma de regularidad, pero antes de adoptar este axioma, paraformarnos una idea clara de lo que supone, vamos a trabajar sin el y vamosa estudiar una clase de conjuntos libres de patologıas como las que estamosconsiderando.

Como en la seccion anterior, trabajaremos en NBG∗ + AI.

Definicion 3.14 Un conjunto x es regular si su clausura transitiva ctx estabien fundada. Llamaremos R a la clase de los conjuntos regulares.

Observemos que no hubiera sido buena idea llamar conjuntos regulares a losconjuntos bien fundados. Por ejemplo, si x = y con y = x (pero y 6= x),entonces tanto x como y estan bien fundados, pero el problema se pone demanifiesto en ctx = ct y = x, y, que no esta bien fundada.

Vamos a cerciorarnos de que entre los conjuntos regulares no pueden darsepatologıas de las que estamos considerando. Empezamos probando sus propie-dades basicas:

Teorema 3.15 Se cumple:

a) R es una clase transitiva.

b) Ω ⊂ R, luego R es una clase propia.

c) La relacion de pertenencia esta bien fundada en R.

d) PR = R.

e)∧

A(R ∩ PA ⊂ A→ R ⊂ A).

En particular,∧

A(PA ⊂ A→ R ⊂ A).

Demostracion: a) Se trata de probar que los elementos de los conjuntosregulares son regulares. Supongamos que u ∈ v ∈ R. Entonces u ∈ ct v, luegou ⊂ ct v, luego u esta contenido en un conjunto transitivo y bien fundado, luegou ∈ R.

b) Todo ordinal es un conjunto transitivo y bien fundado, luego cumple ladefinicion de conjunto regular.

c) Sea A ⊂ R una clase no vacıa y tomemos y ∈ A. Si y∩A = ∅, entonces yes ya un ∈-minimal de A. En caso contrario, sea u ∈ y ∩A. Como y es regular,su clausura transitiva esta bien fundada. Definimos x = ct y ∩ A, que no esvacıo, pues u ∈ x. Como ct y esta bien fundada, x tiene un ∈-minimal u, quees tambien un ∈-minimal de A, ya que ciertamente u ∈ x ⊂ A y si v ∈ u ∩ Aentonces v ∈ u ∈ x ⊂ ct y, luego v ∈ ct y por la transitividad de ct y, luegov ∈ u ∩ x = ∅, contradiccion. Por lo tanto, u ∩ A = ∅.

d) La inclusion R ⊂ PR es equivalente a la transitividad de R. Si x ⊂ R,entonces para cada u ∈ x la clausura ctu esta bien fundada, luego ctu ∈ R,

Page 93: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.2. El axioma de regularidad 83

luego ctu ⊂ R. Por 3.7 d) tenemos que ctx ⊂ R, y esta clausura esta bienfundada por c), luego x ∈ R.

e) Si R no esta contenida en A, por c) existe un ∈-minimal u ∈ R \A, peroentonces u ∈ (R ∩ PA) \A.

Observemos que e) es un principio de induccion: si queremos probar que todoconjunto regular tiene una propiedad (pertenecer a la clase A) podemos tomarcomo hipotesis de induccion que todos los elementos de un conjunto regular xtienen la propiedad y demostrar a partir de ahı que x tambien la tiene.

En particular, sobre los conjuntos regulares esta definida la aplicacion rangodada por 3.10 (para la relacion de pertenencia E). Explıcitamente:

Definicion 3.16 La aplicacion rango es la aplicacion rang : R −→ Ω determi-nada por

rangx =⋃

y∈x(rang y + 1).

Para cada α ∈ Ω definimos la clase Rα = x ∈ R | rangx < α.

El teorema siguiente nos muestra que es R:

Teorema 3.17 R0 = ∅ ∧∧

α Rα+1 = PRα ∧∧

λ Rλ =⋃

δ<λ

Rδ,

R =⋃

α∈Ω

Rα.

Demostracion: La unica igualdad que no es trivial es Rα+1 = PRα. Six ∈ PRα, entonces x ⊂ Rα, luego

rang x =⋃

y∈x(rang y + 1) ≤ α < α+ 1,

luego x ∈ Rα+1. Recıprocamente, si x ∈ Rα+1, entonces todo y ∈ x cumplerang y+1 ≤ rang x < α+1, luego rang y < α, luego y ∈ Rα. Ası pues, x ⊂ Rα.

Hay que senalar que el miembro derecho de la igualdad

Rλ =⋃

δ<λ

no puede entenderse como la union de una familia de conjuntos Rδδ<λ, pueslas clases Rδ no tienen por que ser conjuntos. Hay que entender la igualdadcomo una forma comoda de expresar que

x(x ∈ Rλ ↔∨

δ < λ x ∈ Rδ),

y lo mismo vale para la igualdad del enunciado del teorema anterior. No obs-tante, si suponemos el axioma de partes (AP), entonces una induccion trivialprueba

α ctoRα, con lo que sı que podemos definir la sucesion transfinita de

Page 94: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

84 Capıtulo 3. La teorıa de conjuntos NBG

conjuntos Rαα∈Ω. De hecho, bajo AP podemos usar el teorema 3.17 comouna definicion alternativa de la clase R y del rango de un conjunto regular (quepuede definirse entonces como el menor α tal que x ⊂ Rα).

Como se muestra en el teorema siguiente, las clases Rα forman una sucesiontransfinita creciente de clases transitivas y en cada nivel aparecen nuevos con-juntos (al menos un ordinal) que no estan en los anteriores:

Teorema 3.18 Se cumple:

a) Si α ≤ β son ordinales, entonces Rα ⊂ Rβ.

b) Para cada ordinal α, la clase Rα es transitiva.

c) Para cada ordinal α, se cumple rangα = α, luego Rα ∩ Ω = α.

Demostracion: a) es trivial.

b) Si y ∈ x ∈ Rα, entonces rang y < rangx < α, luego y ∈ Rα.

c) Por induccion sobre α: si suponemos que rangβ = β para todo β < α,entonces

rangα =⋃

β<α

(rangβ + 1) =⋃

β<α

(β + 1) = α.

Ahora ya podemos presentar el axioma de regularidad en condiciones de quese pueda valorar su contenido:

Teorema 3.19 Las afirmaciones siguientes son equivalentes:

a)∧

x(cto x ∧ x 6= ∅→∨

u ∈ x u ∩ x = ∅).

b) Todo conjunto esta bien fundado.

c) Todo conjunto es regular, es decir, V = R.

Demostracion: La propiedad a) afirma que todo conjunto no vacıo tieneun ∈-minimal, y la propiedad b) es que todo subconjunto no vacıo de todoconjunto tiene un ∈-minimal. Es claro, pues, que a) ⇒ b). Tambien es obvioque si todo conjunto esta bien fundado, entonces la clausura transitiva de todoconjunto esta bien fundada, luego tenemos que b) ⇒ c). Por ultimo, si V = R,entonces la clase V esta bien fundada, luego todos sus subconjuntos (todos losconjuntos) no vacıos tienen ∈-minimal, luego c) ⇒ a).

Aunque normalmente se hace referencia a el como V = R, lo habitual estomar como axioma de regularidad la mas simple de estas afirmaciones, es decir:

Page 95: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.2. El axioma de regularidad 85

Axioma de regularidad (V=R)∧

x(cto x ∧ x 6= ∅→∨

u ∈ x u ∩ x = ∅).

Este axioma es el menos relevante de toda la teorıa de conjuntos. Ello sedebe a que todas las construcciones conjuntistas realizadas a partir de conjuntosregulares dan lugar a conjuntos regulares, hecho que se sigue inmediatamentede la propiedad PR = R.

Por ejemplo, si x, y ∈ R, entonces x, y ∈ PR = R, de donde a su vez(x, y) ∈ PR = R, luego si A y B son conjuntos regulares, A × B ∈ PR = R, ylo mismo vale para toda f : A −→ B, y (suponiendo AP) para el conjunto BA

de todas las aplicaciones de A en B, etc.Uniendo esto a que todos los ordinales son regulares, y en particular lo es el

conjunto de los numeros naturales, y teniendo en cuenta que todos los conjun-tos que los matematicos consideran habitualmente estan construidos mediantelas operaciones conjuntistas basicas que ya conocemos (uniones, intersecciones,productos cartesianos, conjuntos de partes, conjuntos de sucesiones o de fun-ciones de un conjunto en otro, etc.) partiendo en ultimo extremo del conjuntode los numeros naturales, resulta en definitiva que los matematicos trabajanexclusivamente con conjuntos regulares, independientemente de que la teorıa deconjuntos admita o no la existencia de conjuntos “patologicos”.

Por ello, postular que todo conjunto es regular no debe verse como unaafirmacion profunda sobre la naturaleza de los conjuntos, sino mas bien comoalgo analogo a lo que hace un algebrista cuando dice “solo voy a consideraranillos conmutativos y unitarios”, lo cual no signifique que niegue la existenciade anillos mas generales, sino que simplemente anuncia que no va a ocuparse deellos.

Ası pues, lo unico que hace el axioma de regularidad es restringir el alcancede la teorıa a los conjuntos que realmente nos van a interesar. Naturalmente,esto no contradice que alguien pueda considerar que los conjuntos no regulares,no solo no interesan, sino que son una perversion de la idea de conjunto y queal erradicarlos solo estamos aumentando la fidelidad de la nocion formal deconjunto a nuestra idea intuitiva de conjunto.

Cuando se asume el axioma de regularidad, es habitual escribir Vα ≡ Rα, demodo la clase universal queda estructurada en la jerarquıa transfinita crecientede clases transitivas (conjuntos si suponemos AP) dada por:

V0 = ∅ ∧∧

α Vα+1 = PVα ∧∧

λ Vλ =⋃

δ<λ

Vδ ∧ V =⋃

α∈Ω

Vα,

y ası todo conjunto puede pensarse como construido a partir de ∅ en una canti-dad transfinita de pasos, en el sentido de que si rastreamos sus elementos y loselementos de sus elementos, etc. siempre terminamos en ∅.

El rango esta entonces definido para todos los conjuntos, y es una medidade su complejidad, del numero de pasos que hay que dar para obtenerlo en lajerarquıa de los conjuntos regulares.

Si suponemos AP, tenemos una distincion clara entre los conjuntos y lasclases propias:

Page 96: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

86 Capıtulo 3. La teorıa de conjuntos NBG

Teorema 3.20 Una clase es propia si y solo si contiene conjuntos de rangoarbitrariamente grande.

Demostracion: Si todos los elementos de una clase X tienen rango menorque un ordinal α entonces X ⊂ Vα, luego X es un conjunto. Recıprocamente,si X es un conjunto, la imagen de X por la aplicacion rango es un subconjuntode Ω (por el axioma del reemplazo), luego esta acotado.

3.3 El axioma de eleccion

Consideremos la afirmacion siguiente:

Principio de elecciones dependientes (ED) Para todo conjunto A 6= ∅ ytoda relacion R ⊂ A × A tal que

a ∈ A∨

b ∈ A bRa, existe f : ω −→ A talque

n ∈ ω f(n+ 1)Rf(n).

Y consideremos la siguiente “demostracion”:

Como A no es vacıo, podemos tomar x0 ∈ A. Por hipotesis existe unx1 ∈ A tal que x1Rx0, por el mismo motivo, existe un x2 ∈ A talque x2 Rx1. Como este proceso puede prolongarse indefinidamente,concluimos que existe una sucesion xnn∈ω de elementos de A talque

n ∈ ω xn+1Rxn, pero tal sucesion no es sino una funcionf : ω −→ A que cumple lo requerido.

Cualquier matematico darıa esto por bueno, pero, si pretende ser una de-mostracion a partir de los axiomas que hemos considerado hasta ahora, lo ciertoes que no lo es. La existencia de la sucesion xnn∈ω no puede ser demostradaa partir del hecho de que R no esta bien fundada en A (no si tomamos comounica base admisible los axiomas que estamos considerando).

Para entender cual es el fallo, observemos que lo que se pretende es afirmarla existencia de una cierta funcion f : ω −→ A, una funcion con la propiedad deque

n ∈ ω f(n+ 1)Rf(n), pero ¿cual es esa funcion? ¿como y cuando hemosprobado su existencia?

Lo que hemos probado es que existe una funcion s1 : 2 −→ A tal ques1(1) ∈ s1(0), y luego hemos probado que puede extenderse hasta una funcions2 : 3 −→ A tal que s2(2) ∈ s2(1) ∈ s2(0), y de ahı hemos pasado a afirmardirectamente la existencia de f sin mas explicaciones. ¿Es posible justificar eseultimo paso?

Obviamente, ningun matematico aceptara que porque algo se cumpla para0, 1, 2 (en nuestro contexto, trivialmente para 0), se vaya a cumplir en general,pero no es extrano que los matematicos den saltos ası cuando son justificablespor argumentos inductivos. Ahora bien, en nuestro caso, si continuamos elargumento por induccion, lo que podemos demostrar sin dificultad es que

n∨

s(s : n+ 1 −→ A ∧∧

i < n s(i+ 1)Rs(i)).

Hasta aquı todo es correcto, pero ¿como se obtiene la existencia de f a partirde aquı?

Page 97: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.3. El axioma de eleccion 87

Un matematico podrıa decir: “para cada n ∈ ω, tomemos sn : n + 1 −→ Aen las condiciones indicadas”. Eso es admisible en la practica habitual delmatematico, pero no es una consecuencia logica de los axiomas que hemos vistohasta el momento. Una cosa es que, fijado un n, la logica nos dice que podemoseliminar los cuantificadores y considerar un s que cumpla lo indicado, e inclusoque podemos llamarlo sn si preferimos llamarlo ası, pero otra cosa muy distinta,y que esta implıcita en lo que entiende el matematico al “tomar sn”, es afirmarla existencia de una funcion s que a cada n le asigne una sucesion finita sn. Laexistencia de semejante funcion s no es una consecuencia de eliminar un par decuantificadores, es una afirmacion sobre la existencia de un conjunto que tendrıaque ser respaldada por algun axioma que justifique la existencia de tal conjunto.Y, aun suponiendo que tuvieramos a nuestra disposicion tal funcion s, nada nosgarantiza que cada sn+1 fuera una extension de sn, cosa que nos harıa falta siquisieramos definir f a partir de s.

Si el lector se convence de que por ahı no hay salida, tal vez pase a considerarla posibilidad de que f pueda definirse por recursion: fijamos x0 ∈ A y aplicamosel teorema 2.22 para concluir que existe una funcion f : ω −→ A tal quef(0) = x0 y, para cada n ∈ ω, f(n + 1) es cualquier elemento de A tal quef(n+ 1)Rf(n), que existe por hipotesis.

Tenemos aquı una aplicacion incorrecta del teorema de recursion, pues esteexige que f(n) = G(f |n), para una cierta funcion G, definida en este caso sobreel conjunto Xω ≡ s |

n ∈ ω s : n −→ A pero ¿cual es en nuestro caso lafuncion G? Deberıa ser algo ası como

G(s) =

x0 si Ds = ∅,x si Ds = n+ 1 ∧ x ∈ A ∧ xR s(n),

pero esto no es una definicion aceptable de una funcion. La unica forma acep-table de definir una clase es mediante el axioma de comprension. Habrıa queexpresar G en la forma G = z | φ(z), para una cierta propiedad normal φ(z)o, si se prefiere, usando los convenios de notacion que hemos establecido,

G = (s, x) ∈ Xω ×A | φ(s, x),

pero esto no es posible (y no por culpa del requisito de normalidad, que no afectaaquı para nada, pues tratamos unicamente con conjuntos). El planteamientodeberıa ser algo ası como:

G = (s, x) ∈ Xω ×A |∨

m ∈ ω(s : m −→ A ∧

((m = 0 ∧ x = x0) ∨ (∨

n ∈ ω(m = n+ 1 ∧ xR s(n)))),pero esto no define necesariamente una funcion, pues para un mismo s ∈ Xω,nada impide que haya varios x ∈ A que cumplan la condicion requerida paraque (s, x) ∈ G, y entonces s no tiene una unica imagen.

El problema es que, aunque tengamos garantizado que existe un x que cum-ple una condicion (en este caso xR s(n)), la logica permite formalizar la idea

Page 98: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

88 Capıtulo 3. La teorıa de conjuntos NBG

de “tomar uno de ellos” para razonar con el, pero no permite formalizar la ideade “tomar uno cualquiera, pero solo uno”, que es lo que necesitarıamos paradefinir G y, a la larga, para construir f .

Esto no significa que los intentos de razonamiento que hemos expuesto estenmal en terminos absolutos, sino que requieren un axioma mas, el llamado axiomade eleccion, el cual, junto con los otros axiomas que hemos discutido hasta aquı,completa la teorıa NBG. En nuestro caso concreto, para llevar a buen puertonuestros intentos de construir f , solo necesitamos una funcion E : PA −→ Acon la propiedad de que

X(X ⊂ A ∧ X 6= ∅→ E(X) ∈ X),

es decir, una funcion que elija un elemento de cada subconjunto no vacıo de A.La funcion E resuelve todos nuestros problemas, pues ahora podemos definir

f(0) = x0 ∧∧

n ∈ ω f(n+ 1) = E(x ∈ A | xR f(n)),

que es una aplicacion legıtima del teorema de recursion, correspondiente a lafuncion

G(s) =

x0 si Ds = ∅,E(x ∈ A | xR s(n)) si Ds = n+ 1,

que, si se quiere, se puede expresar sin dificultad como una clase definida deacuerdo con el axioma de comprension.

En general, el enunciado del axioma de eleccion es como sigue:

Axioma de eleccion (AE)

X(ctoX →∨

f(f : X −→ V ∧∧

u ∈ X(u 6= ∅→ f(u) ∈ u)).

Ası, AE afirma que, dado cualquier conjunto X , existe una funcion que acada elemento u ∈ X no vacıo le elige uno de sus elementos. A una funcion deestas caracterısticas se la llama una funcion de eleccion sobre X .

Observemos que no siempre es necesario apelar al axioma de eleccion paraobtener una funcion de eleccion. Por ejemplo, imaginemos que restringimosel problema que hemos planteado al principio de esta seccion a una relacion Rdefinida sobre A = ω. Entonces podemos demostrar la existencia de una funcionde eleccion tomando, por ejemplo,

E(X) =

∅ si X = ∅,

mınX si X 6= ∅,

y la existencia de la sucesion xnn∈ω puede justificarse, por consiguiente, sinnecesidad de AE.

Ası pues, el axioma de eleccion solo es necesario para garantizar la existen-cia de funciones de eleccion en ausencia de un criterio explıcito que permitaconstruir una. Las situaciones en las que carecemos de tal criterio son muy

Page 99: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.3. El axioma de eleccion 89

frecuentes. Ya hemos visto una: si partimos de una relacion R en una clase Ay sabemos que para cada a ∈ A el conjunto AR

a = b ∈ A | bR a no es vacıo,ello no nos da un criterio para elegir uno de sus elementos para cada x ∈ A, ynecesitamos recurrir al axioma de eleccion.

En definitiva, el axioma de comprension y el axioma de eleccion son losunicos axiomas de NBG que permiten probar la existencia de una clase con unascaracterısticas determinadas (los demas axiomas, salvo el de extensionalidad,que no es un axioma existencial, se limitan a afirmar que ciertas clases dadasde antemano son conjuntos).

Teniendo en cuenta estas consideraciones, el ejemplo que hemos discutido setraduce finalmente en el teorema siguiente (en el que hemos modificado ligera-mente el argumento para evitar el uso de AP):

Teorema 3.21 (AI) AE → ED.

Demostracion: Consideremos un conjunto A y una relacion R en las con-diciones de ED. Consideremos el conjunto X = AR

a | a ∈ A que, por hipotesis,es una familia de conjuntos no vacıos. Sea f : X −→ A una funcion de elecciony sea g : A −→ A la funcion dada por g(a) = f(AR

a ). De este modo se cumpleque

a ∈ A (g(a) ∈ A ∧ g(a)Ra).Ahora fijamos un a0 ∈ A y definimos por recurrencia una funcion x : ω −→ A

mediante x0 = a0 ∧ xn+1 = g(xn). Es claro que la sucesion xnn∈ω cumple lorequerido.

Como ya hemos explicado en la discusion previa a este teorema, no hay queconfundir el uso del axioma de eleccion con la eliminacion de un cuantificadorexistencial. En las paginas precedentes hemos tenido incontables ocasiones depasar de una premisa del tipo

x x ∈ A a elegir un x ∈ A para razonar conel, y no importa que no tengamos ningun criterio especıfico para seleccionar unelemento de A en concreto, que ello no supone el uso del axioma de eleccion(ni del axioma de comprension), sino que es una mera consecuencia logica dela premisa: estamos usando la existencia de un x ∈ A y la premisa afirmabaprecisamente la existencia de un x en A. En cambio, si tenemos una familiaXii∈I de conjuntos no vacıos, esto significa que

i ∈ I∨

x x ∈ Xi, y de aquıno podemos pasar a considerar una sucesion xii∈I tal que

i ∈ I xi ∈ Xi

sin recurrir al axioma de comprension (si tenemos algun criterio explıcito paraseleccionar un elemento de cada Xi) o al axioma de eleccion (si no lo tenemos),pues la conclusion va mas alla de lo contenido en la premisa: partimos de laexistencia de conjuntos en cada Xi y pretendemos concluir la existencia de unconjunto que no es ninguno de los conjuntos cuya existencia se postula, sino unaaplicacion x : I −→ ⋃

i∈I

Xi.

No obstante, a partir del hecho de que podemos eliminar cuantificadoresexistenciales, podemos probar un caso particular del axioma de eleccion inclusoen ausencia de criterios para realizar las elecciones. Se trata de que todo con-junto finito siempre admite una funcion de eleccion. Estudiaremos los conjuntos

Page 100: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

90 Capıtulo 3. La teorıa de conjuntos NBG

finitos en el capıtulo siguiente, pero para probar esto solo necesitamos la meradefinicion (y anticipamos tambien, de paso, la de conjunto numerable):

Definicion 3.22 Un conjunto x es finito si∨

n ∈ ω∨

f f : n −→ x biyectiva).Diremos2 que x es numerable si es finito o bien

f f : ω −→ x biyectiva.

Ası pues, un conjunto es finito si sus elementos se pueden “contar”, es decir,que se pueden emparejar con los elementos de un numero natural.3 Los conjun-tos numerables son los que se pueden “contar” a expensas de agotar todos losnumeros naturales en el proceso de computo.

Teorema 3.23 Todo conjunto finito tiene una funcion de eleccion.

Demostracion: Basta probar, por induccion sobre n, que∧

x(∨

f f : n −→ x biyectiva → x tiene una funcion de eleccion).

En efecto, para n = 0 tenemos que x = ∅ y h = ∅ es trivialmente una funcionde eleccion en x. Si es cierto para n, supongamos que f : n+ 1 −→ x biyectiva,sea u = f(n) y x′ = f [n]. Es claro entonces que f |n : n −→ x′ biyectiva, luegopor hipotesis de induccion existe una funcion de eleccion h : x′ −→ V . Si u 6= ∅,tomamos v ∈ u, y si u = ∅ tomamos v = ∅. Es claro entonces que h ∪ (u, v)es una funcion de eleccion sobre x.

En cambio, no es posible demostrar sin el axioma de eleccion que todo con-junto numerable tiene una funcion de eleccion. Sin embargo, para una gran partede las matematicas que requieren el axioma de eleccion basta con el siguientecaso particular:

Axioma de eleccion numerable (AEN) Todo conjunto numerable tieneuna funcion de eleccion.

O a lo sumo con el principio de elecciones dependientes ED, que es ligera-mente mas fuerte, como se ve en el teorema siguiente:

Teorema 3.24 (AI, AP) ED → AEN.

Demostracion: Sea X = xn | n < ω un conjunto numerable y sea Ael conjunto de las funciones de eleccion sobre conjuntos Xm = xn | n < m,es decir, f ∈ A si y solo si existe un m ∈ ω tal que f : Xm −→ ∅ ∪ ⋃

n<mxn

cumple que∧

n < m(xn 6= ∅→ f(xn) ∈ xn).

Claramente A 6= ∅ y podemos definir en A la relacion dada por f R g siy solo si g f . Ası A y R cumplen las hipotesis de ED, pues si g ∈ A y

2No es infrecuente que se defina un conjunto numerable como un conjunto biyectablecon ω (excluyendo ası los conjuntos finitos). Segun la definicion que estamos adoptando, talesconjuntos seran para nosotros los conjuntos infinitos numerables.

3Notemos que estamos empleando una alteracion tecnica intrascendente de lo que normal-mente se entiende por “contar”. Cuando decimos que un conjunto X tiene 3 elementos esporque hemos numerado sus elementos como x1, x2 y x3, mientras que, para justificar quecumple literalmente la definicion que hemos dado, necesitamos una biyeccion f : 3 −→ X, loque supone contar sus elementos como x0, x1 y x2.

Page 101: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.3. El axioma de eleccion 91

Df = xn | n < m, si xm 6= ∅ tomamos un u ∈ xm, y en caso contrariotomamos u = ∅, de modo que f = g ∪ (xm, u) cumple f ∈ A ∧ f R g. PorED existe una sucesion fnn<ω de elementos de A de modo que

n < ω(fn ∈ A ∧ fn fn+1).

Es claro entonces que f =⋃

n∈ωfn : X −→ V y es una funcion de eleccion

sobre X .

Nota Observemos que ED no puede probarse4 a partir de AEN, pues en laprueba de ED a partir de AE hemos necesitado una funcion de eleccion sobre elconjunto de todos los conjuntos de la forma AR

a , que no es necesariamente nume-rable. Al final, lo que proporciona ED es una cantidad numerable de elecciones,al igual que AEN, pero las elecciones de ED son “dependientes” en el sentido deque se elige xn+1 en funcion de cual es el xn elegido previamente (mas precisa-mente, elegimos xn+1 en el conjunto AR

xn, que depende de la eleccion anterior),

mientras que AEN solo proporciona una cantidad numerable de elecciones in-dependientes (fijamos un conjunto numerable y elegimos un elemento de cadauno de sus elementos, sin tener en cuenta cual hemos elegido en otro cualquierade ellos).

Otra consecuencia de ED (luego de AE) que no puede probarse a partir deAEN es esta caracterizacion de las relaciones bien fundadas:

Teorema 3.25 (AI, ED) Una relacion R esta en un conjunto A esta bienfundada si y solo si no existe ninguna sucesion xnn∈ω de elementos de A talque

n ∈ ω xn+1Rxn.

Demostracion: Una implicacion es inmediata y no requiere ninguna formade AE: si existe tal sucesion, entonces el conjunto B = xn | n ∈ ω es unsubconjunto no vacıo de A que no tiene R-minimal, luego la relacion no estabien fundada.

Supongamos ahora que la relacion R no esta bien fundada, con lo que existeun B ⊂ A no vacıo sin R-minimal. Esto quiere decir que si x ∈ B, al no serR-minimal existe un y ∈ B tal que y R x, pero esto significa que B y R cumplenlas hipotesis de ED, luego existe una sucesion xnn∈ω de elementos de B (luegode A) que cumple la condicion del enunciado.

Hay un resultado que parece muy elemental, pero en realidad requiere elaxioma de eleccion:

Teorema 3.26 (AE) Sean x e y dos conjuntos no vacıos. Existe f : x −→ yinyectiva si y solo si existe g : y −→ x suprayectiva.

4No estamos aquı en condiciones de justificar ningun resultado negativo de este tipo. Estanota solo pretende explicar por que es imposible, sin probarlo realmente

Page 102: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

92 Capıtulo 3. La teorıa de conjuntos NBG

Demostracion: Supongamos que existe f : x −→ y inyectiva y veamoscomo construir la aplicacion g. Esta implicacion no requiere el axioma deeleccion, pues basta tomar un u ∈ x y definir

g(v) =

f−1(v) si v ∈ f [x],u si v ∈ y \ f [x].

Es claro entonces que g es suprayectiva. Mas aun, es claro que f g = Ix,luego la suprayectividad de g es consecuencia del teorema 1.14.

Supongamos ahora que g : y −→ x suprayectiva y sea

X = g−1[u] | u ∈ x,

que es un conjunto por reemplazo (la aplicacion x −→ X dada por u 7→ g−1[u]es suprayectiva). Por el axioma de eleccion, existe una funcion de eleccionE : X −→ V . Definimos f : x −→ y mediante f(u) = E(g−1[u]). De este modo,para cada u ∈ x tenemos que f(u) ∈ g−1[u], luego g(f(u)) = u, luego f g = Ixy de nuevo 1.14 implica que f es inyectiva.

Notemos que el teorema anterior no requiere el axioma de eleccion si supo-nemos que existe un buen orden en y (lo que sucede, por ejemplo, si y = ω),pues entonces podemos definir la funcion de eleccion como E(a) = mın a, paratodo a ∈ X , pues se cumple que a ⊂ y.

Si al teorema anterior le anadimos la condicion f g = Ix que hemos obtenidoen la prueba, tenemos de hecho una equivalencia con el axioma de eleccion. Laprobamos a continuacion junto con otras mas:

Teorema 3.27 Las afirmaciones siguientes son equivalentes:

a) AE

b) Si g : y −→ x es una aplicacion suprayectiva, existe f : x −→ y tal quef g = Ix.

c) Para toda familia Xii∈I de conjuntos no vacıos (donde I es un conjunto)existe otra familia sii∈I tal que

i ∈ I si ∈ xi.

d) Para todo conjunto X formado por conjuntos no vacıos disjuntos dos ados, existe un conjunto a ⊂

⋃X tal que

u ∈ X∨

v u ∩ a = v.

Demostracion: a) ⇒ b) se sigue de la demostracion del teorema anterior.

b) ⇒ c) Consideremos la aplicacion g :⋃

i∈I

i×Xi −→ I dada por g(i, u) = i.

Como los conjuntos Xi son no vacıos, tenemos que g es suprayectiva. Seaf : I −→ ⋃

i∈I

(i ×Xi) segun b), es decir, tal que, para cada i ∈ I, se cumple

que f(i) = (i, v), para cierto v ∈ Xi. Basta tomar s = Rf .

c) ⇒ d) Podemos ver a X como una familia ii∈X de conjuntos no vacıos.Por c) existe sii∈X tal que

i ∈ X si ∈ i. Basta tomar a = Rs.

Page 103: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.3. El axioma de eleccion 93

d) ⇒ a) Dado un conjunto X , no perdemos generalidad si suponemos que nocontiene a ∅. El conjunto X ′ = i× i | i ∈ X esta formado por conjuntos novacıos disjuntos dos a dos. Por d) existe un conjunto f que contiene exactamenteun elemento de cada uno de ellos. Es claro que f es una funcion de eleccionsobre X .

Nota La familia sii∈I no es mas que un elemento del producto cartesiano

i∈I

Xi ≡ s | s : I −→⋃

i∈I

Xi ∧∧

i ∈ I si ∈ Xi,

por lo que AE resulta ser equivalente a que el producto cartesiano de una familiade conjuntos no vacıos es no vacıo.

El axioma de eleccion interviene de forma esencial en la demostracion denumerosos teoremas importantes del algebra, el analisis o la topologıa (paraprobar la existencia de base en todo espacio vectorial, la existencia de idealesmaximales en anillos unitarios, la existencia de clausuras algebraicas, el teoremade Tychonoff, el teorema de Hann-Banach, etc.) En la prueba de estos resultadosy otros muchos, es mucho mas practico utilizar una forma equivalente, un tantotecnica, conocida como lema de Zorn:

Una cadena en un conjunto parcialmente ordenado X es un subconjuntoX ⊂ X para el que se cumpla

uv ∈ C(u ≤ v ∨ v ≤ u). Una cota superior paraun conjunto C ⊂ X es un u ∈ X tal que

v ∈ C v ≤ u. Un elemento maximalen X es un m ∈ X tal que ¬

u ∈ X m < u. El teorema siguiente contieneel enunciado del lema de Zorn junto con otras afirmaciones equivalentes menostecnicas:

Teorema 3.28 (AP) Las afirmaciones siguientes son equivalentes:

a) Axioma de eleccion Todo conjunto tiene una funcion de eleccion.

b) Principio de numerabilidad Todo conjunto puede biyectarse con unordinal.

c) Principio de buena ordenacion Todo conjunto puede ser bien orde-nado.

d) Lema de Zorn Todo conjunto parcialmente ordenado no vacıo en el quetoda cadena tenga una cota superior tiene un elemento maximal.

e) Lema de Zorn (variante) En todo conjunto parcialmente ordenado novacıo en el que toda cadena tenga una cota superior, cada elemento estapor debajo de un elemento maximal.

Demostracion: a) ⇒ b) Supongamos que un conjunto x no puede bi-yectarse con ningun ordinal. En particular tenemos que x 6= ∅. Fijemos una

Page 104: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

94 Capıtulo 3. La teorıa de conjuntos NBG

funcion de eleccion f : Px −→ x. El teorema de recursion 2.22 nos da unafuncion F : Ω −→ x tal que

α ∈ Ω F (α) = f(x \ F [α]).

Veamos por induccion sobre α que F |α : α −→ x inyectiva.

Si α = 0 es trivial. Si es cierto para α, entonces F [α] 6= x, porque estamossuponiendo que x no puede biyectarse con un ordinal. Entonces, puesto quex \ F [α] 6= ∅, tenemos que F (α) = f(x \ F [α]) ∈ x \ F [α], de donde se sigueclaramente que F |α+1 es inyectiva.

Si λ es un ordinal lımite y F |α es inyectiva para todo α < λ, entonces esclaro que F |λ es inyectiva, pues si δ < ǫ < λ, tambien δ < ǫ < ǫ + 1 < λ, y lainyectividad de F |ǫ+1 implica que F (δ) 6= F (ǫ).

A su vez esto implica que F : Ω −→ x inyectiva, pero esto es imposible, puesentonces F [Ω] ⊂ x serıa un conjunto y por reemplazo tambien lo serıa Ω.

b) ⇒ c) es inmediato: dado un conjunto x, tomamos un ordinal α y unabiyeccion f : x −→ α y definimos la relacion en x dada por u ≤ v ↔ f(u) ≤ f(v).Es inmediato comprobar que se trata de un buen orden en x.

c) ⇒ e) Sea (x,≤) un conjunto en las hipotesis del lema de Zorn y fijemosun u0 ∈ x. Hemos de encontrar un elemento maximal m ∈ x tal que u0 ≤ m.Para ello suponemos que no existe tal elemento maximal, es decir, que si u0 ≤ v,siempre existe un v′ ∈ x tal que v < v′.

Como consecuencia, si c ⊂ x es una cadena tal que u0 ∈ c, existe un v ∈ xtal que

u ∈ c u < v. En efecto, estamos suponiendo que la cadena tiene cotasuperior, es decir, que existe un v ∈ x tal que

u ∈ c u ≤ v. En particular,u0 ≤ v, luego, segun acabamos de indicar, existe un v′ ∈ x tal que v < v′, y estev′ cumple lo pedido.

De acuerdo con c), fijamos un buen orden (x,E) en el conjunto x. Conside-ramos la funcion G : V −→ x dada por G(s) = v si y solo si Rs es una cadenaen x que contiene a u0 y entonces v es el mınimo respecto de la relacion E delconjunto v ∈ x |

u ∈ Rs u < v, o bien v = u0 en cualquier otro caso.

El teorema de recursion 2.22 nos da una funcion F : Ω −→ x determinadapor la condicion F (α) = G(F |α). Como RF |0 = ∅ no contiene a u0, la definicionde G nos da que F (0) = u0.

Veamos por induccion sobre α que∧

δ < α F (δ) < F (α).

Suponemos que el resultado es cierto para todo α < β, y podemos suponerque β > 0, pues en caso contrario no hay nada que probar. Tenemos, pues,que si δ < α < β, entonces F (δ) < F (α), lo que implica que R(F |β) = F [β]es una cadena en x que contiene a F (0) = u0. Por lo tanto, por definicion deG, tenemos que F (β) cumple

u ∈ F [β] u < F (β), pero esto es justo lo quetenıamos que probar.

Page 105: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

3.3. El axioma de eleccion 95

Consecuentemente tenemos que F : Ω −→ x inyectiva, pero eso es imposible,porque entonces F [Ω] ⊂ x serıa un conjunto y por reemplazo Ω tambien.

e) ⇒ d) es trivial.

d) ⇒ a) Fijemos un conjunto x, que podemos suponer no vacıo y tal que∅ /∈ x, y sea

y = p ∈ P(x×⋃x) |

a(a ⊂ x ∧ p : a −→ ⋃x ∧

u ∈ a(u 6= ∅→ p(u) ∈ u))

el conjunto de las funciones de eleccion sobre subconjuntos de x. Notemos que∅ ∈ y, luego y 6= ∅. Consideramos en y el orden parcial dado por la inclusion.Es claro que si c ⊂ y es una cadena, entonces tiene por cota superior a

⋃c,

luego el lema de Zorn nos da un f : a −→ ⋃x en y maximal respecto de la

inclusion. Basta probar que a = x, pues entonces f es una funcion de eleccionsobre x.

En caso contrario, tomamos u ∈ x\a y v ∈ u (lo cual es posible, pues estamossuponiendo que ∅ /∈ x). Es claro entonces que f ∪ (u, v) ∈ y y contradice lamaximalidad de f . Ası pues, a = x.

El principio de numerabilidad afirma que los ordinales bastan para “contar”cualquier conjunto, es decir, que todo conjunto se puede poner en la formaxαα<β, para cierto ordinal β.

De la demostracion del teorema anterior se sigue, mas concretamente, queun conjunto x admite un buen orden si y solo si Px admite una funcion deeleccion. Una implicacion es trivial, pues un buen orden en x permite definiruna funcion de eleccion en Px mediante

E(u) =

mınu si u 6= ∅,∅ si u = ∅.

Ahora disponemos ya de todos los axiomas de NBG, lo cual significa en lapractica que todo teorema que podamos encontrar en cualquier libro de algebra,analisis, topologıa, etc. puede probarse a partir de los axiomas que hemos pre-sentado. Ocasionalmente se demuestran teoremas partiendo de axiomas masfuertes, pero en tales casos siempre se indica explıcitamente cuales son dichosaxiomas adicionales.

Terminamos con una aplicacion del lema de Zorn:

Teorema 3.29 (AP, AE) Si A es un anillo conmutativo y unitario, e I Aes un ideal, existe un ideal maximal M tal que I ⊂M A.

Demostracion: Sea M el conjunto de todos los ideales5 de A distintos de A.Consideramos en M el orden dado por la inclusion. De la propia definicion deideal maximal se sigue que un ideal maximal de A es simplemente un elementomaximal de M, luego basta probar que M cumple las hipotesis del lema de Zorn.Ciertamente, M 6= ∅, pues 0 ∈ M (notemos que 0 ⊂ I A). Si C ⊂ M

5Se cumple que M es un conjunto porque M ⊂ PA, y estamos suponiendo AP.

Page 106: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

96 Capıtulo 3. La teorıa de conjuntos NBG

es una cadena (que podemos suponer no vacıa), es facil ver que I =⋃C es un

ideal de A.En efecto:

a) Si J ∈ C, tenemos que 0 ∈ J ⊂ I.

b) Si x, y ∈ I, entonces existen J1, J2 ∈ C tales que x ∈ J1, y ∈ J2. ComoC es una cadena existe un J ∈ C tal que J1, J2 ⊂ J , luego x, y ∈ J , luegox+ y ∈ J ⊂ I.

c) Si x ∈ I, a ∈ A, existe un J ∈ C tal que x ∈ J , luego ax ∈ J ⊂ C.

Ademas I 6= A, pues en caso contrario 1 ∈ I, luego existe un J ∈ C tal que1 ∈ J , luego J = A, en contradiccion con que J ∈ M. Esto implica que I ∈ M

y es claramente una cota superior de C.

Page 107: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo IV

Cardinales

Uno de los resultados mas impactantes de la teorıa de conjuntos de Cantor esque permite extender la nocion de cardinal o “numero de elementos” a conjuntosarbitrarios, no necesariamente finitos, de modo que, al igual que hay conjuntosfinitos con mas o con menos elementos, lo mismo sucede con los conjuntosinfinitos, que los hay mas grandes y mas pequenos. Dedicamos este capıtulo adesarrollar esas ideas. En general trabajaremos en NBG − AE e indicaremosexplıcitamente los resultados que dependen del axioma de eleccion. No obstante,cabe senalar que los resultados de la primera seccion se demuestran en NBG∗.

4.1 Equipotencia

La idea basica subyacente a toda la teorıa de cardinales es que podemos decirque dos conjuntos X e Y tienen el mismo numero de elementos si podemosemparejar cada elemento de X con un elemento distinto de Y , sin que falteni sobre ninguno, pero esto se corresponde simplemente con el concepto debiyeccion:

Definicion 4.1 Diremos que dos conjuntos X e Y son equipotentes, y lo re-

presentaremos por X = Y , si existe una aplicacion f : X −→ Y biyectiva.

Diremos que X es minuspotente a Y , y lo representaremos por X ≤ Y , si existef : X −→ Y inyectiva. Diremos que X es estrictamente minuspotente a Y , en

signos X < Y , si X ≤ Y y no X = Y .

Observaciones Debemos recordar en todo momento que el signo = que apa-

rece en la expresion X = Y no es realmente un signo igual, sino que esta ex-presion no es sino una forma comoda de indicar que se cumple “

f f : X −→ Ybiyectiva”, y aquı no hay ningun igual.

La notacion se remonta a Cantor. Si X es un conjunto ordenado, Cantorrepresentaba por X su ordinal, es decir, el concepto resultante de abstraer la

naturaleza de los elementos de X pero conservando su ordenacion, y por X su

97

Page 108: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

98 Capıtulo 4. Cardinales

cardinal, su numero de elementos, es decir, el resultado de abstraer tanto lanaturaleza de sus elementos como su ordenacion.

De este modo, con X = Y pretendemos expresar que “el cardinal de X”es igual a “el cardinal de Y ”, pero, insistimos, es fundamental tener presenteque, de momento, no hemos definido ningun objeto (clase o conjunto) al que

llamar X . Nos ocuparemos de ello en la seccion siguiente, pero, de momento,

la notacion X solo tiene sentido como parte inseparable las expresiones queacabamos de definir.

Observemos que suponiendo AE el teorema 3.26 nos da que, para conjuntos

no vacıos, X ≤ Y ↔∨

g g : Y −→ X suprayectiva, pero en esta seccion novamos a necesitar este hecho.

El teorema siguiente justifica que las definiciones que hemos dado contienenrealmente una nocion razonable de “numero de elementos” de un conjunto. Ob-servemos que las tres primeras implican que la equipotencia define una relacionde equivalencia sobre la clase universal V .

Teorema 4.2 Sean X, Y , Z, W conjuntos cualesquiera. Se cumple:

a) X = X,

b) X = Y si y solo si Y = X,

c) Si X = Y y Y = Z, entonces X = Z,

d) X ≤ X,

e) Si X ≤ Y y Y ≤ X, entonces X = Y ,

f) Si X ≤ Y y Y ≤ Z, entonces X ≤ Z,

g) Si X = Y y Z = W , entonces X ≤ Z si y solo si Y ≤W .

Todas estas propiedades excepto e) son consecuencias inmediatas de los he-chos basicos sobre aplicaciones entre conjuntos. Debemos insistir en que nodeben confundirse, pese a la notacion, con teoremas logicos. Por ejemplo, b)no se cumple por la simetrıa de la igualdad, ya que, como hemos indicado, larelacion involucrada no es la igualdad, sino la equipotencia. La razon por la quese cumple b) es que si existe una biyeccion f : X −→ Y entonces f−1 : Y −→ Xes tambien una biyeccion.

Como decimos, la propiedad e) no es evidente en absoluto. Explıcitamente,afirma que si existen aplicaciones inyectivas f : X −→ Y y g : Y −→ Xentonces existe una aplicacion biyectiva h : X −→ Y . La forma de construir ha partir de f y g no es inmediata. Cantor demostro este hecho para conjuntosbien ordenados, luego su prueba solo vale en general si aceptamos el axioma deeleccion. Al parecer, el primero que probo este hecho sin hacer uso del axioma deeleccion fue Dedekind, si bien su demostracion permanecio inedita hasta 1932.

Page 109: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.1. Equipotencia 99

Schroder publico en 1897 una prueba, pero resulto ser incorrecta, aunque esemismo ano F. Bernstein publico la primera demostracion valida de lo que hoyse conoce como teorema de Cantor-Bernstein. Para probarlo nos apoyaremosen un resultado previo (notemos que, pese a las apariencias, no usa AP).

Teorema 4.3 Sea X un conjunto y F : PX −→ PX una aplicacion tal que siu ⊂ v ⊂ X entonces F (u) ⊂ F (v). Entonces existe un z ∈ PX tal que F (z) = z.

Demostracion: Sea A = u ∈ PX | F (u) ⊂ u. Se cumple que A es unaclase no vacıa (pues contiene a X). Llamemos z =

u∈A

u. Claramente z ∈ PX(porque X es un conjunto).

Si u ∈ A, entonces z ⊂ u, luego F (z) ⊂ F (u) ⊂ u, con lo que F (z) ⊂ z.Por la hipotesis, F (F (z)) ⊂ F (z), luego F (z) ∈ A, luego z ⊂ F (z), lo que

nos da la igualdad F (z) = z.

Teorema 4.4 (Teorema de Cantor-Bernstein) Sean X e Y conjuntos ta-les que existen aplicaciones inyectivas f : X −→ Y y g : Y −→ X. Entoncesexiste h : X −→ Y biyectiva.

Demostracion: Sea F : PX −→ PX la aplicacion dada por F (u) =X\g[Y \f [u]]. Estamos en las hipotesis del teorema anterior, pues si u ⊂ v ⊂ X ,entonces

f [u] ⊂ f [v], Y \ f [v] ⊂ Y \ f [u], g[Y \ f [v]] ⊂ g[Y \ f [u]],

X \ g[Y \ f [u]] ⊂ X \ g[Y \ f [v]],

luego F (u) ⊂ F (v).En consecuencia existe un subconjunto z ⊂ X tal que F (z) = z, es decir,

X \ g[Y \ f [z]] = z o, equivalentemente, X \ z = g[Y \ f [z]]. Por consiguiente,f |z : z −→ f [z] y g|Y \f [z] : Y \ f [z] −→ X \ z son ambas biyectivas, luego launion de la primera con la inversa de la segunda nos da la aplicacion h buscada.

Ası pues, aunque todavıa no hayamos definido nada a lo que llamar “numerode elementos” de un conjunto, tenemos probado que podemos hablar coherente-mente de si un conjunto tiene un numero de elementos mayor, igual o menor queotro. Tambien es facil probar que, dado cualquier conjunto, aunque sea infinito,siempre hay otro que tiene un numero de elementos estrictamente mayor:

Teorema 4.5 (Teorema de Cantor) (AP) Si X es un conjunto, X < PX.

Demostracion: La aplicacion f : X −→ PX dada por f(x) = x es

claramente inyectiva, luego X ≤ PX. Si se diera la igualdad, existirıa unaaplicacion g : X −→ P(X) biyectiva, pero entonces podrıamos considerar elconjunto R = x ∈ X | x /∈ g(x) ∈ PX . Sea r ∈ X tal que g(r) = R. Pordefinicion de R tenemos que r ∈ R si y solo si r /∈ g(r) = R, lo cual es unacontradiccion.

Por lo tanto, si suponemos tambien AI, resulta que ω y Pω son dos conjuntosinfinitos con distinto numero de elementos.

Page 110: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

100 Capıtulo 4. Cardinales

Nota El teorema de Cantor daba lugar a otra paradoja de la teorıa de con-juntos, esta vez relacionada con la clase universal V . En efecto, si lo aplicamos

al “conjunto” de todos los conjuntos, deberıa cumplirse que V < PV , pero porotra parte, todos los elementos de PV son conjuntos, luego deberıa ser PV ⊂ V

y, por consiguiente, PV ≤ V .En NBG esto no causa ningun problema pues, dado que todos los elementos

de V son conjuntos, se cumple de hecho que PV = V , pero esto no contradice alteorema de Cantor porque este solo se demuestra para conjuntos y V no lo es.Si uno rastrea la prueba para ver en que falla cuando se intenta aplicar a unaclase propia, por ejemplo, tomando como f : V −→ PV la aplicacion identidad,se encuentra con que la clase R construida en la prueba no es sino la clase deRussell R = x | x /∈ x, que no es un conjunto, por lo que R /∈ PV , por loque no podemos tomarle una antiimagen por f , como se hace en la prueba. Dehecho, ası fue como Bertrand Russell descubrio la paradoja que lleva su nombre.

4.2 Numeros cardinales

Ya hemos probado que tiene sentido hablar del numero de elementos deconjuntos arbitrarios en el sentido de que podemos comparar dos conjuntoscualesquiera segun su numero de elementos. Ahora vamos a ver como construirnumeros que midan el numero de elementos de un conjunto arbitrario, es decir,que nos permitan “contar” cualquier conjunto.

Mas concretamente, nos gustarıa asociar a cada conjunto X un cardinal

X que nos permita considerar las relaciones de equipotencia X = Y como

autenticas igualdades, y las relaciones X ≤ Y como una relacion de orden ≤(que tendrıamos que definir) actuando sobre los objetos X y Y (que de momentono tenemos definidos).

Vamos a presentar dos formas de hacerlo, una se apoya en los axiomas departes y regularidad, mientras que la otra se apoya en el axioma de eleccion.

En realidad hay una forma muy sencilla de definir el cardinal de un conjuntosin necesidad de recurrir a ninguno de los axiomas que acabamos de mencionar.Basta tener en cuenta que la relacion de equipotencia determina una relacionde equivalencia en V , la dada por

X RY ↔ X = Y ,

luego podrıamos definir el cardinal de un conjunto X como su clase de equiva-lencia:

X ≡ [X ]R = Y | X = Y .

Ası se cumple ciertamente que X = Y (entendido como igualdad de clases de

equivalencia) si y solo si X = Y (entendido como que X e Y son equipotentes).Sin embargo, no es una buena opcion pues, salvo para X = ∅, un cardinal ası

Page 111: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.2. Numeros cardinales 101

definido es siempre una clase propia. En efecto, la aplicacion V −→ X dadapor Y 7→ X ×Y es claramente inyectiva, luego su imagen es una clase propia

contenida en X, luego este no puede ser un conjunto.

Esto no es del todo inviable, pero es tecnicamente desaconsejable pues, porejemplo, nos impide definir la clase de todos los cardinales, ya que los cardinalesson clases propias y no pueden definir a ninguna clase. Aunque podrıamosarreglarnoslas para definir una suma de cardinales, dicha suma no podrıa versecomo una ley de composicion interna, porque eso requerirıa que los cardinalesfueran conjuntos, etc.

Pero este “primer intento” se puede refinar. Para ello suponemos los axiomasde partes y regularidad, lo cual nos da la descomposicion de la clase universal

V =⋃

α∈Ω

Vα,

donde cada Vα es un conjunto, ası como la aplicacion rang : V −→ Ω, que a cadaconjunto x le asigna el menor ordinal α tal que x ⊂ Vα. De este modo podemosdefinir el cardinal de un conjunto X , no como la clase de todos los conjuntosequipotentes a X (que no es un conjunto), sino como el conjunto de todos losconjuntos equipotentes aX del menor rango posible. Esto es un conjunto porquesi α es el menor rango de un conjunto equipotente a X , entonces el cardinal asıdefinido es un subconjunto del conjunto Vα+1. Concretamente:

Definicion 4.6 Un cardinal es un conjunto no vacıo p tal que1

a)∧

xy ∈ p(x = y ),

b)∨

α∧

x ∈ p rang x = α,

c)∧

xy(x ∈ p ∧ x = y ∧ rang x = rang y → y ∈ p),

d) ¬∨

xy(y ∈ p ∧ x = y ∧ rang x < rang y).

Llamaremos C a la clase de todos los cardinales.

La primera condicion dice que todos los elementos de un cardinal p sonequipotentes entre sı. La segunda afirma que todos tienen un mismo rango α.La tercera dice que todo conjunto equipotente a un conjunto de p que tenga elrango de los elementos de p esta en p, y la ultima afirma que no existen conjuntosequipotentes a los de p de rango menor al rango de los elementos de p. En suma,un cardinal es un conjunto no vacıo de conjuntos equipotentes entre sı de rangomınimo.

Si X es un conjunto cualquiera, definimos su cardinal como

X ≡ Y | X = Y ∧ ¬∨

Z(ctoZ ∧ rang Z < rang Y ∧ X = Z ).1En lo sucesivo las letras goticas p, q, . . . denotaran siempre cardinales, aunque no se

indique explıcitamente.

Page 112: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

102 Capıtulo 4. Cardinales

Es claro que X es realmente un cardinal. En efecto, puesto que existe almenos un conjunto equipotente a X (el propio X), la clase

α ∈ Ω |∨

Y (cto Y ∧ Y = X ∧ rangY = α)

no es vacıa, luego tiene un mınimo elemento α, lo cual significa que existe un

conjunto Y0 equipotente a X de rango α y que si Z = X entonces rang Z ≥ α.

Por lo tanto, Y0 ∈ X, luego X 6= ∅, y no ofrece ninguna dificultad comprobar

que X no es sino el conjunto de todos los conjuntos equipotentes a X de rangoα, de donde se sigue a su vez que cumple las propiedades a) – d) de la definicionde cardinal.

Aunque estas definiciones sean tecnicamente complejas, esto carece de im-portancia, pues podemos olvidarnos de ellas en cuanto nos convencemos de losiguiente:

Teorema 4.7 Se cumple:

a) Para cada conjunto x tenemos definido x ∈ C y para todo p ∈ C existe unconjunto x tal que x = p.

b) Dados dos conjuntos x e y, se cumple x = y (entendido como igualdad decardinales) si y solo si x e y son equipotentes.

Demostracion: Si p ∈ C, por definicion no es vacıo, luego existe un x ∈ p,y es facil ver que p = x.

Si dos conjuntos x e y son equipotentes, entonces los conjuntos de rangomınimo equipotentes a uno de ellos coinciden con los conjuntos de rango mınimoequipotentes al otro, luego sus cardinales son iguales. Recıprocamente, si ambostienen el mismo cardinal x = y = p y z ∈ p, entonces z es equipotente a x y ay, luego ambos son equipotentes entre sı.

Ası pues, hemos conseguido nuestro proposito: las formulas x = y tienenel mismo significado que les hemos dado en la definicion 4.1, pero ahora sonautenticas igualdades de cardinales.

Definicion 4.8 Definimos la relacion en C dada por

p ≤ q ≡∨

xy(cto x ∧ cto y ∧ p = x ∧ q = y ∧ x es minuspontente a y).

Esta definicion no depende de la eleccion de x e y en virtud del ultimoapartado del teorema 4.2, de modo que, para todo par de conjuntos x e y, secumple que

x ≤ y si y solo si x es minuspotente a y,

es decir, que la formula x ≤ y (entendida en terminos de la relacion que acaba-mos de definir) tiene el mismo significado que tenıa en 4.1, pero ahora es unaautentica desigualdad entre cardinales.

Page 113: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.2. Numeros cardinales 103

El teorema 4.2 implica inmediatamente que la relacion que acabamos dedefinir es ciertamente una relacion de orden (no necesariamente de orden total)sobre la clase C.

Ahora veamos otra forma alternativa de definir el cardinal de un conjuntoque no requiere ni el axioma de regularidad ni el de partes, pero (para que sirvarealmente para todo conjunto) sı el axioma de eleccion. La idea es que, bajoAE, todo conjunto x puede biyectarse con un ordinal, luego podemos definir elcardinal de x como el menor ordinal equipotente a x. En lugar de suponer AE,restringiremos las definiciones a conjuntos biyectables con ordinales:

Definicion 4.9 La clase de los cardinales de von Neumann es la clase2

K = α ∈ Ω | ¬∨

β < α β = α.

Usaremos las letras griegas κ, µ, ν, . . . para referirnos a cardinales de vonNeumann, aunque no lo indiquemos explıcitamente.

De este modo, un cardinal (de von Neumann) es un ordinal no equipotente aningun ordinal anterior. Por lo tanto, si κ y µ son cardinales de von Neumann,se tiene que κ = µ↔ κ = µ, ya que si κ = µ pero κ < µ o µ < κ, entonces µ (enel primer caso) o κ (en el segundo) no serıa un cardinal, pues serıa equipotentea un ordinal anterior.

Diremos que un conjunto es bien ordenable si admite una buena ordenaciono, equivalentemente, si es equipotente a un ordinal.

Para cada conjunto bien ordenable x, el menor ordinal equipotente a x nopuede ser equipotente a ningun ordinal anterior (pues dicho ordinal anteriorserıa tambien equipotente a x), luego es un cardinal de von Neumann. Endefinitiva, si definimos

|x| = κ | (κ ∈ K ∧ κ = x ),

tenemos que para todo conjunto bien ordenable x se cumple que |x| ∈ K y esun ordinal equipotente a x.

Mas aun, si x e y son conjuntos bien ordenables entonces |x| = |y| si y solosi x es equipotente a y.

En efecto, tenemos que x es equipotente a |x| e y es equipotente a |y|, luegox es equipotente a y si y solo si |x| es equipotente a |y| si y solo si |x| = |y|.

Ası pues, si aceptamos AE, todo conjunto tiene asociado un cardinal de vonNeumann, luego podemos olvidarnos de la definicion de C y trabajar unicamentecon K.

Por otra parte, si no suponemos AE, la relacion entre ambas definiciones esque tenemos una inmersion K −→ C dada por κ 7→ κ, es decir, a cada cardinal

2Por seguir la tradicion cantoriana, escribiremos α en lugar de α cuando α sea un ordinal.Recordemos que para Cantor una barra significaba “ordinal” y una barra sobre el ordinal (osea, dos barras sobre un conjunto) significaba “cardinal”.

Page 114: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

104 Capıtulo 4. Cardinales

de von Neumann le asociamos su cardinal en el sentido de 4.6. La aplicacion esinyectiva, pues si κ = µ, entonces κ y µ son cardinales equipotentes, luego soniguales.

Si esta inmersion es suprayectiva, entonces para todo conjunto x tenemosque x = κ, para cierto κ ∈ K, luego x es equipotente a κ y, por consiguiente,bien ordenable. En suma, la suprayectividad de la inmersion de K en C equivaleal axioma de eleccion.

Por otra parte, si consideramos en K el orden de Ω, tenemos que la inmersiones una semejanza en la imagen, es decir, κ ≤ µ si y solo si κ ≤ µ.

En efecto, si κ ≤ µ, entonces κ ⊂ µ, luego es obvio que κ ≤ µ. Recıproca-mente, si κ ≤ µ, no puede ser µ < κ, pues entonces µ ≤ κ, luego κ = µ, luegoκ = µ, contradiccion. Ası pues, κ ≤ µ.

En particular, si x e y son conjuntos bien ordenables, tenemos que |x| ≤ |y|si y solo si x es minuspotente a y.

Puede probarse que sin el axioma de eleccion es imposible demostrar que larelacion de orden en C sea un orden total, mientras que con el axioma de eleccionC es semejante a K y, por consiguiente, C resulta estar no solo totalmenteordenado, sino incluso bien ordenado.

En la practica identificaremos K con su imagen en C, en el sentido de quesi p ∈ C y afirmamos que p ∈ K deberemos entender que p = κ para un cierto

κ ∈ K. Por ejemplo, es obvio que si X ≤ Y e Y es bien ordenable, entonces Xtambien lo es. Alternativamente, podemos expresar esto diciendo que si p ≤ κ,entonces p ∈ K.

Veamos ahora algunos resultados basicos sobre los cardinales de von Neu-mann.

Teorema 4.10 ω ⊂ K.

Demostracion: Probamos por induccion que todo numero natural es uncardinal. Obviamente 0 no es equipotente a ningun ordinal anterior, luego0 ∈ K. Supongamos que n ∈ K pero que n+ 1 /∈ K. Entonces existe un ordinalanterior m < n+ 1 y una biyeccion f : n+ 1 −→ m. Es claro que m no puedeser 0, luego m = r + 1. Veamos que podemos suponer que f(n) = r. En casocontrario, sea n′ = f−1(r). Definimos

f ′ = (f \ (n, f(n)), (n′, r)) ∪ (n, r), (n′, f(n)),

y es claro que f ′ es una biyeccion como f pero tal que f(n) = r.Ahora bien, r < n y f ′|n : n −→ r biyectiva, lo cual contradice que n sea un

cardinal.

Teorema 4.11 ω ∈ K.

Page 115: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.2. Numeros cardinales 105

Demostracion: En caso contrario existirıa un n ∈ ω tal que n = ω, perocomo n ⊂ n + 1 ⊂ ω es claro que n ≤ n+ 1 ≤ ω = n, luego serıa n = n+ 1 yn+ 1 no serıa un cardinal, en contra del teorema anterior.

El siguiente cardinal ya no es tan facil de encontrar. Ciertamente no puedeser ω + 1, como muestra el teorema siguiente:

Teorema 4.12∧

κ(ω ≤ κ→ κ es un ordinal lımite).

Demostracion: Vamos a ver que no puede existir un ordinal α tal queκ = α + 1. En efecto, en tal caso podrıamos definir una aplicacion f : κ −→ αbiyectiva mediante

f(β) =

β si β ∈ α \ ω,β + 1 si β ∈ ω,0 si β = α.

Por consiguiente κ no serıa un cardinal.

La forma mas natural de encontrar un cardinal mayor que ω es tomar unordinal equipotente a Pω y aplicar el teorema de Cantor. No obstante, no po-demos encontrar dicho ordinal sin el axioma de eleccion, pues sin el no puedeprobarse que Pω pueda ser bien ordenado. Pero es posible probar la existenciade cardinales arbitrariamente grandes sin necesidad del axioma de eleccion. Encualquier caso, el axioma que necesitaremos inevitablemente es el axioma departes, pues sin el no puede demostrarse la existencia de conjuntos no numera-bles (es decir, de conjuntos de cardinal mayor que ω). Ası, el teorema siguientees el segundo en el que usamos AP de forma esencial, despues del teorema deCantor (que hasta ahora no hemos usado para nada):

Teorema 4.13∧

α∨

κ α < κ.

Demostracion: Sea

A = R ∈ P(α× α) | R es un buen orden en α,

es decir, A es el conjunto de todos los buenos ordenes posibles en α. Se cumpleque es un conjunto por el axioma de partes.

Sea f : A −→ Ω la aplicacion dada por f(R) = ord(α,R). Por el axioma delreemplazo f [A] es un subconjunto de Ω, luego esta acotado. Sea β ∈ Ω tal que∧

δ ∈ f [A] δ < β.Si R es la relacion de orden usual en α, tenemos que R ∈ A y f(R) = α,

luego α < β. Si fuera α = β, entonces tendrıamos una biyeccion g : α −→ β, lacual nos permitirıa definir la relacion en α dada por δRǫ si y solo si g(δ) < g(ǫ).Claramente R es un buen orden en α y g : (α,R) −→ β es una semejanza. Porconsiguiente f(R) = β ∈ f [A], en contradiccion con la eleccion de β. Ası pues,como obviamente α ≤ β, ha de ser α < β.

Llamemos κ al mınimo ordinal tal que α < κ. Claramente κ ∈ K, pues siexistiera un γ < κ tal que γ = κ, tambien tendrıamos que α < γ, en contra dela definicion de κ.

Page 116: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

106 Capıtulo 4. Cardinales

Ademas α < κ, pues de lo contrario serıa κ ≤ α, y esto contradice a α < κ,por el teorema de Cantor-Bernstein.

Definicion 4.14 Dado un ordinal α llamaremos cardinal siguiente de α almınimo cardinal mayor que α y lo representaremos por α+.

Segun hemos visto,∧

n ∈ ω n+ = n+ 1, mientras que si α es infinito esto yano es cierto, pues entonces α+ es un ordinal lımite.

Ahora ya tenemos demostrada la existencia de infinitos cardinales infinitos.Mas aun, hemos probado que K no esta acotado en Ω, lo que implica que laclase de todos los cardinales no es un conjunto. Otro hecho importante es elsiguiente:

Teorema 4.15 El supremo de un conjunto de cardinales es un cardinal.

Demostracion: Sea A ⊂ K un conjunto y sea κ =⋃

µ∈A

µ. Ciertamente

κ ∈ Ω y hemos de probar que es un cardinal. Si existiera un α < κ tal queα = κ, entonces existe un µ ∈ A tal que α < µ ≤ κ. Entonces

α ≤ µ ≤ κ = α.

Por consiguiente α = µ, en contra de que µ sea un cardinal.

Definicion 4.16 Llamaremos ℵ : Ω −→ Ω (funcion alef) a la unica aplicacionque cumple

ℵ0 = ω ∧∧

α ℵα+1 = ℵ+α ∧

λ ℵλ =⋃

δ<λ

ℵδ.

Es claro que se trata de una funcion normal. Vamos a probar que recorretodos los cardinales infinitos.

Teorema 4.17 ℵ : Ω −→ K \ ω biyectiva.

Demostracion: Como ℵ es normal sabemos que es inyectiva, luego bastaprobar que es suprayectiva. Una simple induccion demuestra que

αℵα ∈ K(el caso lımite es el teorema 4.15). Esto significa que ℵ[Ω] ⊂ K. Como ℵ escreciente y ℵ0 = ω, ciertamente ℵ[Ω] ⊂ K \ ω. Solo nos falta probar que siκ ∈ K \ ω existe un α tal que κ = ℵα.

Por la normalidad tenemos que κ ≤ ℵκ < ℵκ+1. Sea β el mınimo ordinal talque κ < ℵβ. No puede ser β = 0, pues entonces κ ∈ ℵ0 = ω. Por la definicionde ℵ tampoco puede ocurrir que β sea un ordinal lımite. Consecuentemente,β = α + 1 y tenemos que ℵα ≤ κ < ℵα+1 = ℵ+

α . Necesariamente entoncesκ = ℵα.

Segun esto, tenemos que ℵ0 = ω, aunque es costumbre no usar las dosnotaciones indiscriminadamente, sino que se usa ℵ0 cuando lo consideramos

Page 117: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.3. La aritmetica cardinal 107

como un cardinal y ω cuando lo consideramos como un ordinal. Similarmente,es costumbre representar ℵα como ωα cuando lo consideramos como un ordinal.

En estos terminos, es claro que un conjunto es finito (resp. numerable) enel sentido de la definicion 3.22 si y solo si es bien ordenable y |x| < ℵ0 (resp.|x| ≤ ℵ0). Las clases que no son finitas (y esto incluye obviamente a todaslas clases propias) se llaman infinitas. Tenemos entonces que la sucesion de loscardinales (de von Neumann) infinitos empieza ası:

ℵ0, ℵ1, ℵ2, . . . ℵω, ℵω+1, ℵω+2, . . . ℵω1 , ℵω1+1, . . . ℵω1+ω, . . .

Es claro que el axioma de eleccion equivale a que todo cardinal infinito esun alef.

4.3 La aritmetica cardinal

La aritmetica cardinal permite reducir el calculo del cardinal de un conjuntoal de otros conocidos. Empezamos estudiando la suma y el producto de cardi-nales, que, a diferencia de lo que ocurre con la exponenciacion, son muy facilesde calcular.

Suma y producto La definicion se apoya en el siguiente hecho elemental:

Si X, Y , X ′, Y ′ son conjuntos cualesquiera y X = X ′, Y = Y ′,entonces

X × 0 ∪ Y × 1 = X ′ × 0 ∪ Y ′ × 1, X × Y = X ′ × Y ′.

La comprobacion no ofrece ninguna dificultad.

Definicion 4.18 Definimos las operaciones + y · en C dadas por

p + q = X × 0 ∪ Y × 1, pq = X × Y ,

donde p = X, q = Y .

La observacion anterior justifica que esta definicion no depende de la eleccionde los conjuntos X e Y . Mas aun, es facil probar:

Teorema 4.19 a) Si X e Y son conjuntos disjuntos, X ∪ Y = X + Y .

b) Si X e Y son conjuntos cualesquiera, X × Y = X · Y .

El teorema siguiente se demuestra sin dificultad sin mas que manipular deforma obvia aplicaciones entre conjuntos:

Teorema 4.20 Para todos los cardinales p, q, r, s se cumple:

Page 118: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

108 Capıtulo 4. Cardinales

a) (p + q) + r = p + (q + r),

b) p + q = q + p,

c) p + 0 = p,

d) p ≤ q ∧ r ≤ s → p + r ≤ q + s,

e) (pq)r = p(qr),

f) pq = qp,

g) p · 0 = 0 ∧ p · 1 = p,

h) p(q + r) = pq + pr,

i) p ≤ q ∧ r ≤ s → p + r ≤ q + s ∧ pr ≤ qs.

Estas propiedades permiten operar facilmente con cardinales. Veamos unejemplo:

Teorema 4.21 Para todo par de conjuntos X, Y se cumple

X + Y = X ∪ Y +X ∩ Y .

En particular X ∪ Y ≤ X + Y .

Demostracion: Claramente X se descompone en la union disjunta X =

(X \ (X ∩ Y )) ∪ (X ∩ Y ), luego X = X \ (X ∩ Y ) +X ∩ Y . Por lo tanto

X + Y = X \ (X ∩ Y ) + Y +X ∩ Y = (X \ (X ∩ Y )) ∪ Y +X ∩ Y ,

donde hemos usado que los dos primeros sumandos del termino central son

disjuntos. Es claro que el ultimo miembro coincide con X ∪ Y + X ∩ Y . Ladesigualdad se sigue del ultimo apartado del teorema anterior.

Veamos ahora que la suma y el producto de cardinales de K esta tambienen K. De hecho, podemos definir directamente las operaciones en K sin pasarpor C:

Definicion 4.22 Definimos las operaciones + y · en K dadas por

κ+ µ = |κ× 0 ∪ µ× 1|, κµ = |κ× µ|.

Para que esta definicion sea correcta (al menos sin suponer AE) debemosjustificar que los conjuntos κ× 0 ∪ µ× 1 y κ × µ son bien ordenables. Dehecho, esto es cierto para ordinales cualesquiera:

En la seccion 2.5 hemos visto que si α y β son dos ordinales cualesquiera,entonces α + β = ord(α ⊕ β) y αβ = ord(α × β), donde en los conjuntosα⊕ β = α× 0 ∪ β × 1 y α× β se considera el orden lexicografico, luego en

Page 119: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.3. La aritmetica cardinal 109

particular ambos conjuntos son bien ordenables. Esto justifica que la definicionanterior es correcta, pero prueba ademas que

α+ β = α× 0 ∪ β × 1 = α+ β, α β = α× β = αβ,

donde la suma y el producto de los miembros izquierdos son la suma y pro-ducto de ordinales, mientras que en los miembros derechos tenemos la suma yel producto de cardinales definidas en 4.18.

En particular esto vale para κ, µ ∈ K, lo que significa que, si tenemos doscardinales en K, es lo mismo sumarlos o multiplicarlos como cardinales en K yluego considerar sus cardinales asociados en C que sumar o multiplicar en C suscardinales asociados. En definitiva, que a la hora de sumar y multiplicar cardi-nales de K, da igual hacerlo en K o en C, pues los resultados se correspondena traves de la inclusion K −→ C.

Por consiguiente, si X e Y son conjuntos bien ordenables, tambien lo sonX ∪ Y y X × Y . En efecto, si son disjuntos, tenemos que

X ∪ Y = X + Y = |X | + |Y | = |X | + |Y |,

luego el cardinal de X ∪ Y es un cardinal de K, lo que significa que X ∪ Y esbien ordenable y

|X ∪ Y | = |X | + |Y |.

Si X e Y no son disjuntos, sabemos de todos modos que

X ∪ Y ≤ X + Y = |X | + |Y |,

luego X ∪ Y es minuspotente al cardinal |X | + |Y |, luego es bien ordenableigualmente. Con el producto sucede lo mismo:

X × Y = X Y = |X | + |Y | = |X | |Y |,

luego el cardinal de X × Y es un cardinal de K, luego es bien ordenable y

|X × Y | = |X | |Y |.

Ahora es inmediato que todas las propiedades del teorema 4.20 valen tambienpara las operaciones en K. Por ejemplo, κ+µ = µ+κ porque ambos cardinalesde K se corresponden con el cardinal κ + µ = µ + κ de C, y la inmersion esinyectiva. Igualmente, el teorema 4.21 se traduce en que, si X e Y son conjuntosbien ordenables,

|X | + |Y | = |X ∪ Y | + |X ∩ Y |,

simplemente porque, precisamente por 4.21, ambos miembros se correspondencon el mismo cardinal de C. Tambien hemos probado lo siguiente:

Page 120: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

110 Capıtulo 4. Cardinales

Teorema 4.23 Para todos los ordinales α y β, se cumple

|α+ β| = |α| + |β|, |αβ| = |α||β|,

donde la suma y el producto de los miembros izquierdos son la suma y el pro-ducto de ordinales, y los de los miembros derechos son la suma y el producto decardinales.

(Por ejemplo, para la suma hemos visto que ambos miembros se correspondencon el cardinal α+ β = α+ β de C, e igualmente sucede con el producto.)

Es importante tener presente que ahora tenemos dos sumas y dos productosdefinidos sobre todos los cardinales de K: la suma y el producto de ordina-les (cuyo resultado no esta necesariamente en K) y la suma y el producto decardinales. Son distintas. Por ejemplo, las operaciones ordinales no son conmu-tativas, pero las cardinales sı. Un ejemplo concreto: ω + 1 6= ℵ0 + 1, pues elmiembro izquierdo no es un cardinal (los cardinales infinitos son ordinales lımite)y el miembro derecho sı que lo es. El teorema anterior muestra la relacion entreellas, pero lo que necesitamos ahora son resultados que nos permitan calcularsumas y productos de cardinales. El caso finito es trivial:

Teorema 4.24 Sobre los numeros naturales, la suma cardinal coincide con lasuma ordinal.

Demostracion: Es consecuencia inmediata del teorema anterior, teniendoen cuenta que todo n ∈ ω cumple |n| = n.

La suma y el producto en K quedan completamente determinados por elteorema siguiente:

Teorema 4.25 Para todo alef κ se cumple κκ = κ.

Demostracion: Lo probamos por induccion, es decir, suponemos que paratodo alef µ < κ se cumple µµ = µ. Entonces,

µ < κ µµ < κ, pues µ ha de serun alef o bien un numero natural.

Consideramos en κ × κ la restriccion del orden canonico de Ω × Ω definidoen 2.30.

Sea α = ord (κ × κ). Entonces α ≥ |α| = κκ ≥ κ. Supongamos que fueraκ < α y sea f : α −→ κ × κ la semejanza. Sea f(κ) = (β, γ). Como κ es unordinal lımite, podemos tomar δ < κ tal que β, γ < δ.

Como κ esta formado por los ordinales menores que κ, tenemos que f [κ]esta formado por los pares menores que (β, γ). Ahora bien, por la definicion delorden canonico, si (β′, γ′) < (β, γ), entonces β′, γ′ < δ, es decir, f [κ] ⊂ δ × δ.

Por consiguiente, κ = |f [κ]| ≤ |δ × δ| = |δ| |δ| < κ, contradiccion. Porconsiguiente α = κ, lo cual prueba que κ× κ es equipotente a κ.

Como consecuencia:

Page 121: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.3. La aritmetica cardinal 111

Teorema 4.26 Se cumple:

κµ(κ ≤ µ ∧ ℵ0 ≤ µ→ κ+ µ = µ),

κµ(κ ≤ µ ∧ ℵ0 ≤ µ ∧ κ 6= 0 → κµ = µ).

Demostracion: µ ≤ κ+ µ ≤ µ+ µ = 2µ ≤ µµ = µ, luego κ+ µ = µ.µ ≤ κµ ≤ µµ = µ, luego κµ = µ.

Ası pues, la aritmetica de K es muy sencilla:

ℵ0 + ℵ1 = ℵ1, ℵω15 + ℵ3 = ℵω15 , 3ℵ7 = ℵ7, ℵ23 ℵ7 = ℵ23, etc.

Ejercicio: Probar que si Y es un conjunto infinito bien ordenable y |X| < |Y |,entonces |Y \X| = |Y |.

Nota En la prueba del teorema 4.25 hemos visto que si κ es un alef y con-sideramos el orden canonico en κ × κ, entonces ord(κ × κ) = κ. De la de-finicion del orden canonico se sigue facilmente que el producto es la seccioninicial κ× κ = (Ω × Ω)<(κ,0).

Respecto a la aritmetica de los cardinales no bien ordenables, poco podemosdecir. Un concepto util en su estudio es el siguiente:

Definicion 4.27 Sea X un conjunto infinito. Sea

B = R | R es un buen orden en un subconjunto de X.

Se cumple que B es un conjunto porque B ⊂ P(X ×X). Llamaremos numerode Hartogs de X a ℵ(X) = ord(DR,R) | R ∈ B.

Como ℵ(X) es imagen de B, por el axioma del reemplazo es un conjuntode ordinales. Es claro que α ∈ ℵ(X) si y solo si existe f : α −→ X inyec-tiva, de donde se sigue claramente que ℵ(X) es un conjunto transitivo y, porconsiguiente, un ordinal.

Mas aun, si |α| = |β| y β < ℵ(X), entonces α < ℵ(X), de donde se sigueque ℵ(X) es, de hecho, un cardinal, y una simple induccion prueba que si Xes infinito existe f : n −→ X inyectiva para todo n, luego ℵ(X) es un cardinalinfinito, es decir, un alef.

Tambien es inmediato que si X = Y entonces ℵ(X) = ℵ(Y ), luego, paracada cardinal p, podemos definir ℵ(p) = ℵ(X), donde X es cualquier conjunto

tal que X = p.

Es claro que ℵ(p) es el menor alef κ que no cumple κ ≤ p (notemos que sifuera ℵ(p) ≤ p entonces tendrıamos ℵ(p) < ℵ(p)). En particular, si κ es un alef,se cumple ℵ(κ) = κ+.

Page 122: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

112 Capıtulo 4. Cardinales

Teorema 4.28 Sean p y κ cardinales infinitos tales que p + κ = pκ. Entoncesp ≤ κ o κ ≤ p. En particular, si p + ℵ(p) = pℵ(p), entonces p es un alef.

Demostracion: Sea X un conjunto de cardinal p. Por hipotesis existen

conjuntos disjuntos A y B tales que X × κ = A ∪B, A = p, B = κ.Si existe un x ∈ X tal que (x, α) | α < κ ⊂ A, entonces claramente κ ≤ p.En caso contrario, para cada x ∈ X existe un mınimo αx ∈ κ tal que

(x, αx) /∈ A, de donde (x, αx) | x ∈ X ⊂ B, por lo que p ≤ κ.

En el caso particular en que κ = ℵ(p) no puede ocurrir ℵ(p) ≤ p, luego hade ser p ≤ ℵ(p) y, por consiguiente, p es un alef.

Como aplicacion tenemos un resultado interesante:

Teorema 4.29 El axioma de eleccion equivale a que pp = p para todo cardinalinfinito p.

Demostracion: Si suponemos el axioma de eleccion entonces todo cardinalinfinito es un alef y basta aplicar el teorema 4.25. Para el recıproco basta probarque todo cardinal infinito p es un alef y, a su vez, para ello basta probar quep + ℵ(p) = pℵ(p). De hecho basta ver que pℵ(p) ≤ p + ℵ(p), ya que la otradesigualdad se da siempre trivialmente. Ahora bien:

p + ℵ(p) = (p + ℵ(p))(p + ℵ(p)) = pp + 2pℵ(p) + ℵ(p)ℵ(p) ≥ pℵ(p).

Exponenciacion Finalmente introducimos la exponenciacion de cardinales,una operacion tan natural como la suma y el producto pero cuyo comporta-miento es muy diferente. Recordemos que AB = f | f : B −→ A. Ladefinicion de la exponenciacion de cardinales se apoya en el siguiente hechoobvio:

Si A, A′, B y B′ son conjuntos tales que A = A′ y B = B′ entonces

se cumple AB = A′B′ .

Definicion 4.30 Dados dos cardinales p y q, definimos pq = AB, donde A = p

y B = q.

La observacion precedente demuestra que pq no depende de la eleccion delos conjuntos A y B. Las propiedades siguientes se demuestran sin dificultad:

Teorema 4.31 Para todos los cardinales p, q, r se cumple:

a) p 6= 0 → 0p = 0,

b) p0 = 1, 1p = 1, p1 = p,

c) q ≤ r → pq ≤ pr,

d) p 6= 0 ∧ q 6= 0 ∧ q ≤ r → pq ≤ pr,

e) pq+r = pqpr,

f) (pq)r = prqr.

Page 123: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.3. La aritmetica cardinal 113

Una simple induccion basada en estas propiedades demuestra que la expo-nenciacion cardinal sobre los numeros naturales coincide con la exponenciacionordinal. Otro resultado notable es el siguiente:

Teorema 4.32 Para todo conjunto X, se cumple PX = 2X .

Demostracion: Basta observar que la aplicacion f : 2X −→ PX dada porh 7→ h−1[1] es biyectiva.

Como consecuencia, el teorema de Cantor admite una formulacion aritmetica:

Teorema 4.33 (Teorema de Cantor) Para todo cardinal p se cumple

p < 2p.

Observaciones El hecho de que la exponenciacion cardinal este tan vinculadaal operador P hace que los axiomas de la teorıa de conjuntos dejen sin decidir loshechos mas importantes sobre la misma. En efecto, dichos axiomas se limitana imponer la existencia de los conjuntos que un matematico necesita, es decir,garantizan la existencia de uniones, intersecciones, de los conjuntos de numeros,etc., pero no dicen nada sobre que clase de cosa es un conjunto y, en particular,no dicen nada sobre que contiene PX , ni de lo grande o pequeno que pueda sereste conjunto.

Como muestra de lo “reacia” que es la teorıa de conjuntos a pronunciarsesobre la exponenciacion cardinal, observamos que sin el axioma de eleccion nopodemos asegurar que AB o incluso PA sean bien ordenables aunque A y B losean. Esto hace que no podamos desarrollar una aritmetica de la exponenciacionde K que no requiera el axioma de eleccion, al contrario de lo que sucede conla suma y el producto. El hecho de que cualquier resultado no trivial requierael axioma de eleccion es una muestra de que, por muy bien que conozcamoslos conjuntos A y B, en realidad no sabemos casi nada de AB (y lo mismovale para PX). De todos modos, aunque el axioma de eleccion hace que laexponenciacion cardinal tenga un comportamiento bastante razonable, lo ciertoes que no resuelve en absoluto las cuestiones centrales en torno a ella.

Por ejemplo, la hipotesis del continuo es la conjetura de Cantor segun lacual 2ℵ0 = ℵ1. Sin el axioma de eleccion hemos probado que 2ℵ0 > ℵ0 y, con elaxioma de eleccion (¡pero no sin el!), lo unico que podemos anadir a esto es que2ℵ0 ≥ ℵ1. Naturalmente, el problema es identico para cardinales mayores:

Definicion 4.34 Se llama hipotesis del continuo generalizada a la siguientesentencia:

(HCG) Si p es un cardinal infinito, no existe ningun cardinal q tal que

p < q < 2p.

Con el axioma de eleccion esto equivale a que 2κ = κ+ para todo cardinalinfinito κ, o tambien a que

α 2ℵα = ℵα+1.

Page 124: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

114 Capıtulo 4. Cardinales

Veremos que la HCG determina completamente la exponenciacion cardi-nal, pero dejamos esto —junto a estudio en profundidad de la exponenciacioncardinal— para el capıtulo siguiente.

Sucesiones y partes finitas Para completar los calculos aritmeticos basicos,dado un conjunto bien ordenable A, vamos a calcular el cardinal de los conjuntos

A<ω =⋃

n∈ωAn, y PfA = x | x ⊂ A ∧ |x| < ℵ0,

es decir, el conjunto de las sucesiones finitas en A y el de los subconjuntos finitosde A.

Teorema 4.35 Si A es un conjunto bien ordenable no vacıo, entonces A<ω esbien ordenable, y |A<ω| = ℵ0|A|.

Demostracion: Supongamos en primer lugar que A es infinito. Entonces|A × A| = |A|, luego podemos fijar una biyeccion h : A × A −→ A. Vamosa definir por recurrencia, para cada n ∈ ω, una biyeccion fn : An+1 −→ A.Definimos f0 : A1 −→ A mediante f0(s) = s(0). Claramente es una biyeccion.Supuesta definida fn, definimos fn+1 : An+2 −→ A mediante

fn+2(s) = h(fn+1(s|n+1), s(n+ 1)).

Una simple induccion prueba que cada fn es biyectiva. Ahora definimos laaplicacion fn : An+1 −→ A×n mediante fn(s) = (fn(s), n). Es claro entoncesque

n∈ωfn : A<ω \ ∅ −→ A× ω biyectiva.

Esto prueba que A<ω \ ∅ es bien ordenable, y que su cardinal es |A| ℵ0

(que en este caso es |A|). Obviamente entonces, |A<ω| = |A| + 1 = |A|.

Si A es finito, a partir de una aplicacion inyectiva A −→ ω se construyefacilmente una aplicacion A<ω −→ ω<ω tambien inyectiva, de donde resultaque |A<ω | ≤ |ω<ω| = ℵ0.

Por otra parte, fijado un a ∈ A, la aplicacion ω −→ A<ω que a cada n ∈ ωle asigna la funcion cna = n × a (es decir, la funcion n −→ A que tomasiempre el valor a) es claramente inyectiva, luego ℵ0 ≤ |A<ω | y concluimos que|A<ω| = ℵ0 = |A| ℵ0.

Si A es un conjunto finito, entonces todos sus subconjuntos son finitos, luego|PfA| = |PA| = 2|A|, que es un numero natural, luego PA y PfA son conjuntosfinitos. Si A es infinito y bien ordenable, tenemos lo siguiente:

Teorema 4.36 Si A es un conjunto infinito bien ordenable, entonces PfA tam-bien es bien ordenable, y |PfA| = |A|.

Page 125: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.4. Conjuntos finitos 115

Demostracion: La aplicacion A<ω −→ PfA dada por s 7→ Rs es clara-

mente suprayectiva, luego existe una aplicacion PfA −→ A<ω inyectiva,3 lo queprueba que PfA es bien ordenable, y |PfA| ≤ |A<ω | = |A|.

Por otra parte, la aplicacion A −→ PfA dada por a 7→ a es inyectiva, luego|A| ≤ |PfA| y tenemos la igualdad.

4.4 Conjuntos finitos

Recogemos aquı las propiedades especıficas de los conjuntos finitos que nocomparten los conjuntos infinitos. Recordemos que hemos definido un conjuntofinito como un conjunto bien ordenable x tal que |x| < ℵ0, es decir, tal que |x|sea un numero natural.

Obviamente, si y ⊂ x, entonces y tambien es bien ordenable, y |y| ≤ |x|, luegotodo subconjunto de un conjunto finito es finito. Por otra parte, como la sumay el producto de numeros naturales es un numero natural (y las operacionescardinales coinciden con las ordinales sobre los numeros naturales) concluimosque la union y el producto cartesiano de dos conjuntos finitos es de nuevo unconjunto finito. Mas aun, una simple induccion prueba que la union de unconjunto finito de conjuntos finitos es finita.

Un ejemplo de propiedad que no es valida para conjuntos infinitos es lasiguiente:

Teorema 4.37 Si x ⊂ y son conjuntos finitos y |x| = |y|, entonces x = y.

Demostracion: Tenemos que y = x ∪ (y − x), luego |y| = |x| + |y \ x|,y ahora usamos que la suma de numeros naturales es simplificable, por lo que|y \ x| = 0, lo que equivale a que y \ x = ∅, luego x = y.

A su vez esto implica:

Teorema 4.38 Si f : x −→ y es una aplicacion entre conjuntos finitos talesque |x| = |y|, entonces f es inyectiva si y solo si es suprayectiva, si y solo si esbiyectiva.

Demostracion: Si f es inyectiva entonces |f [x]| = |x| = |y| y f [x] ⊂ y,luego por el teorema anterior f [x] = y, lo cual significa que f es suprayectiva.

Si f es suprayectiva, por el teorema 3.26 existe4 g : y −→ x inyectiva tal queg f = Iy. Tenemos entonces que g es biyectiva por la parte ya probada, luegog−1 g f = g−1, luego f = g−1 y f es biyectiva.

3Notemos que aquı no usamos el axioma de eleccion porque A<ω es bien ordenable.4Tal y como se explica tras la prueba, como x es bien ordenable el argumento no requiere

el axioma de eleccion.

Page 126: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

116 Capıtulo 4. Cardinales

Nota Un conjunto x con la propiedad de que existe f : x −→ x inyectiva y nosuprayectiva recibe el nombre de conjunto D–infinito (o infinito de Dedekind),y los conjuntos que no son D–infinitos se llaman D–finitos.

El teorema anterior implica que todo conjunto D–infinito es infinito, luegotodo conjunto finito es D–finito. Sin embargo, el recıproco no puede probarsesin el axioma de eleccion.5 Lo mas que podemos probar es que un conjunto Nes D–infinito si y solo si tiene un subconjunto infinito numerable, es decir, si

ℵ0 ≤ N .En efecto, una implicacion esta probada en el teorema 2.25, pues en su de-

mostracion hemos visto que si un conjunto N es D–infinito existe una aplicacion

F : ω −→ N inyectiva, luego ℵ0 ≤ N .

Recıprocamente, si ℵ0 ≤ N , tenemos F : ω −→ N inyectiva, y podemosdefinir g : N −→ N inyectiva y no suprayectiva mediante

g(u) =

F (F−1(u) + 1) si u ∈ F [ω],u si u /∈ F [ω].

Con AE tenemos la equivalencia, pues si N es infinito entonces no |N | < ℵ0,luego ℵ0 ≤ |N | y, por consiguiente, N es D–infinito.

Otra propiedad relevante de los conjuntos finitos es la siguiente:

Teorema 4.39 Si X es un conjunto finito parcialmente ordenado no vacıo,entonces tiene al menos un elemento maximal y un elemento minimal. Porconsiguiente, todo conjunto finito totalmente ordenado tiene maximo y mınimoelemento, luego todo conjunto finito totalmente ordenado esta bien ordenado.

Demostracion: Por induccion sobre |X |. Suponemos que el resultado escierto cuando |X | < n y suponemos que |X | = n. Tomamos u ∈ X . Si esminimal, no hay nada que probar. En caso contrario, consideramos el conjuntoY = v ∈ X | v < u, que es finito, no vacıo y |Y | < |X |, luego tiene unelemento minimal v, que claramente es minimal de X . Igualmente se prueba laexistencia de maximales.

La parte para conjuntos totalmente ordenados es inmediata (pues en unconjunto totalmente ordenado todo minimal es un mınimo y todo maximal esun maximo) y, por consiguiente, si X es un conjunto finito totalmente ordenadoesta bien ordenado, ya que todo subconjunto de X no vacıo es tambien unconjunto finito totalmente ordenado, luego tiene mınimo.

Notemos que hemos probado algo ligeramente mas fuerte: todo elemento ude un conjunto finito parcialmente ordenado esta por encima de un minimal ypor debajo de un maximal.

5En realidad basta ED. Si X es un conjunto infinito, consideramos el conjunto A de todaslas funciones s : n −→ A inyectivas, con n ∈ ω, con la relacion sR t ↔ t s. Claramente EDproporciona una sucesion snn∈ω que determina una aplicacion f =

n∈ω: ω −→ A inyectiva.

Page 127: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.4. Conjuntos finitos 117

En la seccion 2.6 definimos sumas finitas sobre cualquier clase A dotada deuna operacion asociativa y con elemento neutro para sucesiones aii∈I , dondeI era un subconjunto de un numero natural (lo cual se usaba para determinar elorden de los sumandos en la suma finita). Vamos a ver ahora que si la operaciones conmutativa podemos definir sumas de sucesiones definidas sobre cualquierconjunto finito, en las que no importa el orden de los sumandos. Para elloprobamos lo siguiente:

Teorema 4.40 Sea A una clase y + una operacion en A asociativa, conmu-tativa y con elemento neutro 0. Sea σ : n −→ n biyectiva y sea aii∈n unasucesion finita en A. Entonces

i<n

ai =∑

i<n

aσ(i).

Demostracion: Lo probamos por induccion sobre n. Si n = 0 por de-finicion ambos terminos son 0. Si vale para n, consideramos una sucesionaii<n+1 en A y una biyeccion σ : n + 1 −→ n + 1. Si σ(n) = n, enton-ces, aplicando la hipotesis de induccion a σ|n : n −→ n vemos que

i<n+1

ai =∑

i<n

ai + an =∑

i<n

aσ(i) + aσ(n) =∑

i<n+1

aσ(i).

Supongamos ahora que σ(n) = k < n. Entonces, por la asociatividad generali-zada probada en la seccion 2.6 tenemos que

i<n+1

ai =k−1∑

i=0

ai + ak +n∑

i=k+1

ai =∑

i∈I

ai + ak,

donde I = (n+ 1) \ k. Sea s : n −→ I la semejanza, que no es sino

s(i) =

i si i < k,i+ 1 si k ≤ i,

y sea τ : n −→ n la biyeccion dada por

τ(i) =

σ(i) si σ(i) < k,σ(i) − 1 si σ(i) > k.

Entonces, aplicando a τ la hipotesis de induccion,

i<n+1

ai =∑

i∈I

ai + ak =∑

i<n

as(i) + aσ(n) =

i<n

as(τ(i)) + aσ(n) =∑

i<n

aσ(i) + aσ(n) =∑

i<n+1

aσ(i).

De este modo, si I es un conjunto finito cualquiera, aii∈I es una sucesionen A y en A tenemos definida una operacion en las condiciones del teoremaanterior, podemos definir

i∈I

ai =∑

j<n

as(j),

Page 128: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

118 Capıtulo 4. Cardinales

donde s : n −→ I es cualquier biyeccion. El resultado no depende de la biyeccionelegida porque si t : n −→ I es otra biyeccion, podemos aplicar el teoremaanterior a σ = t s−1 : n −→ n, lo que nos da la igualdad

j<n

as(j) =∑

j<n

at(j).

Ahora podemos expresar la propiedad asociativa generalizada bajo hipotesismas generales que en 2.48:

Teorema 4.41 (Propiedad asociativa generalizada) Sea A una clase enla que hay definida una operacion + asociativa, conmutativa y con elementoneutro. Sea Iii<k una familia de conjuntos finitos disjuntos dos a dos, seaI =

i<k

Ii y sea aii∈I una sucesion en A. Entonces,

j∈I

aj =∑

i<k

j∈Ii

aj .

Demostracion: Basta observar que existe una biyeccion s : n −→ I, donden ∈ ω, de modo que la familia s−1[Ii]i<k cumple las condiciones de 2.48, conlo que

j∈I

aj =∑

j<n

as(j) =∑

i<k

j∈s−1[Ii]

as(j) =∑

i<k

j∈Ii

aj .

Finalmente vamos a dar la caracterizacion que tenıamos pendiente de laexponenciacion ordinal en terminos de buenos ordenes.

Definicion 4.42 Sean A y B dos conjuntos bien ordenados y sea m el mınimode A. Definimos

A(B) = s | s : B −→ A ∧ |b ∈ B | s(b) 6= m| < ℵ0.

Si A = ∅ (en cuyo caso m no esta definido) entendemos que A(B) = ∅, salvo sitambien B = ∅, en cuyo caso A(B) = ∅, pues ∅ : ∅ −→ ∅.

Ası, si s, t ∈ A(B) son distintos, el conjunto

b ∈ B | s(b) 6= t(b) ⊂ b ∈ B | s(b) 6= m ∪ b ∈ B | t(b) = m

es finito, luego tiene un maximo elemento b∗ respecto del orden de A. Definimosel orden en A(B) dado por

s < t↔ s(b∗) < t(b∗).

Para probar que esta relacion es realmente de orden basta ver que es tran-sitiva. Ahora bien, si tenemos s < t < u y las dos primeras funciones difie-ren en b∗1 y las dos ultimas en b∗2, entonces la primera y la tercera difieren enmaxb∗1, b∗2 y si, por ejemplo, este maximo es b∗1, entonces s(b∗1) < t(b∗1) ≤ u(b∗1),y analogamente sucede si el maximo es b∗2, por lo que s < u. Trivialmente elorden es total.

Page 129: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.5. Sumas y productos infinitos 119

Vamos a ver que es un buen orden, para lo cual podemos simplificar elargumento si observamos que si A y A′, al igual que B y B′, son pares deconjuntos bien ordenados semejantes, es facil ver que A(B) ∼= A′(B′), por lo quepodemos limitarnos a probar que si α y β son ordinales, entonces α(β) estabien ordenado. De hecho, probaremos que ordα(β) = αβ y con ello habremosprobado el teorema siguiente:

Teorema 4.43 Si A y B son conjuntos bien ordenados de ordinales α y βrespectivamente, entonces A(B) esta bien ordenado, y

ord(A(B)) = αβ .

Demostracion: Por la discusion previa, basta probar que α(β) esta bienordenado y tiene ordinal αβ . El caso en que α = 0 es trivial, pues entonces

α(β) =

∅ si β = 0,∅ si β > 0.

Supongamos, pues que α 6= 0 y razonamos por induccion sobre β. Si β = 0tenemos que α(β) = ∅ y la conclusion es trivial. Si vale para β, basta observarque la aplicacion f : α(β+1) −→ α(β) × α dada por f(s) = (s|β , s(β)) es unasemejanza cuando en el producto consideramos el orden lexicografico.

Supongamos finalmente que el resultado es cierto para todo δ < λ, con loque tenemos semejanzas fδ : α(δ) −→ αδ. Definimos

Aδ = s ∈ α(λ) |∧

ǫ(δ ≤ ǫ→ s(ǫ) = 0).

Es inmediato comprobar que α(λ) =⋃

δ<λ

Aδ, y que la aplicacion Aδ −→ α(δ)

dada por s 7→ s|δ es una semejanza, luego Aδ esta bien ordenado y ordAδ = αδ.Ademas, si δ < δ′ < λ, todo elemento de Aδ′ \Aδ es mayor que todo elemento deAδ, luego si sδ = mın(Aδ′ \Aδ), se cumple que Aδ = (Aδ′ )

<sδ . Por consiguiente,

si llamamos fδ : Aδ −→ αδ a la semejanza, se cumple que fδ′ |Aδ: Aδ −→ fδ′(sδ)

es una semejanza, luego por la unicidad fδ′(sδ) = αδ y fδ′ |Aδ= fδ. Esto hace

que⋃

δ<λ

fδ : α(λ) −→ ⋃

δ<λ

αδ = αλ

sea una semejanza.

4.5 Sumas y productos infinitos

El calculo explıcito del cardinal de determinados conjuntos requiere consi-derar sumas y productos infinitos de otros cardinales conocidos. Practicamentetodos los resultados sobre estas sumas y productos dependen del axioma deeleccion, pues cuando tenemos infinitos conjuntos a menudo es imprescindibleescoger una biyeccion entre cada uno de ellos y su cardinal. Ası pues, en estaseccion usaremos libremente dicho axioma sin mencion explıcita.

Page 130: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

120 Capıtulo 4. Cardinales

Definicion 4.44 La suma de una familia de cardinales κii∈I se define como

i∈I

κi =∣∣∣⋃

i∈I

κi × i∣∣∣.

El resultado fundamental sobre sumas infinitas es el siguiente:

Teorema 4.45 Para cualquier familia de conjuntos Xii∈I se cumple que∣∣∣⋃

i∈I

Xi

∣∣∣ ≤

i∈I

|Xi|,

y si los conjuntos son disjuntos dos a dos entonces se da la igualdad.

Demostracion: Por el axioma de eleccion existe una familia de aplicacionesbiyectivas fi : |Xi| × i −→ Xi. Claramente

i∈I

fi :⋃

i∈I

|Xi| × i −→⋃

i∈I

Xi

es suprayectiva y si los conjuntos Xi son disjuntos dos a dos es biyectiva. Con-secuentemente ∣

∣∣⋃

i∈I

Xi

∣∣∣ ≤

∣∣∣⋃

i∈I

|Xi| × i∣∣∣ =

i∈I

|Xi|,

y se da la igualdad si los conjuntos son disjuntos.

El teorema siguiente se demuestra sin dificultad:

Teorema 4.46 Se cumple

a) Si∧

i ∈ I κi ≤ µi, entonces∑

i∈I

κi ≤∑

i∈I

µi,

b)∑

i∈I

κ = |I|κ,

c) µ∑

i∈I

κi =∑

i∈I

µκi.

A modo de ejemplo demostraremos la asociatividad generalizada de la sumade cardinales:

Teorema 4.47 Si I =⋃

j∈J

Ij y los conjuntos Ij son disjuntos dos a dos, enton-

ces∑

i∈I

κi =∑

j∈J

i∈Ij

κi.

Demostracion: En efecto:∑

i∈I

κi =∣∣∣⋃

i∈I

κi × i∣∣∣ =

∣∣∣⋃

j∈J

i∈Ij

κi × i∣∣∣ =

j∈J

∣∣∣⋃

i∈Ij

κi × i∣∣∣ =

j∈J

i∈Ij

κi.

Finalmente demostramos el teorema que nos permite calcular cualquier sumade cardinales. Las hipotesis excluyen el caso de una suma finita de cardinalesfinitos, pero esto es una suma usual de numeros naturales.

Page 131: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.5. Sumas y productos infinitos 121

Teorema 4.48 Si κii∈I es una familia de cardinales no nulos de modo queI es infinito o algun κi lo es, entonces

i∈I

κi = |I| supi∈I

κi.

Demostracion: Llamemos κ al supremo de los κi. Como los κi son nonulos tenemos que 1 ≤ κi ≤ κ, luego

|I| =∑

i∈I

1 ≤ ∑

i∈I

κi ≤∑

i∈I

κ = |I|κ.

Como cada κi ≤∑

i∈I

κi, tambien κ ≤ ∑

i∈I

κi.

Multiplicando las desigualdades (y teniendo en cuenta que, por las hipotesis,la suma es un cardinal infinito) obtenemos

|I|κ ≤(∑

i∈I

κi

)2

=∑

i∈I

κi.

Pasemos ahora a estudiar los productos infinitos. No podemos obtener re-sultados tan concluyentes como los que hemos obtenido para las sumas debidoa su proximidad a la exponenciacion cardinal. Recordemos la definicion delproducto cartesiano de una familia de conjuntos:

i∈I

Xi = f | f : I −→ ⋃

i∈I

Xi ∧∧

i ∈ I f(i) ∈ Xi.

El producto cartesiano de un conjunto de conjuntos es un conjunto porqueesta contenido en P(I × ⋃

i∈I

Xi).

Definicion 4.49 Llamaremos producto de una familia de cardinales κii∈I alcardinal

i∈I

κi =∣∣∣∏

i∈I

κi

∣∣∣,

donde el producto de la izquierda es el que estamos definiendo y el de la derechaes el producto cartesiano.

El resultado basico sobre productos infinitos es el siguiente:

Teorema 4.50 Si Xii∈I es una familia de conjuntos infinitos, entonces∣∣∣∏

i∈I

Xi

∣∣∣ =

i∈I

|Xi|.

Demostracion: Por el axioma de eleccion existe una familia de aplicacionesbiyectivas fi : Xi −→ |Xi|. Entonces la aplicacion f :

i∈I

Xi −→∏

i∈I

|Xi| dada

por f(xii∈I) = f(xi)i∈I es claramente biyectiva. Ası pues,∣∣∣∏

i∈I

Xi

∣∣∣ =

∣∣∣∏

i∈I

|Xi|∣∣∣ =

i∈I

|Xi|.

Recogemos en el teorema siguiente las propiedades sencillas de los productos:

Page 132: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

122 Capıtulo 4. Cardinales

Teorema 4.51 Se cumple:

a) Si algun κi = 0, entonces∏

i∈I

κi = 0,

b)∏

i∈I

κ = κ|I|,

c)(∏

i∈I

κi

=∏

i∈I

κµi ,

d)∏

i∈I

κµi = κ

i∈I

µi

,

e) Si∧

i ∈ I κi ≤ µi, entonces∏

i∈I

κi ≤∏

i∈I

µi,

f) Si I =⋃

j∈J

Ij, donde los conjuntos Ij son disjuntos dos a dos, entonces

i∈I

κi =∏

j∈J

i∈Ij

κi.

No es posible demostrar un teorema tan general como 4.48 para el calculode productos infinitos, pero a menudo basta el teorema siguiente:

Teorema 4.52 Sea καα<µ una familia de cardinales no nulos (donde µ esun cardinal infinito) tal que si α ≤ β < µ entonces κα ≤ κβ. Entonces

α<µκα = (sup

α<µκα)µ.

Demostracion: Sea κ = supα<µ

κα. Entonces∏

α<µκα ≤ ∏

α<µκ = κµ.

Tomemos una aplicacion biyectiva f : µ × µ −→ µ. Sea Aα = f [µ × α].Ası µ =

α<µAα y los conjuntos Aα tienen cardinal µ y son disjuntos dos a dos.

En particular no estan acotados en µ (o tendrıan cardinal menor). Teniendo encuenta la monotonıa de la sucesion κα, es claro que sup

β∈Aα

κβ = κ.

Como los κβ son no nulos, tenemos que κβ ≤∏

β∈Aα

κβ , luego

κ = supβ∈Aα

κβ ≤ ∏

β∈Aα

κβ .

Por consiguiente

κµ =∏

α<µκ ≤ ∏

α<µ

β∈Aα

κβ =∏

α<µκα ≤ κµ.

Por ejemplo,∏

n∈ωℵn = ℵℵ0

ω .

Page 133: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.5. Sumas y productos infinitos 123

Ejercicio: Probar que el teorema anterior sigue siendo valido si sustituimos µ por unordinal lımite λ y suponemos que λ contiene |λ| subconjuntos no acotados disjuntosdos a dos. En particular, probar que es cierto siempre que λ < ω1. En el capıtulosiguiente veremos que en general estas restricciones no pueden ser eliminadas.

Veamos ahora una desigualdad entre una suma y un producto:

Teorema 4.53 Si∧

i ∈ I 2 ≤ κi, entonces∑

i∈I

κi ≤∏

i∈I

κi.

Demostracion: Claramente |I| ≤ 2|I| =∏

i∈I

2 ≤ ∏

i∈I

κi. Por otra parte,

κi ≤∏

i∈I

κi, luego supi∈I

κi ≤∏

i∈I

κi. El teorema 4.48 nos da la conclusion si I

es infinito o algun κi es infinito. El caso restante se demuestra facilmente porinduccion sobre el cardinal de I (aunque nunca vamos a necesitar este caso).

Si nos fijamos en todos los teoremas sobre cardinales infinitos que hemosdemostrado hasta ahora, no encontraremos mas que una desigualdad estricta:el teorema de Cantor. El proximo teorema es la desigualdad estricta mas generalque se conoce sobre cardinales infinitos. Cualquier otra es un caso particular deesta. Por ejemplo, el teorema de Cantor se obtiene haciendo κi = 1 y µi = 2.

Teorema 4.54 (Teorema de Konig) Si∧

i ∈ I κi < µi, entonces

i∈I

κi <∏

i∈I

µi.

Demostracion: Si I = ∅ el teorema se reduce a 0 < 1. En otro caso, seaI ′ = i ∈ I | κi > 0. Para i ∈ I ′ tenemos que 1 ≤ κi < µi, luego 2 ≤ µi ypodemos aplicar el teorema anterior:

i∈I

κi =∑

i∈I′

κi ≤∏

i∈I′

µi ≤∏

i∈I

µi.

Supongamos que se diera la igualdad, es decir, que existe una aplicacionbiyectiva

f :⋃

i∈I

κi × i −→∏

i∈I

µi.

Sea fi : κi −→ µi dada por fi(α) = f(α, i)(i).

Como κi < µi la aplicacion fi no puede ser suprayectiva, luego existe unαi ∈ µi \fi[κi]. Los αi determinan un elemento α = (αi)i∈I ∈ ∏

i∈I

µi. Como f es

biyectiva, α tiene una antiimagen, de modo que f(β, j) = α. Entonces β ∈ κj yfj(β) = f(β, j)(j) = αj ∈ fj[κj ], en contradiccion con la eleccion de αj .

Page 134: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

124 Capıtulo 4. Cardinales

4.6 Cofinalidad

El concepto de cofinalidad es esencial en el estudio de los cardinales infinitos,y en particular en el estudio de la exponenciacion cardinal que todavıa tenemospendiente. En esta seccion no usamos el axioma de eleccion salvo en unos pocoscasos, donde lo indicaremos explıcitamente.

Definicion 4.55 Diremos que una aplicacion f : α −→ β entre dos ordinaleses cofinal si f [α] no esta acotado estrictamente en β, es decir, si se cumple que∧

γ < β∨

δ < α γ ≤ f(δ).

Llamaremos cofinalidad de β al menor ordinal α tal que existe una aplicacioncofinal f : α −→ β. Lo representaremos por cf β. Como la identidad en β esobviamente cofinal, vemos que cf β esta bien definida y ademas cf β ≤ β.

Informalmente, podemos decir que cf β es el mınimo numero de pasos que hayque dar para ascender completamente por β, es decir, para ascender rebasando(o, al menos, igualando) cualquier ordinal menor que β. Obviamente cf 0 = 0y cf(α + 1) = 1. En efecto, la aplicacion f : 1 −→ α + 1 dada por f(0) = α escofinal (α+ 1 tiene un maximo elemento y basta un paso para llegar hasta el).

Ası pues, la cofinalidad solo tiene interes sobre los ordinales lımite, los cualesno se pueden recorrer en un paso. De hecho, siempre hacen falta infinitos pasos:

Teorema 4.56∧

λ ω ≤ cf λ ≤ λ.

Demostracion: Ya sabemos que cf λ ≤ λ. Por otra parte cf λ no puedeser un numero natural n, ya que si f : n −→ λ, entonces f [n] es un conjuntofinito, luego tiene un maximo α < λ, luego α + 1 < λ es una cota estricta def [n], luego f no es cofinal.

Decimos que cf α es el mınimo numero de pasos necesarios para ascendercompletamente por α. Este “numero de pasos” es ciertamente un cardinal:

Teorema 4.57∧

α cf α ∈ K.

Demostracion: Si α = 0 o α = β + 1 sabemos que cf α es 0 o 1, luegoes un cardinal. Basta probar entonces que

λ cf λ ∈ K. Supongamos que| cf λ| < cf λ. Sea f : | cf λ| −→ cf λ biyectiva y sea g : cf λ −→ λ cofinal.Entonces f g : | cf λ| −→ λ tiene la misma imagen que g, luego es cofinal, encontra de la minimalidad de cf λ.

A partir de aquı trataremos unicamente con ordinales lımite. Notemos quef : α −→ λ es cofinal si y solo si f [α] no esta acotado en λ, es decir, si y solo si

λ = sup f [α] =⋃

δ<α

f(δ).

La forma mas economica de ascender por un ordinal es no retrocediendonunca. Veamos que esto siempre es posible:

Page 135: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.6. Cofinalidad 125

Teorema 4.58∧

λ∨

f f : cf λ −→ λ cofinal y normal.

Demostracion: Sea g : cf λ −→ λ cofinal. Definimos f : cf λ −→ Ω comola unica aplicacion que cumple

f(0) = g(0),∧

α < cf λ f(α+ 1) = maxg(α), f(α) + 1,∧

λ′ < cf λ f(λ′) =⋃

δ<λ′

f(δ).

Claramente f es normal. Veamos por induccion que∧

α < cf λ f(α) < λ.En efecto, para α = 0 es obvio y si vale para α vale claramente para α + 1.Supongamos que λ′ < cf λ y que

δ < λ′f(δ) < λ. Entonces es claro quef(λ′) ≤ λ, pero no puede darse la igualdad porque entonces f |′λ serıa cofinal enλ, en contradiccion con que λ′ < cf λ. Ası pues, tambien se cumple para λ′.

Tenemos entonces que f : cf λ −→ λ normal y, como∧

α < cf λ g(α) ≤ f(α),es claro que f es cofinal.

Este teorema nos permite expresar la cofinalidad de un ordinal lımite enterminos unicamente de sus subconjuntos acotados:

Teorema 4.59 La cofinalidad de un ordinal lımite λ es el mınimo cardinal κtal que existe un subconjunto a ⊂ λ no acotado de cardinal κ.

Demostracion: Si f : cf λ −→ λ es cofinal y normal, entonces a = f [cf λ]es un subconjunto no acotado de λ y, como f es inyectiva, su cardinal es cf λ.

Recıprocamente, si a ⊂ λ es un subconjunto no acotado, sea f : |a| −→ auna biyeccion. Entonces es claro que f : |a| −→ λ cofinal, luego cf λ ≤ |a|.

En general, la composicion de aplicaciones cofinales no es necesariamentecofinal (es facil encontrar ejemplos). El teorema siguiente nos da una condicionsuficiente:

Teorema 4.60 Si f : λ1 −→ λ2 y g : λ2 −→ λ3 son cofinales y ademas g escreciente, entonces f g : λ1 −→ λ3 es cofinal.

Demostracion: Sea α < λ3. Como g es cofinal existe β < λ2 tal queα ≤ g(β). Como f es cofinal existe γ < λ1 tal que β ≤ f(γ). Como g escreciente, α ≤ g(β) ≤ g(f(γ)) = (f g)(γ), luego f g es cofinal.

Esto tiene una consecuencia destacable:

Teorema 4.61 Si f : λ1 −→ λ2 es cofinal y creciente, entonces cf λ1 = cf λ2.

Demostracion: Sea g : cf λ1 −→ λ1 cofinal. Por el teorema anteriorg f : cf λ1 −→ λ2 es cofinal, luego cf λ2 ≤ cf λ1.

Sea ahora h : cf λ2 −→ λ2 cofinal y definamos r : cf λ2 −→ λ1 de modo quer(α) sea el menor β < λ1 tal que h(α) < f(β), que existe porque f es cofinal.Entonces r es cofinal, pues si γ < λ1 entonces f(γ) < λ2, luego existe un

Page 136: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

126 Capıtulo 4. Cardinales

δ < cf λ2 tal que f(γ) ≤ h(δ). Por definicion de r tenemos que h(δ) < f(r(δ)),y si fuera r(δ) ≤ γ serıa f(r(δ)) ≤ f(γ) ≤ h(δ), contradiccion, luego γ ≤ r(δ) yr es cofinal. Por consiguiente cf λ1 ≤ cf λ2 y tenemos la igualdad.

Este teorema, ademas de servir para calcular cofinalidades, tiene una lecturanegativa: en la prueba del teorema 4.58 hemos partido de una aplicacion cofinalarbitraria y la hemos modificado para hacerla cofinal y normal, en particularcreciente. Ahora vemos que esto no siempre puede hacerse: pueden darse casosen los que exista una aplicacion cofinal entre dos ordinales lımite y no existaninguna aplicacion cofinal y creciente, pues una condicion necesaria para queesto ocurra es que ambos ordinales tengan la misma cofinalidad.

Respecto al calculo de cofinalidades, el teorema siguiente es una consecuenciasencilla del anterior, pero mas comodo en la practica:

Teorema 4.62 Si f : λ1 −→ Ω es normal y λ < λ1, entonces cf λ = cf f(λ).

Demostracion: Es claro que f |λ : λ −→ f(λ) es cofinal y creciente. Bastaaplicar el teorema anterior.

Por ejemplo, cf ℵω2 = cf ω2 = cf(ω · ω) = cf ω = ℵ0, donde hemos usadola normalidad de las funciones ℵ y ω·. Una funcion cofinal de ω en ℵω2 esf(n) = ℵω·n.

Veamos un ejemplo tıpico de la utilidad del concepto de cofinalidad.

Definicion 4.63 Sea f : λ −→ λ, donde λ cumple cf λ > ℵ0 o bien λ = Ω.Para cada α ∈ λ definimos

f0(α) = α,

fn+1(α) = f(fn(α)),

fω(α) = supn∈ω

fn(α).

Una simple induccion prueba que∧

n ∈ ω fn(α) ∈ λ, y la hipotesis sobre λasegura que el conjunto numerable fn(α) | n ∈ ω tiene que estar acotadoen λ (teorema 4.59), luego fω(α) ∈ λ. Ası pues, tenemos definida una funcionfω : λ −→ λ a la que llamaremos funcion iterada de f .

Es inmediato a partir de esta construccion que∧

α ∈ λ α ≤ fω(α).

Informalmente, fω(α) resulta de aplicar infinitas veces f a α, lo cual haceque si aplicamos f una vez mas no se nota:

Teorema 4.64 Sea f : λ −→ λ una funcion normal, donde cf λ > ℵ0 o bienλ = Ω. Entonces

α ∈ λ f(fω(α)) = fω(α).

Demostracion: Como f es normal, se cumple que fω(α) ≤ f(fω(α)).Para probar la otra desigualdad distinguimos tres casos:

Si fω(α) = 0, entonces α = f(α) = 0, pues tanto α como f(α) estan bajofω(α). Por consiguiente f(fω(α)) = f(0) = f(α) ≤ fω(α).

Page 137: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.6. Cofinalidad 127

Si fω(α) = γ + 1, entonces γ < fω(α), luego γ < fn(α) para cierto n ∈ ω.Ası,

f(fω(α)) = f(γ + 1) ≤ f(fn(α)) = fn+1(α) ≤ fω(α).

Si fω(α) es un ordinal lımite, como f es normal,

f(fω(α)) =⋃

δ<fω(α)

f(δ) ≤⋃

n∈ωf(fn(α)) ≤

n∈ωfn+1(α) ≤ fω(α).

En particular hemos demostrado:

Teorema 4.65 (Teorema de punto fijo para funciones normales) Seaf : λ −→ λ una funcion normal, donde cf λ > ℵ0 o bien λ = Ω. Entonces

α ∈ λ∨

β ∈ λ(α ≤ β ∧ f(β) = β).

La funcion (ω+) : ω2 −→ ω2 es un ejemplo de funcion normal sin puntosfijos. Destaquemos el papel que desempena la hipotesis sobre la cofinalidad:para construir puntos fijos necesitamos ascender ℵ0 pasos, luego necesitamosque la cofinalidad de λ sea no numerable para garantizar que con el ascenso nonos salimos de λ.

Ası, por ejemplo, existen cardinales κ arbitrariamente grandes tales queκ = ℵκ.

Pasemos ahora al calculo de la cofinalidad de los cardinales infinitos. Ellorequiere el axioma de eleccion. En primer lugar damos una caracterizacion enterminos de la aritmetica cardinal:

Teorema 4.66 (AE) Sea κ un cardinal infinito. Entonces cf κ es el menorcardinal µ tal que existe una familia de cardinales ναα<µ tales que

α < µ να < κ y∑

α<µνα = κ.

Demostracion: Sea f : cf κ −→ κ cofinal. Entonces κ =⋃

α<cf κ

f(α). Sea

να = |f(α)| < κ. Entonces

κ = |κ| =∣∣∣

α<cf κ

f(α)∣∣∣ ≤

α<cf κ

να ≤ ∑

α<cf κ

κ = κ cf κ = κ.

Por consiguiente κ =∑

α<cf κ

να. Ahora veamos que cf κ es el mınimo cardinal

que cumple esto. Tomemos µ < cf κ y sea ναα<µ una familia de cardinalestal que

α < µ να < κ.La aplicacion f : µ −→ κ dada por f(α) = να no puede ser cofinal, luego

existe un ordinal β < κ tal que∧

α < µ να < β y ası∑

α<µνα ≤ ∑

α<µ|β| = µ |β| < κ,

luego, en efecto, cf κ es el mınimo cardinal con la propiedad del enunciado.

Ası pues, tenemos lo siguiente sobre las cofinalidades de los cardinales infi-nitos:

Page 138: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

128 Capıtulo 4. Cardinales

Teorema 4.67 (AE) Se cumple

a) cf ℵ0 = ℵ0,

b)∧

λ cf ℵλ = cf λ,

c) (AE)∧

α cf ℵα+1 = ℵα+1.

Demostracion: a) es consecuencia inmediata de 4.56, b) es un caso parti-cular de 4.62. Veamos c). En caso contrario, serıa cf ℵα1 ≤ ℵα y por el teoremaanterior existirıan cardinales νδδ<cf ℵα+1 tales que

δ < cf ℵα+1 νδ ≤ ℵα y

ℵα+1 =∑

δ<cf ℵα+1

νδ ≤∑

δ<cf ℵα+1

ℵα = ℵα cf ℵα+1 = ℵα,

contradiccion.

Ası pues, el hecho de que cf ℵ0 = ℵ0 expresa que la union finita de conjuntosfinitos es finita e, igualmente, cf ℵ1 = ℵ1 expresa que la union de una cantidadnumerable de conjuntos numerables es numerable. En cambio, podemos obte-ner un conjunto de cardinal ℵω uniendo tan solo una cantidad numerable deconjuntos de cardinal menor que ℵω, pues basta unir un conjunto de cardinalℵ0 con otro de cardinal ℵ1, con otro de cardinal ℵ2, etc. Por ello, cf ℵω = ℵ0.

Definicion 4.68 Un cardinal infinito κ es regular si cf κ = κ y es singular sicf κ < κ.

Un cardinal infinito κ es un cardinal sucesor si es de la forma µ+, para otrocardinal µ y es un cardinal lımite en caso contrario. Es claro que los cardinaleslımite son ℵ0 y los de la forma ℵλ, mientras que los cardinales sucesores sonlos de la forma ℵα+1. Hemos probado que ℵ0 y todos los cardinales sucesoresson regulares. En cambio, ℵω o ℵω3 son ejemplos de cardinales singulares (decofinalidades, respectivamente, ℵ0 y ℵ3).

De los teoremas 4.58 y 4.61 se sigue inmediatamente:

Teorema 4.69∧

α cf α es un cardinal regular.

Todo cardinal sucesor es regular y conocemos ejemplos de cardinales lımitesingulares. Queda abierta la cuestion de si existen cardinales lımite regularesaparte de ℵ0.

Definicion 4.70 Un cardinal debilmente inaccesible es un cardinal lımite regu-lar distinto de ℵ0.

Sucede que a partir de los axiomas que estamos considerando no es posi-ble demostrar la existencia de cardinales debilmente inaccesibles. Terminamosprobando una propiedad de estos cardinales:

Teorema 4.71 Un cardinal regular κ es debilmente inaccesible si y solo si cum-ple κ = ℵκ.

Page 139: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.7. Aplicaciones sobre el axioma de eleccion 129

Demostracion: Una implicacion es obvia. Si κ es debilmente inaccesible,entonces κ = ℵλ, para cierto λ tal que

λ ≤ ℵλ = κ = cf κ = cf ℵλ = cf λ ≤ λ.

Naturalmente, la funcion ℵ tiene infinitos puntos fijos que no son cardinalesinaccesibles (porque son singulares).

4.7 Aplicaciones sobre el axioma de eleccion

Terminamos este capıtulo con dos aplicaciones de la aritmetica cardinal re-lacionadas con el axioma de eleccion. La primera es un hecho sorprendente:La hipotesis del continuo generalizada implica el axioma de eleccion. Esto fueanunciado por Hausdorff, si bien la primera prueba publicada fue de Sierpinski.La demostracion que veremos aquı es posterior. Necesitamos algunos resultadosprevios.

En primer lugar, sin el axioma de eleccion hemos probado que, para todoordinal infinito α, se cumple |α×α| = |α|. Ahora necesitamos construir, tambiensin el axioma de eleccion,6 una aplicacion que a cada ordinal infinito α le asigneuna biyeccion fα : α × α −→ α. Por ejemplo, la prueba de 4.25 muestra quesi α es un cardinal entonces α × α con el orden canonico es semejante a α,luego si nos bastara trabajar con cardinales podrıamos definir fα como la unicasemejanza entre α×α y α. El problema es que necesitamos esto para cualquierordinal α ≥ ω. Resolveremos esto en varios pasos.

a) Para cada par de ordinales α y β, podemos definir explıcitamente unabiyeccion fα,β : α+ β −→ β + α.

Llamamos gα,β : α + β −→ α × 0 ∪ β × 1 a la unica semejanza entreambos conjuntos cuando en el segundo consideramos el orden lexicografico.Por otra parte podemos considerar la biyeccion

hα,β : α× 0 ∪ β × 1 −→ β × 0 ∪ α× 1

dada por hα,β(δ, n) = (δ, 1 − n). Basta tomar fα,β = gα,β hα,β g−1β,α.

b) Para cada sucesion de ordinales η = ηii<n+1 podemos definir una bi-yeccion

gη : ωη0 + · · · + ωηn −→ ωηn + · · · + ωη0 .

En efecto, para ello definimos recurrentemente biyecciones

giη : ωη0 + · · · + ωηi −→ ωηi + · · · + ωη0 .

6El lector que conozca la clase L de los conjuntos constructibles tiene una alternativa massencilla a toda la construccion que sigue: basta definir fα como el mınimo f ∈ L (respectodel buen orden constructible) tal que f : α× α −→ α biyectiva.

Page 140: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

130 Capıtulo 4. Cardinales

Tomamos como g0η la identidad en ωη0 y, supuesta definida giη, con i < n,definimos

hiη : (ωη0 + · · · + ωηi) + ωηi+1 −→ (ωηi + · · · + ωη0) + ωηi+1

mediante

hiη(α) =

hiη(α) si α < ωη0 + · · · + ωηi ,(ωηi + · · · + ωη0) + δ si α = (ωη0 + · · · + ωηi) + δ.

Y entonces definimos gi+1η = hiη fωη0+···+ωηi ,ωηi+1 . De este modo, basta

tomar gη = gn+1η .

c) Si α = ωη0k0 + · · · + ωηnkn es la forma normal de Cantor del ordinal α,podemos definir una biyeccion c∗α : α −→ ωη0k0.

En efecto, llamamos η′α = η′ii<m a la unica sucesion decreciente de

ordinales tal que α = ωη′0 + · · · + ωη′

m (donde cada ordinal ηi se repite kiveces). Basta considerar

c∗α = gη′α

: ωη′0 + · · · + ωη′

m −→ ωη′m + · · · + ωη′

0 ,

pues por 2.52 todos los sumandos de la ultima suma se cancelan exceptolos que son iguales a η0, que son los k0 ultimos, luego la ultima suma esωη0k0.

d) En las condiciones del apartado anterior, si α ≥ ω (con lo que η0 > 0)podemos definir una biyeccion cα : α −→ ωη0 .

En efecto, razonando como en el apartado a), pero para el producto enlugar de la suma, podemos definir una biyeccion ωη0k0 −→ k0ω

η0 = ωη0 ,y solo tenemos que componerla con la c∗α del apartado anterior.

Ası pues, si llamamos ηα al exponente director de la forma normal de α,tenemos una biyeccion cα : α −→ ωηα .

e) Para todo ordinal α se cumple que ηα = ηα+α.

En efecto, α+α = α · 2, por lo que la forma normal de α+α se diferenciade la de α en que sus coeficientes estan multiplicados por 2 (pero losexponentes son identicos).

f) Para cada α ≥ ω, podemos definir una biyeccion sα : α −→ α+ α.

Basta tomar sα = cα c−1α+α, teniendo en cuenta que ωηα = ωηα+α .

g) Podemos definir una biyeccion eη : ωη −→ ωη+η.

Si η es infinito podemos considerar las semejanzas uη : ωη −→ ω(η) yuη+η : ωη+η −→ ω(η+η) dadas por el teorema 4.43. Por otra parte, la

Page 141: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.7. Aplicaciones sobre el axioma de eleccion 131

aplicacion vη : ω(η+η) −→ ω(η) dada por vη(s) = sη s es claramentebiyectiva, luego basta tomar eη = uη v−1

η u−1η+η.

Si η es finito (no nulo), consideramos la semejanza f0 : ω × ω −→ ωdeterminada por el orden canonico. Vamos a definir recurrentemente bi-yecciones tn : ω −→ ωn, para n ≥ 1. Tomamos como t1 la identidad en ωy, supuesto definido tn, definimos tn+1 como la composicion de:

• la semejanza ωn+1 = ωn · ω −→ ωn × ω, cuando en el productoconsideramos el orden lexicografico,

• la biyeccion ωn × ω −→ ω × ω dada por (δ, n) 7→ (tn(δ), n),

• la biyeccion f0 : ω × ω −→ ω.

Ahora basta tomar eη = t−1η tη+η.

h) Para cada α ≥ ω, podemos definir una biyeccion fα : α −→ α× α.

Basta definir fα como la composicion de la biyeccion: cα : α −→ ωηα coneηα

: ωηα −→ ωηα+ηα = ωηα ·ωηα , con la semejanza ωηα ·ωηα −→ ωηα×ωηα

con la biyeccion ωηα × ωηα −→ α× α dada por (δ, ǫ) 7→ (c−1α (δ), c−1

α (ǫ)).

El paso siguiente es probar lo que sin el axioma de eleccion es una levegeneralizacion del teorema de Cantor:

Teorema 4.72 Si p ≥ 5 entonces no 2p ≤ p2.

Demostracion: Para cardinales finitos se demuestra facilmente por in-duccion que n ≥ 5 → n2 < 2n: Para n < 5 la implicacion es cierta trivialmente,para n = 5 se hace el calculo y, si vale para n ≥ 5, entonces

(n+ 1)2 = n2 + 2n+ 1 < n2 + 3n ≤ n2 + n2 = 2n2 < 2 · 2n = 2n+1.

Supongamos ahora que p es un cardinal infinito y sea X = p. Por reduccional absurdo suponemos una aplicacion f : PX −→ X × X inyectiva y vamosa construir una aplicacion G : Ω −→ X inyectiva, con lo que tendremos unacontradiccion. En primer lugar veremos que podemos construir gω : ω −→ Xinyectiva.

Por el teorema 4.36 tenemos que Pfω es numerable, luego podemos fijarun buen orden en el. Tomemos elementos distintos x0, x1, x2, x3, x4 ∈ X ydefinamos gω(i) = xi, para i < 5.

Supuesta definida gω|n : n −→ X inyectiva, para n ≥ 5, sea Cn = gω[n].Como |PCn| = 2n > n2 = |Cn × Cn|, existe un subconjunto U de Cn tal quef(U) /∈ Cn × Cn. Elegimos el que cumple que g−1

ω [U ] es mınimo respecto albuen orden que hemos fijado en Pfω. Si f(U) = (x, y), definimos

gω(n+ 1) =

x si x /∈ Cn,y si x ∈ Cn.

Page 142: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

132 Capıtulo 4. Cardinales

Con esto tenemos que gω|n+1 : n+1 −→ X es inyectiva. El teorema de recursionnos garantiza la existencia de gω.

Pasemos ahora a la construccion de G : Ω −→ X . Para ello nos apoyaremosen las biyecciones fα : α −→ α × α que hemos definido para todo ordinalinfinito α (sin el axioma de eleccion). Suponemos definida G|α : α −→ Xinyectiva. Sea Cα = G[α].

Definimos g : α −→ PX como sigue: dado β < α calculamos fα(β) = (γ, δ)y tomamos g(β) = f−1(G(γ), G(δ)) si el par (G(γ), G(δ)) tiene antiimagen porf y g(β) = ∅ en caso contrario.

Sea U = G(β) | β < α ∧ G(β) /∈ g(β) y sea f(U) = (x, y).

Si (x, y) ∈ Cα × Cα entonces (x, y) = (G(γ), G(δ)) para ciertos γ, δ < α.Sea β = f−1

α (γ, δ), de modo que g(β) = U y tenemos una contradiccion tantosi G(β) ∈ U como en caso contrario. Por consiguiente (x, y) /∈ Cα × Cα, luegopodemos definir G(α) = x si x /∈ Cα o G(α) = y en caso contrario. El teoremade recursion transfinita nos da entonces la existencia de G.

Nota Sin el axioma de eleccion no puede probarse en general que p2 ≤ 2p.

Teorema 4.73 La hipotesis del continuo generalizada implica el axioma deeleccion.

Demostracion: Por el teorema 4.29, basta probar que p2 = p para todocardinal infinito p. En primer lugar probamos que p = p + 1.

Es facil ver que p ≤ p + 1 ≤ 2p, pero si fuera p + 1 = 2p, tendrıamos que2p ≤ p + 1 ≤ p + p ≤ pp, en contradiccion con el teorema anterior. Ası pues, laHCG implica que p = p + 1

Ahora veamos que p = 2p.

En efecto, p ≤ 2p ≤ 2 · 2p = 2p+1 = 2p, pero no puede ser 2p = 2p ya queentonces 2p = 2p ≤ pp, de nuevo en contra del teorema anterior. La HCG nosda, pues, la igualdad p = 2p.

Ası, p ≤ p2 ≤ (2p)2 = 22p = 2p. El teorema anterior y la HCG nos dan laigualdad p2 = p.

Hemos demostrado que el axioma de eleccion equivale a que todo conjuntopuede ser bien ordenado. En cambio, sin el axioma de eleccion no es posibledemostrar que Pω pueda ser bien ordenado. Nuestra segunda aplicacion de laaritmetica cardinal sera demostrar el teorema siguiente:

Teorema 4.74 El axioma de eleccion equivale a que Pα puede ser bien orde-nado, para todo ordinal α.

Demostracion: Suponemos que Pα puede ser bien ordenado, para todoordinal α, y vamos a probar que Vα puede ser bien ordenado, tambien para todo

Page 143: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

4.7. Aplicaciones sobre el axioma de eleccion 133

ordinal α. Esto es suficiente, ya que (por el axioma de regularidad) todo con-junto esta contenido en un conjunto Vα, luego todo conjunto admitira entoncesun buen orden. Lo probamos por induccion sobre α. Si α = 0 es trivial.

Si suponemos que Vα es bien ordenable, existe f : Vα −→ β biyectiva, paracierto ordinal β. Claramente, f induce una biyeccion F : Vα+1 = PVα −→ Pβy, como estamos suponiendo que Pβ es bien ordenable, concluimos que Vα+1

tambien lo es.

Supongamos ahora que Vδ es bien ordenable, para todo ordinal δ < λ. Estees el caso mas delicado, porque no podemos elegir un buen orden en cada Vδ sinmas aclaracion, ya que entonces estarıamos usando el axioma de eleccion.

Vamos a construir una sucesion Eδδ≤λ de modo que cada Eδ es un buenorden en Vδ con la propiedad de que si δ < δ′ < λ, entonces Vδ sea una seccioninicial de Vδ′ respecto a Eδ′ .

Antes de ello, observamos que esta definida la sucesion |Vδ|δ<λ, luegopodemos considerar el cardinal κ =

δ<λ

|Vδ|+. Fijamos un buen orden ≤∗ en elconjunto Pκ.

Ahora definimos E0= ∅. Supuesto definido Eδ, consideramos la semejanzasδ : (Vδ,Eδ) −→ αδ, donde |αδ| = |Vδ| < κ, luego αδ < κ, luego Pαδ ⊂ Pκ,luego el buen orden ≤∗ induce un buen orden en Pαδ, que a su vez induce unbuen orden E∗

δ+1 en Vδ+1 a traves de la biyeccion PVδ −→ Pαδ inducida por sδ.Por ultimo definimos Eδ+1 mediante:

x Eδ+1 y ↔ (x, y ∈ Vδ ∧ x Eδ y) ∨ (x ∈ Vδ ∧ y ∈ Vδ+1 \ Vδ)

∨ (x, y ∈ Vδ+1 \ Vδ ∧ x E∗δ+1 y).

Con este retoque nos aseguramos de que Vδ es una seccion inicial de Vδ+1.

Si tenemos definidos Eδδ<λ′ , para λ′ ≤ λ, la condicion de que cada Vδsea una seccion inicial de los siguientes conjuntos de la jerarquıa implica que launion de todos los buenos ordenes es un buen orden Eλ′ respecto del cual cadaVδ es una seccion inicial de Vλ′ .

Ası tenemos construida la sucesion de buenos ordenes y, en particular, tene-mos el buen orden Eλ, que prueba que Vλ es bien ordenable.

Observemos que el axioma de regularidad es esencial en el teorema anterior.Si no suponemos dicho axioma, lo que muestra la prueba es que si Pα puede serbien ordenado, para todo ordinal α, entonces todo conjunto regular puede serbien ordenado.

Sin el axioma de eleccion, ni siquiera es demostrable que todo conjunto puedaser totalmente ordenado, pero como complemento al teorema anterior convieneobservar lo siguiente:

Teorema 4.75 Si A es un conjunto bien ordenable, entonces PA admite unorden total.

Page 144: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

134 Capıtulo 4. Cardinales

Demostracion: Basta probar que si α es un ordinal, entonces Pα admiteun orden total, pero siempre podemos comparar dos subconjuntos x, y ⊂ α talesque x 6= y tomando el mınimo δxy ∈ (x \ y) ∪ (y \ x) y estableciendo que

x < y ↔ δxy ∈ x.

Observemos que la relacion es transitiva, pues si x < y < z, entonces δxy 6= δyz,pues δxy /∈ y ∧ δyz ∈ y. Si δxy < δyz, entonces δxy ∈ x \ z, pues si δxy ∈ zcumplirıa tambien δxy ∈ y (por ser menor que el mınimo ordinal que distinguea y y a z) y de hecho δxy = δxz, pues si α ∈ (x \ z) ∪ (z \ x), o bien α ∈ y, encuyo caso, o bien α ∈ y \ z, luego α ≥ δyz > δxy, o bien α ∈ y \x, luego α ≥ δxy.Esto prueba que x < z.

Alternativamente, si δyz < δxy, tiene que ser δyz ∈ x (pues esta en y y es me-nor que el mınimo ordinal que distingue a x de y) y se comprueba analogamenteque δxz = δyz, luego tambien x < z.

Page 145: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo V

La exponenciacion cardinal

Tal y como indicamos en el capıtulo anterior, la exponenciacion de cardi-nales es muy diferente de la suma y el producto, en cuanto que estos estancompletamente determinados y pueden ser calculados con facilidad, de modoque podemos afirmar, por ejemplo, que ℵ5 + ℵ7 = ℵ5ℵ7 = ℵ7. En cambio, losaxiomas de NBG no permiten determinar ni siquiera el valor de 2ℵ0 , que esel cardinal de un conjunto tan “relativamente simple” como Pω. De hecho, laexponenciacion cardinal sigue siendo hoy en dıa objeto de investigacion, puesno se sabe a ciencia cierta donde acaba lo que se puede decir sobre ella sin masbase que los axiomas usuales de la teorıa de conjuntos y que posibilidades sonconsistentes con ellos aunque indemostrables a partir de ellos.

Hasta ahora hemos presentado unicamente las propiedades mas elementalesde la exponenciacion de cardinales, que pueden probarse incluso sin el axiomade eleccion. Aquı vamos a obtener mas resultados trabajando con la axiomaticacompleta de NBG.

Nota En lo sucesivo usaremos la notacion βα para representar al conjunto delas aplicaciones de β en α cuando la notacion usual αβ pueda confundirse conla exponenciacion ordinal o cardinal.

5.1 La exponenciacion en NBG

Veamos primero lo que podemos decir sobre el calculo de potencias de car-dinales partiendo exclusivamente de los axiomas de NBG. En las secciones si-guientes veremos que mas podemos anadir si suponemos axiomas adicionalescomo la hipotesis del continuo generalizada.

Sabemos que la exponenciacion de numeros naturales se reduce a la usual,por lo que podemos centrarnos en el caso en que al menos uno de los cardinaleses infinito. Mas concretamente, el caso realmente interesante se da cuando elexponente es infinito, ya que si es finito la potencia se reduce a las propiedadesdel producto de cardinales por induccion. De hecho, en virtud del teorema

135

Page 146: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

136 Capıtulo 5. La exponenciacion cardinal

4.29, el teorema siguiente (enunciado para cardinales no necesariamente bienordenables) es una forma equivalente del axioma de eleccion:

Teorema 5.1 Si κ es un cardinal infinito y n un numero natural no nulo,entonces κn = κ.

Si la base es finita (mayor que 1, o si no el calculo es trivial), el problema sereduce al caso en que es igual a 2. Mas en general:

Teorema 5.2 Sean κ y µ cardinales tales que 2 ≤ κ ≤ µ y ℵ0 ≤ µ. Entoncesκµ = 2µ.

Demostracion: κµ ≤ (2κ)µ = 2µ ≤ κµ.

Si la base es infinita podemos centrarnos en el caso en que sea un cardinallımite, en virtud de la formula que probamos a continuacion. En la pruebahacemos uso de un argumento general que conviene destacar porque nos va aaparecer mas veces:

Si µ < cf κ, entoncesµκ =

α<κ

µα.

En efecto, esto es una forma de expresar que toda funcion f : µ −→ κ estaacotada.

Teorema 5.3 (Formula de Hausdorff) Se cumple:

αβ ℵℵβ

α+1 = ℵℵβα ℵα+1.

Demostracion: Si α+ 1 ≤ β, entonces ℵα+1 ≤ ℵβ < 2ℵβ , luego

ℵℵβα ℵα+1 = 2ℵβℵα+1 = 2ℵβ = ℵℵβ

α+1.

Si, por el contrario, β < α+ 1, entonces, como ℵα+1 es regular,

ωβωα+1 =⋃

δ<ωα+1

ωβδ,

luego

ℵℵβ

α+1 = |ωβωα+1| =∣∣∣

δ<ωα+1

ωβδ∣∣∣ ≤

δ<ωα+1

|δ|ℵβ ≤∑

δ<ωα+1

ℵℵβα = ℵℵβ

α ℵα+1.

La otra desigualdad es obvia.

Al igual que 5.2, muchos de los resultados sobre exponenciacion cardinal in-volucran la funcion 2κ, la cual, ciertamente, es el esqueleto de la exponenciacioncardinal. Por ello es conveniente darle un nombre:

Definicion 5.4 Se llama funcion del continuo a la funcion κ 7→ 2κ definidasobre los cardinales infinitos.

Page 147: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

5.1. La exponenciacion en NBG 137

Ası, la hipotesis del continuo generalizada no es mas que una determinacionde la funcion del continuo, en virtud de la cual 2κ = κ+. Ya hemos comentadoque esta hipotesis no puede ser demostrada ni refutada, lo que significa que hayotras alternativas igualmente consistentes con los axiomas de NBG (supuesto,claro, que estos sean consistentes). De todos modos, no sirve cualquier deter-minacion total o parcial de la funcion del continuo. Por ejemplo, es obvio queserıa contradictorio suponer que

2ℵ0 = ℵ5 ∧ 2ℵ1 = ℵ3.

Mas en general, la funcion del continuo ha de respetar la monotonıa:

κ ≤ µ→ 2κ ≤ 2µ.

Otra restriccion a la funcion del continuo es el teorema de Cantor: serıa con-tradictorio suponer que 2κ = κ para todo cardinal κ, a pesar de que esta funciondel continuo sı que es monotona. En realidad, la funcion del continuo esta so-metida a una desigualdad mas fina que el teorema de Cantor, consecuencia delteorema de Konig 4.54 y, mas concretamente, del teorema siguiente:

Teorema 5.5 (Teorema de Konig) Para todo cardinal infinito κ se cumpleκ < κcf κ.

Demostracion: Sea µαα<cf κ una familia de cardinales menores que κtales que κ =

α<cf κ

µα. Por el teorema 4.54 resulta que

κ =∑

α<cf κ

µα <∏

α<cf κ

κ = κcf κ.

Ciertamente, este teorema refina al teorema de Cantor, pues en virtud delteorema 5.2 este puede expresarse como κ < κκ, y en el teorema anterior elexponente es menor o igual que κ. De todos modos, podemos expresar estarestriccion en terminos de la funcion del continuo:

Teorema 5.6 (Teorema de Konig) Si κ es un cardinal infinito, entoncesκ < cf 2κ.

Demostracion: Si cf 2κ ≤ κ, entonces (2κ)cf 2κ ≤ (2κ)κ = 2κ, en contra-

diccion con el teorema anterior.

Ası pues, 2ℵ0 puede ser ℵ1, ℵ2, ℵω+1 o ℵω3 , pero no ℵω. Cuando decimos“puede ser” queremos decir que es consistente suponer que lo es. En efecto,aunque no lo vamos a probar aquı, este teorema y la monotonıa es todo lo quepuede probarse sobre la funcion del continuo sobre cardinales regulares, en elsentido de que cualquier axioma que determine la funcion del continuo sobrecardinales regulares que sea compatible con estos dos requisitos es consistentecon los axiomas de NBG (supuesto que estos sean consistentes).

Notemos que no exigimos que la funcion 2κ sea estrictamente monotona, demodo que, por ejemplo, es consistente suponer que 2ℵ0 = 2ℵ1 = ℵ5.

Page 148: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

138 Capıtulo 5. La exponenciacion cardinal

Debemos resaltar la restriccion a cardinales regulares. Si no fuera ası podrıa-mos decir que comprendemos completamente la funcion del continuo, en cuantoque sabrıamos decir exactamente que posibilidades son consistentes y cuales no.Sin embargo, la situacion en los cardinales lımite es muy confusa. Por ejemplo,es contradictorio suponer que

α 2ℵα = ℵα+ω+2,

a pesar de que esta (presunta) funcion del continuo respeta tanto la monotonıacomo el teorema de Konig. Segun lo dicho, no hay inconveniente en postulareste axioma unicamente para cardinales regulares, pero no puede cumplirse paratodos los cardinales singulares, como muestra el teorema siguiente:

Teorema 5.7 Si un ordinal β cumple∧

α 2ℵα = ℵα+β, entonces β < ω.

Demostracion: Supongamos que β es infinito y sea α el mınimo ordinaltal que β < α + β. Claramente 0 < α ≤ β. Necesariamente α es un ordinallımite, pues si α = γ + 1 entonces

β < α+ β = γ + 1 + β = γ + β,

luego γ cumple lo mismo que α, en contra de la minimalidad de α.

ℵα+α+β = 2ℵα+α = 2

δ<α

ℵα+δ

=∏

δ<α

2ℵα+δ =∏

δ<α

ℵα+δ+β =∏

δ<α

ℵα+β

=∏

δ<α

2ℵα = (2ℵα)|α| = 2ℵα = ℵα+β .

Por consiguiente, α + α + β = α+ β, y de aquı α + β = β, en contra de laeleccion de α.

Para continuar nuestro estudio conviene introducir una operacion muy rela-cionada con la exponenciacion de cardinales:

Definicion 5.8 Si β es un ordinal y A es un conjunto, definimos

A<β = <βA =⋃

α<β

Aα,

es decir, A<β es el conjunto de las aplicaciones de un ordinal menor que β en A.Usaremos la segunda notacion cuando pueda haber confusion con el cardinal

κ<µ = |<µκ|.

El teorema siguiente, que generaliza a 4.35, nos da varias caracterizacionesinteresantes de esta operacion:

Teorema 5.9 Si µ es infinito y κ ≥ 2, entonces

κ<µ = supν<µ

κν =∑

ν<µκν ,

donde ν recorre los cardinales menores que µ (no los ordinales).

Page 149: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

5.1. La exponenciacion en NBG 139

Demostracion: Si µ es un cardinal lımite, µ = supν<µ

ν ≤ supν<µ

κν .

Si µ = ν+ entonces ν < κν , pues si ν < κ es obvio y si κ ≤ ν entoncesν < 2ν = κν , luego ν < sup

ν<µκν y ası µ = ν+ ≤ sup

ν<µκν . En cualquier caso

ν<µκν = sup

ν<µκν .

Por consiguiente

κ<µ =∣∣∣⋃

α<µ

ακ∣∣∣ =

α<µκ|α| ≤ ∑

α<µsupν<µ

κν = supν<µ

κν .

Si ν < µ, entonces νκ ⊂ <µκ, luego κν ≤ |<µκ| = κ<µ. Ası pues, tomandoel supremo, sup

ν<µκν ≤ κ<µ y tenemos la igualdad.

A partir de este teorema es inmediato que si µ es infinito entonces

κ<µ+

= κµ,

luego κ<µ solo tiene interes cuando µ es un cardinal lımite.

Volviendo a la funcion del continuo, ahora podemos expresar la condicionde monotonıa como que 2<κ ≤ 2κ. El teorema siguiente es un refinamiento deesta relacion que para cardinales sucesores es trivial, pero no ası para cardinaleslımite:

Teorema 5.10 Si κ es un cardinal infinito, entonces 2κ = (2<κ)cf κ.

Demostracion: Sea κ =∑

α<cf κ

να, donde∧

α < cf κ να < κ. Entonces

2κ = 2

α<cf κ

να=

α<cf κ

2να ≤ ∏

α<cf κ

2<κ = (2<κ)cf κ ≤ (2κ)cf κ = 2κ.

Notemos que si κ = µ+ entonces la igualdad se reduce a 2µ+

= 2µ+

, luegoes trivial, tal y como advertıamos, pero para cardinales lımite puede no serlo.Por ejemplo, si

n ∈ ω 2ℵn = 2ℵ0 (lo cual es consistente), entonces 2<ℵω = 2ℵ0

y necesariamente 2ℵω = 2ℵ0 .Por otra parte, este teorema tampoco es definitivo pues, si tenemos, por

ejemplo,∧

n ∈ ω 2ℵn = ℵω+n+1, entonces 2<ℵω = ℵω+ω y solo concluimos que2ℵω = ℵℵ0

ω+ω, pero no sabemos que valores puede tomar esta expresion.

Esto esta relacionado con el problema de la relacion que hay entre la funciondel continuo y la exponenciacion en general κµ (una muestra es el teorema 5.2).Comprenderemos mejor esta relacion en la seccion siguiente. De momento aca-bamos esta con algunos resultados tecnicos de interes:

Teorema 5.11 Si µ es un cardinal regular y κ ≥ 2, entonces (κ<µ)<µ = κ<µ.

Page 150: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

140 Capıtulo 5. La exponenciacion cardinal

Demostracion: Si µ = ξ+ es inmediato, ası que podemos suponer que µes un cardinal lımite. Al ser regular, los subconjuntos no acotados en µ tienencardinal µ. En particular, hay µ cardinales ν < µ, de donde

µ ≤∑

ν<µκν = κ<µ.

Sea π < µ. Como µ es regular se cumple que

π supν<µ

κν ⊂ ⋃

ν<µ

π(κν).

En efecto, dada f en el miembro izquierdo, la aplicacion π −→ µ que a cadaα < π le asigna el mınimo ν < µ tal que f(α) < κν no puede ser cofinal, luegoha de existir un ν < µ tal que f [π] ⊂ κν y f esta en el miembro derecho.

Ası pues, tomando cardinales,

(κ<µ)π ≤ ∑

ν<µκνπ ≤ ∑

ν<µκ<µ = µ κ<µ = κ<µ.

Tomando el supremo en π obtenemos (κ<µ)<µ ≤ κ<µ, y la otra desigualdades obvia.

Definicion 5.12 Dado un conjunto A y un cardinal κ, llamaremos

[A]κ = x | x ⊂ A ∧ |x| = κ,[A]<κ = x | x ⊂ A ∧ |x| < κ.

La exponenciacion cardinal permite calcular los cardinales de estos conjun-tos. El teorema siguiente generaliza a 4.36:

Teorema 5.13 Sea A un conjunto infinito y κ un cardinal κ ≤ |A|, Entonces

|[A]κ| = |A|κ, |[A]<κ| = |A|<κ.

En particular A tiene |A| subconjuntos finitos.

Demostracion: Podemos suponer κ > 0. Sea µ = |A| = κµ = |κ × µ|.Para la primera igualdad basta probar que |[κ × µ]κ| = µκ, pero es inmediatoque κµ ⊂ [κ × µ]κ, de donde µκ ≤ |[κ × µ]κ| y, por otra parte, para cadax ∈ [κ × µ]κ podemos escoger una biyeccion fx : κ −→ x, de modo que laaplicacion g : [κ × µ]κ −→ κ(κ× µ) dada por g(x) = fx es inyectiva, de donde|[κ× µ]κ| ≤ |κ(κ× µ)| = |κ× µ|κ = µκ.

Respecto a la segunda igualdad,

|[A]<κ| =∣∣∣⋃

µ<κ[A]µ

∣∣∣ =

µ<κ|[A]µ| =

µ<κ|A|µ = |A|<κ.

Page 151: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

5.2. La hipotesis de los cardinales singulares 141

5.2 La hipotesis de los cardinales singulares

La funcion del continuo mas simple posible es, sin duda, la que postula lahipotesis del continuo generalizada:

2κ = κ+.

Sucede que esta hipotesis determina de hecho toda la exponenciacion cardi-nal. En efecto:

Teorema 5.14 (HCG) Si κ y µ son cardinales y µ es infinito, entonces

κµ =

κ si µ < cf κ,κ+ si cf κ ≤ µ ≤ κ,µ+ si κ ≤ µ.

Demostracion: Si µ < cf κ tenemos la inclusion µκ ⊂ ⋃

α<κ

µα, de donde

κµ ≤∑

α<κ|α|µ. Ahora bien, dado α < κ, se cumple que ν = max|α|, µ < κ,

luego |α|µ ≤ νν = ν+ ≤ κ. Por consiguiente,

κ ≤ κµ ≤ ∑

α<κκ = κ.

Si cf κ ≤ µ ≤ κ entonces, por el teorema de Konig,

κ+ ≤ κcf κ ≤ κµ ≤ κκ = 2κ = κ+.

Finalmente, si κ ≤ µ entonces κµ = 2µ = µ+.

En particular es claro que la HCG implica, para κ ≥ 2 y µ un cardinal lımite:

κ<µ =

κ si µ ≤ cf κ,κ+ si cf κ < µ ≤ κ,µ si κ < µ.

Ejemplo Suponiendo la HCG tenemos:

ℵℵ53 = ℵ6, ℵℵ2

7 = ℵ7, ℵℵ1ω2

= ℵω2 , ℵℵ8ω6

= ℵ+ω6.

A la vista de este resultado, es natural conjeturar que la funcion del con-tinuo determina la exponenciacion cardinal. En realidad existıa una razon demucho mayor peso que corroboraba esta conjetura: Durante mucho tiempo, lastecnicas conocidas para construir modelos con funciones del continuo alterna-tivas forzaban el resto de la exponenciacion, es decir, se sabıa como construirmodelos con cualquier funcion del continuo sobre los cardinales regulares, pero,una vez determinada esta, el resto de la exponenciacion venıa determinada porla construccion, ademas por un criterio muy simple. Esto podıa deberse a quelas tecnicas conocidas no eran suficientemente generales o bien a un teoremadesconocido que hiciese necesarias las restricciones encontradas. Ademas seconocıa el enunciado de este hipotetico teorema:

Page 152: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

142 Capıtulo 5. La exponenciacion cardinal

Definicion 5.15 Llamaremos hipotesis de los cardinales singulares a la senten-cia siguiente:

(HCS) Para todo cardinal singular κ, si 2cf κ < κ, entonces κcf κ = κ+.

Notemos que la condicion 2cf κ < κ ya implica que κ es singular. Lo expre-samos explıcitamente para enfatizar que la HCS solo impone una restriccion alos cardinales singulares.

Vamos a demostrar que, bajo la hipotesis de los cardinales singulares, lafuncion del continuo sobre los cardinales regulares determina completamente laexponenciacion cardinal (en particular la funcion del continuo sobre los cardi-nales singulares). En realidad la HCS no es un teorema de NBG, pero —porrazones que comentaremos mas adelante— es difıcil construir modelos donde nose cumpla. En particular, los modelos a los que nos referıamos antes cumplentodos esta hipotesis, y esta es la razon de que en ellos la exponenciacion cardinaleste determinada por la funcion del continuo. Precisamente por ello, podemosasegurar que la HCS es consistente con cualquier determinacion de la funciondel continuo sobre los cardinales regulares compatible con la monotonıa y conel teorema de Konig. Por otra parte, es inmediato que HCG → HCS, lo cualexplica que la HCG determine la exponenciacion cardinal.

Veamos ahora como la HCS determina la funcion del continuo sobre loscardinales singulares.

Ejemplo Supongamos que∧

α(ℵα regular → 2ℵα = ℵα+ω+5). Entonces,usando el teorema 5.10 vemos que

2ℵω = ℵℵ0ω+5 = (2ℵ0)ℵ0 = ℵω+5,

2ℵω1 = ℵℵ1ω1

= ℵω1+1,

donde en la ultima igualdad hemos usado la HCS. Vamos a demostrar que lafuncion del continuo en un cardinal singular puede calcularse siempre con unode estos dos argumentos.

Definicion 5.16 Diremos que la funcion del continuo es finalmente constantebajo un cardinal lımite κ si existe un µ < κ tal que si µ ≤ ν < κ entonces2ν = 2µ.

En tal caso es obvio que 2<κ = 2µ. Notemos ademas que si la condicion secumple para todo ν regular, entonces se cumple para todo ν, por la monotonıa.Ası mismo, no perdemos generalidad si suponemos que µ es regular.

Teniendo esto en cuenta, el teorema siguiente nos permite calcular 2κ paraun cardinal singular κ supuesto que sabemos calcular 2µ para todo cardinalregular µ < κ. Mas aun, lo que probamos es que la HCS implica que 2κ tomasiempre el mınimo valor posible:

Page 153: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

5.2. La hipotesis de los cardinales singulares 143

Teorema 5.17 Sea κ un cardinal singular.

a) Si la funcion del continuo es finalmente constante bajo κ, entonces

2κ = 2<κ.

b) En caso contrario 2κ ≥ (2<κ)+ y si suponemos la HCS tenemos la igual-dad.

Demostracion: En el caso a), sea µ < κ tal que si µ ≤ ν < κ entonces2ν = 2µ. Ası, 2<κ = 2µ y, por 5.10, tenemos que 2κ = (2µ)cf κ = 2µ cf κ = 2µ.

En el caso b), para todo cardinal µ < κ se cumple que 2µ < 2<κ. Porconsiguiente, la aplicacion κ −→ 2<κ dada por α 7→ 2|α| es cofinal y creciente,luego el teorema 4.61 nos da que cf 2<κ = cf κ < κ.

Por otra parte, por el teorema de Konig, cf 2κ > κ, luego 2κ 6= 2<κ y, comola desigualdad 2<κ ≤ 2κ es obvia, tenemos en realidad que (2<κ)+ ≤ 2κ.

Respecto a la otra desigualdad, tenemos que 2cf 2<κ

= 2cf κ < 2<κ, luegopodemos aplicar la HCS a 2<κ, lo cual nos da que (2<κ)cf 2

= (2<κ)+, esdecir, 2κ = (2<κ)cf κ = (2<κ)+.

Veamos ahora que la HCS determina toda la exponenciacion cardinal a partirde la funcion del continuo:

Teorema 5.18 (HCS) Sean κ y µ cardinales infinitos. Entonces

κµ =

κ si 2µ < κ ∧ µ < cf κ,κ+ si 2µ < κ ∧ cf κ ≤ µ,2µ si κ ≤ 2µ.

Demostracion: Si κ ≤ 2µ, entonces 2µ ≤ κµ ≤ (2µ)µ = 2µ.

Observemos que en esta parte no hemos usado la HCS, ası como tampocohace falta para concluir que κ ≤ κµ y que si cf κ ≤ µ entonces κ+ ≤ κcf κ ≤ κµ.Ası pues, lo que vamos a probar con la ayuda de la HCS es que κµ toma siempreel mınimo valor posible.

El caso 2µ < κ lo probamos por induccion sobre κ, es decir, lo suponemoscierto para todos los cardinales menores que κ.

Si κ = ν+, entonces µ < 2µ < κ = cf κ. Por lo tanto hemos de probar queκµ = κ.

Tenemos que 2µ ≤ ν. Si es 2µ < ν, entonces por hipotesis de inducciontenemos que νµ = ν o bien νµ = ν+, y en cualquier caso νµ ≤ κ. Si, por elcontrario, 2µ = ν entonces νµ = 2µ < κ.

Por consiguiente podemos afirmar que νµ ≤ κ. Por la formula de Hausdorff

κµ = (ν+)µ = νµν+ = νµκ = κ.

Consideramos ahora el caso en que κ es un cardinal lımite. Si ν < κ,por hipotesis de induccion tenemos que νµ es ν, ν+ o 2µ, pero en cualquier

Page 154: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

144 Capıtulo 5. La exponenciacion cardinal

caso νµ < κ (si ν es finito no podemos aplicar la hipotesis de induccion, peroνµ = 2µ).

Si µ < cf κ, entonces

κ ≤ κµ = |µκ| ≤∣∣∣⋃

α<κ

µα∣∣∣ =

α<κ|α|µ ≤

α<κκ = κ.

Por lo tanto κµ = κ.

Si cf κ ≤ µ, expresemos κ =∑

α<cf κ

να, donde να < κ. Entonces

κµ =(

α<cf κ

να

≤(

α<cf κ

να

=∏

α<cf κ

νµα ≤ ∏

α<cf κ

κ = κcf κ ≤ κµ,

luego κµ = κcf κ. Como 2cf κ ≤ 2µ < κ, la HCS nos da que κcf κ = κ+ y tenemosla conclusion.

Ejemplo Si suponemos la HCS y que

α(ℵα regular → 2ℵα = ℵα+ω+5),

entoncesℵℵ35 = ℵω+5, ℵℵ3

ω1= ℵω1+1, ℵℵ3

ω1+4 = ℵω1+4.

Ası pues, la exponenciacion cardinal bajo la HCS no esta determinada (puesla funcion del continuo sobre los cardinales regulares puede ser cualquiera queno contradiga a la monotonıa ni al teorema de Konig) pero sı que esta comple-tamente comprendida, en cuanto que sabemos exactamente como depende dela funcion del continuo. El problema es que la HCS no es un teorema de NBG,y lo que no esta claro en absoluto es lo que se puede decir exclusivamente enNBG sobre la exponenciacion cardinal o sobre la funcion del continuo sobre loscardinales singulares. Si no suponemos la HCS solo conocemos hechos aislados,algunos sencillos y otros muy profundos. Veamos un ejemplo de los sencillos:

Teorema 5.19 Si 2ℵ1 < ℵω y ℵℵ0ω ≥ ℵω1 , entonces ℵℵ0

ω = ℵℵ1ω1.

Demostracion: Aplicamos la formula de Hausdorff:

ℵℵ0ω ≤ ℵℵ1

ω1≤ (ℵℵ0

ω )ℵ1 = ℵℵ1ω =

(∑

n≥1

ℵn

)ℵ1

≤(∏

n≥1

ℵn

)ℵ1

=∏

n≥1

ℵℵ1n =

n≥1

2ℵ1ℵn = 2ℵ1ℵℵ0ω = ℵℵ0

ω .

Consideremos ahora el valor de ℵℵ1ω . Se trata de un cardinal que queda

invariante al elevarlo a ℵ0, luego el teorema de Konig nos da que ha de tenercofinalidad no numerable. Por su parte, la monotonıa exige que sea mayor que

Page 155: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

5.2. La hipotesis de los cardinales singulares 145

el propio ℵω. Ası pues, estas condiciones generales no excluyen la posibilidad deque ℵℵ0

ω = ℵω1 . Mas aun, si suponemos que 2ℵ0 = ℵω1 (lo cual es consistente)entonces

ℵω1 = 2ℵ0 ≤ ℵℵ0ω ≤ ℵℵ0

ω1= (2ℵ0)ℵ0 = 2ℵ0 = ℵω1 ,

con lo que, de hecho, ℵℵ0ω = ℵω1 .

Sin embargo, si suponemos que 2ℵ1 < ℵω (lo cual es consistente), la HCSimplica que ℵℵ0

ω = ℵω+1, pero sin ella aun podemos asegurar que ℵℵ0ω 6= ℵω1 , ya

que en caso contrario el teorema anterior nos darıa ℵℵ1ω1

= ℵω1 , en contradiccioncon el teorema de Konig.

Ası pues, nos encontramos con una restriccion en ZFC al valor que puedetomar ℵℵ0

ω distinta de las que imponen la monotonıa y el teorema de Konig.Una restriccion que, ademas, depende de forma no trivial de los valores de 2ℵ0

y 2ℵ1 . Si queremos un ejemplo en terminos de la funcion del continuo podemossuponer que

n < ω 2ℵn < ℵω, en cuyo caso tenemos que 2ℵω = ℵℵ0ω 6= ℵω1 .

Los resultados basicos sobre la exponenciacion de cardinales fueron estable-cidos por Hausdorff y Tarski. Este ultimo probo un caso particular del teo-rema 4.52 y conjeturo que si καα<λ es una sucesion estrictamente crecientede cardinales ≥ 2 y κ = sup

α<λκα, entonces

α<λ

κα = κ|λ|.

Observemos que la restriccion de que λ sea un ordinal lımite es necesaria.Por ejemplo, si tomaramos λ = ω1 + 1 y la sucesion ℵαα<ω1 ∪ ℵω1·2 (con loque κ = ℵω1·2), suponiendo la HCG y aplicando 4.52 obtenemos que

α<ω1

ℵα · ℵω1·2 = ℵℵ1ω1

· ℵω1·2 = ℵω1+1 · ℵω1·2 = ℵω1·2 < ℵω1·2+1 = ℵℵ1ω1·2

.

Mas en general, es necesario exigir que κα < κ para todo α. Un contraejem-plo sin esta hipotesis (siempre bajo la HCG) serıa λ = ω1 + ω y

κα =

ℵα si α < ω1,ℵω1·2 si α = ω1 + n.

En tal caso κ = ℵω1+ω y el producto sigue valiendo ℵℵ0ω1·2

= ℵω1·2. Por otraparte la HCS implica la conjetura de Tarski:

Teorema 5.20 (HCS) Sea λ un ordinal lımite y καα<λ una sucesion cre-ciente (no exigimos que lo sea estrictamente) de cardinales ≥ 2. Sea κ = sup

α<λκα

y supongamos que∧

α < λ κα < κ. Entonces∏

α<λ

κα = κ|λ|.

Demostracion: La desigualdad ≤ es inmediata por la monotonıa de losproductos. Si κ ≤ 2|λ| entonces, por el teorema 5.18,

κ|λ| = 2|λ| =∏

α<λ

2 ≤∏

α<λ

κα ≤ κ|λ|.

Page 156: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

146 Capıtulo 5. La exponenciacion cardinal

Si |λ| < 2|λ| < κ, tomemos una sucesion de ordinales αδδ<cf λ cofinalcreciente en λ. Entonces

κ|λ| =(

δ<cf λ

καδ

)|λ|

≤ ∏

δ<cf λ

κ|λ|αδ≤ ∏

δ<cf λ

κ = κcf λ =∏

δ<cf λ

καδ≤ ∏

α<λ

κα.

Hemos usado que κ|λ|αδ < κ por el teorema 5.18.

Nota Puede probarse —aunque es muy complicado— que es consistente queℵω1·2 sea un lımite fuerte, ℵℵ1

ω1= ℵω1·2+ω+2 y ℵℵ0

ω1·2+ω = ℵω1·2+ω+1. En estascondiciones tenemos un contraejemplo a la conjetura de Tarski. Basta tomarλ = ω1 + ω y

κα =

ℵα si α < ω1,ℵω1·2+n si α = ω1 + n.

En efecto, el producto da

ℵℵ1ω1

· ℵℵ0ω1·2+ω ≤ 2ℵω1ℵω1·2+ω+1 = ℵω1·2+ω+1 < ℵ|ω1+ω|

ω1·2+ω.

5.3 Cardinales fuertemente inaccesibles

Vamos a estudiar ahora una version fuerte de los cardinales inaccesibles queintrodujimos en el capıtulo anterior.

Definicion 5.21 Un cardinal infinito κ es un lımite fuerte si para todo cardinalµ < κ se cumple 2µ < κ.

Es claro que un cardinal lımite fuerte es en particular un cardinal lımite, yaque si fuera κ = µ+, entonces tendrıa que ser 2µ < µ+, lo cual es imposible.Obviamente ℵ0 es un cardinal lımite fuerte.

Un cardinal (fuertemente) inaccesible es un cardinal lımite fuerte regulardistinto de ℵ0.

En particular, todo cardinal fuertemente inaccesible es debilmente inacce-sible, aunque el recıproco no es necesariamente cierto. En el capıtulo anteriorsenalamos que no es posible demostrar la existencia de cardinales debilmenteinaccesibles, luego lo mismo vale para los cardinales fuertemente inaccesibles.

Nota Cuando hablemos de cardinales inaccesibles habra que entender que sonfuertemente inaccesibles.

Conviene observar que bajo la HCG todos los cardinales lımite son lımitesfuertes y, en particular, los cardinales debilmente inaccesibles coinciden con losfuertemente inaccesibles.

Tambien es claro que si κ es un lımite fuerte, entonces 2<κ = κ. Mas aun,si µ, ν < κ, entonces µν < κ, pues si ξ < κ es el maximo de µ y ν, tenemos queµν ≤ ξξ = 2ξ < κ. Si κ es fuertemente inaccesible podemos decir mas:

Page 157: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

5.3. Cardinales fuertemente inaccesibles 147

Teorema 5.22 Si κ es un cardinal fuertemente inaccesible entonces κ<κ = κ.

Demostracion: Basta probar que κµ ≤ κ para todo µ < κ. En efecto,como κ es regular µκ =

α<κ

µα luego

κµ ≤ ∑

α<κ|α|µ ≤ ∑

α<κκ = κ.

Del mismo modo que los cardinales lımite pueden caracterizarse como los dela forma ℵ0 o ℵλ, existe una caracterizacion similar para los cardinales lımitefuerte, en terminos de la llamada funcion bet.1

Definicion 5.23 Definimos i : Ω −→ K (funcion bet) como la unica funcionque cumple:

i0 = ℵ0 ∧∧

α iα+1 = 2iα ∧∧

λ iλ =⋃

δ<λ

iδ.

Teniendo en cuenta que el supremo de un conjunto de cardinales es un car-dinal, una simple induccion prueba que i toma todos sus valores en K. Obvia-mente es una funcion normal.

Ejercicio: La HCG es equivalente a que i = ℵ.

La caracterizacion a la que nos referıamos es:

Teorema 5.24 Los cardinales lımite fuerte son exactamente los de la forma i0

o iλ.

Demostracion: Se cumple que iλ es un lımite fuerte, pues si κ < iλ

entonces existe un δ < λ tal que κ < iδ, luego

2κ ≤ 2iδ = iδ+1 < iδ+2 ≤ iλ.

Recıprocamente, si κ es un lımite fuerte, entonces κ ≤ iκ < iκ+1, luegopodemos tomar el mınimo ordinal α tal que κ < iα. Ciertamente α no puedeser 0 ni un cardinal lımite, luego α = γ + 1 y, por consiguiente,

iγ ≤ κ < iγ+1 = 2iγ .

Si la primera desigualdad fuera estricta κ no serıa un lımite fuerte, luegoκ = iγ . Falta probar que γ no puede ser de la forma δ + 1, pero es que ental caso serıa iδ < κ y 2iδ = κ, y de nuevo κ no serıa un lımite fuerte. Porconsiguiente γ = 0 o bien es un ordinal lımite.

La prueba del teorema siguiente es identica a la de su analogo 4.71:

Teorema 5.25 Un cardinal regular κ es fuertemente inaccesible si y solo siκ = iκ.

1Bet (i) es la segunda letra del alfabeto hebreo.

Page 158: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

148 Capıtulo 5. La exponenciacion cardinal

Es claro que Vω es una union numerable de conjuntos finitos, luego su car-dinal es |Vω | = ℵ0 = i0. A partir de aquı, una simple induccion nos da elteorema siguiente:

Teorema 5.26∧

α |Vω+α| = iα. En particular,∧

α(ω2 ≤ α → |Vα| = iα).

(Recordemos que si ω2 ≤ α entonces α = ω2 + β y ω + α = ω + ω2 + β =ω(1 + ω) + β = ω2 + β = α.)

De este modo, si κ es fuertemente inaccesible tenemos que |Vκ| = κ. Masaun:

Teorema 5.27 Si κ es un cardinal fuertemente inaccesible se cumple que

x(x ∈ Vκ ↔ x ⊂ Vκ ∧ |x| < κ).

Demostracion: Si x ∈ Vκ, entonces x ∈ Vδ, para cierto δ < κ (podemossuponer ω2 ≤ δ), luego x ⊂ Vδ y |x| ≤ |Vδ| = iδ < iκ = κ. Ademas x ⊂ Vκporque Vκ es transitivo.

Recıprocamente, si x ⊂ Vκ y |x| < κ, entonces el conjunto

A = rang y | y ∈ x ⊂ κ

es imagen de x, luego tiene cardinal menor que κ y, como κ es regular, A estaacotado. Si δ < κ es una cota concluimos que x ⊂ Vδ, luego x ∈ Vδ+1 ⊂ Vκ.

Nota La razon por la que no puede demostrarse la existencia de cardinalesinaccesibles es similar a la razon por la que no puede demostrarse la existenciade conjuntos no regulares: imaginemos que existe un cardinal inaccesible κ.Entonces, todas las operaciones conjuntistas, cuando se aplican a conjuntos deVκ, dan lugar a conjuntos de Vκ, por lo que no es posible construir un conjuntode cardinal κ. Si decidimos llamar “conjuntos” exclusivamente a los conjuntosde Vκ (y llamamos “clases” a los subconjuntos de Vκ), con ello no perdemosninguno de los conjuntos que sabemos construir, y todos los axiomas de NBGsiguen cumpliendose igualmente (mas aun, se cumplen los axiomas de MK, sinla restriccion de normalidad en el axioma de comprension), pero ahora (si κ erael mınimo cardinal inaccesible) ya no hay cardinales inaccesibles.

En suma, no es posible demostrar la existencia de cardinales inaccesiblesporque estos no son necesarios para que se cumplan los axiomas de la teorıa deconjuntos. En realidad la razon es la misma por la que no puede demostrarse elaxioma de infinitud a partir de los axiomas restantes: todas las construccionesconjuntistas, cuando se aplican a conjuntos finitos, dan conjuntos finitos. Launica razon por la que ℵ0 no es un cardinal inaccesible es porque lo hemosexcluido en la definicion, pero en el fondo ℵ0 es el menor cardinal inaccesible.Del mismo modo que sin el axioma de infinitud no podemos decidir si ω = Ω

Page 159: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

5.3. Cardinales fuertemente inaccesibles 149

o bien ω ∈ Ω (y en el segundo caso ω pasa a ser el menor cardinal infinito),podemos definir

Ω1 = α ∈ Ω |∧

δ ≤ α δ no es inaccesible,

y ası Ω1 es una clase tal que en NBG no puede decidirse si Ω1 = Ω o bienΩ1 ∈ Ω, y en el segundo caso Ω1 pasa a ser el menor cardinal inaccesible.

En cuanto postulamos la existencia de un cardinal infinito (ω) tenemos au-tomaticamente la existencia de muchos cardinales infinitos (ℵ1, ℵ2, . . . ), perono la existencia de un cardinal inaccesible. Similarmente, la existencia de uncardinal inaccesible no implica la existencia de un segundo, pues si existen dos(mınimos) cardinales inaccesibles κ < µ, si restringimos el alcance de la pala-bra “conjunto” a los conjuntos de Vµ, se siguen cumpliendo los axiomas de lateorıa de conjuntos, pero ahora solo hay un cardinal inaccesible, puesto que µha quedado excluido. Equivalentemente: las operaciones conjuntistas aplicadasa conjuntos de Vµ solo producen conjuntos de Vµ, luego no dan lugar nunca aconjuntos de cardinal µ.

Por ello, aunque anadamos como axioma a NBG que Ω1 ∈ Ω (que es una“repeticion” del axioma de infinitud a otro nivel), podemos definir

Ω2 = α ∈ Ω |∧

δ ≤ α(δ es inaccesible → δ = Ω1)

y de nuevo tenemos que es imposible decidir si Ω2 = Ω o bien Ω2 ∈ Ω, y en elsegundo caso Ω2 es el segundo cardinal inaccesible.

Estos argumentos (algo mejor formalizados) nos permiten concluir que siNBG es consistente, tambien es consistente anadir como axioma que no existencardinales inaccesibles (pues, como hemos dicho, tales cardinales son siempreprescindibles). En cambio, un argumento estandar relacionado con el segundoteorema de incompletitud de Godel nos da que es imposible demostrar la consis-tencia de que existan cardinales inaccesibles, es decir, que NBG + Ω1 ∈ Ω puedeser consistente, pero si lo es, no puede demostrarse que ası es, ni siquiera acep-tando como hipotesis la consistencia de NBG. Similarmente, aun suponiendoque NBG + Ω1 ∈ Ω sea consistente, ello no permite demostrar la consistenciade NBG + Ω1 ∈ Ω + Ω2 ∈ Ω, y ası sucesivamente.

Esto permite extender este tipo de razonamientos a los cardinales debilmenteinaccesibles, pues, aunque un cardinal debilmente inaccesible no tiene por queser fuertemente inaccesible, puede probarse que si es consistente NBG+ “existeun cardinal debilmente inaccesible”, tambien lo es NBG + “existe un cardinalfuertemente inaccesible”, luego la consistencia de NBG + “existe un cardinaldebilmente inaccesible” no puede ser demostrada, y mucho menos la existenciade tales cardinales (es decir, que si no podemos demostrar que es consistentesuponer que existen, mucho menos podemos demostrar que existen).

A su vez, todo esto esta relacionado con la hipotesis de los cardinales sin-gulares, pues a partir de ¬HCS puede probarse la consistencia de que existaninfinitos cardinales inaccesibles, y esa es en el fondo la razon de que no puedademostrarse la HCS en NBG.

Page 160: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

150 Capıtulo 5. La exponenciacion cardinal

Terminamos la seccion con una aplicacion de la funcion i que no tiene nadaque ver con cardinales inaccesibles. El axioma de eleccion de Godel es la sen-tencia2

(AEG)∨

F (F : V −→ V ∧∧

x(x 6= ∅→ F (x) ∈ X)).

El axioma de eleccion de Godel postula la existencia de una funcion deeleccion sobre la clase universal, por lo que implica trivialmente el axioma deeleccion de Zermelo, que solo postula la existencia de una funcion de eleccion(distinta) para cada conjunto.

Teorema 5.28 (AEG) Todas las clases propias son equipotentes.

Demostracion: Basta observar que podemos descomponer V y Ω en res-pectivas clases de conjuntos disjuntos como sigue:

V = Vω ∪ ⋃

α∈Ω

(Vω+α+1 \ Vω+α), Ω = i0 ∪⋃

α∈Ω

(iα+1 \ iα).

Teniendo en cuenta el teorema 5.26 y la aritmetica cardinal basica es claroque

|Vω+α+1 \ Vω+α| = iα+1 = |iα+1 \ iα|.El axioma de eleccion de Godel nos permite elegir funciones

fα : Vω+α+1 \ Vω+α −→ iα+1 \ iα biyectivas.

Por otra parte es claro que podemos tomar f∗ : Vω −→ i0 biyectiva. Contodas estas funciones podemos construir

F = f∗ ∪ ⋃

α∈Ω

fα : V −→ Ω biyectiva.

Ası, si A es cualquier clase propia, F [A] es una subclase de Ω, es decir, unaclase bien ordenada por una relacion conjuntista. Por el teorema 2.29 concluimosque F [A] es semejante a Ω (y A es equipotente a F [A]), luego toda clase propiaes equipotente a Ω.

Observemos que el axioma de regularidad —al contrario de lo que suelesuceder— desempena un papel crucial en la prueba anterior. En estas condicio-nes tenemos una nueva caracterizacion de las clases propias: una clase es propiasi y solo si su tamano es comparable al de la clase universal. Podrıa decirse quesi una clase no es un conjunto es “a causa” de un “exceso de tamano”.

2Este axioma involucra esencialmente clases propias, luego no puede ser considerado comosentencia de ZFC, es decir, de la teorıa de conjuntos en la que solo existen conjuntos y noclases propias. Solo tiene sentido como extension de NBG. Para incorporarlo a ZF es necesarioextender el lenguaje formal con un funtor F que represente la funcion de eleccion o con unrelator que represente un buen orden sobre la clase universal.

Page 161: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo VI

Conjuntos cerrados no

acotados y estacionarios

Introducimos ahora unos conceptos fundamentales para trabajar con ordina-les. Exponemos la teorıa general en las dos primeras secciones, mientras que lassiguientes contienen diversas aplicaciones independientes entre sı. Entre otrasdemostraremos un profundo teorema de Silver (1974) sobre la funcion del con-tinuo en los cardinales singulares. Trabajamos en NBG, incluyendo el axiomade eleccion.

6.1 Conjuntos cerrados no acotados

El concepto basico alrededor del cual girara todo este capıtulo es el siguiente:

Definicion 6.1 Sea λ un ordinal lımite o bien λ = Ω. Una clase C ⊂ λ escerrada en λ si cuando un ordinal lımite δ < λ cumple que δ∩C no esta acotadoen δ, entonces δ ∈ C.

Informalmente, la definicion exige que si C contiene ordinales menores queδ tan proximos a δ como se quiera, entonces δ ∈ C. Una caracterizacion util esla siguiente:

Teorema 6.2 Sea λ un ordinal lımite o bien λ = Ω. Una subclase C de λ escerrada en λ si y solo si para todo conjunto X ⊂ C no vacıo y acotado en λse cumple que supX ∈ C. Equivalentemente: para todo X ⊂ C no vacıo, sisupX ∈ λ, entonces supX ∈ C.

Demostracion: Supongamos que C es cerrada y sea X un subconjunto enlas condiciones indicadas. Llamemos δ = supX .

Si δ ∈ X entonces δ ∈ C. Supongamos que δ /∈ X y veamos que igualmenteδ ∈ C. En primer lugar, δ es un ordinal lımite, pues si fuera δ = 0 tendrıa queser X = 0 y si β < δ entonces β < α para cierto α ∈ X , luego α ≤ δ, pero,como δ /∈ X , ha de ser α < δ, luego β + 1 < α+ 1 ≤ δ.

151

Page 162: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

152 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

En realidad hemos probado tambien que δ ∩ C no esta acotado en δ, pues,dado β < δ, hemos encontrado un α ∈ δ ∩ C mayor que β. Por definicion declase cerrada concluimos que δ ∈ C.

Recıprocamente, si C tiene la propiedad indicada y δ < λ es un ordinallımite tal que δ ∩ C no esta acotado en δ, es claro que δ = sup(δ ∩ C), luegoδ ∈ C.

Definicion 6.3 En lo sucesivo las iniciales c.n.a. significaran “cerrado no aco-tado”, es decir, diremos que una clase C ⊂ λ es c.n.a. en λ si es cerrada en λ yno esta acotada en λ.

Un resultado fundamental es que los conjuntos cerrados no acotados se con-servan por intersecciones si su numero no alcanza la cofinalidad de λ:

Teorema 6.4 Sea λ un ordinal lımite de cofinalidad no numerable, β < cf λ yCαα<β una familia de conjuntos c.n.a. en λ. Entonces se cumple que

α<β

es c.n.a. en λ.

Demostracion: Del teorema anterior se sigue inmediatamente que la in-terseccion de cualquier familia de cerrados es cerrada. Solo queda probar que⋂

α<β

Cα no esta acotado.

Sea fα : λ −→ λ la funcion dada por fα(δ) = mınǫ ∈ Cα | δ < ǫ.La definicion es correcta porque Cα no esta acotado en λ. Para todo δ < λtenemos que δ < fα(δ) ∈ Cα.

Sea ahora g : λ −→ λ la funcion dada por g(δ) = supα<β

fα(δ). Notemos que

g(δ) ∈ λ por la hipotesis de que β < cf λ. Es claro que si δ < λ entoncesδ < g(δ) ≤ gω(δ) < λ, donde gω es la funcion iterada de g definida en 4.63.

Ademas gω(δ) es un ordinal lımite, pues si α < gω(δ), entonces α ∈ gn(δ)para cierto n ∈ ω y ası α+ 1 ≤ gn(δ) < g(gn(δ)) = gn+1(δ) ≤ gω(δ).

Se cumple que gω(δ) ∩ Cα no esta acotado en gω(δ), pues si γ ∈ gω(δ),entonces γ ∈ gn(δ) < fα(gn(δ)) ∈ Cα y fα(gn(δ)) ≤ g(gn(δ)) = gn+1(δ) <gω(δ), o sea, γ < fα(gn(δ)) ∈ gω(δ) ∩ Cα.

Como Cα es cerrado podemos concluir que gω(δ) ∈ Cα, y esto para todoα < β, luego δ < gω(δ) ∈

α<β

Cα, lo que prueba que la interseccion es noacotada.

Nota Hemos enunciado el teorema anterior para conjuntos por no complicar elenunciado, pero vale igualmente (con la misma prueba) si λ = Ω y β es un ordinalcualquiera. Se podrıa objetar que no tiene sentido considerar una sucesionCαα<β de clases (necesariamente propias) c.n.a. en Ω, pero tal sucesion puededefinirse como una subclase C ⊂ Ω × β, de modo que Cα ≡ ǫ | (ǫ, α) ∈ C.

El teorema siguiente nos proporciona los primeros ejemplos no triviales decerrados no acotados:

Page 163: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.1. Conjuntos cerrados no acotados 153

Teorema 6.5 Sea κ un cardinal regular no numerable. Un conjunto C ⊂ κ esc.n.a. en κ si y solo si existe una funcion normal f : κ −→ κ tal que f [κ] = C.

Demostracion: Por el teorema 2.28, ordC ≤ κ y como |C| = κ (porque Cno esta acotado en κ y κ es regular), ha de ser ordC = κ. Sea, pues, f : κ −→ Cla semejanza. Basta probar que f : κ −→ κ es normal. Claramente solo hay quever que si λ < κ entonces f(λ) =

δ<λ

f(δ). Ahora bien, λ = supκδ | δ < λ,luego, al ser f una semejanza,

f(λ) = supCf(δ) | δ < λ =⋃

δ<λ

f(δ).

En efecto, como κ es regular tenemos que⋃

δ<λ

f(δ) ∈ κ y como C es cerrado

tenemos que⋃

δ<λ

f(δ) ∈ C, luego obviamente se trata del supremo del conjunto

f(δ) | δ < λ.

Supongamos ahora que C es el rango de una funcion normal f . Entonces|C| = κ y en consecuencia C no esta acotado en κ. Si δ < κ es un ordinal lımitetal que δ∩C no esta acotado en δ, entonces sea λ = α < κ | f(α) < δ. Es facilver que λ es un ordinal lımite y f |λ : λ −→ δ es inyectiva, luego |λ| ≤ |δ| < κ,de donde λ < κ. Por consiguiente podemos calcular

f(λ) =⋃

α<λ

f(α) = sup(δ ∩ C) = δ,

luego δ ∈ C y C es cerrado.

Nota La prueba se adapta con cambios mınimos (que la simplifican) al casoen que κ = Ω. En tal caso, en lugar del teorema 2.28 aplicamos 2.29, que nosda una semejanza F : Ω −→ C. El resto de la prueba vale sin mas cambioque omitir las referencias a la cofinalidad de κ. Para el recıproco, en lugar deafirmar que |C| = κ, concluimos que C no esta acotado porque toda funcionnormal cumple

α α ≤ F (α), y luego tenemos trivialmente que λ ∈ Ω, sinnecesidad de considerar cardinales.

El teorema 4.65 prueba que una funcion normal en un cardinal regular nonumerable tiene un conjunto no acotado de puntos fijos. Ahora probamos quedicho conjunto tambien es cerrado.

Teorema 6.6 Sea κ un cardinal regular no numerable o bien κ = Ω y seaf : κ −→ κ una funcion normal. Entonces la clase F = α < κ | f(α) = α esc.n.a. en κ.

Demostracion: Ya sabemos que F no esta acotada en κ. Veamos que escerrada. Para ello tomamos λ < κ tal que λ∩F no este acotado en λ. Entoncesf(λ) =

δ<λ

f(δ). Si δ < λ, entonces existe un η ∈ F tal que δ < η, luego

f(δ) < f(η) = η < λ, y por consiguiente concluimos que f(λ) ≤ λ. La otradesigualdad se da por ser f normal, luego λ ∈ F , que es, por tanto, cerrada.

Page 164: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

154 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

A partir de aquı nos restringimos a estudiar conjuntos cerrados no acotados(no clases). La mayor parte de las ocasiones en que se dice que un conjunto esevidentemente c.n.a. se esta apelando tacitamente al teorema siguiente:

Teorema 6.7 Sea κ un cardinal regular no numerable y A un conjunto de apli-caciones f : nκ −→ κ, donde n es un numero natural que depende de f . Supon-gamos que |A| < κ. Entonces el conjunto

C = α < κ |∧

fn(f ∈ A ∧ f : nκ −→ κ→ f [nα] ⊂ α)

es c.n.a. en κ.

Demostracion: Sea λ < κ tal que C ∩ λ no este acotado en λ, sea f ∈ A,f :n κ −→ κ, tomemos ordinales ǫ1, . . . , ǫn ∈ λ y sea β ∈ C ∩λ mayor que todosellos.

Ası f(ǫ1, . . . , ǫn) ∈ f [nβ] ⊂ β < λ, luego∧

x ∈ nλ f(x) ∈ λ, es decir,f [nλ] ⊂ λ, lo que implica que λ ∈ C, el cual es, por tanto, cerrado.

Sea α ∈ κ. Definimos recurrentemente una sucesion αm de ordinales en κ.Tomamos α0 = α y, supuesto definido αm, para cada f ∈ A, f : nκ −→ κ sea βfel mınimo ordinal tal que f [nαm] ⊂ βf < κ (existe porque |f [nαm]| ≤ |nαm| < κ,luego f [nαm] esta acotado en κ).

Definimos αm+1 =⋃

f∈A

βf < κ, pues |A| < κ y κ es regular. Finalmente

definimos α∗ = supm∈ω

αm ∈ κ. Claramente α ≤ α∗. Si probamos que α∗ ∈ C

tendremos que C es no acotado.Tomemos una funcion f ∈ A, f :n κ −→ κ y ordinales ǫ1, . . . , ǫn ∈ α∗.

Entonces existe un natural m tal que ǫ1, . . . , ǫn ∈ αm y ası

f(ǫ1, . . . , ǫn) ∈ f [nαm] ⊂ βf ≤ αm+1 ≤ α∗,

luego f [α∗] ⊂ α∗ y, consecuentemente, α∗ ∈ C.

Si κ es un cardinal regular no numerable, el teorema 6.4 nos da que la in-terseccion de una cantidad menor que κ de subconjuntos c.n.a. es c.n.a. Obvia-mente esto no es cierto para familias cualesquiera de κ conjuntos (por ejemplopara κ \αα<κ), pero sı se cumple un hecho parecido y de gran utilidad. Paraenunciarlo necesitamos una definicion:

Definicion 6.8 Sea Xαα<κ una familia de subconjuntos de un cardinal κ.Llamaremos interseccion diagonal de la familia al conjunto

α<κ

Xα = γ < κ | γ ∈⋂

α<γXα.

Si intentamos probar algo “razonable” y “nos gustarıa” que una interseccionde κ conjuntos c.n.a. fuera c.n.a. es probable que en realidad nos baste lo si-guiente:

Teorema 6.9 Sea κ un cardinal regular no numerable y Cαα<κ una familiade conjuntos c.n.a. en κ. Entonces

α<κCα es c.n.a. en κ.

Page 165: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.1. Conjuntos cerrados no acotados 155

Demostracion: Por abreviar, llamaremos D a la interseccion diagonal.Tomemos λ < κ tal que λ ∩ D no este acotado en λ. Hemos de probar queλ ∈ D, es decir, tomamos α < λ y hemos de ver que λ ∈ Cα. A su vez, paraello basta probar que λ ∩ Cα no esta acotado en λ, pero si β ∈ λ tenemos queexiste un ǫ ∈ λ ∩D tal que α, β < ǫ. Como ǫ ∈ D se cumple que ǫ ∈ Cα ∩ λ,luego, efectivamente, Cα ∩ λ no esta acotado en λ y D es cerrado.

Para cada β < κ, el teorema 6.4 nos permite tomar g(β) ∈⋂

α<β

Cα tal queβ < g(β). Tenemos ası una funcion g : κ −→ κ.

Por el teorema 6.7, el conjunto

C = λ ∈ κ | g[λ] ⊂ λ

es c.n.a. en κ (en principio tenemos que es c.n.a. el conjunto de todos los or-dinales α < κ tales que g[α] ⊂ α, pero es claro que el conjunto de los λ < κtambien es c.n.a., y C es la interseccion de ambos conjuntos). Si probamos queC ⊂ D tendremos que D no esta acotado.

Sea λ ∈ C. Tomamos α < λ y hemos de ver que λ ∈ Cα, para lo cual se hade cumplir que λ ∩ Cα no este acotado en λ. Ahora bien, si δ < λ, tomamosǫ ∈ λ tal que α, δ < ǫ. Ası δ < g(ǫ) ∈ λ ∩ Cα.

Los resultados que hemos obtenido sobre los conjuntos cerrados no acotadosen un ordinal lımite λ se interpretan mas adecuadamente con ayuda de la nocionsiguiente:

Definicion 6.10 Un filtro en un conjunto X es una familia F ⊂ PX que cumplalas propiedades siguientes:

a) X ∈ F ∧ ∅ /∈ F ,

b)∧

y ∈ F∧

x ∈ X(y ⊂ x→ x ∈ F ),

c)∧

xy ∈ F x ∩ y ∈ F .

Si κ es un cardinal infinito, un filtro F es κ-completo si para toda familiaxδδ<α de α < κ elementos de F se cumple que

δ<α

xδ ∈ F .

Un ideal en un conjunto X es una familia I ⊂ PX que cumpla las propiedadessiguientes:

a) X /∈ I ∧ ∅ ∈ I,

b)∧

y ∈ I∧

x ∈ X(x ⊂ y → x ∈ I),

c)∧

xy ∈ I x ∪ y ∈ F .

Un ideal I es κ-completo si para toda familia xδδ<α de α < κ elementos de Ise cumple que

δ<α

xδ ∈ I.

La idea subyacente en estas definiciones es que un filtro es una familia deconjuntos que pueden ser considerados “muy grandes”. La primera propiedad

Page 166: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

156 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

establece que el mayor conjunto posible es muy grande, mientras que el conjuntovacıo no lo es, la segunda que todo conjunto que contiene a un conjunto muygrande es muy grande y la tercera que la interseccion de dos conjuntos muygrandes, aunque es algo mas pequena, sigue siendo muy grande.

En general, todo filtro es ℵ0-completo, es decir, que la interseccion de unnumero finito de conjuntos muy grandes es muy grande. Cuanto mas se puedamejorar esto (es decir, si F es κ completo, para un cardinal mayor) mas justifi-cado esta el “muy” cuando hablamos de “conjuntos muy grandes”.

La definicion de ideal se interpreta analogamente cambiando “muy grande”por “muy pequeno”. Las dos definiciones estan relacionadas del modo siguiente:para cada familia A ⊂ PX , definimos su familia dual como

A′ = X \ x | x ∈ A.

Es inmediato comprobar que el dual de un filtro κ-completo es un ideal κ-completo, y viceversa. Informalmente, podemos considerar como conjuntos“muy pequenos” a los que tienen complementario “muy grande” y viceversa.

Los conjuntos cerrados no acotados no forman por sı mismos un filtro, perogeneran uno, en el sentido siguiente:

Sea λ un ordinal lımite de cofinalidad no numerable. Definimos el filtro decerrados no acotados en λ como el conjunto

c.n.a.(λ) = X ⊂ λ |∨

C(C ⊂ X ∧ C es c.n.a. en λ ⊂ Pλ.

Es inmediato comprobar que realmente es un filtro cf λ-completo, por lo quepodemos considerar tambien su ideal dual c.n.a.(λ)′. Mas aun, es claro que siδ < λ entonces λ \ δ es c.n.a. en λ, luego λ \ δ ∈ c.n.a.(λ), luego δ ∈ c.n.a.(λ)′.En particular, como δ ⊂ δ + 1 ∈ λ, tenemos que

δ ∈ λ δ ∈ c.n.a.(λ)′

y por la completitud,∧

x(x ⊂ λ ∧ |x| < cf λ→ x ∈ c.n.a.(λ)′),

ya que podemos expresar x =⋃

δ∈x

δ. Esto se interpreta como que respecto del

filtro de cerrados no acotados en λ, todos los conjuntos de cardinal menor quecf λ son considerados “muy pequenos”.

El interes de estos conceptos se debe a que, por ejemplo, si tenemos unafamilia de menos de κ subconjuntos “muy grandes” de un cardinal regular κ,sabemos que la interseccion sera tambien “muy grande”, y en particular serano vacıa, luego podremos tomar ordinales que cumplan simultaneamente laspropiedades que definen a todos los conjuntos de la familia. No obstante, esfrecuente tener que trabajar con conjuntos que no son “muy grandes”, peropuede ser suficiente con que no sean “muy pequenos”. Esto nos lleva al conceptode conjunto estacionario que presentamos en la seccion siguiente.

Page 167: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.2. Conjuntos estacionarios 157

6.2 Conjuntos estacionarios

Un conjunto estacionario es un conjunto “no demasiado pequeno”:

Definicion 6.11 Sea λ un ordinal de cofinalidad no numerable. Un conjuntoE ⊂ λ es estacionario en λ si E /∈ c.n.a.(λ)′.

He aquı las propiedades elementales de los conjuntos estacionarios:

Teorema 6.12 Sea λ un ordinal de cofinalidad no numerable y E ⊂ λ. Secumple:

a) Si E es c.n.a en λ entonces E es estacionario en λ.

b) E es estacionario en λ si y solo si corta a todo c.n.a. en λ.

c) Si E es estacionario en λ entonces no esta acotado en λ.

d) Si E es estacionario y C es c.n.a. en λ entonces E ∩ C es tambien esta-cionario en λ.

Demostracion: a) es inmediato: si E no fuera estacionario entonces λ \Econtendrıa un c.n.a. disjunto de E.

b) E es estacionario si y solo si λ\E /∈ c.n.a.(λ), si y solo si no existe ningunc.n.a. C tal que C ⊂ λ \ E, si y solo si todo c.n.a. C corta a E.

c) Se sigue de b) junto con el hecho obvio de que si α ∈ λ entonces λ \ α esc.n.a.

d) Si C′ es otro c.n.a. en λ, entonces C ∩C′ es c.n.a., luego E ∩C ∩C′ 6= ∅por b), luego, tambien por b), E ∩ C es estacionario.

La propiedad b) es tal vez la mas significativa: un conjunto estacionario noes necesariamente “muy grande”, pero es lo suficientemente grande como paracortar a cualquier conjunto “muy grande”.

Notemos que si E es estacionario en λ y δ < λ, entonces E corta a λ \ δ,porque es c.n.a. en λ, luego E contiene ordinales mayores que δ. Ası pues, todoconjunto estacionario es no acotado. Tambien es obvio que todo conjunto quecontenga a un conjunto estacionario es estacionario.

Veamos un ejemplo:

Teorema 6.13 Sea λ un ordinal lımite de cofinalidad no numerable y κ < cf λun cardinal regular. Entonces el conjunto

α < λ | cf α = κ

es estacionario en λ.

Demostracion: Llamemos E al conjunto del enunciado. Sea C un c.n.a.en λ y sea α = ordC. Tenemos que |α| = |C| ≥ cf λ > κ. Por lo tanto κ < α.Sea f : α −→ C la semejanza. Igual que en la prueba de 6.5 se ve que f es unafuncion normal, por lo que cf f(κ) = cf κ = κ, de modo que f(κ) ∈ C ∩ E. Porel teorema anterior concluimos que E es estacionario.

Page 168: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

158 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Ejemplo Los conjuntos

α < ω2 | cf α = ℵ0 y α < ω2 | cf α = ℵ1

son estacionarios disjuntos en ω2, luego vemos que la interseccion de conjuntosestacionarios no es necesariamente estacionaria. Mas aun, de aquı se deduceque existen conjuntos estacionarios que no son cerrados.

Veamos ahora una caracterizacion muy util de los conjuntos estacionarios enun cardinal regular. Para ello necesitamos una definicion:

Definicion 6.14 Si A ⊂ κ, una aplicacion f : A −→ κ es regresiva si

α ∈ A(α 6= 0 → f(α) < α).

Teorema 6.15 (Fodor) Sea κ un cardinal regular no numerable y E ⊂ κ. Lasafirmaciones siguientes son equivalentes:

a) E es estacionario en κ,

b) Si f : E −→ κ es regresiva, existe un α < κ tal que

f−1[α] = β ∈ E | f(β) = α

es estacionario en κ,

c) Si f : E −→ κ es regresiva, existe un α < κ tal que

f−1[α] = β ∈ E | f(β) = α

no esta acotado en κ.

Demostracion: a) → b) Si f es regresiva pero f−1[α] no es estacionariopara ningun α < κ, tomemos un c.n.a. Cα tal que Cα∩f−1[α] = ∅. EntoncesD =

α<κCα es tambien c.n.a. en κ. Por consiguiente E∩D es estacionario, luego

podemos tomar γ ∈ E∩D, γ 6= 0. En particular γ ∈ ⋂

α<γCα. Sea δ = f(γ) < γ.

Ası γ ∈ f−1[δ] ∩ Cδ = ∅.

b) → c) es obvio.

c) → a) Si E no es estacionario, sea C un c.n.a. en κ tal que C ∩E = ∅. Seaf : E −→ κ la aplicacion dada por f(α) = sup(C ∩ α). Claramente f(α) ≤ α,pero f(α) ∈ C y α ∈ E, luego de hecho f(α) < α y f es regresiva.

Por otra parte, si γ < κ, como C no esta acotado, existe un α ∈ C tal queγ < α. Vamos a probar que f−1[γ] ⊂ α + 1, es decir, que f−1[γ] estaacotado en κ para todo γ, en contradiccion con c). En efecto, si δ ∈ E y α < δ,entonces f(δ) = sup(C ∩ δ) ≥ α, pues α ∈ C ∩ δ. Ası pues, f(δ) 6= γ.

Terminamos la seccion con un resultado nada trivial sobre conjuntos esta-cionarios que tiene aplicaciones importantes. Necesitamos un resultado previoauxiliar.

Page 169: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.2. Conjuntos estacionarios 159

Teorema 6.16 Sea κ un cardinal regular no numerable y sea E un subconjuntoestacionario en κ. Entonces el conjunto

T = λ ∈ E | cf λ = ℵ0 ∨ (cf λ > ℵ0 ∧ E ∩ λ no es estacionario en λ

es estacionario en κ.

Demostracion: Tomamos un conjunto c.n.a. C en κ. Hemos de probarque C ∩ T 6= ∅. Sea

C′ = λ ∈ C | C ∩ λ no esta acotado en λ.

Veamos que C′ es c.n.a. Por el teorema 6.5 sabemos que existe una funcionnormal f : κ −→ κ tal que f [κ] = C. Por otra parte, el conjunto L = λ|λ < κes claramente c.n.a. en κ, luego existe g : κ −→ κ normal tal que g[κ] = L. Seah = g f : κ −→ κ. Basta ver que C′ = h[κ].

Si α ∈ κ, entonces g(α) ∈ κ es un ordinal lımite, luego

h(α) = f(g(α)) =⋃

δ∈g(α)

f(δ),

donde cada f(δ) ∈ C, luego h(α) ∩ C no esta acotado en h(α). Ası pues,h(α) ∈ C′.

Tomemos ahora λ ∈ C′. Sea α < κ tal que f(α) = λ. Si α = 0 entonces λes el mınimo de C, luego C ∩ λ = ∅ esta acotado en λ, lo cual contradice queλ ∈ C′.

Si α = β+1 entonces f(β) es una cota de C∩λ en λ, pues f(β) ∈ f(β+1) = λy, si δ ∈ C ∩ λ entonces δ = f(γ) para un γ ∈ κ. Ası, δ < λ, f(γ) < f(α),γ < α = β + 1, γ ≤ β, δ = f(γ) ≤ f(β), luego tambien C ∩ λ resulta estaracotado en λ y tenemos otra contradiccion.

La unica posibilidad es que α sea un lımite, luego existe ǫ < κ tal queα = g(ǫ), y ası λ = h(ǫ) ∈ h[κ].

Como E es estacionario y C′ es c.n.a. tenemos que E ∩ C′ 6= ∅. Sea λ elmınimo de E ∩ C′. Si cf λ = ℵ0 entonces λ ∈ T ∩ C 6= ∅. Supongamos quecf λ > ℵ0. Como λ ∈ C′ tenemos que λ ∩ C no esta acotado en λ. Vamos aprobar que, de hecho, λ ∩ C′ no esta acotado en λ. Para ello consideramos laaplicacion f : λ −→ λ que a cada α ∈ λ le asigna el mınimo ordinal en λ ∩ Cmayor que α.

Vamos a probar que si α < λ, entonces fω(α) ∈ λ ∩ C′ y, desde luego,α ≤ fω(α). Teniendo en cuenta que δ < f(δ) para todo δ < λ, es claro quela sucesion fn(α) es estrictamente creciente de ordinales de λ ∩ C. De aquıdeducimos que su supremo fω(α) es un ordinal lımite y fω(α) ∩ C no estaacotado en fω(α). Como C es cerrado concluimos que fω(α) ∈ C y de aquı asu vez que fω(α) ∈ λ ∩ C′.

Por otra parte, es inmediato comprobar que λ∩C′ es cerrado en λ, luego setrata de un c.n.a. Ahora bien, (λ ∩C′) ∩ (λ ∩E) ⊂ λ ∩ (C′ ∩E) = ∅, porque λes el mınimo de C′ ∩ E. Esto significa que E ∩ λ no es estacionario en λ, luegoλ ∈ T ∩ C′ 6= ∅.

Page 170: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

160 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

No es facil encontrar ejemplos de conjuntos estacionarios disjuntos en ℵ1.Sin embargo, lo cierto es que existen, como se desprende del siguiente teoremageneral:

Teorema 6.17 (Solovay) Sea κ un cardinal regular no numerable y A un con-junto estacionario en κ. Entonces existen conjuntos Eαα<κ estacionarios enκ y disjuntos dos a dos tales que

A =⋃

α<κEκ.

Demostracion: Sea

T = λ ∈ A | cf λ = ℵ0 ∨ (cf λ > ℵ0 ∧ A ∩ λ no es estacionario en λ,

que segun el teorema anterior es estacionario en κ. Para cada λ ∈ T tomemosfλ : cf λ −→ λ cofinal y normal. Veamos que si cf λ > ℵ0 podemos exigir quefλ[cf λ] ∩ T = ∅.

En efecto, si cf λ > ℵ0 tenemos que A ∩ λ no es estacionario en λ, luegotampoco lo es T ∩ λ. Por consiguiente existe un c.n.a. C en λ de manera queC ∩ T ∩ λ = ∅. Definimos f∗

λ : cf λ −→ λ mediante

f∗λ(0) = mınC,

f∗λ(α+ 1) = mınimo ordinal ǫ ∈ C tal que f∗

λ(α) < ǫ y fλ(α) < ǫ.

f∗λ(λ′) =

δ<λ′

f∗λ(δ).

Claramente f∗λ es normal y una simple induccion (usando que C es cerrado

en el caso lımite) prueba que f∗λ : cf λ −→ C. Como fλ(α) < f∗

λ(α + 1)para todo α < λ y fλ es cofinal, es claro que f∗

λ tambien lo es, y ademasf∗λ [cf λ] ∩ T ⊂ C ∩ T = ∅.

En lo sucesivo suprimiremos los asteriscos. Veamos ahora que existe unδ < κ tal que para todo ǫ < κ el conjunto

Fǫ = λ ∈ T | δ < cf λ ∧ fλ(δ) ≥ ǫ

es estacionario en κ.En caso contrario, para todo δ < κ existe un ǫ(δ) < κ y un c.n.a. Cδ en κ

tales queλ ∈ T | δ < cf λ ∧ fλ(δ) ≥ ǫ(δ) ∩ Cδ = ∅.

Equivalentemente, para todo δ < κ existe un ǫ(δ) < κ y un c.n.a. Cδ en κtales que si λ ∈ T ∩ Cδ y δ < cf λ, entonces fλ(δ) < ǫ(δ).

Sea C = α<κ

Cα, que es c.n.a. en κ. Si λ ∈ C ∩ T , entonces

δ < cf λ fλ(δ) < ǫ(δ)

(puesto que λ ∈ T ∩ Cδ).

Page 171: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.3. Un teorema de Silver 161

Claramente, D∗δ = γ ∈ κ | ǫ(δ) < γ = κ \ (ǫ(δ) + 1) es c.n.a. en κ. Por

consiguiente, Dδ = γ ∈ C | ǫ(δ) < γ = C ∩ D∗δ es c.n.a. en κ y, a su vez,

D = γ ∈ C |∧

δ < γ ǫ(δ) < γ = δ<κ

Dδ es c.n.a. en κ.

En consecuencia T ∩ D es estacionario y, en particular, tiene al menos doselementos γ < λ. Veamos que

(∗) Si δ < γ y δ < cf λ, entonces fλ(δ) < ǫ(δ) < γ.

En efecto, λ ∈ D, λ ∈ C ∩ T , fλ(δ) < ǫ(δ) y, como γ ∈ D, tambien ǫ(δ) < γ.

Como fλ es cofinal, existe un δ < cf λ (podemos tomarlo infinito) tal queγ ≤ fλ(δ), luego —por lo que acabamos de probar— γ ≤ δ < cf λ. En particularla condicion δ < cf λ es redundante en (∗), y ademas tenemos que cf λ > ℵ0.

Tenemos, pues, que si δ < γ entonces fλ(δ) < γ, luego fλ(γ) =⋃

δ<γ

fλ(δ) ≤ γ.

Como fλ es normal tenemos, de hecho, la igualdad fλ(γ) = γ, pero esto esimposible, pues γ ∈ T y fλ(γ) /∈ T .

Con esto hemos encontrado un δ < κ tal que para todo ǫ < κ el conjuntoFǫ es estacionario en κ. Sea g : T −→ κ la funcion dada por g(λ) = fλ(δ),obviamente regresiva.

Para cada ǫ < κ tenemos que g|Fǫ: Fǫ −→ κ es regresiva, luego por 6.15

existe un γǫ < κ tal que Gǫ = (g|Fǫ)−1(γǫ) es estacionario en κ.

Si λ ∈ Gǫ, entonces γǫ = g(λ) = fλ(δ) ≥ ǫ (porque Gǫ ⊂ Fǫ). Ası pues,∧

ǫ < κ ǫ ≤ γǫ.Por consiguiente, el conjunto B = γǫ | ǫ < κ no esta acotado en κ, luego

tiene cardinal κ. Sea h : κ −→ B biyectiva y sea Eα = Gh(α). Ası, los conjuntosEα son estacionarios en κ y disjuntos dos a dos, pues si γǫ 6= γǫ′ entoncesGǫ ∩Gǫ′ = ∅. Ademas Eα = Gh(α) ⊂ Fh(α) ⊂ T ⊂ A.

Sea U = A \ ⋃

α<κEα. Podemos cambiar E0 por E0 ∪ U , y ası conseguimos

que la union de los Eα sea A.

6.3 Un teorema de Silver

Vamos a aplicar los resultados sobre conjuntos estacionarios y cerrados noacotados para probar un importante resultado sobre la hipotesis de los cardinalessingulares.

Diremos que un cardinal infinito κ cumple la HCG si 2κ = κ+. Diremos queκ cumple la HCS si 2cf κ < κ→ κcf κ = κ+.

Es claro que la HCG (resp. la HCS) equivale a que la HCG (la HCS) secumpla en todos los cardinales.

Teorema 6.18 (Silver) Se cumple:

a) Si κ es un cardinal singular de cofinalidad no numerable y los cardinales(infinitos) menores que κ cumplen la HCG entonces κ cumple la HCG.

Page 172: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

162 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

b) Si no se cumple la HCS, entonces el mınimo cardinal que no la cumpletiene cofinalidad numerable.

c) Si la HCS se cumple sobre los cardinales de cofinalidad numerable, enton-ces se cumple sobre todos los cardinales.

En adelante supondremos que ℵ0 < µ = cf κ < κ y que καα<µ es unasucesion normal de cardinales cofinal en κ.

Definicion 6.19 Dos funciones f y g de dominio µ son casi disjuntas si elconjunto α < µ | f(α) = g(α) esta acotado en µ.

Una familia F de funciones de dominio µ es casi disjunta si esta formada porfunciones casi disjuntas dos a dos.

Teorema 6.20 Si∧

ν < κ νµ < κ, F ⊂∏

α<µAα es una familia casi disjunta

de funciones y el conjunto α < µ | |Aα| ≤ κα es estacionario en µ, entonces|F| ≤ κ.

Demostracion: No perdemos generalidad si suponemos que los conjuntosAα estan formados por ordinales y que α < µ | Aα ⊂ κα es estacionario en µpues, biyectando cada Aα con su cardinal podemos construir otra F equipotentea la dada y en las mismas condiciones.

Sea E0 = λ < µ | Aλ ⊂ κλ, que es estacionario en µ, pues es la intersecciondel conjunto que estamos suponiendo que es estacionario con el conjunto de losordinales lımite < µ, que es c.n.a.

Si f ∈ F, entonces para todo λ ∈ E0 tenemos que f(λ) ∈ Aλ ⊂ κλ y comoκαα<µ es normal existe un ordinal g(λ) < λ tal que f(λ) ∈ κg(λ).

Como E0 es estacionario y g : E0 −→ µ es regresiva, el teorema 6.15 nos daun conjunto estacionario Ef ⊂ E0 tal que g es constante en Ef : En particularf esta acotada en Ef por un κα < κ.

La aplicacion que a cada f le asigna f |Efes inyectiva, pues si f |Ef

= g|Eg

entonces f = g por ser F casi disjunta (los conjuntos Ef y Eg son no acotados).El numero de funciones h : E −→ κα con E ⊂ µ fijo es a lo sumo (teniendo

en cuenta la hipotesis)∣∣∣⋃

α<µκEα

∣∣∣ ≤

α<µκµα ≤

α<µκ = κ.

Como |Pµ| = 2µ < κ, el numero de funciones h : E −→ κα para cualquier Ees a lo sumo 2µ · κ = κ.

Como hemos asociado a cada f ∈ F una funcion h = f |Efdistinta y a lo

sumo puede haber κ funciones h, ha de ser |F| ≤ κ.

En realidad vamos a necesitar una ligera variante de este teorema:

Teorema 6.21 Si∧

ν < κ νµ < κ, F ⊂∏

α<µAα es una familia casi disjunta

de funciones y el conjunto α < µ | |Aα| ≤ κ+α es estacionario en µ, entonces|F| ≤ κ+.

Page 173: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.3. Un teorema de Silver 163

Demostracion: Como en el teorema anterior podemos suponer que losconjuntos Aα estan formados por ordinales y que E0 = α < µ | Aα ⊂ κ+α esestacionario en µ.

Sea f ∈ F y E ⊂ E0 estacionario. Definimos

Ff,E = g ∈ F |∧

α ∈ E g(α) ≤ f(α).

Claramente se trata de una familia casi disjunta contenida en∏

α<µBα, donde

Bα =f(α) + 1 si α ∈ E,κ en caso contrario.

Ası, si α ∈ E ⊂ E0, tenemos que f(α) ∈ κ+α , luego |Bα| = |f(α) + 1| ≤ κ.Por consiguiente el conjunto α < µ | |Bα| ≤ κα es estacionario (contiene a E)y podemos aplicar el teorema anterior, segun el cual |Ff,E | ≤ κ.

Ahora definimos

Ff = g ∈ F |∨

E ⊂ E0(E estacionario ∧∧

α ∈ E g(α) ≤ f(α)) =⋃

E

Ff,E ,

donde E varıa en los subconjuntos estacionarios de E0. Claramente

|Ff | ≤∑

E

κ ≤ 2µκ = κ.

Veamos finalmente que |F| ≤ κ+. En otro caso tomemos fαα<κ+ funciones

distintas en F. Tenemos que∣∣∣⋃

α<κ+

∣∣∣ ≤

α<κ+

κ = κ+, luego ha de existir una

funcion f ∈ F \ ⋃

α<κ+

Fα.

En tal caso el conjunto γ ∈ E0 | f(γ) ≤ fα(γ) no es estacionario paraningun α < κ+, luego su complementario γ ∈ E0 | fα(γ) ≤ f(γ) sı lo es, yesto significa que cada fα ∈ Ff , lo cual es imposible, dado que hay κ+ funcionesfα y |Ff | ≤ κ.

El apartado a) del teorema de Silver es un caso particular del teorema si-guiente:

Teorema 6.22 Si el conjunto α < µ | 2κα = κ+α es estacionario en µ, en-tonces 2κ = κ+.

Demostracion: Veamos que∧

ν < κ νµ < κ. En efecto, si ν < κ sea α talque ν, µ < κα y 2κα = κ+α . Entonces νµ ≤ κκα

α = 2κα = κ+α ≤ κα+1 < κ.Para cada X ⊂ κ sea fX = Xαα<µ, donde Xα = X ∩ κα. Definimos

F = fX | X ⊂ κ. Si X 6= Y entonces fX y fY son casi disjuntas, pues ha deexistir un α tal que X ∩ κα 6= Y ∩ κα y entonces δ < µ | fX(δ) = fY (δ) ⊂ α.En particular, si X 6= Y entonces fX 6= fY , luego |F| = 2κ.

Por otra parte F es una familia casi disjunta de funciones contenida en∏

α<µPκα y el conjunto α < µ | |Pκα| = κ+α es estacionario en µ. El teorema

anterior nos da, entonces, que 2κ = |F| ≤ κ+.

Para probar el resto del teorema de Silver necesitamos un paso mas:

Page 174: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

164 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Teorema 6.23 Si∧

ν < κ νµ < κ y el conjunto α < µ | κcf καα = κ+α es

estacionario en µ, entonces κµ = κ+.

Demostracion: Para cada h : µ −→ κ sea fh = hαα<µ, donde lasaplicaciones hα : µ −→ κ vienen dadas por

hα(β) =h(β) si h(β) < κα,0 en otro caso.

Sea F = fh | h ∈ µκ. Si h 6= g, entonces fg y fh son casi disjuntas, puessi h(δ) 6= g(δ) y ambos son menores que κα, entonces

δ < µ | fh(δ) = fg(δ) ⊂ α+ 1.

En particular si h 6= g se cumple fh 6= fg, luego |F| = κµ. Ademas F es casidisjunta y esta contenida en

α<µ

µκα.

Queremos aplicar el teorema 6.21 para concluir que κµ = |F| ≤ κ+. Necesi-tamos, pues, probar que el conjunto E = α < µ | κµα = κ+α es estacionario enµ. Para ello consideramos el conjunto

C = λ < µ |∧

ν < κλ νµ < κλ.

Veamos que si λ ∈ C entonces κcf κλ

λ = κµλ. De aquı se seguira que

α < µ | κcf καα = κ+α ∩ C ⊂ E

y, como el conjunto de la izquierda es estacionario por hipotesis, si probamostambien que C es c.n.a., concluiremos que E es estacionario, tal y como noshace falta.

Sea, pues, λ ∈ C. Entonces cf κλ = cf λ ≤ λ < µ. Sea κλ =∑

α<cf κλ

να,

donde∧

α < cf κλ να < κλ. Ası

κcf κλ

λ ≤ κµλ =(

α<cf κλ

να

≤ ∏

α<cf κλ

νµα ≤ ∏

α<cf κλ

κλ = κcf κλ

λ .

Segun lo dicho, ahora solo queda probar que C es c.n.a. en µ. Para ellodefinimos l : µ −→ µ mediante

l(α) = mınβ < µ | κµα < κβ.

Basta probar que

C = λ | λ < µ ∩ α < µ | l[α] ⊂ α.

En efecto, si λ ∈ C y α < λ, entonces κµα < κλ, existe un β < λ tal queκµα < κβ, luego l(α) ≤ β < λ. Por lo tanto l[λ] ⊂ λ.

Recıprocamente, si l[λ] ⊂ λ y ν < κλ, sea α < λ tal que ν < κα. Entoncesνµ ≤ κµα < κl(α) < κλ, luego λ ∈ C.

Page 175: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.4. Cardinales de Mahlo 165

Ahora estamos en condiciones de probar el apartado b) del teorema de Silver,y el apartado c) es una consecuencia inmediata. Sea κ el mınimo cardinal queincumple la HCS, es decir, κ > ℵ0, 2cf κ < κ, pero κcf κ > κ+. Supongamos quecf κ > ℵ0.

Sea µ = cf κ y καα<µ como en los teoremas precedentes. Tenemos que laHCS se cumple bajo κ, luego el argumento del teorema 5.18 es valido en estecontexto y nos permite probar que si ν < κ entonces νµ toma uno de los valores2µ, µ o µ+, luego en particular

ν < κ νµ < κ.Sea E = α < µ | cf κα = ℵ0 ∧ 2ℵ0 < κα. Es claro que E es estacionario

en µ, pues contiene a la interseccion del c.n.a. µ \ α0, donde α0 es el mınimoordinal tal que 2ℵ0 < κα0 , con el conjunto λ < µ | cf λ (= cf κλ) = ℵ0, el cuales estacionario por el teorema 6.13.

Si α ∈ E, entonces 2cf κα < κα, con cf κα = ℵ0 y, como κα < κ cumplela HCS, κcf κα

α = κ+α , de modo que E ⊂ α < µ | κcf καα = κ+α. Concluimos

que este ultimo conjunto es estacionario y ello nos permite aplicar el teoremaanterior, segun el cual κcf κ = κ+.

Tenemos ası un ejemplo no trivial de las numerosas restricciones que seconocen sobre la funcion del continuo en cardinales singulares. Por ejemplo, sisuponemos que

α < ω1 2ℵα = ℵα+1, entonces necesariamente 2ℵω1 = ℵω1+1.En cambio, aunque supongamos

n ∈ ω 2ℵn = ℵn+1

no podemos demostrar —aunque no es facil probar que ası es— que 2ℵω = ℵω+1,es decir, la HCS no puede demostrarse ni siquiera para ℵω. Esto no significa que2ℵω este libre de este tipo de restricciones. Por ejemplo, un profundo teoremade S. Shelah de 1982 afirma que, para todo ordinal lımite λ:

ℵcf λλ < ℵ(|λ|cf λ)+ .

En particular, si∧

n ∈ ω 2ℵn < ℵω, entonces 2ℵω = ℵℵ0ω < ℵ(2ℵ0)+ .

Mas sorprendente aun es otro teorema de Shelah de 1990, segun el cual, si2ℵ0 < ℵω entonces ℵℵ0

ω < ℵω4 , con lo que, por 5.10, si∧

n ∈ ω 2ℵn < ℵω,necesariamente 2ℵω < ℵω4 . Estos resultados son algunas consecuencias de lallamada teorıa de las cofinalidades posibles, descubierta por Shelah y que tienemuchas mas consecuencias en muchas ramas de la teorıa de conjuntos.

6.4 Cardinales de Mahlo

Los conjuntos estacionarios intervienen tambien en la definicion de una fa-milia de los llamados “cardinales grandes”, cardinales cuya existencia no puedeser demostrada porque son “innecesarios” para que se cumplan los axiomas dela teorıa de conjuntos. Ya hemos discutido los menores de ellos, los cardinalesinaccesibles. Los siguientes en la jerarquıa son los cardinales de Mahlo, queahora vamos a introducir.

Page 176: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

166 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Definicion 6.24 Un cardinal κ es (debilmente) de Mahlo si κ es (debilmente)inaccesible y el conjunto µ < κ | µ es regular es estacionario en κ.

En realidad los cardinales de Mahlo cumplen mucho mas de lo que exige ladefinicion:

Teorema 6.25 Si κ es un cardinal (debilmente) de Mahlo, entonces el conjuntoµ < κ | µ es (debilmente) inaccesible es estacionario en κ.

Demostracion: Basta ver que el conjunto

C = µ < κ | µ es un cardinal lımite fuerte (resp. lımite)

es c.n.a. en κ, pues el conjunto del enunciado es la interseccion con C del con-junto de la definicion de cardinal de Mahlo.

El conjunto C es cerrado porque el supremo de un conjunto no acotado decardinales es un cardinal lımite, y si los cardinales son lımites fuertes el supremotambien lo es.

Si α < κ, sea µ0 = α+ y definimos∧

n ∈ ω µn+1 = µ+n (respectivamente

n ∈ ω µn+1 = 2µn). Como κ es un cardinal lımite (fuerte), se cumple que∧

n ∈ ω µn ∈ κ y, como κ es regular, µ = supn∈ω

µn ∈ κ. Claramente µ es un

cardinal lımite (fuerte), de modo que µ ∈ C ∧ α < µ. Ası pues, C no estaacotado en κ.

Se suele decir que un cardinal de Mahlo es “mas grande” que un cardinalinaccesible, pero esto no ha de ser entendido en sentido literal: pueden existircardinales κ < µ de modo que κ sea de Mahlo y µ sea (meramente) inaccesi-ble. La comparacion debe entenderse en dos sentidos: por una parte, el mınimocardinal de Mahlo κ (si existe) ha de ser mucho mayor que el mınimo cardinalinaccesible, pues κ ha de dejar bajo sı un conjunto estacionario de cardinalesinaccesibles; por otra parte, tambien se dice que un cardinal de Mahlo es “masgrande” en el sentido de que implica la existencia de muchos cardinales inac-cesibles, es decir, en el sentido de que suponer la existencia de un cardinal deMahlo es “mas fuerte” que suponer la existencia de un cardinal inaccesible.

Por el mismo razonamiento que empleamos con los cardinales inaccesibles, apartir de la existencia de un cardinal de Mahlo no puede probarse la existenciade dos de ellos, por lo que postular que existen dos es un axioma mas fuerte quepostular que existe uno. Pero podemos ir mucho mas alla:

Definicion 6.26 Sea γ un ordinal infinito. Definimos los conjuntos

M0(γ) = κ < γ | κ es (debilmente) inaccesible,Mα+1(γ) = κ ∈Mα(γ) | µ < κ | µ ∈Mα(γ) es estacionario en κ,Mλ(γ) =

δ<λ

Mδ(γ).

Page 177: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.4. Cardinales de Mahlo 167

Definimos las clasesMα =

γ∈Ω

Mα(γ).

A los elementos de Mα los llamaremos cardinales (debilmente) α-Mahlo. Elordinal γ que aparece en la definicion es un auxiliar tecnico para evitar unarecurrencia con clases propias que no estarıa justificada, pero se compruebainmediatamente lo siguiente:

Para todo cardinal infinito κ:

κ es (debilmente) 0-Mahlo si y solo si es (debilmente) inaccesible.

κ es (debilmente) α+1-Mahlo si y solo si es (debilmente) α-Mahlo y el conjuntoµ < κ | µ es (debilmente) α-Mahlo es estacionario en κ.

κ es (debilmente) λ-Mahlo si y solo si es (debilmente) δ-Mahlo para todo δ < λ.

De este modo, los cardinales (debilmente) de Mahlo son precisamente los(debilmente) 1-Mahlo. Es facil ver que la situacion en cuanto a consistencia delos cardinales 2-Mahlo respecto a los 1-Mahlo es la misma que la de los 1-Mahlorespecto a los inaccesibles, con lo que tenemos una escala de cardinales grandes.

Notemos que si κ es un cardinal (debilmente) α-mahlo y para cada β < αllamamos µβ al menor cardinal (debilmente) β-Mahlo, entonces la aplicacionf : α −→ κ dada por f(β) = µβ es inyectiva y creciente, luego α ≤ κ. Asıpues, un cardinal κ puede a lo sumo ser (debilmente) κ-Mahlo, pero nuncaκ+ 1-Mahlo.

Esto no significa que los cardinales (debilmente) κ-Mahlo sean “los mayoresposibles”. Por ejemplo, en la escala de los llamados “cardinales grandes” tienenpor encima a los llamados “cardinales debilmente compactos”, de modo que siκ es debilmente compacto, el conjunto µ < κ | µ es µ-Mahlo es estacionarioen κ.

Nota Como ya hemos indicado, no es posible demostrar en NBG la existenciade cardinales de ninguno de los tipos que acabamos de definir, lo cual equivalea que podemos suponer que no existen sin que ello pueda introducir ningunacontradiccion en la teorıa. Cabe entonces preguntarse si, en sentido contrario, esconsistente suponer que existen, es decir, si el axioma que afirma la existenciade un cardinal de Mahlo, o de un cardinal κ que sea κ-Mahlo no da lugar acontradicciones. La respuesta es que, si bien es plausible que ası sea, es decir,que no haya contradiccion alguna en suponer la existencia de cardinales deestos tipos, no es posible demostrar tal cosa. Mas aun, aun suponiendo queNBG mas la existencia de un cardinal de Mahlo sea consistente, no podemosprobar a partir de ahı que tambien lo es NBG mas la existencia de un cardinal2-Mahlo, y ası sucesivamente.

De este modo, las teorıas que resultan de extender NBG anadiendo axiomascada vez mas fuertes sobre existencia de cardinales grandes (la existencia de uncardinal de Mahlo, la existencia de dos cardinales de Mahlo, la existencia de uncardinal 2-Mahlo, etc.) forman una escala de teorıas cada vez “mas fuertes” en

Page 178: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

168 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

el sentido de que la consistencia de cualquiera de ellas no puede demostrarse niaunque se suponga la consistencia de las anteriores en la escala.

Esto mismo vale en general para todos los llamados “cardinales grandes”, delos cuales los cardinales α-Mahlo son solo los “mas pequenos”, y precisamenteen ello radica su interes, pues hay muchas afirmaciones conjuntistas, que enprincipio no tienen nada que ver con cardinales grandes, que no son demostrablesen NBG, pero cuya consistencia no puede demostrarse ni siquiera suponiendola consistencia de NBG, porque es “mas fuerte” que esta. En tal caso, dichaconsistencia solo puede probarse suponiendo la consistencia de NBG mas laexistencia de uno o varios cardinales grandes “del tamano adecuado”.

Por ejemplo, la negacion de la HCS implica la existencia de ciertos cardina-les grandes, luego si es consistente NBG + ¬HCS tambien lo es NBG mas laexistencia de tales cardinales, y como esto no puede demostrarse a partir de lamera consistencia de NBG, lo maximo que puede probarse respecto de la consis-tencia de ¬HCS es que si NBG mas la existencia de ciertos cardinales grandeses consistente, tambien lo es NBG + ¬HCS.

6.5 Principios combinatorios

Otro contexto en el que aparecen los conjuntos c.n.a. y estacionarios es enla formulacion de los llamados “principios combinatorios”. No existe una defi-nicion precisa, pero se conoce con este nombre a una serie de afirmaciones de“aspecto similar” (aunque unas son mas fuertes que otras) que tienen entre suscaracterısticas comunes el no ser demostrables en NBG, pero, al contrario delo que sucede con los axiomas que postulan la existencia de cardinales grandes,cuya consistencia no puede ser demostrada, sı que es posible demostrar1 que siNBG es consistente, tambien lo es la teorıa que resulta de anadir como axiomacualquiera de los principios combinatorios que vamos a considerar (o todos ellosa la vez). Por lo tanto, cualquier teorema que se demuestre suponiendo uno ovarios principios combinatorios, no sera necesariamente un teorema de NBG,pero sabremos que su conclusion no puede ser refutada en NBG (si es que NBGes consistente).

En cierta medida, todos los principios combinatorios que vamos a considerarson generalizaciones o variantes del diamante de Jensen:

(♦) Existe una sucesion Aαα<ω1 tal que∧

α < ω1 Aα ⊂ α y que verifica

A ⊂ ω1 α < ω1 | A ∩ α = Aα es estacionario en ω1.

A las sucesiones Aαα<ω1 que cumplen ♦ se las llama sucesiones ♦ (diamante).

Veamos algunas de estas generalizaciones y variantes:

1Mas concretamente, todos son demostrables a partir del axioma de constructibilidad,V = L, que puede probarse que es consistente con NBG.

Page 179: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.5. Principios combinatorios 169

Definicion 6.27 Sea κ un cardinal regular no numerable, para cada E ⊂ κestacionario consideramos las sentencias:

(♦E) Existe una sucesion Aαα∈E tal que∧

α ∈ E Aα ⊂ α y que verifica

A ⊂ κ α ∈ E | A ∩ α = Aα es estacionario en κ.

(♦′E) Existe una sucesion Sαα∈E tal que

α ∈ E (Sα ⊂ Pα ∧ |Sα| < κ)y que verifica

A ⊂ κ α ∈ E | A ∩ α ∈ Sα es estacionario en κ.

(♦∗κ) Existe una sucesion Sαα∈κ tal que

α ∈ κ (Sα ⊂ Pα ∧ |Sα| < κ)y que verifica

A ⊂ κ∨

C (C c.n.a. en κ ∧ C ⊂ α ∈ κ | A ∩ α ∈ Sα).

(♦+κ ) Existe una sucesion Sαα∈κ tal que

α ∈ κ (Sα ⊂ Pα ∧ |Sα| < κ)y que verifica

A ⊂ κ∨

C (C c.n.a. en κ ∧ C ⊂ α ∈ κ | A ∩ α ∈ Sα ∧ C ∩ α ∈ Sα).

A las sucesiones que cumplen estas propiedades se las llama, respectivamentesucesiones ♦E , ♦′

E , ♦∗κ, ♦+

κ . En particular se llama ♦, ♦′, etc. a ♦ω1 , ♦′ω1

, etc.

Podrıamos haber enunciado principios ♦∗E y ♦+

E , para conjuntos estacionariosE ⊂ κ, como hemos hecho con ♦E y ♦′

E , pero no los vamos a necesitar, ası quepara ambos principios nos limitaremos a considerar el caso E = κ. Ademas,aunque los hemos definido para cardinales regulares cualesquiera, limitaremosnuestro estudio principalmente al caso de los cardinales sucesores.

En el capıtulo IX veremos varias aplicaciones de estos principios combinato-rios. Aquı estudiaremos las relaciones entre ellos y la aritmetica cardinal.

Los hemos presentado todos a la vez para que resulte mas facil compararlos,pero vamos a estudiarlos uno a uno, empezando por ♦E . Notemos en primerlugar que si E ⊂ E′ son estacionarios en κ entonces ♦E → ♦E′ , pues si com-pletamos una sucesion ♦E de cualquier modo, por ejemplo, haciendo Aα = ∅para α ∈ E′ \E, obtenemos una sucesion ♦E′ , luego ♦E es “mas fuerte” cuantomenor es E y ası ♦κ es el mas debil de todos los diamantes sobre κ.

Observamos que la condicion∧

α ∈ E Aα ⊂ α se puede suprimir de ladefinicion de ♦E , pues si una sucesion cumple las condiciones de ♦E exceptoesa, entonces Aα ∩αα∈E es una sucesion ♦E , ya que en la condicion principalda igual escribir Aα que Aα ∩ α.

El teorema siguiente muestra que los diamantes no pueden demostrarse enNBG:

Teorema 6.28 Si κ es un cardinal infinito, entonces ♦κ+ → 2κ = κ+.

Page 180: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

170 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Demostracion: Sea Aαα<κ+ una sucesion ♦κ+ . Si A ⊂ κ, el conjuntoα < κ+ | A ∩ α = Aα es estacionario, luego no esta acotado, luego contieneun α > κ, de modo que A = A∩α = Aα. Esto prueba que Pκ ⊂ Aα | α ∈ κ+,luego |Pκ| ≤ κ+, luego 2κ = κ+.

Veamos ahora que, para κ > ω, la implicacion del teorema anterior es rever-sible:

Teorema 6.29 (Shelah) Sea κ un cardinal tal que 2κ = κ+. Entonces secumple ♦E para todo conjunto estacionario en κ+ tal que

E ⊂ δ < κ+ | cf δ 6= cf κ.

En particular, para todo cardinal κ > ω, se cumple ♦κ+ ↔ 2κ = κ+.

Demostracion: La parte final se debe a que si κ > ω y cf κ > ℵ0, por 6.13sabemos que

E = δ < κ+ | cf δ = ℵ0es estacionario en κ+ y, cumple las condiciones del teorema, luego si 2κ = κ+

tenemos ♦E y en particular ♦κ+ . En el caso en que cf κ = ℵ0 definimos E conℵ1 en lugar de ℵ0 y concluimos igualmente.

Para probar la primera parte, observamos que el conjunto C0 de los ordi-nales lımite κ < λ < κ+ es cerrado no acotado en κ+, luego E0 = E ∩ C0 esestacionario, y basta probar ♦E0 . Equivalentemente, podemos suponer que Eesta formado unicamente por ordinales lımite mayores que κ.

Sea µ = cf κ. Observemos que si δ ∈ E entonces cf δ < κ, por hipotesis siµ = κ o porque κ es singular si µ < κ y las cofinalidades son siempre regulares.Fijemos f : µ −→ κ cofinal creciente, de modo que κ =

⋃f(i) | i < µ. Para

cada δ ∈ E, sea g : δ −→ κ biyectiva y sea Aδi = g−1[f(i)], de modo que Aδ

i i<µ

es una sucesion creciente en [δ]<κ cuya union es δ.Como cf δ < κ podemos anadir a cada Aδ

i un conjunto cofinal en δ y asıtodos los Aδ

i son cofinales en δ. Por otra parte,

|[µ× κ× κ+]<κ+ | = (κ+)<κ+

= (κ+)κ = (2κ)κ = κ+,

luego podemos tomar una enumeracion Xββ<κ+ de [µ× κ× κ+]<κ+

.

Si X ⊂ µ× κ× κ+, llamamos (X)i = (α, α′) < κ× κ+ | (i, α, α′) ∈ X.

Vamos a probar que existe un i < µ tal que, para todo Z ⊂ κ × κ+ elconjunto siguiente es estacionario:

Ei,Z = δ ∈ E | supα ∈ Aδi |

β ∈ Aδi (Z ∩ (κ× α) = (Xβ)i) = δ.

En efecto, suponemos que no se cumple esto. Entonces, para cada i < µexiste un Zi ⊂ κ × κ+ y un c.n.a. Ci ⊂ κ+ tal que Ci ∩ Ei,Zi

= ∅. Definimosf : κ+ −→ κ+ mediante

f(α) = mınβ < κ+ | Xβ =⋃

j<µ

(j × (Zj ∩ (κ× α))).

Page 181: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.5. Principios combinatorios 171

Por el teorema 6.7, el conjunto C∗ = δ ∈ κ+ | f [δ] ⊂ δ es c.n.a. en κ+, ytambien lo es C =

i<κ

Ci ∩ C∗. Ası, si δ ∈ C se cumple que

Aδ0 = α ∈ Aδ

0 |∨

β < δ∧

j < µ(Zi ∩ (κ× α) = (Xβ)j).

Como E es estacionario, podemos tomar δ ∈ E ∩ C. Para cada i < µ sea

Bδi = α ∈ Aδ

0 |∨

β ∈ Aδi

j < µ(Zj ∩ (κ× α) = (Xβ)j).

Entonces Aδ0 =

i<µ

Bδi . Si, para todo i < µ, se cumpliera que ξi = supBδ

i < δ,

como Aδ0 no esta acotado en δ, la sucesion ξii<µ serıa cofinal en δ y creciente

(pues como la sucesion Aδi es creciente Bδ

i tambien lo es, ası como la sucesionde sus supremos), y concluimos que cf δ = µ, contradiccion. Ası pues, existe uni < µ tal que supBδ

i = δ. En particular, como Aδ0 ⊂ Aδ

i ,

supα ∈ Aδi |

β ∈ Aδi

j < µ(Zj ∩ (κ× α) = (Xβ)j) = δ,

pero esto quiere decir que δ ∈ Ei,Zi, en contradiccion con que δ ∈ Ci.

Ası pues, fijado el i < µ cuya existencia acabamos de probar, llamamosAδ = Aδ

i y Xβ ⊂ κ × κ+ al conjunto que hasta ahora llamabamos (Xβ)i.De este modo tenemos una sucesion Aδδ∈E con Aδ ⊂ δ y |Aδ| < κ y una

sucesion Xββ<κ+ que recorre todos los elementos de [κ × κ+]<κ+

(tal vezcon repeticiones) de modo que para todo Z ⊂ κ × κ+ el conjunto siguiente esestacionario:

EZ = δ ∈ E | supα ∈ Aδ |∨

β ∈ Aδ(Z ∩ (κ× α) = Xβ) = δ.

Para cada τ < κ definimos (Xβ)τ = σ | (τ, σ) ∈ Xβ.

Ahora vamos a definir recurrentemente una sucesion (Yτ , Cτ )τ<κ de paresde subconjuntos de κ+ de modo que la sucesion Cττ<κ es decreciente y suselementos son subconjuntos c.n.a. en κ+.

Tomamos Y0 = C0 = κ+. Supongamos definida la sucesion (Yτ , Cτ )τ<γ ,para γ < κ, no nulo. Para cada δ ∈ E definimos

V δγ = (α, β) ∈ Aδ ×Aδ |

τ < γ Yτ ∩ α = (Xβ)τ.

Notemos que si prolongamos la sucesion Yττ<γ con cualquier conjuntoYγ ⊂ κ+, se va a cumplir, para todo δ ∈ E, que V δ

γ+1 ⊂ V δγ . Si se puede elegir

Yγ de modo que exista un c.n.a. Cγ ⊂ ⋂

τ<γCτ tal que, para todo δ ∈ E ∩Cγ que

cumpla

supα < δ |∨

β < δ (α, β) ∈ V δγ+1 = δ,

se tiene que V δγ+1 V δ

γ , entonces prolongamos la sucesion con (Yγ , Cγ). Encaso contrario la sucesion termina.

Page 182: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

172 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Vamos a probar que la sucesion tiene que terminar en algun γ∗ < κ. Encaso contrario habrıamos construido una sucesion (Yτ , Cτ )τ<κ de modo queC =

τ<κCτ serıa un c.n.a. en κ+. Definimos

Z =⋃

τ<κτ × Yτ .

Tomamos δ ∈ EZ ∩ C. Por la definicion de EZ se cumple que

supα ∈ Aδ |∨

β ∈ Aδ(Z ∩ (κ× α) = Xβ) = δ,

que es lo mismo que

supα ∈ Aδ |∨

β ∈ Aδ

τ < κ Yτ ∩ α = (Xβ)τ = δ.

Entonces, para todo γ < κ,

supα < δ |∨

β < δ (α, β) ∈ V δγ+1 = δ.

Entonces, la construccion de la sucesion implica que Y δγ γ<κ es estrictamente

decreciente en Aδ ×Aδ, pero esto es imposible, pues |Aδ ×Aδ| < κ.

Fijamos, pues γ∗ < κ tal que la sucesion (Yτ , Cτ )τ<γ∗ ya no puede pro-longarse mas, sea C∗ =

τ<γ∗

Cτ , que es c.n.a. en κ+, y para cada δ ∈ E ∩ C∗

seaSδ =

(α,β)∈V δγ∗

(Xβ)γ∗ .

Finalmente, veamos que Sδδ∈E∩C∗ es una sucesion ♦E∩C∗ , lo que implica ♦E .

En caso contrario existe un Y ⊂ κ+ y un c.n.a. C ⊂ C∗ tal que∧

δ ∈ C ∩ E Sδ 6= Y ∩ δ.

Para obtener una contradiccion, basta probar que la sucesion se puede pro-longar tomando Yγ∗ = Y , Cγ∗ = C.

Para ello tomamos un δ ∈ E ∩Cγ∗ que cumpla

supα < δ |∨

β < δ (α, β) ∈ V δγ∗+1 = δ.

Esto equivale a

supα ∈ Aδ |∨

β ∈ Aδ

τ ≤ γ∗ Yτ ∩ α = (Xβ)τ = δ.

Por lo tanto, supα < δ |∨

β < δ(α, β) ∈ V δγ∗ = δ, y por otra parte

Yγ∗ ∩ δ =⋃

(α,β)∈V δγ∗+1

(Xβ)γ∗ .

Si V δγ∗+1 = V δ

γ∗ , entonces la ultima expresion es Y ∗γ ∩ δ = Sδ. Pero esto no

sucede, por la eleccion de Y y de C, luego V δγ∗+1 V δ

γ∗ , y esta es la condicionque debe cumplirse para que (Y,C) puedan prolongar la sucesion.

Page 183: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.5. Principios combinatorios 173

Sucede, en cambio, que ♦ implica la hipotesis del continuo 2ℵ0 = ℵ1, perono es equivalente a ella.

Ya hemos observado que si E ⊂ E′ entonces ♦E → ♦E′ . Ahora vamosa probar un recıproco parcial, que nos permite deducir un diamante para unconjunto menor a partir de un diamante para un conjunto mayor:

Teorema 6.30 Sea κ un cardinal infinito, sea E ⊂ κ+ un conjunto estacionarioy sea E =

δ<κ

Eδ una particion de E en conjuntos disjuntos dos a dos. Si se

cumple ♦E , entonces existe un δ < κ tal que Eδ es estacionario en κ+ y secumple ♦Eδ

.

Demostracion: Sea j : κ+ −→ κ×κ+ la semejanza cuando en el productoconsideramos el orden lexicografico. El conjunto C∗ = λ < κ+ | κλ = λ(donde el producto es el de ordinales) es c.n.a. en κ+ y, para cada λ ∈ C∗ (como(κ × κ+)(0,λ) = κ × λ y tiene ordinal κλ = λ), tenemos que j|λ : λ −→ κ × λbiyectiva.

Sea Aαα∈E una sucesion ♦E y, para cada α ∈ E, definamos

Bα =

j[Aα] si α ∈ C∗,∅ si α /∈ C∗.

Ası tenemos definida una sucesion Bαα∈E que cumple lo mismo que las su-cesiones ♦E , pero para subconjuntos de κ × κ+, es decir, Bα ⊂ κ × α y siX ⊂ κ× κ+, entonces α ∈ E | X ∩ (κ× α) = Bα es estacionario en κ+, puessabemos que lo es

C∗ ∩ α ∈ E | j−1[X ] ∩ α = Aα ⊂ α ∈ E | X ∩ (κ× α) = Bα.

Para cada δ < κ sea Aδαα∈Eδ

la sucesion dada por

Aδα = β ∈ α | (β, δ) ∈ Bα.

Vamos a probar que existe un δ < κ tal que Eδ es estacionario y Aδαα∈Eδ

es una sucesion ♦Eδ. En caso contrario, para cada δ < κ existe un Xδ ⊂ κ+ y

un c.n.a. Cδ ⊂ κ+ de modo que∧

α ∈ Cδ ∩ Eδ Xδ ∩ α 6= Aδα.

Notemos que si lo que falla es que Eδ no es estacionario esto se cumple concualquier Cδ disjunto de Eδ. Definimos

X =⋃

δ<κ

(δ ×Xδ), C =⋂

δ<κ

Cδ.

Entonces C es c.n.a. en κ+, luego existe un α ∈ E∩C tal que X∩ (κ×α) = Bα,luego existe un δ < κ tal que α ∈ Eδ, y tambien α ∈ Cδ, luego

β ∈ Xδ ∩ α ↔ (δ, β) ∈ X ∩ (κ× α) = Bα ↔ β ∈ Aδα,

en contradiccion con que Xδ ∩ α 6= Aδα.

Page 184: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

174 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Observemos ahora la relacion entre ♦E y ♦′E : El primero nos asegura que si

A ⊂ κ es un conjunto arbitrario, muchas de sus secciones A∩α son “previsibles”,en el sentido de que son terminos de una sucesion ♦E fijada a priori. En cambio,♦′E es una version mas debil que, en lugar de identificar exactamente (algunas

de) estas secciones de A, nos dice unicamente que cada una de ellas sera algunode los elementos de un conjunto prefijado Sα de cardinal < κ.

Es claro entonces que ♦E → ♦′E , pues si Aαα∈E es una sucesion ♦E ,

entonces basta definir Sα = Aα para tener una sucesion ♦′E . Pero, aunque no

es tan evidente, sucede que el recıproco tambien es cierto:

Teorema 6.31 Si κ es un cardinal infinito y E ⊂ κ+ es estacionario, entonces♦E ↔ ♦′

E .

Demostracion: Como en la prueba del teorema anterior, consideramos lasemejanza j : κ+ −→ κ× κ+ la semejanza cuando en el producto consideramosel orden lexicografico y el c.n.a. C∗ = λ < κ+ | κλ = λ, de modo que paracada λ ∈ C∗ se cumple que j|λ : λ −→ κ× λ biyectiva.

Si Sαα∈E es una sucesion ♦′E , para cada α ∈ E definimos

Tα =

j[A] | A ∈ Sα si α ∈ C,

∅ si α /∈ C.

Ası tenemos definida una sucesion Tαα∈E que cumple lo mismo que las suce-siones ♦′

E , pero para subconjuntos de κ× κ+, es decir, Tα ⊂ P(κ×α), |Tα| ≤ κy si X ⊂ κ× κ+, entonces α ∈ E | X ∩ (κ× α) ∈ Tα es estacionario.

Enumeremos (con repeticiones, si es preciso) Tα = T δα | δ < κ. Ası, para

cada X ⊂ κ× κ+ existe E0 ⊂ E estacionario tal que

α ∈ E∨

δ < κ X ∩ (κ× α) = T δα.

Veamos ahora que, dado X ⊂ κ× κ+, existe F ⊂ E estacionario tal que

δ < κ∧

α ∈ F X ∩ (κ× α) = T δα.

En efecto, definimos f : E0 −→ κ mediante f(α) = 0 si α < κ y, paraκ ≤ α < κ+, tomamos como f(α) el mınimo δ tal que X ∩ (κ×α) = T δ

α. Por elteorema 6.15 sabemos que existe un δ < κ tal que F = f−1[δ] es estacionario.Claramente F y δ cumplen lo requerido.

Por otra parte, para cada α ∈ E y δ < κ definimos

Aδα = β ∈ α | (δ, β) ∈ T δ

α,

y afirmamos que existe un δ < κ tal que Aδαα∈E es una sucesion ♦E . En caso

contrario, para cada δ < κ existe un Xδ ⊂ κ+ y un c.n.a. Cδ ⊂ κ+ de modo que

α ∈ Cδ Xδ ∩ α 6= Aδα.

Page 185: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.5. Principios combinatorios 175

Tomamos entonces X =⋃

δ<κ

(δ × Xδ) y C =⋂

δ<κ

Cδ, que es c.n.a. en κ+.

Segun hemos probado, existe un δ < κ, un conjunto estacionario F ⊂ E y unα ∈ F ∩ C de modo que X ∩ (κ× α) = T δ

α. Pero entonces

β ∈ Xδ ∩ α ↔ (δ, β) ∈ X ∩ (κ× α) = T δα ↔ β ∈ Aδ

α,

en contradiccion con que Xδ ∩ α 6= Aδα.

Nota Es evidente que no tiene interes trabajar con ♦′κ+ , que es superficial-

mente mas debil que ♦κ+ (aunque en el fondo sea equivalente). El interes de♦′κ+ es que admite una version mas fuerte, ♦∗

κ+ , que consiste en cambiar lacondicion de que el conjunto α ∈ κ+ | A ∩ α ∈ Sα sea estacionario por lacondicion de que contenga un c.n.a.

Si tratamos de reforzar de este modo el principio ♦κ+ llegamos a un principiocontradictorio:

Existe una sucesion Aαα∈κ tal que∧

α ∈ κ Aα ⊂ α y que verifica∧

A ⊂ κ∨

C (C c.n.a. en κ ∧ C ⊂ α ∈ κ | A ∩ α = Aα).

En efecto, esto no puede suceder, porque si A y A′ son dos subconjuntosdistintos de κ, entonces el conjunto

α ∈ κ | A ∩ α = Aα ∩ α ∈ κ | A′ ∩ α = Aα ⊂ α ∈ κ | A ∩ α = A′ ∩ α

deberıa contener un c.n.a., pero claramente el conjunto de la derecha esta aco-tado por cualquier β ∈ κ que este en A y no en A′ o viceversa. Ası pues, siqueremos cambiar “estacionario” por “cerrado no acotado” en ♦κ+ , necesitamospartir de la forma equivalente ♦′

κ+ para pasar a ♦∗κ+

Observemos que ♦∗κ no solo implica trivialmente ♦′

κ, sino que de hecho secumple:

Teorema 6.32 Si κ es un cardinal regular, E ⊂ κ es estacionario y se cumpleel principio ♦∗

κ, entonces tambien se cumple ♦′E. En particular, ♦∗

κ+ implicatodos los principios ♦E , para todo conjunto estacionario E ⊂ κ+.

Demostracion: Sea Sαα∈κ una sucesion ♦κ. Entonces, dado A ⊂ κ,existe un c.n.a. C ⊂ κ tal que C ⊂ α ∈ κ | A ∩ α ∈ Sα, luego

C ∩ E ⊂ α ∈ E | A ∩ α ∈ Sα,

lo que prueba que el conjunto de la derecha es estacionario, y que Sαα∈E esuna sucesion ♦′

E .

Ası pues, tenemos la cadena de implicaciones

♦+κ+ → ♦∗

κ+ → ♦′E ↔ ♦E → 2κ = κ+.

Introducimos ahora un nuevo principio combinatorio mas sofisticado:

Page 186: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

176 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Definicion 6.33 Sea κ un cardinal infinito y E ⊂ κ+. Llamaremos cuadradode Jensen κ(E) a la afirmacion siguiente: existe una sucesion Cλλ<κ+ (loque significa que λ recorre los ordinales lımite menores que κ+) tal que:

a) Cλ es c.n.a. en λ.

b) Si cf λ < κ, entonces |Cλ| < κ.

c) Si λ′ < λ cumple que Cλ ∩ λ′ no esta acotado en λ′, entonces λ′ /∈ E yCλ′ = Cλ ∩ λ′.

Una sucesion que cumpla estas condiciones recibe el nombre de sucesion κ(E).Llamaremos κ ≡ κ(∅).

Observemos que si E ⊂ E′ ⊂ κ+, se cumple que κ(E′) → κ(E), por loque κ es el mas debil de los cuadrados sobre κ.

Los principios ω(E) se cumplen trivialmente, pues basta tomar como Cλ

cualquier sucesion cofinal en λ, de modo que las hipotesis de b) y c) no puedendarse nunca.

Si κ > ω, entonces una sucesion κ(E) cumple ademas que si cf λ = κentonces ordCλ = κ.

En efecto, si γ = ordCλ, la semejanza f : γ −→ Cλ es cofinal creciente enλ, luego cf γ = cf λ = κ ≤ γ. Si fuera κ < γ, entonces κ < κ + ω < γ (puescf γ = κ > ω) y Cλ ∩ f(κ) no esta acotado en f(κ), luego por c) tenemos queCf(κ) = Cλ∩f(κ) = f [κ] tiene ordinal κ. Similarmente, Cf(κ+ω) = Cλ∩f(κ+ω),luego Cf(κ) ⊂ Cf(κ+ω), luego κ = ordCf(κ) ≤ ordCf(κ+ω) < κ por b) ya quecf f(κ+ ω) = ω < κ, y tenemos una contradiccion.

El teorema siguiente es trivial salvo si cf κ = ℵ0, y en este caso prueba que,bajo ciertas hipotesis sobre la funcion del continuo, κ implica el caso no trivialde ♦E que no se sigue de la mera hipotesis 2κ = κ+:

Teorema 6.34 Sea κ un cardinal no numerable tal que 2<κ = κ y 2κ = κ+.Sea W = λ < κ | cf λ = ℵ0. Entonces κ → ♦W .

Demostracion: Si cf κ > ℵ0 entonces se cumple ♦W por 6.29, ası quepodemos suponer que cf κ = ℵ0. Si µ ≤ κ tenemos que

(κ+)µ ≤ κµκ+ ≤ κκκ+ = κ+,

luego hay exactamente κ+ subconjuntos de κ+ de cardinal a lo sumo κ. SeaXαα<κ+ una enumeracion de todos ellos. Podemos exigir que Xα ⊂ α. Enefecto, definimos f : κ+ −→ κ+ de modo que f(α) sea el menor ordinal ≥

⋃Xα

que no este en f [α], lo cual siempre es posible, pues |f [α]| ≤ κ y hay κ+ ordinalesen κ+ mayores que uno dado. Ası f es inyectiva por construccion y biyectivaporque si δ < κ+, existe un α tal que Xα = δ y, o bien f(α) = δ, o bienexiste un β < α tal que f(β) = δ. Basta definir X ′

α = Xf−1(α) y tenemos unaenumeracion que cumple lo requerido.

Page 187: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.5. Principios combinatorios 177

Sea Γα = Xδ | δ < α y sea Cλλ<κ+ una sucesion κ. Para cada λ < κ+

sea θλ = ordCλ y sea cλδ δ<θλ la semejanza θλ −→ Cλ. Sea κ =⋃

β<κ

una particion de κ en subconjuntos de cardinal κ disjuntos dos a dos. Seafαβ : Γα −→ Aβ inyectiva. Para cada λ < κ+ definimos fλ : Γλ −→ κ mediante

fλ(x) = fcλδδ (x), donde δ < θλ es el menor ordinal tal que x ∈ Γcλ

δ. De este

modo fλ es inyectiva y cumple lo siguiente:

Si λ′ < λ y Cλ ∩ λ′ no esta acotado en λ′, entonces fλ|Γλ′ = fλ′ .

En efecto, en estas circunstancias se cumple que Cλ′ = Cλ∩λ′, luego cλδ = cλ′

δ

para todo δ < θλ′ luego si x ∈ Γλ′ el δ con el que se definen fλ y fλ′ es el mismo,luego fλ(x) = fλ′(x).

Para cada λ ∈ W sea Sλ = ⋃ f−1λ [x] | x ⊂ κ ∧ |x| ≤ ℵ0 ∧ x acotado en κ.

Ası Sλ ⊂ Pλ y, como (por hipotesis) el numero de subconjuntos numerablesacotados de κ es κ, tenemos que |Sλ| ≤ κ. Vamos a probar que Sλλ∈W es unasucesion ♦′

W .

Fijamos X ⊂ κ+ y un c.n.a. C ⊂ κ+. Tenemos que encontrar un λ ∈ C ∩Wtal que X ∩ λ ∈ Sλ. Para ello definimos

A = λ ∈ κ+ |∧

λ′ < λ X ∩ λ′ ∈ Γλ.

Se cumple que A es c.n.a. en κ+ pues claramente es cerrado y podemosdefinir h : κ+ −→ κ+ de modo que h(0) = 0, h(α+ 1) = 0 y h(λ′) es el mınimoordinal λ < κ+ tal que X ∩λ′ ∈ Γλ. Ası, λ < κ+ | g[λ] ⊂ λ ⊂ A y el conjuntode la izquierda es c.n.a., luego A no esta acotado.

Tenemos que A∩C es c.n.a. en κ+, y tambien lo es el conjunto de sus puntosde acumulacion (es decir, el conjunto de los λ tales que λ∩A∩C no esta acotadoen λ) y, como λ ∈ κ+ | cf λ = ℵ1 es estacionario, podemos tomar λ ∈ A ∩ Ctal que λ∩A∩C no este acotado en λ y cf λ = ℵ1. Entonces λ∩A∩C es c.n.a.en λ y, como Cλ tambien lo es, resulta que A∩C ∩Cλ es c.n.a. en λ y podemostomar una sucesion normal bδδ<ω1 en A ∩ C ∩ Cλ cofinal en λ. Observemosque X ∩ bδ ∈ Γbδ+1

para todo δ < ω1.Sea κnn<ω cofinal creciente en κ. Sea h : ω1 −→ ω la funcion dada por

que h(δ) es el mınimo n tal que fλ(X∩bδ) < κn. Como es una funcion regresiva,existe un E ⊂ ω1 estacionario sobre el que h toma el mismo valor n.

Sea γi el i-esimo elemento de E, sea γ =⋃

i∈ω

γi y sea λ′ = bγ . Entonces

cf λ′ = cf γ = ω, luego λ′ ∈ W . Por otra parte, λ′ ∩ C ∩ Cλ no esta acotadoen λ′, ya que los bγi

estan en la interseccion, luego λ′ ∈ C ∩ Cλ.

Ahora observamos que X ∩ λ′ =⋃

i∈ω

X ∩ bγi=

⋃f−1λ [x], donde

x = fλ(X ∩ bγi) | i < ω.

Pero por la eleccion de E tenemos que x ⊂ κn < κ, luego x es un subconjuntonumerable y acotado de κ. Ademas sabemos que fλ|Γλ′ = fλ′ , luego X∩λ′ ∈ Sλ′

Page 188: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

178 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Por ultimo veamos que κ implica una version mas fuerte de sı mismo:

Teorema 6.35 Sea κ un cardinal no numerable y W = λ < κ+ | cf λ = ℵ0.Entonces, si se cumple κ, existe E ⊂W estacionario tal que κ(E) y ademas♦W → ♦E.

Demostracion: Sea Aλλ<κ+ una sucesion κ. Para cada λ, sea Bλ elconjunto de los puntos de acumulacion de Aλ (los λ′ tales que Aλ ∩ λ′ no estaacotado en λ). La sucesion Bλλ<κ+ tiene las propiedades siguientes:

a) Bλ es cerrado en λ.

b) Si cf λ > ℵ0, entonces Bλ no esta acotado en λ.

c) Si λ′ ∈ Bλ, entonces Bλ′ = Bλ ∩ λ′.

d) Si cf λ < κ entonces |Bλ| < κ.

En efecto, a) es inmediato. Para probar b) observamos que, dado α < λ,podemos formar una sucesion creciente α < λ0 < λ1 < · · · de elementos de Aλ,y entonces α <

n<ωλn ∈ Bλ.

Para c) sabemos que Aλ′ = Aλ ∩ λ′, y es claro entonces que los puntos deacumulacion de Aλ′ son precisamente los puntos de acumulacion de Aλ menoresque λ′.

Por ultimo, si cf λ < κ tenemos que |Bλ| ≤ |Aλ| < κ, luego se cumple d).

De las propiedades c) y d) se sigue que ordBλ ≤ κ.

En efecto, si cf λ = κ y γ = ordBλ, sea f : γ −→ Bλ la semejanza, que escofinal en λ por b). Si fuera κ < γ, entonces κ+ ω < γ (pues cf γ = cf λ = κ),luego Bf(κ) = Bλ ∩ f(κ) = f [κ] tiene ordinal κ y Bf(κ+ω) = Bλ ∩ f(κ + ω),luego Bf(κ) ⊂ Bf(κ+ω), y ası, por d) llegamos a una contradiccion:

κ = |Bf(κ)| ≤ |Bf(κ+ω)| < κ.

Llamamos Wδ = λ ∈ W | ordBλ = δ, de modo que W =⋃

δ≤κ

Wδ. Enton-

ces existe un δ ≤ κ tal que Wδ es estacionario en κ+ (si para cada δ existiera unc.n.a. Cδ tal que Wδ ∩Cδ = ∅, entonces

δ≤κ

Cδ serıa un c.n.a. disjunto con W ).

Mas aun, el teorema 6.30 implica que podemos elegir δ de modo que se dela implicacion ♦W → ♦Wδ

. Llamamos E = Wδ. Hemos de probar κ(E).

Para cada λ < κ+, si θλ = ordBλ ≤ δ definimos Dλ = Bλ, y en otro casoDλ es el conjunto que resulta de quitar a Bλ sus δ + 1 primeros elementos, esdecir,

Dλ = Bλ \ fλ[δ + 1],

donde fλ : θλ −→ Bλ es la semejanza entre Bλ y su ordinal θλ.

Vamos a comprobar que la sucesion Dλλ<κ+ cumple las mismas propie-dades a) – d) y ademas Dλ ∩E = ∅.

Page 189: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.5. Principios combinatorios 179

Veamos unicamente la c), pues las demas son inmediatas. Si λ′ ∈ Dλ, en-tonces λ′ ∈ Bλ, luego Bλ′ = Bλ ∩ λ′. Si δ < θλ′ entonces Dλ y Dλ′ resultande quitarles a Bλ y Bλ′ los mismos δ + 1 primeros elementos, luego sigue cum-pliendose que Dλ′ = Dλ ∩λ′. No puede ocurrir que θλ′ ≤ δ < θλ, pues entoncesλ′ /∈ Dλ, y si θλ ≤ δ entonces Dλ′ = Bλ′ y Dλ = Bλ, luego la conclusion estrivial.

Por ultimo, si λ′ ∈ Dλ∩E, entonces Bλ′ = Bλ∩λ′, luego λ′ es el δ+1-esimoelemento de Bλ, luego λ′ /∈ Dλ, contradiccion.

Ahora definimos por recurrencia una sucesion Cλλ<κ+ :

Si Dλ no esta acotado en λ, definimos Cλ =⋃

λ′∈Dλ

Cλ′ y en caso contrario (lo

que implica que cf λ = ℵ0), definimos Cλ =⋃

λ′∈Dλ

Cλ′ ∪ αλn | n ∈ ω, donde

θλnn∈ω es una sucesion cofinal creciente en λ tal que θλ0 =⋃

λ′∈Dλ

Cλ′ .

Vamos a probar que Cλλ<κ+ es una sucesion κ y que Dλ es el conjuntode los puntos de acumulacion de Cλ (es decir, que λ′ ∩Cλ no esta acotado en λ′

si y solo si λ′ ∈ Dλ). Esto implica que se trata de hecho de una sucesion κ(E).

Es claro que si Cλ′ no esta acotado en λ′ para cada λ′ < λ, entonces Cλ

no esta acotado en λ, luego todos los Cλ son conjuntos no acotados en el λcorrespondiente.

Veamos ahora, por induccion sobre λ, que si λ′ ∈ Dλ entonces Cλ′ = Cλ∩λ′.Si es cierto para todo λ′ < λ y λ′ ∈ Dλ, por construccion Cλ′ ⊂ Cλ, luego

Cλ′ ⊂ Cλ ∩ λ′. Tomemos ahora α ∈ Cλ ∩ λ′. Entonces, por construccionα ∈ Cλ′′ ∩ λ′, para cierto λ′′ ∈ Dλ. Si λ′′ = λ′ entonces α ∈ Cλ′ . Supongamosahora que λ′′ < λ′. Entonces, como λ′ ∈ Dλ, sabemos que Dλ′ = Dλ ∩ λ′,luego λ′′ ∈ Dλ′ , luego Cλ′′ ⊂ Cλ′ , luego α ∈ Cλ′ . Supongamos por ultimo queλ′ < λ′′. Entonces λ′′ ∈ Dλ ∩ λ′ = Dλ′ , luego por la hipotesis de induccionaplicada a λ′ sabemos que Cλ′′ = Cλ′ ∩ λ′′, luego α ∈ Cλ′ .

Veamos ahora que Dλ es el conjunto de puntos de acumulacion de Cλ,tambien por induccion sobre λ.

Si λ′ ∈ Dλ, tenemos que Cλ′ ⊂ Cλ ∩ λ′ y C′λ no esta acotado en λ′, luego

ciertamente λ′ es un punto de acumulacion de Cλ. Recıprocamente, supongamosque Cλ ∩ λ′ no esta acotado en λ′. Supongamos en primer lugar que Dλ estaacotado en λ. Entonces, por la construccion de Cλ, es claro que λ′ debe serun punto de acumulacion de

λ′∈Dλ

Cλ′ . Como Dλ es cerrado en λ, tenemos que

λ′′ =⋃Dλ ∈ Dλ, luego Dλ′′ = Dλ ∩ λ′′ y

λ′∈Dλ

Cλ′ =⋃

λ′∈Dλ′′

Cλ′ ∪ Cλ′′ = Cλ′′ ∪ Cλ′′ = Cλ′′ .

Por lo tanto, λ′ es un punto de acumulacion de Cλ′′ . Por la hipotesis de induccionpara λ′′ tenemos que λ′ ∈ Dλ′′ = Dλ ∩ λ′′, luego λ′ ∈ Dλ.

Page 190: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

180 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Supongamos ahora que Dλ no esta acotado en λ. Entonces podemos tomarλ′′ ∈ Dλ tal que λ′ < λ′′. Antes hemos probado que Cλ′′ = Cλ ∩ λ′′ y asıCλ′′ ∩ λ′ = Cλ ∩ λ′ no esta acotado en λ′, luego por la hipotesis de induccionpara λ′′ tenemos que λ′ ∈ Cλ′′ ⊂ Cλ.

Veamos ahora, siempre por induccion sobre λ, que Cλ es cerrado en λ.

Supongamos que Cλ ∩ λ′ no esta acotado en λ′. Hemos visto que entoncesλ′ ∈ Dλ. Si λ′ =

⋃Dλ, entonces λ′ = θλ0 ∈ Cλ. En caso contrario existe

λ′′ ∈ Dλ tal que λ′ < λ′′. Hemos probado entonces que Cλ′′ = Cλ ∩ λ′′, peroentonces Cλ′′ ∩ λ′ = Cλ ∩ λ′ no esta acotado en λ′, luego por hipotesis deinduccion λ′ ∈ Cλ′′ ⊂ Cλ.

Con esto ya tenemos que Cλ es c.n.a. en λ, y solo falta probar que si cf λ < κentonces |Cλ| < κ.

Si |Cλ| ≥ κ, entonces ordCλ ≥ κ, luego Cλ tiene κ puntos de acumulacion,luego |Dλ| = κ, luego cf λ = κ, por la propiedad d).

Al combinar los dos ultimos teoremas obtenemos:

Teorema 6.36 Si κ es un cardinal no numerable tal que 2<κ = κ, 2κ = κ+ yκ, existe un conjunto E ⊂ κ+ estacionario tal que κ(E) y ♦E.

Terminamos demostrando que κ es equivalente esta variante:

Definicion 6.37 Si κ es un cardinal infinito, llamamos ′κ a la afirmacion

siguiente: existe una sucesion Bλλ<κ+ tal que:

a) Bλ es cerrado en λ y esta formado por ordinales lımite.

b) Si cf λ > ℵ0 entonces Bλ no esta acotado en λ.

c) ordBλ ≤ κ.

d) Si λ′ ∈ Bλ, entonces Bλ′ = Bλ ∩ λ′.

A las sucesiones que cumplen esto se las llama sucesiones ′κ.

Se cumple trivialmente ′ω, sin mas que tomar todos los Bλ vacıos.

Teorema 6.38 Para todo cardinal infinito κ, se cumple que κ ↔ ′κ.

Demostracion: La prueba es una modificacion del argumento empleado en6.35. Podemos suponer que κ > ℵ0. Una implicacion es sencilla: si Cλλ<κ+ esuna sucesion κ, basta definir Bλ como el conjunto de los puntos de acumulacionde Cλ, es decir, los λ′ < λ tales que Cλ ∩ λ′ no esta acotado en λ′. (En 6.35esta probado que Bλλ<κ+ es una sucesion ′

κ.)

Supongamos ahora que Bλλ<κ+ es una sucesion ′κ y definamos Cλ como

en 6.35:

Page 191: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.5. Principios combinatorios 181

Si Bλ no esta acotado en λ, definimos Cλ =⋃

λ′∈Bλ

Cλ′ y en caso contrario (lo que

implica que cf λ = ℵ0), definimos Cλ =⋃

λ′∈Bλ

Cλ′ ∪ αλn | n ∈ ω, donde θλnn∈ω

es una sucesion cofinal creciente en λ tal que θλ0 =⋃

λ′∈Bλ

Cλ′ .

Los hechos siguientes (menos el cuarto) se prueban exactamente igual queen 6.35:

• λ′ ∈ Bλ entonces Cλ′ = Cλ ∩ λ′.

• Bλ es el conjunto de puntos de acumulacion de Cλ.

• Cλ es c.n.a. en λ.

• ordCλ ≤ κ.

Para probar la ultima propiedad observamos que si ordCλ > κ, entoncestambien ordBλ > κ (pues κ −→ κ dada por α 7→ ω ·α muestra que un conjuntode ordinal κ tiene κ puntos de acumulacion, y si tiene ordinal ≥ κ+ 1 entoncestiene al menos κ+ 1, los κ de ordinal < κ y el de ordinal κ), y esto contradicela definicion de sucesion ′

κ.

Para tener una sucesion κ falta que si cf λ < κ entonces ordCλ < κ. Estose cumple trivialmente si κ es regular, pues si fuera ordCλ = κ entonces lasemejanza f : κ −→ Cλ serıa cofinal creciente en κ, luego κ = cf κ ≤ cf λ.

En el caso en que κ sea singular necesitamos modificar ligeramente los con-juntos Cλ. Sea µ = cf κ y sea θαα<µ una sucesion cofinal y normal en κ talque θ0 = 0. Sea θµ = κ. Para cada λ < κ+, sea fλ : ηλ −→ Cλ la semejanza ensu ordinal ηλ ≤ κ.

Si θα < ηλ ≤ θα+1 definimos C′λ = fλ[ηλ \ (θα + 1)], es decir, le quitamos a

Cλ sus primeros θα + 1 elementos.

En caso contrario ηλ = θλ′ , para cierto λ′ ≤ µ, y entonces definimos

C′λ = fλ[θα | α < λ′].

Se cumple entonces que C′λλ<κ+ es una sucesion κ. En efecto, es claro

que C′λ es c.n.a. en λ (en el segundo caso C′

λ es el rango de una funcion normal).

Si C′λ ∩ λ′ no esta acotado en λ′, entonces tampoco lo esta Cλ ∩ λ′, luego

sabemos que Cλ′ = Cλ ∩ λ′ y que λ′ ∈ C′λ, luego fλ′ = fλ|ηλ′ y λ′ = fλ(ηλ′).

Si θα < ηλ ≤ θα+1, entonces tambien θα < ηλ′ ≤ θα+1, pues en caso contrarioλ′ /∈ C′

λ. Por lo tanto, a Cλ le quitamos los mismos elementos que a Cλ′ y esclaro que C′

λ′ = C′λ ∩ λ′.

Si ηλ = θλ′′ , entonces λ′ = fλ(ηλ′) = fλ(θβ), para cierto β < λ′′, luegoηλ′ = θβ , y α tiene que ser un ordinal lımite, pues

C′λ ∩ λ′ = C′

λ ∩ fλ(θβ) = fλ(θα) | α < β

Page 192: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

182 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

no esta acotado en λ′, luego no puede tener maximo. Por lo tanto

C′λ′ = fλ[θα | α < β] = C′

λ ∩ fλ(θβ) = C′λ ∩ λ′.

Finalmente, observamos que se cumple |C′λ| < κ. En el primer caso de la

definicion |C′λ| ≤ |ηλ| ≤ |θα+1| < κ, mientras que en el segundo vemos que

|C′λ| = |λ′| ≤ µ < κ.

6.6 Puntos fijos de funciones normales

El teorema 6.5 (vease la nota posterior) nos da que una clase es c.n.a. en Ωsi y solo si es la imagen de una funcion normal F : Ω −→ Ω y, por otra parte,el teorema 6.6 nos da que la clase de los puntos fijos de una funcion normal esc.n.a., luego es a su vez el rango de una funcion normal, y ası sucesivamente.En esta seccion precisaremos este “y ası sucesivamente”.

Definicion 6.39 Dada una funcion normal F : Ω −→ Ω, su derivada es lafuncion normal F ′ : Ω −→ Ω tal que F ′[Ω] es la clase de los puntos fijos de F .

Segun acabamos de explicar, la existencia de F ′ esta justificada por losteoremas 6.5 y 6.6 (y las notas posteriores a cada uno de ellos). Tambien esposible definir directamente F ′ por recurrencia, estableciendo que F ′(a) es elmenor punto fijo de F que no pertenece a F ′[α], y se comprueba facilmente quese trata de una funcion normal.

Veamos ahora que podemos definir derivadas sucesivas de una funcion nor-mal. Cuando decimos que una funcion enumera una clase o conjunto de ordinalesqueremos decir que es una semejanza entre Ω (o un λ ∈ Ω) y la clase indicada.

Teorema 6.40 Si F : Ω −→ Ω es una funcion normal, para cada ordinal γexiste una unica funcion F (γ) : Ω −→ Ω (que tambien es normal) de modo queF (0) = F y, para cada γ > 0, la funcion F (γ) enumera la clase de los ordinalesque son puntos fijos comunes de todas las funciones F (δ), con δ < γ.

La funcion F (γ) se llama derivada de orden γ de F . La existencia de estasderivadas sucesivas no es inmediata porque se trata de definir recurrentementeuna sucesion de clases propias, y no es inmediato que esto pueda formalizarseen NBG, sin embargo, vamos a demostrar que sı que es posible.

Demostracion: Diremos que una funcion f : λ −→ λ es una derivada de

orden γ de F en λ si existe una sucesion f (δ)λ δ≤γ de funciones f

(δ)λ : λ −→ λ

tales que f (0) = F |λ, cada f(δ)λ enumera los ordinales < λ que son puntos fijos

de todas las funciones precedentes y f = f(γ)λ .

Es inmediato que si existe una derivada de orden γ de F en λ entonces la

sucesion f (δ)λ δ≤γ es unica. Veamos ahora que cada una de sus funciones es

normal.

Page 193: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.6. Puntos fijos de funciones normales 183

En efecto, f(0)λ = F |λ es normal y, si es cierto para todo ǫ < δ ≤ γ, tenemos

que f(δ)λ es estrictamente creciente por definicion, y si λ′ < λ es un ordinal lımite,

tenemos que f (δ)λ (α) | α < λ′ es un conjunto de puntos fijos de f

(ǫ)λ , para todo

ǫ < δ. Como f(δ)λ es estrictamente creciente, el supremo de este conjunto es un

ordinal lımite y, como f(ǫ)λ es normal, para todo ǫ < δ,

f(ǫ)λ (

α<λ′

f(δ)λ (α)) =

α<λ′

f(ǫ)λ (f

(δ)λ (α)) =

α<λ′

f(δ)λ (α),

luego, como el supremo es punto fijo de todas las f(ǫ)λ y es el menor valor que

puede tomar f(δ)λ (λ′), tiene que ser

f(δ)λ (λ′) =

α<λ′

f(δ)λ (α),

y esto prueba que f(δ)λ es normal.

Veamos ahora que si λ < λ′ y existen derivadas de orden γ de F en ambos

ordinales, se cumple que f(δ)λ′ |λ = f

(δ)λ y f

(δ)λ′ (λ) = λ.

En efecto, trivialmente es cierto para δ = 0 y, si vale para todo ǫ < δ,

tenemos que f(δ)λ′ enumera los puntos fijos de las funciones f

(ǫ)λ′ , y los puntos

fijos < λ de estas funciones son los puntos fijos de las funciones f(ǫ)λ′ |λ = f

(ǫ)λ ,

luego f(δ)λ′ [λ′] ∩ λ = f

(δ)λ [λ]. Esto implica que f

(δ)λ [λ] es una seccion inicial de

f(δ)λ′ [λ′] (de ordinal λ), luego la restriccion a λ de f

(δ)λ′ : λ′ −→ f

(δ)λ′ [λ′] es una

semejanza f(δ)λ′ |λ : λ −→ f

(δ)λ [λ], luego tiene que ser f

(δ)λ′ |λ = f

(δ)λ . En particular

f(δ)λ′ [λ] ⊂ λ, luego f

(δ)λ′ (λ) = λ, porque la funcion es normal.

Ahora basta probar que para todo γ existen derivadas de orden γ de F sobreordinales arbitrariamente grandes, pues entonces podemos definir F (γ) como launion de todas las derivadas de orden γ de F . Mas aun, al ser uniones defunciones normales podremos afirmar que cada F (γ) es normal.

Razonamos por induccion sobre γ. Si γ = 0 es trivial. Supuesto ciertopara todo δ < γ, podemos definir las derivadas F (δ) como la union de todas lasderivadas de orden δ de F (para cada δ < γ), y son funciones normales. Porla nota tras 6.4, la clase C de los puntos fijos comunes de todas las funcionesF (δ) es c.n.a. en Ω, pues es la interseccion de γ clases c.n.a. Esto implica queC es el rango de una funcion normal G. Basta probar que si λ es cualquiera

de sus puntos fijos, entonces f(γ)λ = G|λ es una derivada de orden γ de F en λ.

En efecto, G(λ) = λ implica que λ ∈ C, de donde λ es un punto fijo de todas

las funciones F (δ) con δ < γ, luego las restricciones f(δ)λ = F (δ)|λ forman, junto

con f(γ)λ = G|λ, una sucesion f (δ)

λ δ≤γ que prueba que f(γ)λ es realmente una

derivada de orden γ.

Es inmediato que F (1) = F ′. Veamos otras propiedades elementales de lasderivadas sucesivas:

Page 194: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

184 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Teorema 6.41 Si δ ≤ γ, entonces, para todo α se cumple F (δ)(α) ≤ F (γ)(α) ysi ademas α < F (α) y δ < γ entonces F (δ)(α) < F (γ)(α).

Demostracion: Claramente F (γ)[Ω] ⊂ F (δ)[Ω] y la funcion

G = F (γ) (F (δ))−1 : Ω −→ Ω

es creciente. Por lo tanto F (δ)(α) ≤ F (δ)(G(α)) = F (γ)(α). Si

α < F (α) = F (0)(α) ≤ F (δ)(α),

entonces F (δ)(α) < F (δ)(F (δ)(α)), luego F (δ)(α) no es un punto fijo de F (δ),luego no puede estar en la imagen de F (γ) y no puede ser F (δ)(α) = F (γ)(α).

Las derivadas sucesivas de derivadas sucesivas de una funcion son derivadassucesivas de la funcion de partida:

Teorema 6.42 Para todo par de ordinales γ, ǫ se cumple que (F (γ))(ǫ) = F (γ+ǫ).

Demostracion: Por induccion sobre ǫ. Para ǫ = 0 es inmediato. Veamosahora el caso ǫ = 1. Basta tener en cuenta que F (γ+1) es la funcion que enumeralos puntos fijos comunes de todas las derivadas F (δ), con δ ≤ γ, pero estos sonsimplemente los puntos fijos de F (γ), pues todo punto fijo de esta derivada loes de las anteriores. Pero la funcion que enumera los puntos fijos de F (γ) no essino (F (γ))′ = (F (γ))(1). De aquı se sigue que si el teorema vale para ǫ tambienvale para ǫ+ 1, pues

(F (γ))(ǫ+1) = ((F (γ))(ǫ))(1) = (F (γ+ǫ))(1) = F (γ+ǫ+1).

Por ultimo, si ǫ es un ordinal lımite y el teorema vale para todo δ < ǫ,entonces (F (γ))(ǫ) enumera los puntos fijos comunes de todas las funciones(F (γ))(δ) = F (γ+δ), para todo δ < ǫ, mientras que F (γ+ǫ) enumera los pun-tos fijos comunes de las funciones F (β), con β < γ + ǫ. Basta observar queambas clases de puntos fijos son la misma, pues todo β < γ + ǫ es de la formaβ = γ + δ o bien β < γ, y en este segundo caso todo punto fijo de una funcionF (γ+δ) es tambien un punto fijo de F (β).

Ejemplo 1 Los puntos fijos de la funcion F (α) = β + α son los ordinales≥ β · ω, por lo que sus derivadas son las funciones F (γ)(α) = βωγ + α.

En efecto, la primera parte es el teorema 2.51 y el ejercicio posterior, y lafuncion que enumera los ordinales ≥ β · ω es precisamente F ′(α) = βω + α.

Si F (γ)(α) = βωγ + α, entonces

F (γ+1)(α) = (F (γ))′(α) = βωγω + α = βωγ+1 + α.

Si la expresion para la derivada es cierta para todo exponente δ < λ, enton-ces la derivada F (λ) es la funcion que enumera a los puntos fijos de todas lasfunciones F (δ)(α) = βωδ +α, es decir, a los ordinales que son mayores o igualesque βωδ para todo δ < λ, que son precisamente los ordinales mayores o igualesque βωλ, luego F (λ)(α) = βωλ + α.

Page 195: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.6. Puntos fijos de funciones normales 185

Ejemplo 2 Los puntos fijos de F (α) = βα (para β > 0) son los ordinales dela forma βωα, por lo que sus derivadas son las funciones F (γ)(α) = βωγ

α.

Ciertamente, F (βωα) = ββωα = β1+ωα = βωα. Recıprocamente, si secumple F (δ) = δ, dividimos δ = βωα+ ǫ, con ǫ < βω, y tenemos que

δ = F (δ) = ββωα+ βǫ = δ + βǫ,

luego βǫ = 0, luego ǫ = 0 y δ = βωα.

La funcion que enumera los ordinales βωα es F ′(α) = βωα. Si se cumpleF (γ)(α) = βωγ

(α), tambien

F (γ+1)(α) = (F (γ))′(α) = (βωγ

)ωα = βωγ+1

α.

Si la expresion vale para las derivadas de ındice δ < λ, entonces F (λ) es la

funcion que enumera a los ordinales que son multiplos de βωδ

para todo δ < λ.

Basta probar que estos son los de la forma βωλ

α.

Por una parte, por 2.52 tenemos que βωλ

α = βωδ+ωλ

α = βωδ

βωλ

α, luego en

efecto, βωλ

α es multiplo de todos los βωδ

con δ < λ.

Recıprocamente, si ζ es multiplo de todos los βωδ

, para δ < λ, dividimos

ζ = βωλ

α+ǫ, con ǫ < βωλ

, con lo que, por la definicion de la exponencial, existe

un δ′ < ωλ tal que ǫ < βδ′ , luego existe un δ < λ tal que δ′ < ωδ y ǫ < βωδ

, pero

entonces ζ = βωδ

βωλ

α + ǫ y, por la unicidad del resto de la division euclıdea,

dado que ζ es multiplo de βωδ

, tiene que ser ǫ = 0, luego ζ = βωλ

α.

Los puntos fijos de las funciones exponenciales ya no pueden expresarse enterminos de sumas, productos y potencias:

Definicion 6.43 Se llama funcion ǫ a la derivada de la funcion F (α) = ωα

De este modo, los numeros ǫα son precisamente los numeros epsilon quedefinimos en 2.56 y, segun probamos justo a continuacion, ǫ0 es el mismo ordinalconsiderado allı, ya que es el menor numero epsilon.

Mas en general, las derivadas F (γ) de la funcion F (α) = ωα se suelen re-presentar con la notacion φγ y reciben el nombre de funciones de Veblen. Ası,φ0(α) = ωα y φ1(α) = ǫα.

Los numeros epsilon incluyen a todos los cardinales no numerables. Mas engeneral:

Teorema 6.44 Si κ es un cardinal no numerable y δ < κ entonces φδ(κ) = κ.

Demostracion: Supongamos en primer lugar que κ es regular y veamospor induccion que φδ|κ : κ −→ κ.

Para δ = 0 hay que probar que δ < κ→ ωδ < κ, pero una simple induccionsobre δ muestra que |ωδ| = ℵ0|δ| (para δ > 0), luego ωδ < κ.

Page 196: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

186 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Si vale para δ, entonces, como φδ|κ es una funcion normal, su conjunto depuntos fijos es un c.n.a. C ⊂ κ, luego tiene cardinal κ, pero su ordinal tiene queser ≤ κ, luego es κ, luego la funcion que enumera C tiene dominio κ, luego setrata de φδ+1|κ, luego φδ+1|κ : κ −→ κ.

Si el resultado vale para todo β < λ < κ, entonces el conjunto de puntosfijos de φβ |κ es el rango de φβ+1|κ, que es un cerrado no acotado en κ. Lainterseccion de menos de κ cerrados no acotados es cerrada no acotada, y tieneordinal κ, luego φλ|κ : κ −→ κ.

La normalidad de las funciones φδ implica ası que φδ(κ) =⋃

ǫ<κφδ(ǫ) ≤ κ,

luego φδ(κ) = κ.

Si κ no es regular, es un cardinal lımite, y es el supremo de cardinalesregulares, que son puntos fijos de cada φδ, luego κ es tambien punto fijo de φδ.

En particular, φδ(α) es un ordinal numerable siempre que δ y α son nume-rables.

Observemos que, como 0 < ω0, el teorema 6.41 implica que la sucesionφα(0)α∈Ω es estrictamente creciente, luego α ≤ φα(0), para todo ordinal α.

En particular, α < φα(α) para todo α (el caso α = 0 se comprueba porseparado), luego si κ es un cardinal no numerable, por una parte tenemos queningun α < κ puede ser punto fijo de todas las funciones φδ, con δ < κ (nolo es para δ = α), mientras que κ sı que lo es, por el teorema anterior, luegoconcluimos que φκ(0) = κ.

Observemos ahora que si δ < ǫ, entonces cualquier φǫ(α) es, por cons-truccion, un punto fijo de φδ, con lo que tenemos que φδ(φǫ(α)) = φǫ(α). Estees el unico caso no trivial en que dos funciones de Veblen pueden coincidir:

Teorema 6.45 La igualdad φδ(α) = φǫ(β) solo puede darse en uno de los trescasos siguientes:

a) δ = ǫ ∧ α = β,

b) δ < ǫ ∧ α = φǫ(β),

c) ǫ < δ ∧ β = φδ(α).

Similarmente, la desigualdad φδ(α) < φǫ(β) solo puede darse en uno de los trescasos siguientes:

a) δ = ǫ ∧ α < β,

b) δ < ǫ ∧ α < φǫ(β),

c) ǫ < δ ∧ φδ(α) < β.

Page 197: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.6. Puntos fijos de funciones normales 187

Demostracion: Probamos simultaneamente las dos partes: si δ = ǫ, esobvio que tiene que ser α = β en el primer caso y α < β en el segundo.

Supongamos que δ < ǫ. Entonces φǫ(β) es punto fijo de φδ, luego se cumpleque φδ(φǫ(β)) = φǫ(β) ≥ φδ(α), luego φǫ(β) ≥ α (con igualdad en el primer casoy desigualdad estricta en el segundo). El caso restante es analogo. Notemos quesiempre que se da uno de los tres casos se tiene la igualdad o la desigualdad delenunciado.

Esto nos da un tipo de representacion unica en terminos de funciones deVeblen. Veamos antes un caso particular:

Teorema 6.46 Todo ordinal de la forma α = ωβ se expresa de forma unicacomo α = φδ(η), con η < α.

Demostracion: La unicidad se debe al teorema anterior: si tuvieramosdos representaciones α = φδ(η) = φǫ(η

′), no puede ser δ < ǫ, pues eso obliga aque η = φǫ(η

′) = α, pero suponemos η < α. Tampoco puede ser ǫ < δ, luegoδ = ǫ ∧ η = η′.

Para probar la existencia observamos que α ≤ φα(0) < φα(α), luego pode-mos tomar el mınimo ordinal δ tal que α < φδ(α). Si es δ = 0 tenemos queα = ωβ < φ0(α) = ωα, luego β < α y sirve la representacion α = φ0(η) conη = β.

Si δ > 0, entonces, por la minimalidad de δ, para todo ǫ < δ tenemos queφǫ(α) ≤ α, pero como φǫ es normal, se cumple de hecho que φǫ(α) = α. Ası, αes un punto fijo de todas las funciones φǫ, con ǫ < δ, luego existe un η tal queα = φδ(η) < φδ(α), luego η < α.

Observemos que, en las condiciones del teorema anterior,

δ ≤ φδ(0) ≤ φδ(η) = α,

y si se da la igualdad es porque φδ(0) = φδ(η), luego η = 0, luego α = φα(0).

Definicion 6.47 Un ordinal α es fuertemente crıtico si α = φα(0).

Acabamos de probar que si α = ωβ no es fuertemente crıtico entonces seexpresa de forma unica como φδ(η) con δ, η < α

La existencia de ordinales fuertemente crıticos se sigue de la caracterizacionsiguiente:

Teorema 6.48 Un ordinal ξ es fuertemente crıtico si y solo si

ξ > 0 ∧∧

αβ < ξ φα(β) < ξ.

Demostracion: Si ξ es fuertemente crıtico, es claro que ξ 6= 0 y si α, β < ξ,entonces φα(β) < φα(ξ) = ξ, pues ξ = φξ(0) es punto fijo de todas las funcionesφα con α < ξ.

Page 198: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

188 Capıtulo 6. Conjuntos cerrados no acotados y estacionarios

Recıprocamente, si ξ > 0 cumple la condicion del enunciado, en particular1 = φ0(0) < ξ y ω = φ0(1) < ξ. Ademas ξ tiene que ser un ordinal lımite, puessi fuera ξ = δ + 1 entonces δ ≤ φδ(0) < φδ(δ) < ξ, luego ξ = δ + 1 ≤ φδ(δ) < ξ.

Por otra parte,∧

δ < ξ ωδ < ξ, luego ωξ = ξ, luego ξ es un numero ǫ, luegoes cerrado para sumas, productos y potencias.

Veamos por induccion sobre α que α < φξ(0) → α < ξ.

Para α = 0 es trivial. Supongamos que vale para todo δ < α < φξ(0).Descomponemos α = ωη + β, con β < α (teorema 2.53). Si β 6= 0, entoncesωη, β < α, luego por hipotesis de induccion ωη, β < ξ y, como ξ es cerrado parasumas, α < ξ. Por lo tanto podemos suponer que α = ωη. El teorema 6.46 nosda entonces que α = φδ(η′), con η′ < α.

Si tambien δ < α, entonces por hipotesis de induccion δ, η′ < ξ, luego α < ξpor la clausura de ξ. Si, por el contrario α = φα(η′) ≥ φα(0) > α, tiene queser η′ = 0, y tenemos que α = φα(0) < φξ(0), y esto implica α < ξ, porque lasucesion φα(0)α∈Ω es estrictamente creciente.

Concluimos entonces que φξ(0) = ξ.

Teorema 6.49 La clase de los ordinales fuertemente crıticos es c.n.a. en Ω.

Demostracion: Si κ es un cardinal regular no numerable, consideramos laaplicacion f : κ× κ −→ κ dada por f(α, β) = φα(β), que esta bien definida porel teorema 6.44, y aplicamos el teorema 6.7 y el teorema anterior. Obtenemosque el conjunto Cκ de los ordinales fuertemente crıticos menores que κ es c.n.a.en κ. Es claro que esto implica el resultado para Ω.

En particular, existen ℵ1 ordinales fuertemente crıticos numerables.

Definicion 6.50 Se llama Γ : Ω −→ Ω a la funcion (normal) que enumera alos ordinales fuertemente crıticos. El ordinal Γ0 se llama ordinal de Feferman-Schutte.

Sabemos que Γ0 es un numero ǫ cerrado para sumas, productos, potenciasy la funcion φ (vista como funcion de dos argumentos). Es claro que es muchomayor que ǫ0.

Hemos probado que si α = ωβ < Γ0 entonces se expresa de forma unicacomo α = φδ(η), con δ, η < α. Como todo ordinal no nulo se expresa de formaunica como α = ωη0 + · · ·+ωηn , para cierta sucesion decreciente de exponentes(teorema 2.54), concluimos:

Teorema 6.51 Todo ordinal 0 < α < Γ0 se expresa de forma unica como

α = φξ0(η0) + · · · + φξn(ηn),

donde φξ0(η0) ≥ · · · ≥ φξn(ηn), ξi < α, ηi < φξi(ηi) < α.

Page 199: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

6.6. Puntos fijos de funciones normales 189

Si a su vez desarrollamos cada ξi y cada ηi en forma normal, y hacemos losmismo con los coeficientes de dichas formas normales, y continuamos el proceso,como los coeficientes que vamos obteniendo son cada vez menores, al cabo deun numero finito de pasos tenemos que llegar a coeficientes iguales a 0, que noadmiten mas desarrollos. En suma, todo ordinal menor que Γ0 puede calcularseen un numero finito de pasos a partir de 0 en terminos de sumas y aplicacionesde la funcion φ.

Recıprocamente, si construimos expresiones a partir de 0 y la funcion φ, paraasegurarnos de que obtenemos formas normales solo tenemos que evitar que alaplicar φ suceda φξ(η) = η, pero para que esto ocurra, es decir, para que η seaun punto fijo de φξ, en particular tiene que ser de la forma ωα, luego su formacanonica tiene que ser η = φξ′(η

′) con η′ < η (es decir, tiene que tener un unicosumando) y, segun 6.45, la igualdad φξ(η) = φξ′ (η

′) solo puede darse (y se da)si ξ < ξ′, pues los casos ξ = ξ′ ∧ η = η′ o ξ′ < ξ ∧ η′ = φξ(η) ≥ η contradicenη′ < η. En suma, para construir expresiones de ordinales en forma normal, solohay que evitar aplicar φξ a los ordinales cuya forma normal es φ′ξ(η′) con ξ < ξ′.

Naturalmente, esto exige comparar formas normales, para lo cual aplicamosel mismo criterio que con la forma normal de Cantor (son formas normales deCantor), lo que nos reduce el problema a comparar ordinales de la forma φξ(η)y φξ′(η

′), lo cual puede hacerse recurrentemente aplicando el teorema 6.45.

Page 200: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS
Page 201: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo VII

El sistema numerico

Para terminar de perfilar a NBG como teorıa capaz de formalizar todoel razonamiento matematico, veremos ahora que permite definir los conjuntosnumericos que intervienen en practicamente todas las ramas de la matematica,y a partir de los cuales construyen la mayorıa de sus objetos de estudio: yahemos definido los numeros naturales y aquı presentaremos los numeros ente-ros, los numeros racionales y los numeros reales. Para completar el sistemanumerico usual faltarıan los numeros complejos, pero no entraremos en su cons-truccion porque no los vamos a necesitar y esta es trivial desde un punto devista conjuntista.

Por el contrario, el conjunto R de los numeros reales representa un papel nadatrivial en la teorıa de conjuntos, ya que esta relacionado directa o indirectamentecon muchos de los problemas estudiados en ella.

Para la construccion de Z y Q bastan los axiomas de NBG∗ + AI, ası queempezaremos trabajando en esta teorıa salvo que se indique lo contrario. Paraconstruir los numeros reales sera necesario anadir el axioma de partes AP. Algu-nos resultados aislados requeriran el axioma de eleccion, pero solo en su formadebil AEN (el axioma de eleccion numerable).

7.1 Los numeros enteros

En el conjunto ω de los numeros naturales tenemos definidas una suma yun producto, pero no forman un anillo, principalmente porque ningun numeronatural (salvo el cero) tiene un opuesto para la suma. El conjunto Z de losnumeros enteros surge de forma natural como la menor extension posible de ωque es un anillo.

La idea basica es que queremos que en Z haya numeros suficientes paracalcular la resta m − n de cualquier par de numeros naturales m y n. Unaprimera aproximacion al problema serıa definir Z = ω×ω y definir una suma yun producto de forma que el par (m,n) acabara siendo “el resultado de restarm− n”. Ahora bien, este intento tiene un fallo, y es que es facil convencerse de

191

Page 202: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

192 Capıtulo 7. El sistema numerico

que, por ejemplo, la resta 5 − 7 deberıa dar lo mismo que la resta 1 − 3 (igualque 7 − 5 = 3 − 1). En general, debe cumplirse

a− b = c− d↔ a+ d = b+ c,

donde la resta del miembro izquierdo es una operacion que todavıa no tenemosdefinida, mientras que la suma del miembro derecho es simplemente la suma denumeros naturales. Eliminando la operacion no definida, lo que queremos esque el numero asociado al par (a, b) sea el mismo que el asociado al par (c, d) siy solo si a+ d = b+ c. La forma tıpica de conseguir esto es formar un conjuntocociente:

Definicion 7.1 Definimos en ω × ω la relacion R dada por

(a, b)R (c, d) ↔ a+ d = b+ c.

Es facil probar que se trata de una relacion de equivalencia. Llamaremos [a, b]a la clase de equivalencia del par (a, b).

Llamaremos conjunto de los numeros enteros al cociente Z = (ω×ω)/R. Laletra Z es por el aleman Zahl (numero).

Ahora podemos afirmar con rigor que

[a, b] = [c, d] ↔ a+ d = b+ c.

Definimos en Z la suma y el producto dados por:

[a, b] + [c, d] = [a+ c, b+ d], [a, b][c, d] = [ac+ bd, ad+ bc].

Notemos que son las operaciones “obligadas” por la idea de que [a, b] debeser la resta a− b:

(a− b) + (c− d) = (a+ c) − (b+ d), (a− b)(c− d) = (ac+ bd) − (ad+ bc).

Para que estas definiciones sean correctas debemos comprobar que no de-penden de los representantes elegidos en las clases, es decir, que si [a, b] = [a′, b′]y [c, d] = [c′, d′], entonces

[a+ c, b+ d] = [a′ + c′, b′ + d′] y [ac+ bd, ad+ bc] = [a′c′ + b′d′, a′d′ + b′c′].

Esto se comprueba sin dificultad a partir de las definiciones. A partir de ahıes una pura rutina comprobar que Z con la suma y el producto ası definido esun anillo conmutativo y unitario. El elemento neutro para la suma es 0 = [0, 0],y el simetrico de un numero [a, b] es −[a, b] = [b, a], pues

[a, b] + [b, a] = [a+ b, a+ b] = [0, 0].

Para cada n ∈ ω, definimos +n ≡ [n, 0]. Observamos que

+m = +n↔ m = n, +m+ (+n) = +(m+ n), (+m)(+n) = +(mn).

Page 203: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.1. Los numeros enteros 193

Definimos N ≡ +n | n ∈ ω. Tenemos entonces que la aplicacion i : ω −→ Ndada por i(n) = +n es biyectiva y nos permite identificar cada numero naturaln con el numero entero +n, de tal forma que, en lo que se refiere a la suma y elproducto, es indiferente trabajar con los numeros de ω o con los de N, porquese suman y se multiplican igual. Si en ω tenemos, por ejemplo, 3 · 4 = 12, en Ztenemos que (+3)(+4) = +12.

Ası, cuando identificamos el numero natural n con el entero +n, resulta quetiene opuesto para la suma, a saber, el numero entero −n ≡ [0, n]. Ademas,cualquier numero entero se descompone como

[m,n] = [m, 0] + [0, n] = (+m) + (−n) = (+m) − (+n),

con lo que acabamos de materializar la idea que habıa guiado la construccionde Z.

Observemos ahora que la igualdad +n = −m equivale a m + n = 0 y solose da si m = n = 0, en cuyo caso tenemos que +0 = −0 = 0. Esto nos lleva adefinir los conjuntos

Z+ = +n | n ∈ ω \ 0, Z− = −n | n ∈ ω \ 0

y se cumple que Z = Z− ∪ 0 ∪ Z+, donde la union es disjunta. En efecto, yahemos probado que la union es disjunta, y contiene a todos los numeros enterosporque, dado [m,n] ∈ Z, o bien m < n, en cuyo caso [m,n] = [m−n, 0] ∈ Z+, obien n < m, en cuyo caso [m,n] = [0, n−m] ∈ Z−, o bien m = n, en cuyo caso[m,n] = [0, 0] = 0.

Ası pues, Z consta exclusivamente de los numeros

· · · − 3, −2, −1, 0, +1, +2, +3, · · ·

y todos ellos son distintos entre sı.

Ahora veamos que es posible extender la relacion de orden de ω a Z paraformar un anillo ordenado. La guıa es que en todo anillo ordenado debe cum-plirse:

(a− b) ≤ (c− d) ↔ a+ d ≤ b + c,

lo que nos lleva a definir la relacion en Z dada por

[a, b] ≤ [c, d] ↔ a+ d ≤ b + c.

Esto supone comprobar que si [a, b] = [a′, b′] y [c, d] = [c′, d′] entonces

a+ d ≤ b+ c↔ a′ + d′ ≤ b′ + c′,

lo cual no ofrece ninguna dificultad, al igual que comprobar que se trata de unarelacion de orden total que satisface las dos propiedades que definen los anillosordenados (pagina 30). Para comprobar la segunda, es decir, que

ab ∈ Z(a ≥ 0 ∧ b ≥ 0 → ab ≥ 0),

Page 204: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

194 Capıtulo 7. El sistema numerico

es mas facil observar primero que los numeros enteros estrictamente positivosson los de Z+, mientras que los estrictamente negativos son los de Z−, luego lapropiedad se reduce a comprobar que

ab ∈ N a · b ∈ N, lo cual ya lo sabemos.

Tambien es inmediato a partir de las definiciones que, si m, n ∈ ω, entoncesm ≤ n ↔ +m ≤ +n, lo cual significa que ω y N tampoco se distinguen porlo que respecta al orden, de modo que, por ejemplo, 3 < 7 es equivalente a+3 < +7.

Las propiedades generales de los anillos ordenados implican ahora que

mn ∈ ω (−m < −n↔ n < m),

lo que en definitiva se traduce en que los numeros enteros estan ordenados ası:

· · · − 3 < −2 < −1 < 0 < +1 < +2 < +3 < · · ·

Ahora es inmediato que Z es un dominio ıntegro, pues si ab = 0, entonces|ab| = |a||b| = 0, pero los valores absolutos estan en N y, como tiene las mismaspropiedades que ω, podemos concluir que |a| = 0 ∨ |b| = 0, luego a = 0 ∨ b = 0.

En lo sucesivo identificaremos los numeros naturales con los enteros positivos,de modo que escribiremos 3 en lugar de +3.

Una ultima propiedad relevante de la aritmetica basica de los numeros en-teros es que admite la division euclıdea en los terminos siguientes:

Teorema 7.2∧

Dd ∈ Z(d 6= 0 →1∨cr ∈ Z (D = dc+ r ∧ 0 ≤ r < d))

Demostracion: Aplicamos el teorema de la division euclıdea a los numerosnaturales |D| y |d|, lo que nos da que existen naturales c y r de manera que|D| = |d|c+ r, con 0 ≤ r < |d|.

Si r = 0 entonces cambiando el signo de c si es preciso tenemos D = dc+ 0.Supongamos r > 0 y distingamos cuatro casos:

• Si D ≥ 0 y d > 0 entonces tenemos D = dc+ r, como querıamos.

• D ≥ 0 y d < 0 entonces sirve D = d(−c) + r.

• D < 0 y d > 0 entonces D = d(−c− 1) + (d− r).

• D < 0 y d < 0 entonces D = d(c+ 1) + (−d− r).

Si tuvieramos dos expresiones distintas D = dc+ r = dc′ + r′, entonces seac = c si d > 0 y c = −c si d < 0. Igualmente definimos c′. Ası dc = |d|c,dc′ = |d|′c′. Supongamos que c < c′. Entonces

D = dc+ r = |d|c+ r < |d|c+ |d| = |d|(c+ 1) ≤ |d|c′ = dc′ ≤ dc′ + r′ = D,

y esto es una contradiccion. Por lo tanto ha de ser c = c′ y de aquı quedc+ r = dc+ r′, luego r = r′.

Page 205: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.1. Los numeros enteros 195

Observemos ahora que si A es cualquier anillo, podemos definir recurrente-mente una aplicacion ·a : N −→ A mediante

0a = 0 ∧∧

n ∈ N (n+ 1)a = na+ a.

Equivalentemente, na =∑

i<n

a. Si n ∈ Z cumple n < 0, definimos na = (−n)a,

con lo que tenemos definido un producto Z× A −→ A (esto es lo que se llamauna ley de composicion externa en A con coeficientes en Z). Alternativamente,la definicion se resume en:

ma =

mveces︷ ︸︸ ︷

a+ · · · + a si m > 0,0 si m = 0,

−a− · · · − a︸ ︷︷ ︸

−mveces

si m < 0.

Es facil comprobar las propiedades siguientes:

(m+ n)a = ma+ na, m(a+ b) = ma+mb, m(na) = (mn)a.

Por ejemplo, la primera se prueba para todo m ∈ Z y todo n ∈ N porinduccion sobre n, y luego se prueba, tambien por induccion sobre n, que

(m+ (−n))a = ma+ (−n)a,

con lo que vale para todo m y todo n en Z.

De esta primera propiedad se sigue claramente que −(na) = (−n)a = n(−a).

Estas propiedades implican que, si A es un anillo unitario, la aplicacioni : Z −→ A dada por i(m) = m · 1 es un homomorfismo de anillos. En lapractica escribiremos m en lugar de m · 1, lo cual significa que, en un anilloarbitrario, llamamos, por ejemplo, 3 al elemento 1 + 1 + 1, y llamamos −5 alelemento −1 − 1 − 1 − 1 − 1.

El hecho de que i sea un homomorfismo implica que las ecuaciones 2 + 3 = 5o −2 · 3 = −6, al ser validas en Z, valen tambien en cualquier anillo, pero hayque tener presente que la aplicacion i no es en general un monomorfismo, demodo que puede ocurrir que en un cierto anillo se cumpla, por ejemplo, 3 = 8.Esto no sucede si el anillo esta ordenado:

Teorema 7.3 Si A es un anillo ordenado, la aplicacion i : Z −→ A dada pori(m) = m · 1 es un monomorfismo de anillos ordenados.

Demostracion: Basta probar que∧

mn ∈ Z(m < n → i(m) < i(n)),pues esto ya implica la inyectividad. Observemos en primer lugar que si n > 0entonces i(n) > 0. Para n = 1 se reduce al hecho de que en todo anillo ordenado1 > 0, y si i(n) > 0, entonces i(n+ 1) = i(n) + 1 > 0 + 1 = 1 > 0. Por lo tanto,si n < 0 tenemos que i(n) = −i(−n) < 0.

Page 206: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

196 Capıtulo 7. El sistema numerico

Ahora probamos por induccion la tercera propiedad para n ≥ 0. Si m < 0acabamos de ver que i(m) < 0 = i(0). Si vale para n y tenemos que m < n+ 1,entonces m ≤ n, luego m < n ∨ m = n, luego i(m) < i(n) ∨ i(m) = i(n), luegoi(m) ≤ i(n) < i(n) + 1 = i(n+ 1).

Por ultimo, si m < n < 0, entonces 0 < −n < −m, luego i(−n) < i(−m),que es lo mismo que −i(n) < −i(m), luego i(m) < i(n).

Esto significa que si A es un anillo ordenado, los elementos de A de la formam · 1, con m ∈ Z, es decir, los elementos de i[Z], con la notacion del teoremaanterior, forman un subanillo ordenado isomorfo a Z, luego indistinguible de Zen todo lo tocante al orden, la suma y el producto, por lo que en la practicapodemos considerar que Z ⊂ A y que la suma, el producto y el orden en Z son(las restricciones de) los de A.

En estos terminos, el teorema anterior afirma que todo anillo ordenado con-tiene un subanillo isomorfo a Z. Tambien podemos expresar esto diciendo queZ es el menor anillo ordenado.

Definicion 7.4 Diremos que un anillo ordenado A es arquimediano si N no estaacotado superiormente en A, es decir, si1

a ∈ A∨

n ∈ N a < n.

Es inmediato comprobar que esto equivale a que Z no este acotado inferior-mente en A o a que Z no este acotado ni superior ni inferiormente en A.

Trivialmente, Z es un anillo ordenado arquimediano, pues para todo m ∈ Zse cumple que m < 0 o, en caso contrario, m < m + 1, y en ambos casos eltermino de la derecha es un numero natural.

Es facil ver que si A es un anillo arquimediano, para cada a ∈ A existe ununico m ∈ Z tal que m ≤ a < m+ 1. Dicho m recibe el nombre de parte entera(por defecto) de a, y la representaremos por E[a].

El valor F [a] = a − E[a] recibe el nombre de parte fraccionaria de a, demodo que a admite una unica descomposicion:

a = E[a] + F [a], E[A] ∈ Z, 0 ≤ F [a] < 1.

7.2 Los numeros racionales

La construccion del cuerpo Q de los numeros racionales la hemos llevado yaa cabo en un contexto general:

Definicion 7.5 Definimos el cuerpo de los numeros racionales al cuerpo decocientes Q de Z construido en la pagina 34.

1Notemos que aquı estamos considerando N ⊂ Z ⊂ A, si no quisieramos hacer esta identi-ficacion, simplemente deberıamos escribir a < n · 1 en lugar de a < n.

Page 207: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.2. Los numeros racionales 197

Sabemos, pues, que Q es un cuerpo ordenado que contiene un subanilloordenado isomorfo a Z, cuyos elementos son fracciones de la forma a/b, dondea, b ∈ Z con b 6= 0, con el criterio de igualdad de fracciones dado por

a

b=c

d↔ ad = bc.

Con las identificaciones oportunas, podemos considerar que N ⊂ Z ⊂ Q. Laaritmetica cardinal implica trivialmente que |N| = |Z| = |Q| = ℵ0.

En el mismo sentido en que podemos decir que Z es el menor anillo ordenado,podemos decir que Q es el menor cuerpo ordenado:

Teorema 7.6 Si K es un cuerpo ordenado, la aplicacion i : Q −→ K dada pori(a/b) = (a · 1)/(b · 1) es un monomorfismo de cuerpos ordenados.

Demostracion: En primer lugar debemos probar que esta bien definida,es decir, que no depende del representante elegido para la fraccion o, mas con-cretamente, que si a/b = c/d entonces (a · 1)/(b · 1) = (c · 1)/(d · 1). Ante todo,sabemos que la aplicacion i0 : Z −→ K dada por i0(n) = n · 1 es un monomor-fismo de anillos. En particular, si b 6= 0 se cumple que i0(b) 6= 0 y tiene sentidoel cociente (a · 1)/(b · 1).

Por la inyectividad de i0 tenemos que ad − bc = 0 si y solo si se cumplei0(a)i0(d) − i0(b)i0(c) = 0, si y solo si (a · 1)/(b · 1) = (c · 1)/(d · 1). Con estohemos probado que i esta bien definida y que es inyectiva. La prueba de que esun monomorfismo de cuerpos ordenados no ofrece ninguna dificultad.

Notemos que si, en el contexto del teorema anterior, adoptamos el criteriousual de escribir a en lugar de a·1, entonces la imagen de una fraccion a/b ∈ Q essimplemente a/b ∈ K, es decir, que estamos identificando, por ejemplo, 2/3 ∈ Qcon (1 + 1)/(1 + 1 + 1) ∈ K.

Se cumple trivialmente que Q es arquimediano, pues si a/b ∈ Q, o biena/b < 0, o bien podemos suponer que a ≥ 0, b ≥ 1, y entonces

a

b=a

b· 1 ≤ a

b· b = a < a+ 1,

luego en cualquier caso a/b no acota a los numeros naturales.

Definicion 7.7 Se dice que un conjunto ordenado (A,≤) es denso (en sı mismo)si

ab ∈ A(a < b→∨

c ∈ A a < c < b).

Es decir, un conjunto ordenado es denso si entre dos cualesquiera de suselementos hay siempre un tercero. Esta propiedad la tienen todos los cuerposordenados, en particular Q:

Teorema 7.8 Si K es un cuerpo ordenado, entonces K es denso en sı mismoy no tiene ni maximo ni mınimo.

Page 208: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

198 Capıtulo 7. El sistema numerico

Demostracion: En todo anillo ordenado se cumple que 2 = 1+1 > 0. Porlo tanto, si a < b son dos elementos de K, es claro que

a <a+ b

2< b.

Por otra parte, a−1 < a < a+1, luego a no es ni el maximo ni el mınimo de K.

Esta propiedad de Q contrasta con el caso de Z, donde todo numero enteron tiene un inmediato anterior y un inmediato posterior:

n− 1 < n < n+ 1,

de modo que no hay ningun otro numero entero entre n − 1 y n o entre n yn+ 1.

Veamos ahora que las propiedades del teorema anterior, junto con la nume-rabilidad, caracterizan el orden de Q:

Teorema 7.9 (Cantor) Un conjunto totalmente ordenado (D,≤) es seme-jante a Q si y solo si es numerable, denso en sı mismo y no tiene ni maximo nimınimo.

Demostracion: Sean Q = qn | n ∈ ω y D = dn | n ∈ ω. Definimospor recurrencia una sucesion de pares (ik, jk)k∈ω de numeros naturales demodo que

fn = (qik , djk) | k < n

sea una semejanza entre qik | k < n y djk | k < n. Para ello tomamos i0 =j0 = 0, de modo que f1(q0) = d0. Supuesta definida la sucesion (ik, jk)k<n,distinguimos dos casos, segun que n sea par o impar.

Si n es par definimos in como el mınimo natural que no este en ik | k < ny definimos jn como el mınimo natural tal que djn esta respecto de djk | k < nen la misma posicion que qin esta respecto de qik | k < n. Las hipotesis delteorema aseguran que siempre existe tal jn.

Si n es impar definimos jn como el mınimo natural que no este en jk | k < ny definimos in como el mınimo natural tal que qin esta respecto de qik | k < nen la misma posicion que djn esta respecto de djk | k < n. Como Q tambiencumple las hipotesis exigidas a D, la existencia de in esta garantizada.

Llamamos f = (qik , djk) | k ∈ ω. Por construccion es claro que f es unasemejanza de un cierto subconjunto de Q en un cierto subconjunto de D. Bastaprobar que Df = Q y Rf = D. La simetrıa de la construccion hace que las dospruebas sean analogas. Veamos, por ejemplo, la primera. Si Df 6= Q, existe unmınimo i que no aparece nunca en la sucesion ikk∈ω. Sea m ∈ ω tal que todoslos numeros menores que i aparecen en la sucesion ikk<2m, entonces i2m espor definicion el menor numero natural que no aparece en dicha sucesion, conlo que deberıa ser i2m = i, contradiccion.

Page 209: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.3. Cuerpos metricos completos 199

En particular, vemos que dos cuerpos ordenados numerables son necesaria-mente semejantes (aunque no necesariamente isomorfos).

Ejercicio: Probar que Q⊕Q y Q×Q, en ambos casos con el orden lexicografico, sonsemejantes a Q.

7.3 Cuerpos metricos completos

Presentamos aquı algunos resultados preliminares a la construccion del con-junto R de los numeros reales a partir de Q. Aunque para probar que R es unconjunto es imprescindible el axioma de partes, en esta seccion todavıa no lonecesitamos, ası que seguimos trabajando en NBG∗ + AI.

Ası como el paso de N a Z viene a “remediar” la falta de opuestos para lasuma y el paso de Z a Q viene a “remediar” la falta de inversos para el producto,el paso de Q a R viene a “remediar” una incompletitud mas difıcil de describiren general. Empezamos presentando los conceptos necesarios para ponerla enevidencia y despues veremos como subsanarla.

Resulta natural medir la distancia, es decir, la lejanıa o proximidad, entredos numeros racionales como d(r, s) = |r − s|. Como el concepto de distanciaresulta util en muchos otros contextos, conviene tratarlo en un contexto general:

Definicion 7.10 Una distancia en un conjunto M es una aplicacion

d : M ×M −→ R,

donde R es un cuerpo ordenado arquimediano,2 que cumpla las propiedadessiguientes:

a)∧

xy ∈M (d(x, y) ≥ 0 ∧ (d(x, y) = 0 ↔ x = y)),

b)∧

xy ∈M d(x, y) = d(y, x),

c)∧

xyz ∈M d(x, z) ≤ d(x, y) + d(y, z).

Es obvio que las tres propiedades son exigencias razonables para cualquieraplicacion que realmente pueda ser considerada como medida de una distancia.La tercera recibe el nombre de desigualdad triangular. De ellas se deduce unacuarta:

xyz ∈M |d(x, y) − d(x, z)| ≤ d(y, z).

En efecto, d(x, y) ≤ d(x, z) + d(z, y), luego d(x, y) − d(x, z) ≤ d(y, z). Invir-tiendo los papeles de y, z obtenemos igualmente que d(x, z) − d(x, y) ≤ d(y, z),luego

−d(y, z) ≤ d(x, y) − d(x, z) ≤ d(y, z),

y esto es equivalente a la desigualdad que queremos probar.

2En la definicion usual se toma R = R, cosa que no podemos hacer aquı porque todavıano hemos definido R. Luego veremos que, en contra de lo que podrıa parecer, esta definicionno es mas general.

Page 210: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

200 Capıtulo 7. El sistema numerico

Un espacio metrico es un par (M,d), donde M es un conjunto y d es unadistancia en M .

Una aplicacion f : M −→ N entre dos espacios metricos es una inmersionisometrica si cumple

xy ∈M d(f(x), f(y)) = d(x, y).

Notemos que una inmersion isometrica es necesariamente inyectiva, por la pri-mera condicion de la definicion de distancia. Una inmersion isometrica biyectivaentre dos espacios metricos es una isometrıa.

Dos espacios metricos son isometricos cuando existe una isometrıa entreellos. Esto hace que ambos compartan las mismas propiedades definibles enterminos de la distancia.

Sobre un cuerpo podemos considerar una clase de distancias que estan bienrelacionadas con la suma y el producto, a saber, las definidas en terminos devalores absolutos:

Un valor absoluto en un cuerpo K es una aplicacion | | : K −→ R, donde Res un cuerpo ordenado arquimediano, que cumpla las propiedades siguientes:

a)∧

x ∈ K (|x| ≥ 0 ∧ (|x| = 0 ↔ x = 0)),

b)∧

xy ∈ K |x+ y| ≤ |x| + |y|,

c)∧

xy ∈ K |xy| = |x||y|.

Un cuerpo metrico es un par (K, | |), donde K es un cuerpo y | | es un valorabsoluto en K.

En particular, si K es un cuerpo ordenado arquimediano, sabemos que enK hay definido un valor absoluto que cumple claramente la definicion anterior,pero no todo valor absoluto en un cuerpo tiene por que derivar de una relacionde orden. Veamos algunas propiedades adicionales de los valores absolutos:

• |1| = | − 1| = 1,

pues |1| = |1 · 1| = |1| · |1| y, como por a) |1| 6= 0, tiene que ser |1| = 1.Por otra parte, | − 1|2 = |(−1)2| = |1| = 1, luego

| − 1|2 − 1 = (| − 1| − 1)(| − 1| + 1) = 0,

luego | − 1| = 1 o | − 1| = −1, pero la segunda opcion es imposible porquelos valores absolutos son positivos.

•∧

x ∈ K |x| = | − x|,pues | − x| = | − 1||x| = |x|.

• Si x 6= 0, entonces |x−1| = |x|−1,

pues |x||x−1| = |xx−1| = |1| = 1.

Page 211: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.3. Cuerpos metricos completos 201

Ahora es inmediato que si K es un cuerpo metrico, entonces la aplicaciond : K × K −→ R dada por d(x, y) = |x − y| es una distancia en K. En losucesivo consideraremos siempre a cada cuerpo metrico como espacio metricocon esta distancia. Como consecuencia:

xy ∈ K ||x| − |y|| ≤ |x− y|.

En efecto, es un caso particular de la propiedad analoga para espaciosmetricos, pues

||x| − |y|| = |d(0, x) − d(0, y)| ≤ d(x, y) = |x− y|.

En particular, como Q es un cuerpo ordenado arquimediano, podemos con-siderarlo como cuerpo metrico y a su vez como espacio metrico con la distanciadefinida al principio de la seccion.

Una inmersion isometrica (resp. isometrıa) entre dos cuerpos metricos es unmonomorfismo (resp. isomorfismo) f : K −→ L tal que

x ∈ K |f(x)| = |x|.Es claro que las isometrıas de cuerpos metricos son isometrıas de espacios

metricos, y hacen que dos cuerpos metricos isometricos compartan las mismaspropiedades definibles en terminos de la metrica, la suma y el producto.

Notemos tambien que todo isomorfismo de cuerpos ordenados es claramenteuna isometrıa de cuerpos metricos.

Ahora estamos en condiciones de definir los conceptos que ponen en evidenciala presencia de “agujeros microscopicos” en Q:

Definicion 7.11 Una sucesion xnn∈ω en un espacio metrico M converge aun lımite l ∈M si3

ǫ > 0∨

m ∈ ω∧

n ≥ m d(xn, l) < ǫ.

La sucesion es de Cauchy si

ǫ > 0∨

m ∈ ω∧

nn′ ≥ m d(xn, xn′) < ǫ.

La sucesion esta acotada si existe un x ∈M y un C ∈ R de modo que

n ∈ ω d(xn, x) ≤ C.

Un conjunto D ⊂M es denso en M si∧

x ∈M∧

ǫ > 0∨

d ∈ D d(x, d) < ǫ.

Vamos a analizar estos conceptos:

Que una sucesion converja a un lımite l significa que sus terminos se apro-ximan cada vez mas a l hasta hacerse practicamente indistinguibles de l. Por

3En lo sucesivo sobrentenderemos que la letra ǫ representa siempre un elemento del cuerpoR donde toma imagenes la distancia, mientras que m, n representaran siempre numeros na-turales.

Page 212: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

202 Capıtulo 7. El sistema numerico

ejemplo, si una sucesion en Q converge a 1 tenemos que, para ǫ = 1/1 000 000,existe un m ∈ ω tal que todos los terminos posteriores a xm se diferenciande 1 en a lo sumo una millonesima, y si esta aproximacion no nos parece sufi-ciente, siempre podemos tomar un ǫ menor, pues aumentando m si es necesariotendremos garantizada la aproximacion que deseemos.

Observemos que una sucesion no puede converger a mas de un lımite, puessi xnn∈ω converge a dos puntos l y l′ de un espacio metrico, entonces, paraǫ = d(l, l′), existe un m ∈ ω tal que si n ≥ m se cumple4 d(xn, l) < ǫ/2 yd(xn, l

′) < ǫ/2, y entonces tenemos una contradiccion:

d(l, l′) ≤ d(l, xn) + d(xn, l′) < ǫ/2 + ǫ/2 = d(l, l′).

Ası pues, si una sucesion xnn∈ω en un espacio metrico M es convergente,representaremos su unico lımite como

lımnxn ∈M.

A menudo resultara util el resultado siguiente sobre convergencia en cuerposordenados:

Teorema 7.12 Sea K un cuerpo ordenado arquimediano y sea xnn∈ω unasucesion convergente en K tal que existen a, b ∈ K y m ∈ ω de modo que∧

n ≥ m a ≤ xn ≤ b. Entonces a ≤ lımnxn ≤ b.

Demostracion: Llamemos l al lımite y supongamos, por ejemplo que l < a.Entonces tomamos ǫ = a− l y por la definicion de convergencia existe un n ≥ mtal que |xn − l| < ǫ y, como l < a ≤ xn, esto equivale a xn − l < a − l, con loque xn < a, contradiccion, luego a ≤ l. Igualmente se razona que l ≤ b.

Un subconjunto D ⊂M de un espacio metrico es denso si todo punto de Mtiene puntos de D arbitrariamente proximos. Esto puede expresarse en terminosde sucesiones:

Teorema 7.13 Un subconjunto5 D de un espacio metrico M es denso si y solosi todo punto de M es el lımite de una sucesion en D.

Demostracion: Si D es denso y l ∈M , para cada n ∈ ω tomamos dn ∈ Dtal que d(dn, l) <

1n+1 . Tenemos ası una sucesion dnn∈ω en D que ciertamente

converge a l, pues, dado ǫ > 0, como R es arquimediano, existe un m ∈ ω talque 1/ǫ < m, luego 1/m < ǫ, y si n ≥ m entonces

d(dn, l) <1

n+ 1<

1

m< ǫ.

4En principio tendrıamos un m1 tal que para n ≥ m1 se cumplirıa la definicion de conver-gencia a l y otro m2 a partir del cual se cumplirıa la definicion de convergencia a l′, pero sitomamos m = maxm1,m2, a partir de m se cumplen las dos. En lo sucesivo aplicaremostacitamente este argumento con frecuencia.

5Este teorema requiere el axioma de eleccion (numerable) salvo que supongamos que Dadmite un buen orden (que nos permita tomar como dn el mınimo elemento de D que cumple lapropiedad exigida en la prueba). En realidad, todos los conjuntos densos a los que aplicaremoseste teorema seran numerables, por lo que nunca necesitaremos el axioma de eleccion.

Page 213: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.3. Cuerpos metricos completos 203

Recıprocamente, si D tiene la propiedad indicada, dado x ∈ M , tomamosuna sucesion dnn∈ω en D que converja a x. Dado ǫ > 0 existe un m ∈ ω talque d(dm, x) < ǫ, y esto prueba que D es denso.

Este teorema es una buena ilustracion del papel que representa la conver-gencia de sucesiones en este contexto: un punto x ∈ M no tiene por que estaren D, pero podemos encontrar una sucesion de elementos de D que converjaa x. Una sucesion puede converger a un punto x sin necesidad de llegar nuncaa x, por lo que esto no esta renido con que la sucesion este contenida en D, unconjunto al cual x no tiene por que pertenecer. Mediante una sucesion en Delegida oportunamente podemos especificar completamente un punto de fuerade D.

En los cuerpos ordenados los conjuntos densos tienen una caracterizacionmas simple:

Teorema 7.14 Un subconjunto D de un cuerpo ordenado arquimediano K esdenso si y solo si

ab ∈ K (a < b→∨

d ∈ D a < d < b).

Demostracion: Si D es denso y a < b, consideramos c = (a + b)/2 yǫ = (b − a)/2 > 0. Existe un d ∈ D tal que |d − c| < ǫ, pero esto quiere decirque −ǫ < q − c < ǫ, o tambien a− c < d− c < b− c, luego a < d < b.

Recıprocamente, si D cumple la condicion del enunciado, dado x ∈ K yǫ > 0, existe un d ∈ D tal que x < d < x + ǫ, y entonces |d − x| = d − x < ǫ.

Como consecuencia:

Teorema 7.15 Si K es un cuerpo ordenado arquimediano, entonces Q es densoen K.

Demostracion: Tomemos a < b en K. Entonces existe un numero naturaln > 1/(b− a), luego 1/n < b− a.

Si a ≥ 0, sea k el menor numero natural tal que na < k, de modo que

k − 1

n≤ a <

k

n.

Si a < 0, entonces −a > 0 y tomamos el menor numero natural k tal que−na ≤ k, de modo que k − 1 < −na ≤ k, luego

−kn

≤ a <−k + 1

n.

En ambos casos tenemos un entero m tal que

m− 1

n≤ a <

m

n.

Entonces

a <m

n=m− 1

n+

1

n< a+ b− a = b,

luego q = m/n ∈ Q cumple a < q < b, luego Q es denso en K por el teoremaanterior.

Page 214: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

204 Capıtulo 7. El sistema numerico

El concepto de sucesion acotada es un concepto tecnico muy simple: unasucesion esta acotada si nunca se aleja mas de una distancia C de un puntofijo x. Conviene observar que el punto x podemos elegirlo, en el sentido de quesi una sucesion cumple la definicion de sucesion acotada con un cierto x ∈ M ,entonces la cumple tambien con cualquier otro y ∈M , pues

d(xn, y) ≤ d(xn, x) + d(x, y) ≤ C + d(x, y),

y basta tomar C′ = C + d(x, y).

En particular, una sucesion xnn∈ω esta acotada en un cuerpo metrico si ysolo si existe un C ∈ R tal que

n ∈ ω |xn| ≤ C (donde hemos tomado x = 0como punto de referencia para fijar la cota).

Pasamos ahora al concepto mas delicado de todos los que hemos introducido:el de sucesion de Cauchy. Empezamos observando su relacion obvia con laconvergencia:

Teorema 7.16 Toda sucesion convergente en un espacio metrico es de Cauchy,y toda sucesion de Cauchy esta acotada.

Demostracion: Si xnn∈ω converge a l, dado ǫ > 0 existe un m ∈ ω talque si n ≥ m entonces d(xn, l) < ǫ/2, luego si n, n′ ≥ m tenemos que

d(xn, xn′) ≤ d(xn, l) + d(l, xn′) < ǫ/2 + ǫ/2 = ǫ,

luego la sucesion es de Cauchy.

Por otra parte, si la sucesion es de Cauchy, existe un m ∈ ω tal que si n ≥ mse cumple d(xn, xm) ≤ 1. Sea C = max(d(xk, xm) | k < m ∪ 1). Es claroentonces que

n ∈ ω d(xn, xm) ≤ C, luego la sucesion esta acotada.

Una sucesion es de Cauchy cuando sus terminos se aproximan entre sı, hastahacerse indistinguibles unos de otros, de modo que, superado nuestro umbral dediscernimiento, todos ellos se ven “en el mismo punto”. Si la sucesion es con-vergente, ese punto donde “se aglomeran” los puntos de la sucesion es el lımite,pero la definicion de sucesion de Cauchy no exige que exista tal lımite. Si una su-cesion de Cauchy no tiene lımite, entonces sus terminos se estan “aglomerando”alrededor de “nada”, alrededor de “un hueco”, de “un agujero microscopico” enel espacio metrico considerado.

Si una sucesion convergente esta “senalando” un punto, aunque se acerquesin llegar a el, una sucesion de Cauchy no convergente esta “senalando” unagujero, acercandose a el, pero sin “caer” en el (como no puede ser de otraforma, porque la sucesion esta hecha de puntos, no de agujeros). Veremos queQ tiene 2ℵ0 agujeros en este sentido, ası como que podemos “rellenarlos” y elresultado sera el cuerpo R de los numeros reales.

Conviene observar que una sucesion de Cauchy esta “a punto de converger”,en el sentido que precisamos a continuacion, para lo cual necesitamos el conceptode subsucesion:

Page 215: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.3. Cuerpos metricos completos 205

Definicion 7.17 Una sucesion ykk∈ω es una subsucesion de una sucesionxnn∈ω si existe una sucesion estrictamente creciente nkk∈ω de numerosnaturales (es decir, tal que k < k′ → nk < nk′) de modo que

k ∈ ω yk = xnk.

Ası, una subsucesion avanza por los puntos de la sucesion pero dando saltosde varios a la vez, sin retroceder nunca. Observemos que, en las condicionesde la definicion, se cumple que

k ∈ ω k ≤ nk, pues es un caso particular delteorema 1.25.

Por ejemplo, es inmediato que toda subsucesion de una sucesion convergenteconverge al mismo lımite, pues si se cumple d(xn, l) < ǫ para todo n ≥ m,tambien vale d(xnk

, l) < ǫ para k ≥ m, ya que entonces nk ≥ k ≥ m.

Para sucesiones de Cauchy se cumple un recıproco:

Teorema 7.18 Si una sucesion de Cauchy tiene una subsucesion convergenteentonces converge al mismo lımite.

Demostracion: Sea xnn∈ω una sucesion de Cauchy en un espacio me-trico M y sea xnk

k∈ω una subsucesion convergente a l. Entonces, dado ǫ > 0,existe un m ∈ ω tal que si n, n′ ≥ m, entonces d(xn, xn′) < ǫ/2 y si k ≥ mentonces d(xnk

, l) < ǫ/2. Ası,

d(xn, l) ≤ d(xn, xnk) + d(xnk

, l) < ǫ/2 + ǫ/2 = ǫ.

Una sucesion puede ser muy caotica. Dado que la convergencia de unasucesion de Cauchy puede reducirse a estudiar la convergencia de cualquiersubsucesion, resulta util el teorema siguiente, que proporciona subsucesionesespecialmente sencillas:

Teorema 7.19 Toda sucesion en un conjunto totalmente ordenado contieneuna subsucesion monotona.

Demostracion: Sea an∞n=0 una sucesion en un conjunto totalmente or-denado. Sea A el conjunto de las imagenes de la sucesion. Si A es finito es obvioque A tiene una subsucesion constante, luego monotona. Supongamos que A esinfinito.

Si todo subconjunto no vacıo de A tiene mınimo podemos tomar x0 igual almınimo de A, luego x1 igual al mınimo de A\ x0, luego x2 igual al mınimo deA \ x0, x1, y ası obtenemos puntos x0 < x1 < x2 < · · · , es decir, obtenemosun subconjunto de A sin maximo.

Ası pues, o bien existe un subconjunto de A sin mınimo o bien existe unsubconjunto de A sin maximo. Los dos casos se tratan igual. Supongamos quehay un subconjunto de A sin mınimo. Llamemoslo B.

Sea an0 un elemento cualquiera de B. Como B no tiene mınimo contieneinfinitos terminos de la sucesion bajo an0 , pero solo un numero finito de ellostienen ındice anterior a n0, luego existe6 un cierto an1 en B de manera que

6Podemos tomar siempre el mınimo numero natural, n1 en este caso, que cumple lo reque-rido, luego no necesitamos el axioma de eleccion.

Page 216: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

206 Capıtulo 7. El sistema numerico

an1 < an0 y n0 < n1. Podemos repetir recurrentemente este proceso y obteneruna subsucesion

an0 > an1 > an2 > an3 > an4 > an5 > · · ·

monotona decreciente.

La idea de que las sucesiones de Cauchy “deberıan” converger nos lleva alconcepto siguiente:

Definicion 7.20 Un espacio metrico es completo si en el toda sucesion deCauchy es convergente.

En particular podemos hablar de cuerpos metricos y cuerpos ordenados com-pletos. Veamos en que se traduce la completitud en el caso concreto de un cuerpoordenado:

Teorema 7.21 Sea K un cuerpo ordenado arquimediano. Las afirmacionessiguientes son equivalentes:

a) K es completo.

b) Si ann∈ω y bnn∈ω son sucesiones en K tales que, para todo ındice n,se cumpla an ≤ an+1 ≤ bn+1 ≤ bn y lım

n(bn − an) = 0, entonces existe un

unico l ∈ K tal que∧

n ∈ ω an ≤ l ≤ bn.

c) Todo subconjunto no vacıo de K acotado superiormente tiene supremo.

Demostracion: a) ⇒ b) Supongamos que K es completo y consideremosdos sucesiones en las hipotesis de b). Observamos que ann∈ω es de Cauchypues, dado ǫ > 0, tomamos m tal que |bm − am − 0| < ǫ, es decir, bm − am < ǫ.Entonces, si n′ ≥ n ≥ m, tenemos que am ≤ an ≤ an′ ≤ bn′ ≤ bm, luegoan′ − an ≤ bm − am < ǫ, luego |an′ − an| < ǫ y, con el valor absoluto, ladesigualdad vale igualmente si n′ ≤ n.

Por hipotesis existe l = lımnan. Como, para cada m ∈ ω se cumple que si

n ≥ m entonces am ≤ an ≤ bm, el teorema 7.12 nos da que am ≤ l ≤ bm.Ahora supongamos que dos elementos l, l′ ∈ K cumplen

n ∈ ω an ≤ l ≤ bny∧

n ∈ ω an ≤ l′ ≤ bn (no suponemos que l sea el lımite anterior). Entonces noperdemos generalidad si suponemos que l ≤ l′ y, como an ≤ l ≤ l′ ≤ bn, resultaque l′ − l ≤ bn − an. Si fuera l 6= l′, podrıamos tomar ǫ = l′ − l > 0 y resultarıaque no se cumple la definicion de convergencia para lım

n(bn − an) = 0. Ası pues,

l es unico.

b) ⇒ c) Sea A ⊂ K un subconjunto no vacıo acotado superiormente. Seaa ∈ A y sea b una cota superior. Si a es tambien una cota superior entonceses el maximo de A, luego tambien su supremo. Supongamos, pues, que a no esuna cota superior de A. En particular a < b.

Vamos a construir recurrentemente una sucesion (an, bn)n∈ω en K × Kde modo que an < bn y cada bn sea una cota superior de A, pero ningun an

Page 217: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.3. Cuerpos metricos completos 207

lo sea. Tomamos (a0, b0) = (a, b) y, supuesto definido (an, bn), consideramosc = (an + bn)/2, de modo que an < c < bn, y distinguimos dos casos:

Si c no es cota superior de A, definimos an+1 = c, bn1 = bn, mientras que sic es cota superior de A tomamos an+1 = an, bn+1 = c.

Teniendo en cuenta que si c = (a+ b)/2 entonces b− c = c− a = (b− a)/2,una simple induccion prueba que

bn − an =b− a

2n.

Esto implica que lımn

(bn − an) = 0. En efecto, dado ǫ > 0, como R es arquime-

diano, existe un m ∈ ω tal que m > (b − a)/ǫ, luego si n ≥ m se cumple que2n ≥ n ≥ m > (b− a)/ǫ, luego |bn − an| < ǫ.

Por b) existe un l ∈ K tal que∧

n ∈ ω an ≤ l ≤ bn. Vamos a probar quel es el supremo de A. Tiene que ser una cota superior, porque si no lo fueraexistirıa un x ∈ A tal que l < x. Pero entonces serıa an ≤ l < x ≤ bn y ǫ = x− lcontradirıa la convergencia de bn − an a 0.

Por otro lado, toda cota superior c de A cumple l ≤ c, pues si fuera c < ltendrıamos que an ≤ c < l ≤ bn y de nuevo tenemos una contradiccion conǫ = l − c.

c) ⇒ a) Dada una sucesion de Cauchy en K, para probar que es convergente,basta probar que lo es una cualquiera de sus subsucesiones. Por el teorema 7.19podemos tomar una subsucesion monotona. Como toda sucesion de Cauchy esacotada y obviamente toda subsucesion de una sucesion acotada esta acotada,basta probar que toda sucesion xnn∈ω monotona y acotada es convergente.

No perdemos generalidad si suponemos que es monotona creciente, ya quesi es decreciente la sucesion −xnn∈ω es creciente, y si esta converge a l, lasucesion inicial converge a −l (porque la condicion | − xn − l| < ǫ es equivalentea |xn − (−l)| < ǫ).

Es claro que el conjunto A = xn | n ∈ ω es no vacıo y esta acotadosuperiormente, luego tiene supremo l. Vamos a probar que dicho supremo es ellımite de la sucesion. Dado ǫ > 0, por definicion de supremo se cumple que l− ǫno es cota superior de A, luego existe un m ∈ ω tal que l− ǫ < xm ≤ l, luego sin ≥ m tenemos que l− ǫ < xm ≤ xn ≤ l, luego |xn− l| = l−xn < l− (l− ǫ) = ǫ.

Nota Observemos que si X es un conjunto totalmente ordenado y A ⊂ X noes vacıo y esta acotado superiormente, podemos definir los conjuntos

X− = x ∈ X | x no es cota superior de A,

X+ = x ∈ X | x es cota superior de A,y sucede entonces que X = X− ∪X+, la union es disjunta y todo elemento deX− es menor que todo elemento de X+. Si A tiene supremo, dicho supremo

Page 218: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

208 Capıtulo 7. El sistema numerico

sera el maximo de X− o bien el mınimo de X+, segun que este o no en A. Perosi A no tiene supremo, entonces X− no tiene maximo y X+ no tiene mınimo.Podemos pensar que cada uno de ellos esta a un lado de un “agujero” en X . SiX es un cuerpo ordenado, el argumento empleado en la prueba de b) ⇒ c) enel teorema anterior permite construir sucesiones de Cauchy ann∈ω y bnn∈ω

que “se acercan al agujero”, una desde cada lado, sin converger a ningun punto.

La tercera caracterizacion del teorema anterior no depende mas que de laestructura de orden de K, por lo que tiene sentido en conjuntos ordenadosarbitrarios:

Definicion 7.22 Un conjunto totalmente ordenado X es completo si todo sub-conjunto de X no vacıo y acotado superiormente tiene supremo.

Observemos que si R es un cuerpo ordenado completo en el sentido de ladefinicion anterior, entonces es arquimediano, luego por el teorema precedentetambien es completo como cuerpo metrico. En efecto, si R no es arquimediano,entonces N esta acotado superiormente, luego tiene supremo, digamos s. Pordefinicion de supremo, s− 1/2 no es cota superior de N, luego existe un n ∈ Ntal que s − 1/2 < n ≤ s, pero entonces s < n + 1/2 < n + 1, en contradiccioncon que s sea cota superior de N.

Nota No vamos a necesitar este hecho, pero un cuerpo metrico se dice arqui-mediano si existe un C ∈ R tal que

n ∈ N |n| ≤ C. Para cuerpos ordenadosesta definicion coincide con la que hemos dado, pero se pueden construir cuerposmetricos completos no arquimedianos. El teorema anterior solo asegura que nopueden ser cuerpos ordenados.

En un cuerpo ordenado, todos los cuadrados son positivos. Si ademas escompleto se cumple el recıproco:

Teorema 7.23 Si R es un cuerpo ordenado completo, para cada x ∈ R, x ≥ 0existe un unico y ∈ R tal que y ≥ 0 ∧ y2 = x.

Demostracion: Podemos suponer que x > 0. Consideremos el conjuntoA = u ∈ R | u > 0 ∧ u2 < x. Como R es arquimediano, existen numerosnaturales x < n < n2 y 1/x < m < m2, con lo que 1/m2 < x y ası 1/m ∈ A yn es una cota superior de A. Esto implica que A tiene supremo. Llamemoslo y.Claramente y > 0.

Supongamos que x < y2. Tomemos un numero natural n tal que n > 1/y yn > 2y/(y2 − x). Ası 2y/n < y2 − x y en consecuencia

(

y − 1

n

)2

= y2 − 2y1

n+

1

n2> y2 − y2 + x+

1

n2> x.

Ası, si u ∈ A tenemos que u2 < x < (y − 1/n)2, luego u < y − 1/n, pero estosignifica que y − 1/n es una cota superior de A, en contradiccion con que y esel supremo.

Page 219: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.3. Cuerpos metricos completos 209

Supongamos ahora que y2 < x. Entonces tomamos un numero natural nque cumpla n > 4y/(x− y2) y n2 > 2/(x− y2). Ası

(

y +1

n

)2

= x2 + 2y1

n+

1

n2< y2 +

x− y

2+x− y2

2= y2 + x− y2 = x,

luego y + 1/n ∈ A, y esto supone de nuevo una contradiccion. Por lo tanto hade ser y2 = x.

La unicidad es clara, pues si z ∈ R cumple z > 0, z 6= y, entonces z2 < y2 oz2 > y2 segun si z < y o z > y.

Esto implica que en un cuerpo ordenado completo la relacion de orden estadeterminada por la suma y el producto: se cumple x ≤ y ↔

z y − x = z2.Ahora necesitamos un resultado tecnico:

Teorema 7.24 Sea K un cuerpo metrico y ann∈ω, bnn∈ω, dos sucesionesconvergentes (resp. de Cauchy) en K. Entonces las sucesiones an + bnn∈ω

y anbnn∈ω tambien son convergentes (resp. de Cauchy) y, en el caso de laconvergencia,

lımn

(an + bn) = lımnan + lım

nbn, lım

n(anbn) = lım

nan lım

nbn.

Demostracion: En el caso de la convergencia, llamaremos l = lımnan,

l′ = lımnbn. Para la suma observamos que

|an′ + bn′ − an − bn| ≤ |an′ − an| + |bn′ − bn|,

luego, dado ǫ > 0, tomando un m ∈ ω tal que |an′ − an| < ǫ/2 y |bn′ − bn| < ǫ/2siempre que n′, n ≥ m, tenemos tambien que |an′ + bn′ − an − bn| < ǫ, luego lasuma es de Cauchy. En el caso de la convergencia razonamos analogamente apartir de |an + bn − l − l′| ≤ |an − l| + |bn − l′|.

Para el producto usamos que

|an′bn′ −anbn| = |an′bn′ −an′bn +an′bn−anbn| ≤ |an′ ||bn′ − bn|+ |an′ −an||bn|,

ası como que ambas sucesiones estan acotadas, de modo que existe un C ∈ Rtal que |an| ≤ C, |bn| ≤ C para todo n. Por lo tanto, dado ǫ > 0, basta tomarun m ∈ ω tal que |an′ − an| ≤ ǫ/2C, |bn′ − bn| ≤ ǫ/2C siempre que n, n′ ≥ m.Obtenemos entonces que

|an′bn′ − anbn| < Cǫ/2C + Cǫ/2C = ǫ.

En el caso de la convergencia razonamos analogamente a partir de

|anbn − ll′| = |anbn − anl′ + anl

′ − ll′| ≤ |an||bn − l′| + |an − l||l′|.

Notemos que podemos suponer C ≥ |l′|.Con esto podemos probar que a lo sumo hay un cuerpo ordenado completo.

Probamos primero algo mas general:

Page 220: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

210 Capıtulo 7. El sistema numerico

Teorema 7.25 Sean M y N dos espacios metricos completos, sea M0 ⊂M unsubconjunto denso7, considerado como espacio metrico con la restriccion de ladistancia de M . Sea f : M0 −→ N una inmersion isometrica. Entonces existeuna unica inmersion isometrica F : M −→ N que extiende a f (es decir, talque F |M0 = f). Si f [M0] es denso en N , entonces F es una isometrıa. Masaun, si M y N son cuerpos metricos, M0 es un subcuerpo y f es una inmersionisometrica (resp. isometrıa) de cuerpos metricos, entonces F tambien lo es.

Demostracion: Sea x ∈ M . El teorema 7.13 implica que existe una su-cesion xnn∈ω en M0 convergente a x. En particular es una sucesion de Cauchyen M , pero es claro que esto es lo mismo que decir que xnn∈ω es una sucesionde Cauchy en M0 como espacio metrico, pues la definicion de sucesion de Cauchydepende solo de los valores que toma la distancia sobre los terminos de la su-cesion. Como f es una inmersion isometrica, resulta que la sucesion f(xn)n∈ω

es de Cauchy en f [M0], luego en N , y por la completitud de N converge en N .Definimos F (x) = lım

nf(xn).

Para que esta definicion sea correcta tenemos que comprobar que no dependede la sucesion utilizada para calcular F (x). En efecto, si tomamos otra sucesionynn∈ω en M0 convergente a x, es facil ver que la sucesion zkk∈ω dada por

zk =

xn si k = 2n,yn si k = 2n+ 1,

tambien converge a x. Segun hemos visto, entonces f(zk)k∈ω converge a uncierto z en N , pero las sucesiones f(xn)n∈ω y f(yn)n∈ω son subsucesionesde esta sucesion, luego ambas convergen al mismo lımite z.

Por lo tanto F esta bien definida. Veamos ahora que es una inmersionisometrica, es decir, que cumple

xy ∈M d(F (x), F (y)) = d(x, y).

Para ello observamos que si lımnxn = x y lım

nyn = y, donde ambas sucesiones

estan en M0, entonces lımnd(xn, yn) = d(x, y). En efecto,

|d(x, y) − d(xn, yn)| ≤ |d(x, y) − d(xn, y)| + |d(xn, y) − d(xn, yn)|

≤ d(xn, x) + d(yn, y),

luego, dado ǫ > 0, podemos tomar un m ∈ ω tal que si n ≥ m se cumpled(xn, x) < ǫ/2 y d(yn, y) < ǫ/2, con lo que |d(x, y) − d(xn, yn)| < ǫ.

Igualmente, lımnd(f(xn), f(yn)) = d(F (x), F (y)), pero ambas sucesiones de

distancias son la misma, luego los lımites son el mismo.

Si f [M0] es denso en N entonces F es suprayectiva, pues dado y ∈ N ,podemos tomar una sucesion en f [M0] convergente a y y pasarla a M0 con

7Necesitamos suponer que M0 (y, por consiguiente, N0) es bien ordenable para no requerirel axioma de eleccion (numerable). Esto se debe al uso del teorema 7.13.

Page 221: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.3. Cuerpos metricos completos 211

f , con lo que obtenemos una sucesion convergente a un cierto x ∈ M queclaramente cumplira F (x) = y.

La unicidad de F es clara, pues si G fuera otra inmersion isometrica tal queG|M0 = f , entonces, dado x ∈ M , lo expresamos como x = lım

nxn, donde la

sucesion esta en M0, y entonces d(G(x), G(xn)) = d(x− xn), de donde se sigueinmediatamente que

G(x) = lımnG(xn) = lım

nf(xn) = F (x).

Supongamos ahora queM yN son cuerpos metricos, queM0 es un subcuerpoy que f es una inmersion isometrica de cuerpos metricos. Entonces, dadosx = lım

nxn, y = lım

nyn en M , el teorema anterior nos da que x+y = lım

n(xn+yn),

luego podemos calcular F con esta sucesion y entonces

F (x+ y) = lımn

(f(xn) + f(yn)) = lımnf(xn) + lım

nf(yn) = F (x) + F (y),

e igualmente se razona con el producto. Por lo tanto F es un monomorfismo decuerpos. Como |x| = d(x, 0), el hecho de que F sea una inmersion isometricaimplica que |F (x)| = |x|.

En particular:

Teorema 7.26 Dos cuerpos ordenados completos cualesquiera son isomorfos.

Demostracion: Supongamos que R y R′ son cuerpos ordenados comple-tos. Entonces ambos contienen a Q o, si queremos ser mas precisos, existensubcuerpos densos Q ⊂ R, Q′ ⊂ R′ y un isomorfismo de cuerpos ordenadosf : Q −→ Q′.

El teorema anterior nos da que el isomorfismo f se extiende a una unicaisometrıa F : R −→ R′ de cuerpos metricos, pero vamos a probar que ademases una semejanza, y por lo tanto un isomorfismo de cuerpos ordenados. Estoes una consecuencia inmediata del teorema 7.23: se cumple x ≤ y si y solo si∨

z ∈ R y − x = z2, si y solo si∨

z′ ∈ R′ F (y) − F (x) = z′2, si y solo siF (x) ≤ F (y).

Ası pues, el cuerpo de los numeros reales que construiremos en la seccionsiguiente sera el unico cuerpo ordenado completo (salvo isomorfismo).

Terminamos esta seccion demostrando algunos resultados tecnicos que nosharan falta en la siguiente. El primero es una caracterizacion de los espaciosmetricos completos:

Teorema 7.27 SeaM un espacio metrico y sea D ⊂M un conjunto denso8 talque toda sucesion de Cauchy en D converge en M . Entonces M es un espaciometrico completo.

8Necesitamos que D sea bien ordenable si no queremos usar el axioma de eleccion (nume-rable), pues necesitamos escoger un dn para cada n.

Page 222: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

212 Capıtulo 7. El sistema numerico

Demostracion: Sea xnn∈ω una sucesion de Cauchy en M . Para cadan ∈ ω, sea dn ∈ D tal que d(xn, dn) < 1/(n + 1). La sucesion dnn∈ω es deCauchy, pues

|dn′ − dn| ≤ |dn′ − xn′ | + |xn′ − xn| + |xn − dn|,luego, dado ǫ > 0, existe un m > 3/ǫ tal que si n, n′ ≥ m se cumple que|xn′ − xn| < ǫ/3, y entonces

|dn′ − dn| <1

n′ + 1+ǫ

3+

1

n+ 1<ǫ

3+ǫ

3+ǫ

3= ǫ.

Por hipotesis existe lımndn = l y basta probar que lım

nxn = l. En efecto:

|xn − l| ≤ |xn − dn| + |dn − l|.Dado ǫ > 0, basta tomar m ≥ 2/ǫ tal que si n ≥ m se cumpla |dn − l| < ǫ/2, yentonces |xn − l| < ǫ.

Teorema 7.28 Si xnn∈ω es una sucesion acotada en un cuerpo metrico yynn∈ω converge a 0, entonces xnynn∈ω converge a 0.

Demostracion: Sea C ∈ R tal que∧

n ∈ ω |xn| ≤ C. Dado ǫ > 0, existeun m ∈ ω tal que si n ≥ m, entonces |yn| < ǫ/C, luego

|xnyn| = |xn||yn| < Cǫ/C = ǫ.

Esto significa que la sucesion producto tiende a 0.

Teorema 7.29 Si xnn∈ω es una sucesion de Cauchy en un cuerpo metricoy no converge a 0, entonces existe un T ∈ R y un m ∈ ω tal que si n ≥ mentonces 0 < T ≤ |xn|. Ademas, la sucesion ynn∈ω dada por

yn =

1/xn si xn 6= 0,0 si xn = 0,

tambien es de Cauchy.

Demostracion: Si no existe el T indicado, tomando ǫ = T obtenemos∧

ǫ > 0∧

m ∈ ω∨

n ∈ ω(n ≥ m ∧ |xn| < ǫ).

Definimos nkk∈ω por recurrencia estableciendo que nk sea el menor numeronatural mayor que los ya definidos y tal que |xnk

| < 1/(k+1). Es claro entoncesque xnk

k∈ω es una subsucesion de xnn∈ω convergente a 0, pero entonces,por 7.18 tenemos que la sucesion dada converge a 0, contradiccion.

Para la segunda parte observamos que si n, n′ ≥ m (el m dado por la primeraparte) entonces xn, xn′ 6= 0, luego

|yn′ − yn| =

∣∣∣∣

1

xn′

− 1

xn

∣∣∣∣

=|xn − xn′ ||xn′xn|

≤ |xn − xn′ |T 2

.

Ası, dado ǫ > 0, podemos tomar un m mayor (si es preciso) que el de la primeraparte de modo que si n, n′ ≥ m se cumpla que |xn−xn′ | < T 2ǫ, y ası concluimosque |yn′ − yn| < ǫ.

Page 223: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.4. La construccion de R 213

7.4 La construccion de R

Los resultados de la seccion anterior han perfilado muy bien que estamosbuscando cuando pretendemos extender el cuerpo Q de los numeros racionales.Aunque todavıa no lo hemos demostrado,9 sucede que Q es incompleto, y lo quequeremos es encontrar un cuerpo completo R, que necesariamente contendra aQ como subcuerpo denso. Mas en general vamos a ver que todo espacio metricoM puede completarse, en el sentido de que existe un espacio metrico M (unicosalvo isometrıa) que contiene a M como subconjunto denso.

El teorema 7.27 nos dice que, para que M sea completo, solo hemos degarantizar que las sucesiones de Cauchy de M converjan en M , sin necesidadde preocuparnos de que lo hagan las nuevas sucesiones de Cauchy que puedenformarse con los nuevos puntos de M \M .

La estrategia de construccion sera la misma que hemos empleado para cons-truir Z o Q: cada punto de M debe ser el lımite de una sucesion en M , que, alser convergente en M , debe ser de Cauchy en M , por lo que podrıamos pensar endefinir como M el conjunto de las sucesiones de Cauchy en M , pero no podemoshacerlo exactamente ası porque varias sucesiones de Cauchy en M pueden estarforzadas a tener el mismo lımite en M , luego hay que establecer una relacionde equivalencia adecuada y definir M como el conjunto cociente asociado.

A partir de este punto usaremos el axioma de partes.

Definicion 7.30 Si M es un espacio metrico, llamaremos CM al conjunto10

de todas las sucesiones de Cauchy en M . Definimos en CM la relacion deequivalencia dada por

xnn∈ω ∼ ynn∈ω ↔ lımnd(xn, yn) = 0.

Es facil ver que se trata, en efecto, de una relacion de equivalencia. Porejemplo, la transitividad se debe a que si

lımnd(xn, yn) = lım

nd(yn, zn) = 0,

dado ǫ > 0 existe un m ∈ ω tal que si n ≥ m se cumple d(xn, yn) < ǫ/2,d(yn, zn) < ǫ/2, con lo que

d(xn, zn) ≤ d(xn, yn) + d(yn, zn) < ǫ/2 + ǫ/2 = ǫ,

luego lımnd(xn, zn) = 0.

Definimos la complecion de M como el conjunto cociente M de M respectode la relacion de equivalencia que acabamos de definir.

9En realidad el teorema 7.23 ya implica que Q es incompleto, si tenemos en cuenta tambienel resultado aritmetico (que no hemos probado aquı) segun el cual en Q no existe, por ejemplo,la raız cuadrada de 2.

10Notemos que CM ⊂ Mω, y el axioma AP implica que Mω es un conjunto, luego CM

tambien lo es.

Page 224: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

214 Capıtulo 7. El sistema numerico

Definimos i : M −→ M como la aplicacion que a cada x ∈ M le asigna laclase de equivalencia de la sucesion constante xn∈ω. Es una aplicacion inyec-tiva, pues si i(x) = i(y), entonces la sucesion constante d(x, y)n∈ω convergea 0, lo cual equivale a que d(x, y) = 0, luego x = y.

Ası podemos identificar a M con un subconjunto de M .

La complecion de un espacio metrico Si suponemos que el cuerpo R enel que la distancia toma sus valores es completo, entonces es facil convertir aM en espacio metrico. Basta observar que, por una parte, si xnn∈ω, ynn∈ω

son sucesiones de Cauchy en M , entonces d(xn, yn)n∈ω es una sucesion deCauchy en R, pues

|d(xn, yn) − d(xn′ , yn′)| ≤ |d(xn, yn) − d(xn′ , yn)| + |d(xn′ , yn) − d(xn′ , yn′)|

≤ d(xn, xn′) + d(yn, yn′),

luego, dado ǫ > 0, podemos tomar m ∈ ω tal que, para n, n′ ≥ m se cumplad(xn, xn′) < ǫ/2 y d(yn, yn′) < ǫ/2, con lo que |d(xn, yn) − d(xn′ , yn′)| < ǫ. Porlo tanto, si R es completo podemos definir

d([xnn∈ω], [ynn∈ω]) = lımnd(xn, yn).

En realidad, para que esta definicion sea correcta hemos de comprobar queno depende de la eleccion de las sucesiones que tomamos en cada clase de equi-valencia. Esto se debe a que si

[xnn∈ω] = [x′nn∈ω], [ynn∈ω] = [y′nn∈ω],

entonces

|d(xn, yn) − d(x′n, y′n)| ≤ |d(xn, yn) − d(xn, y

′n)| + |d(xn, y

′n) − d(x′n, y

′n)|

≤ d(yn, y′n) + d(xn, y

′n)

y, teniendo en cuenta que los dos ultimos sumandos tienden a 0, es facil ver que

lımn

(d(xn, yn) − d(x′n, y′n)) = 0,

de donde lımnd(xn, yn) = lım

nd(x′n, y

′n).

Ası pues, tenemos una aplicacion d : M ×M −→ R, y es facil comprobarque es una distancia. Por ejemplo, para probar la desigualdad triangular, dadosα = [xnn∈ω], β = [ynn∈ω], γ = [znn∈ω] en M , observamos que

0 ≤ d(xn, yn) + d(yn, zn) − d(xn, zn),

luego por el teorema 7.12 (tomando como b cualquier cota de la sucesion, quees de Cauchy), obtenemos que 0 ≤ d(α, β) + d(β, γ) − d(α, γ).

Page 225: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.4. La construccion de R 215

Ademas, la aplicacion i : M −→M es una inmersion isometrica. En efecto,si x, y ∈ M , es claro que la sucesion constante d(x, y)n∈ω converge a d(x, y),luego d(i(x), i(y)) = d(x, y).

Por ultimo, observamos que si xnn∈ω es una sucesion de Cauchy en M yα = [xnn∈ω], entonces lım

ni(xn) = α.

En efecto, por definicion d(i(xn), α) = lımn′d(xn, xn′), luego, dado ǫ > 0,

existe un m ∈ ω tal que si n, n′ ≥ m entonces 0 ≤ d(xn, xn′) < ǫ/2, luego por elteorema 7.12 tenemos que 0 ≤ d(i(xn), α) ≤ ǫ/2 < ǫ, y esto es lo que habıa queprobar.

En definitiva, lo que sucede es que cada sucesion de Cauchy en M , identi-ficada con una sucesion de Cauchy en M a traves de i, converge a la clase deequivalencia que ella misma determina.

En particular vemos que todo elemento de M es el lımite de una sucesionen i[M ], luego i[M ] es denso en M , y toda sucesion de Cauchy en i[M ] es dela forma i(xn)n∈ω, para una unica sucesion de Cauchy xnn∈ω en M , luegoacabamos de ver que converge en M , luego el teorema 7.27 nos da que M es unespacio metrico completo.

El unico problema de esta demostracion es que hemos supuesto que el cuerpoR es completo, luego en principio no vale cuando R = Q, por ejemplo.

La complecion de un cuerpo metrico Volvamos ahora al caso generalen que R es un cuerpo ordenado arquimediano no necesariamente completo yveamos que sucede en el caso en que partimos de un cuerpo metrico K.

Observamos entonces que el conjunto CK de las sucesiones de Cauchy en Ktiene estructura de anillo con la suma y el producto dadas por

xnn∈ω + ynn∈ω = xn + ynn∈ω, xnn∈ω · ynn∈ω = xnynn∈ω.

Aquı usamos que la suma y el producto de sucesiones de Cauchy es una sucesionde Cauchy.

Por otra parte, el conjunto IK de las sucesiones convergentes a 0 es un idealde CK , pues ciertamente contiene a la sucesion nula (que es el neutro de CK),la suma de sucesiones convergentes a 0 converge a 0 + 0 = 0 y si xnn∈ω ∈ CK

e ynn∈ω ∈ IK , entonces xnynn∈ω ∈ IK , porque xnn∈ω esta acotada porser de Cauchy, y basta aplicar el teorema 7.28.

Ahora observamos que la relacion de equivalencia que hemos definido en CK

es la dada por

xnn∈ω ∼ ynn∈ω ↔ lımn

(xn − yn) = 0 ↔ xnn∈ω − ynn∈ω ∈ IK ,

es decir, se trata de la congruencia modulo IK definida en 1.31, luego, segun elteorema 1.32, sabemos que K = CK/IK tiene estructura de anillo, de modo quesi tenemos dos clases α = [xnn∈ω], β = [ynn∈ω], entonces

α+ β = [xn + ynn∈ω], αβ = [xnynn∈ω].

Page 226: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

216 Capıtulo 7. El sistema numerico

Los neutros 0 y 1 de K son las clases de las sucesiones constantes correspon-dientes, es decir, i(0) e i(1).

Veamos que K es un cuerpo. Para ello tomamos un α ∈ K, α 6= 0. Estoquiere decir que α = [xnn∈ω], donde la sucesion xnn∈ω es de Cauchy en K,pero no converge a 0. Por el teorema 7.29 sabemos que la sucesion 1/xnn∈ω

(definida como 0 cuando xn = 0, cosa que solo puede suceder en un numerofinito de casos) es de Cauchy, luego define un β ∈ K, de modo que αβ es laclase de equivalencia de una sucesion que vale 1 salvo a lo sumo en un numerofinito de casos. Es claro entonces que αβ = 1, luego α tiene inverso y K es uncuerpo.

Se comprueba trivialmente que la aplicacion i : K −→ K es un monomor-fismo de cuerpos.

Nuevamente, si suponemos que el cuerpo R es completo, podemos convertira K en un cuerpo metrico. Por el caso general en que M era un espacio metricoarbitrario, sabemos que si xnn∈ω es una sucesion de Cauchy en M entoncesla sucesion |xn|n∈ω es de Cauchy en R (pues |xn| = d(xn, 0)), luego podemosdefinir |[xnn∈ω]| = lım

n|xn|, y ya hemos visto que la definicion es correcta

en el sentido de que no depende de la eleccion de la sucesion en la clase deequivalencia.

Ahora podemos probar que | | : K −→ R es un valor absoluto en K. Porejemplo, si α = [xn]n∈ω, β = [yn]n∈ω, entonces |xn +yn| ≤ |xn|+ |yn|, luego|xn| + |yn| − |xn + yn| ≥ 0 y por 7.12 resulta que |α| + |β| − |α + β| ≥ 0, luegotenemos la desigualdad triangular. Por otra parte,

|αβ| = lımn

|xnyn| = lımn

|xn||yn| = (lımn

|xn|)(lımn

|yn|) = |α||β|.

La distancia en K definida a partir del valor absoluto es la misma que yatenıamos definida al considerar a K como un mero espacio metrico, luego yasabemos que K es un cuerpo metrico completo.

La complecion de un cuerpo ordenado El problema sigue siendo que paradefinir el valor absoluto en K hemos tenido que suponer que R es completo.Consideremos ahora el caso de un cuerpo ordenado arquimediano K y vamos aprobar que K puede convertirse en un cuerpo ordenado completo sin suponerque R es completo. Sabemos que K tiene estructura de cuerpo (pues en estaparte no hemos supuesto que R fuera completo).

Para definir un orden en K diremos que α ∈ K es positivo si α = [xnn∈ω]y existe un c ∈ K, c > 0 y un m ∈ ω de modo que

n ≥ m xn ≥ c.

Esta propiedad no depende de la sucesion elegida en α, pues si α = [ynn∈ω],entonces, para m es suficientemente grande, tenemos xn ≥ c y |xn − yn| < c/2,y entonces tiene que ser yn ≥ c/2, pues si fuera yn < c/2 < c ≤ xn, tendrıamosque |xn − yn| = xn − yn ≥ c− c/2 = c/2.

Page 227: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.4. La construccion de R 217

Es trivial que la suma y el producto de elementos positivos es positiva.Ademas, todo α ∈ K se encuentra en uno y solo uno de los tres casos siguientes:α es positivo, α = 0 o bien −α es positivo.

En efecto, α = 0 no es positivo, porque α = [0n∈ω] y la sucesion nula nocumple la definicion.

Si α 6= 0, entonces α = [xnn∈ω] (y −α = [−xnn∈ω]) donde, por 7.29,existe un c ∈ K, c > 0 y un m ∈ ω, de modo que si n ≥ m se cumple |xn| ≥ c,es decir, xn ≥ c > 0, o bien xn ≤ −c < 0.

Si se da el primer caso para todo n suficientemente grande, entonces α espositivo y −α no lo es. Si se da el segundo caso para todo n suficientementegrande entonces −α es positivo y α no lo es. Solo falta probar que no puedendarse los dos casos para n grande, es decir, que no puede ocurrir que

m ∈ ω∨

nn′ ∈ ω(n, n′ ≥ m ∧ xn ≥ c ∧ xn′ ≤ −c).

Si ocurriera esto, entonces |xn − xn′ | ≥ 2c y no se cumplirıa la definicion desucesion de Cauchy para ǫ = 2c.

Por lo tanto, si definimos en K la relacion dada por

α < β ↔ β − α es positivo,

tenemos que se trata de una relacion de orden estricto, pues no puede sucederque β−α y α−β sean ambos positivos y si β−α y γ−β son positivos, tambienlo es la suma γ − α, lo que nos da la transitividad. Ademas es una relacion deorden total, pues o bien α− β es positivo, o bien lo es β − α, o bien α− β = 0,es decir, α < β ∨ β < α ∨ α = β.

Mas aun, K cumple las dos propiedades de la definicion de cuerpo ordenado,pues si α ≤ β, entonces β − α es positivo o nulo, luego lo mismo vale para(β + γ) − (α + γ), luego α + γ ≤ β + γ, y si α, β ≥ 0, ambos son positivos onulos, luego lo mismo vale para αβ ≥ 0.

Ademas, la aplicacion i : K −→ K conserva el orden, pues si x < y, esclaro que la clase de la sucesion constante y − xn∈ω es positiva, es decir, quei(y) − i(x) es positivo y, por consiguiente, i(x) < i(y).

Ası pues, K es un cuerpo ordenado que tiene un subcuerpo i[K] isomorfo a Kcomo cuerpo ordenado. Ademas, K es arquimediano, pues si α = [xnn∈ω] ∈K, la sucesion [xnn∈ω esta acotada por ser de Cauchy, y como K es arquime-diano, podemos tomar como cota un numero natural n, de modo que α < i(n).Esto prueba que N no esta acotado en K. Veamos ahora que si α = [xnn∈ω],entonces lım

ni(xn) = α.

En efecto, dado ǫ > 0 (ahora en K, porque queremos probar una convergen-cia en K), tenemos que ǫ = [en]n∈ω de modo que existe un c > 0 en K y unm ∈ ω de modo que

n ≥ m en ≥ c.Cambiando m por otro mayor podemos suponer que si n, n′ ≥ m, entonces

|xn − xn′ | < c/2. Ası −c/2 < xn − xn′ < c/2, luego

en′ − xn + xn′ > c− c/2 = c/2.

Page 228: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

218 Capıtulo 7. El sistema numerico

Por lo tanto, ǫ − i(xn) + α = [en′ − xn + xn′n′∈ω] es positivo, luego con-cluimos que i(xn) − α < ǫ.

Similarmente, xn − xn′ + en′ > c − c/2 = c/2, por lo que i(xn) − α + ǫ espositivo, luego i(xn)−α > −ǫ. En total tenemos que −ǫ < i(xn)−α < ǫ, luego|i(xn) − α| < ǫ (siempre que n ≥ m), luego se cumple la definicion de lımite.

La conclusion, como en el caso general para espacios metricos, es que i[K]es denso en K, que toda sucesion de Cauchy en i[K] converge en K y que K esun cuerpo ordenado completo por el teorema 7.27.

A partir de aquı ya podemos recoger los frutos de todo el desarrollo quehemos realizado:

Definicion 7.31 Llamaremos cuerpo de los numeros reales a la complecionR = Q del cuerpo Q de los numeros racionales. Hemos demostrado que es uncuerpo ordenado completo y, por 7.26 sabemos que es unico salvo isomorfismo,es decir, que todo cuerpo ordenado completo es isomorfo a R.

Tambien sabemos que existe un monomorfismo de cuerpos i : Q −→ R queconserva el orden, por lo que en lo sucesivo identificaremos a Q con i[Q], demodo que podemos considerar que N ⊂ Z ⊂ Q ⊂ R.

Como Q es denso en R (lo cual, segun 7.14 equivale a que entre dos numerosreales hay siempre un numero racional), por 7.23 sabemos que para cada numeroreal α ≥ 0 existe un unico β ≥ 0 tal que β2 = α. Representaremos a dicho βcon la notacion

√α y diremos que es la raız cuadrada (positiva) de α (mientras

que −√α es la raız cuadrada negativa de α).

Cada α > 0 tiene exactamente dos raıces cuadradas en R (es decir, que haydos numeros β que cumplen β2 = α, pues si

0 = β2 − α = β2 −√α 2 = (β −

√α)(β +

√α),

necesariamente β −√α = 0 o bien β +

√α = 0, luego β = ±√

α.

Por el teorema 7.21 sabemos tambien que todo subconjunto de R no vacıoy acotado superiormente tiene supremo.

Por ultimo, si R es cualquier cuerpo ordenado arquimediano, hemos probadoque su complecionR es un cuerpo ordenado completo, luego tiene que ser R ∼= R,y entonces R resulta ser isomorfo a un subcuerpo de R. Esto implica que noperdemos generalidad si consideramos unicamente distancias y valores absolutosde cuerpos metricos con valores en R. Con este convenio adicional, los resultadosque hemos obtenido nos permiten concluir:

Teorema 7.32 Si M es un espacio metrico,11 entonces su complecion M es unespacio metrico completo tal que existe una inmersion isometrica i : M −→ Mde M en un subconjunto denso de M (la cual nos permite considerar M ⊂M) y

11Hay que suponer que M es bien ordenable para no necesitar el axioma de eleccion (nu-merable).

Page 229: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.4. La construccion de R 219

toda inmersion isometrica f : M −→ N de M en un cuerpo metrico completo Nse extiende a una inmersion isometrica F : M −→M , que sera una isometrıa sif [M ] es denso en N . Lo mismo es valido para cuerpos metricos e inmersionesisometricas de cuerpos metricos.

Podemos parafrasear este teorema diciendo que la complecion de un espaciometrico (resp. de un cuerpo metrico) es el menor espacio metrico (resp. cuerpometrico) completo que lo contiene.

Volviendo a R, podemos refinar el teorema 7.21:

Teorema 7.33 (de los intervalos encajados de Cantor) Dadas dos suce-siones ann∈ω y bnn∈ω de numeros reales tales que, para todo ındice n, secumple an ≤ an+1 ≤ bn+1 ≤ bn, existe un l ∈ R tal que

n ∈ ω an ≤ l ≤ bn. Siademas y lım

n(bn − an) = 0, dicho l es unico.

Demostracion: El conjunto A = an | n ∈ ω es no vacıo y esta acotadosuperiormente por cualquier bn, luego tiene supremo l, de modo que an ≤ l ≤ bn.Si existe otro l′ que cumple la condicion, como es cota superior de A, tiene que serl ≤ l′, pero si fuera l 6= l′ entonces tomamos ǫ = l′− l > 0 y

n ∈ ω bn−an ≥ ǫ,luego no se cumple lım

n(bn − an) = 0.

Los elementos de R \ Q se llaman numeros irracionales, pero todavıa nohemos demostrado que existan. El teorema siguiente lo prueba:

Teorema 7.34 R = 2ℵ0 .

Demostracion: Observemos que si α < β son dos numeros reales, entonces

α <2α+ β

3<α+ 2β

3< β,

y la distancia de cada uno de estos numeros al siguiente es (β − α)/3. SeaP = (α, β) ∈ R2 | α < β. Para cada (α, β) ∈ P , definimos

(α, β)0 = (α, (2α + β)/3), (α, β)1 = ((α+ 2β)/3, β).

Fijemos (a, b) ∈ P y definamos por recurrencia una sucesion de funcionesfn : n2 −→ P . Para n = 0 tenemos que 02 = ∅ y definimos f0(∅) = (a, b).Supuesta definida fn, definimos fn+1(s) = fn(s|n)s(n).

Por ejemplo, si partimos de (a, b) = (0, 1) y representamos las sucesionesfinitas de ceros y unos enumerando las imagenes, de modo que

1101 ≡ (0, 1), (1, 1), (2, 0), (3, 1) ∈ 42,

tenemos quef0(∅) = (0, 1), f1(1) = (0, 1)1 = (2/3, 1),

f2(11) = f1(1)1 = (2/3, 1)1 = (8/9, 1),

f3(110) = f2(11)0 = (8/9, 1)0 = (8/9, 25/27),

f4(1101) = f3(110)1 = (8/9, 25/27)1 = (74/81, 25/27).

Page 230: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

220 Capıtulo 7. El sistema numerico

En general, para cada s ∈ n2, llamaremos as y bs a los numeros reales quecumplen fn(s) = (as, bs). En estos terminos, por ejemplo, hemos visto que, sipartimos de (a, b) = (0, 1), se cumple a110 = 8/9, b110 = 25/27.

Si s ∈ ω2, una simple induccion demuestra que

a ≤ as|n ≤ as|n+1< bs|n+1

≤ bs|n ≤ b,

ası como que bs|n− as|n = (b − a)/3n. Por lo tanto lımn

(bs|n − as|n) = 0 (basta

observar que, si ǫ > 0, por la propiedad arquimediana existe un numero naturaltal que (b− a)/ǫ < n ≤ 3n, luego (b− a)/3n < ǫ).

Por el teorema de los intervalos encajados, existe un unico numero real, quepodemos llamar αs, tal que

n ∈ ω as|n ≤ αs ≤ bs|n . Tenemos, por lo tanto,una aplicacion f : ω2 −→ R dada por f(s) = αs. Vamos a probar que esinyectiva.

Si s 6= s′ son dos sucesiones de ω2, sea n ∈ ω el mınimo natural talque s(n) 6= s′(n). No perdemos generalidad si suponemos que s(n) = 0 ys′(n) = 1. Entonces s|n = s′|n, luego (as|n , bs|n) = (as′|n , bs′|n) = (a, b),pero, por construccion (as|n+1

, bs|n+1) = fn+1(s|n+1) = (a, b)0, mientras que

(as′|n+1, bs′|n+1

) = (a, b)1, y entonces

a ≤ αs ≤2a+ b

3<a+ 2b

3≤ αs′ ≤ b,

lo que prueba que αs 6= αs′ .

Como f es inyectiva, concluimos que R ≥ ω2 = 2ℵ0 . Para la desigualdadopuesta consideramos la aplicacion g : R −→ PQ dada por

g(α) = q ∈ Q | q ≤ α.

Tambien es inyectiva, pues si α < β, hemos visto que existe un q ∈ Q talque α < q < β, luego q ∈ g(β) \ g(α), luego g(α) 6= g(β). Esto prueba que

R ≤ PQ = 2ℵ0 .

Ası pues, existen mas numeros irracionales que racionales o, dicho de otromodo, Q esta “lleno de agujeros”. Mas precisamente, el teorema anterior pruebaque si a < b son dos numeros reales cualesquiera, el conjunto x ∈ R | a < x < btiene cardinal 2ℵ0 , luego contiene numeros irracionales. Ası pues, entre dosnumeros reales cualesquiera existen numeros irracionales o, lo que es lo mismo,R \Q es denso en R.

7.5 Conjuntos ordenados completos

En 7.22 hemos definido el concepto de conjunto ordenado completo, aunquehasta ahora hemos estudiado unicamente los cuerpos ordenados completos eneste sentido. Nos ocupamos ahora de los conjuntos ordenados completos en ge-neral. Seguimos trabajando en NBG∗ + AI + AP. Conviene introducir algunosconceptos adicionales:

Page 231: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.5. Conjuntos ordenados completos 221

Definicion 7.35 Sea X un conjunto totalmente ordenado. Llamaremos inter-valos en X a los conjuntos siguientes, para todo a, b ∈ X :

]a, b[ = x ∈ X | a < x < b, [a, b] = x ∈ X | a ≤ x ≤ b,]a, b] = x ∈ X | a < x ≤ b, [a, b[ = x ∈ X | a ≤ x < b,

]−∞, b[ = x ∈ X | x < b, ]a,+∞[ = x ∈ X | a < x,]−∞, b] = x ∈ X | x ≤ b, [a,+∞[ = x ∈ X | a ≤ x,

]−∞,+∞[ = X.

El elemento a (en los intervalos en los que interviene) se llama extremo inferiordel intervalo, mientras que b (cuando procede) es el extremo superior. Losintervalos de la forma ]a, b[, incluso si a o b es infinito, se llaman intervalosabiertos, mientras que los de tipo [a, b] se llaman intervalos cerrados.

Observemos que si X tiene maximo M , entonces

]a,+∞[ = ]a,M ] , [a,+∞[ = [a,M ] ,

y si tiene mınimo m entonces

]−∞, b[ = [m, b[ , ]−∞, b] = [m, b] ,

y si tiene maximo y mınimo entonces ]−∞,+∞[ = [m,M ], por lo que los in-tervalos con extremos infinitos solo son relevantes en ausencia de maximo ode mınimo. En tal caso son conjuntos no acotados, y se llaman intervalos noacotados.

Teorema 7.36 Si X es un conjunto totalmente ordenado, las afirmaciones si-guientes son equivalentes:

a) Todo subconjunto de X no vacıo y acotado superiormente tiene supremo.

b) Todo subconjunto de X no vacıo y acotado inferiormente tiene ınfimo.

c) Un conjunto I ⊂ X es un intervalo si y solo si

ab ∈ I∧

c ∈ X(a < c < b→ c ∈ I).

d) Si X = A ∪ B de modo que A 6= ∅ 6= B y todo elemento de A es menorque todo elemento de B, entonces, o bien A tiene maximo, o bien B tienemınimo.

Demostracion: a) ⇒ b) Sea B un subconjunto de X no vacıo y acotadoinferiormente. Sea A el conjunto de las cotas inferiores de A. Como B estaacotado, A no es vacıo, y como B no es vacıo, cualquiera de sus elementos esuna cota superior de A, luego A tiene supremo i, que es el ınfimo de B, puestodo elemento b ∈ B es una cota superior de A, por lo que i ≤ b, y si c es unacota inferior de B, entonces c ∈ A, luego c ≤ i.

Page 232: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

222 Capıtulo 7. El sistema numerico

Analogamente se prueba que b) ⇒ a). Veamos que a) y b) implican c). Esinmediato que todo intervalo tiene la propiedad indicada. Se trata de probarel recıproco. Supongamos, pues que I cumple la condicion. Si I = ∅, entoncesI = ]−∞,+∞[ si X = ∅, o bien I = ]a, a[ si existe un a ∈ X , luego es unintervalo.

Supongamos, pues, que I 6= ∅. Si I no esta acotado ni superior ni inferior-mente, entonces I = ]−∞,+∞[, pues, para todo x ∈ X , como no es ni una cotasuperior ni una cota inferior de I, existen a, b ∈ I tales que a < x < b, luegox ∈ I.

Si I tiene cota superior pero no inferior, tomamos b = sup I y observamosque ]−∞, b[ ⊂ I ⊂ ]−∞, b], con lo que I sera uno de los dos intervalos segun sib /∈ I o bien b ∈ I.

En efecto, si x ∈ ]−∞, b[, como x no es cota inferior de I existe un a ∈ Ital que a < x y, como b es el supremo de I, no puede ser que x sea una cotasuperior, luego existe un c ∈ I tal que a < x < c, luego x ∈ I. La otra inclusiones trivial, puesto que b es una cota superior.

Los casos restantes (combinaciones de que I tenga o no tenga cota superiore inferior) se tratan analogamente.

c) ⇒ d) Si tenemos u < x < v con u, v ∈ A y x ∈ X , no puede ser x ∈ B,puesto que tendrıa que ser mayor que v, luego tiene que ser x ∈ A, luego Aes un intervalo, y analogamente se razona que B lo es. Es claro que la unicaopcion para A es ser un intervalo de la forma A = ]−∞, c[ o bien A = ]−∞, c],en cuyo caso, B tiene que ser respectivamente de la forma B = [c,+∞[ o bienB = ]c,+∞[. En el primer caso B tiene mınimo, y en el segundo A tienemaximo.

d) ⇒ a) Sea C ⊂ X un conjunto no vacıo y acotado superiormente. Llame-mos A al conjunto de elementos de X que no son cotas superiores de C y B alconjunto de los elementos que sı que lo son. Obviamente X = A∪B y si a ∈ Ay b ∈ B, tenemos que A no es una cota superior de C, luego existe un c ∈ Ctal que a < c y, como b es cota superior, a < c ≤ b. Por d) existe s ∈ X que esel maximo de A o bien el mınimo de B. Si es el mınimo de B, entonces es lamenor cota superior de C, luego s es el supremo de C. Si s es el maximo de A,entonces existe un c ∈ C tal que s < c, pero c ∈ B, luego c es una cota superiorde C, luego c es el maximo, y en particular el supremo, de C.

Las cuatro propiedades del teorema anterior equivalen al concepto de com-pletitud definido en 7.22.

Notemos que si X tiene maximo y mınimo la completitud equivale a que todosubconjunto de X tenga supremo e ınfimo, pues todo conjunto esta acotadosuperior e inferiormente y ∅ tiene al mınimo por supremo y al maximo porınfimo.

Es evidente que todo ordinal α es completo, pues si A ⊂ α esta acotadosuperiormente por β < α, entonces su supremo es

⋃A ≤ β < α.

Page 233: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.5. Conjuntos ordenados completos 223

Definicion 7.37 Llamaremos precontinuos a los conjuntos totalmente ordena-dos densos en sı mismos. Un continuo es un precontinuo completo.

Si X es un precontinuo, diremos que un subconjunto D ⊂ X es denso si

xy ∈ X(x < y →∨

d ∈ D (x < d < y)).

Una aplicacion f : X −→ Y entre dos precontinuos es una inmersion densasi es estrictamente monotona creciente, es decir, si

uv ∈ X (u < v → f(u) < f(v)),

y f [X ] es denso en Y .

Observacion Si X es un continuo y x ∈ X no es maximo ni mınimo de Xentonces X \ x deja de ser un continuo, pues el conjunto ]−∞, x[ no es vacıo(porque x no es mınimo de X) y esta acotado superiormente (porque x no es elmaximo de X), pero no tiene supremo en X \ x.

Por el contrario, es pura rutina comprobar que si a un continuo le quitamossu mınimo o su maximo, el conjunto resultante sigue siendo un continuo, peroahora sin mınimo o sin maximo, mientras que si a un continuo sin mınimo o sinmaximo le anadimos un elemento nuevo y extendemos la relacion de orden demodo que se convierta en el mınimo o el maximo, el conjunto resultante siguesiendo un continuo.

Esto se traduce en que los continuos “vienen en grupos de cuatro”, en elsentido de que si a un continuo X le quitamos su mınimo y su maximo en casode que los tenga y llamamos Y al continuo resultante, entonces X es semejantea uno de los cuatro continuos

Y, m ∪ Y, Y ∪ M, m ∪ Y ∪ M,

donde m, M son conjuntos que no pertenecen a Y y sobre los que la relacion deorden se extiende de modo que m sea el mınimo y M sea el maximo.

Probamos ahora un analogo al teorema 7.25 para continuos:

Teorema 7.38 Sean X e Y dos continuos de modo que X tiene maximo (resp.mınimo) si y solo si Y tambien lo tiene, sea D ⊂ X un conjunto denso ysea f : D −→ Y una inmersion densa. Entonces existe una unica semejanzaF : X −→ Y que extiende a f .

Demostracion: Dado x ∈ X , consideramos el conjunto Dx = ]−∞, x[∩D.Entonces x = supDx, pues ciertamente x es una cota superior de Dx y si y < x,existe un d ∈ D tal que y < d < x, luego d ∈ Dx, luego y no es cota superior deDx, luego x es la menor cota superior de Dx.

Si x no es el maximo de X , entonces existe un d ∈ D tal que d > x, con loque d es una cota superior de Dx y f(d) es una cota superior de f [Dx]. Si x es

Page 234: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

224 Capıtulo 7. El sistema numerico

el maximo de X , entonces Y tambien tiene maximo por hipotesis, luego f [Dx]esta igualmente acotado en Y (por su maximo).

Si x no es el mınimo de Dx, entonces existe un d ∈ D tal que d < x, luegoDx 6= ∅ y f [Dx] 6= ∅, luego la completitud de Y implica que f [Dx] tienesupremo. Si x es el mınimo de X entonces Dx = ∅ y f [Dx] = ∅, pero porhipotesis Y tiene mınimo, y dicho mınimo es el supremo de ∅.

Ası pues, podemos definir F : X −→ Y mediante F (x) = sup f [Dx]. Veamosque F es una inmersion. Si x < x′, existen d, d′ ∈ D tal que x < d < d′ < x′.Entonces d es una cota superior de Dx y d′ ∈ Dx′ , luego f(d) es una cotasuperior de f [Dx] y f(d′) ∈ f [Dx′], luego F (x) ≤ f(d) < f(d′) ≤ F (x′).

Se cumple que F |D = f , pues si d ∈ D, entonces f(d) es una cota superiorde f [Dd], luego F (d) ≤ f(d). Si la desigualdad fuera estricta, como f [D] esdenso existirıa un d′ en D tal que F (d) < f(d′) < f(d), pero entonces d′ < d,luego d′ ∈ Dd y f(d′) ≤ F (d), contradiccion.

Para probar que F es suprayectiva (y, por consiguiente, una semejanza) bastaobservar que podemos definir igualmente F ∗ : Y −→ X usando la inmersiondensa f−1 : f [D] −→ X , pero entonces H = F ∗ F : Y −→ Y es estrictamentecreciente y restringida a f [D] es la identidad. Esto implica queH es la identidad,pues si y ∈ Y , entonces no puede ser y < H(y), porque existirıa un d ∈ f [D]tal que y < d < H(y), luego H(y) < H(d) = d, contradiccion, e igualmente siH(y) < y. Esto implica que F es suprayectiva.

La unicidad es clara, pues si G : X −→ Y es una semejanza tal que G|D = f ,entonces necesariamente

G(x) = G(supDx) = supG[Dx] = sup f [Dx] = F (x).

Siguiendo la analogıa con los espacios metricos, vamos a ver que todo pre-continuo se puede sumergir de forma unica salvo semejanza como subconjuntodenso de un continuo:

Definicion 7.39 Sea X un precontinuo sin maximo ni mınimo. Una seccioninicial abierta deX es un conjunto α ⊂ X que cumpla las propiedades siguientes:

a)∧

x ∈ X∧

a ∈ α(x ≤ a→ x ∈ α).

b) α no tiene maximo elemento.

Llamaremos C(X) al conjunto12 de todas las secciones iniciales abiertas de X ,y la llamaremos complecion fuerte de X . Si definimos −∞ = ∅ y +∞ = X ,es claro que ±∞ ∈ C(X). Definimos la complecion de X como el conjuntoC(X) = C(X) \ −∞,+∞.

12Notemos que es un conjunto porque C(X) ⊂ PX, y usamos el axioma de partes. Noobstante, es interesante observar que sin suponer AP podemos trabajar igualmente con laclase C(X), aunque no podamos probar que es un conjunto.

Page 235: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.5. Conjuntos ordenados completos 225

Observemos que si α, β ∈ C(X), entonces α ⊂ β ∨ β ⊂ α. En efecto, si nose cumple β ⊂ α es que existe un b ∈ β \ α. Dado a ∈ α, no puede ser b ≤ a,ya que entonces b ∈ α por la primera propiedad de la definicion anterior. Porconsiguiente, a < b, pero entonces a ∈ β, con lo que hemos probado que α ⊂ β.

En lo sucesivo consideraremos siempre a la complecion C(X) como conjuntototalmente ordenado con la relacion de inclusion, de modo que si α, β ∈ C(X),escribiremos α ≤ β en lugar de α ⊂ β. Claramente, −∞ y +∞ son el mınimoy el maximo de C(X), respectivamente.

Pero sucede que C(X) es trivialmente completo, pues si A ⊂ C(X), entoncesse comprueba inmediatamente que α =

⋃A es una seccion inicial abierta de X

y obviamente es la menor que contiene a todos elementos de A, luego se tratade su supremo.

Consideramos la aplicacion i : X −→ C(X) dada por i(a) = ]−∞, a[.

Observemos que ciertamente i(a) ∈ C(X), pues cumple trivialmente la pri-mera condicion de la definicion de seccion inicial abierta y la segunda la cumpleporque si x ∈ i(a), como X es denso en sı mismo existe un y ∈ X tal quex < y < a, luego y ∈ i(a), luego i(a) no tiene maximo. Ademas, como X notiene mınimo existe un x ∈ i(a) 6= −∞, y como no tiene maximo existe unx ∈ X tal que a < x, luego x /∈ i(a) 6= +∞.

Tambien es claro que i es estrictamente monotona creciente, es decir, que∧

xy ∈ X (x < y → i(x) < i(y)).

La desigualdad i(x) ≤ i(y) es trivial. Para ver que es estricta usamos queX es denso en sı mismo, con lo que existe un z tal que x < z < y, y entoncesz ∈ i(y) \ i(x).

De hecho, i es una inmersion densa, ya que si α < β son dos elementos deC(X), entonces existe un b ∈ β \α. Como b no es maximo de β, existe un b′ ∈ βtal que b < b′, y podemos tomar c ∈ X tal que b < x < b′. Entonces es claroque A ≤ i(b) < i(x) < i(b′) ≤ β.

Notemos que esto implica en particular que C(X) es denso en sı mismo.Ademas no tiene maximo ni mınimo, pues si α ∈ C(X), entonces α 6= X , luegoexiste un u ∈ X \ α, luego α ≤ i(u) y, como u no es el maximo de X , existev ∈ X tal que u < v y α ≤ i(u) < i(v), luego α no es el maximo de C(X). Porotra parte, como α 6= ∅, existe v ∈ α y existe u < v, luego i(u) < i(v) ≤ α,luego α no es el mınimo de C(X). Esto implica a su vez que C(X) (que resultade anadir a C(X) un maximo y un mınimo) tambien en denso en sı mismo.

Recapitulando:

Teorema 7.40 Sea X un precontinuo sin maximo ni mınimo. Entonces C(X)es un continuo sin maximo ni mınimo, i : X −→ C(X) es una inmersion densay si Y es un continuo sin maximo ni mınimo tal que existe una inmersiondensa j : X −→ Y , entonces existe una unica semejanza f : C(X) −→ Y talque i f = j.

Page 236: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

226 Capıtulo 7. El sistema numerico

Demostracion: Acabamos de ver que C(X) es un continuo sin maximo nimınimo tal que i es una inmersion densa. Si j : X −→ Y es una inmersion densa,entonces i−1 j : i[X ] −→ j[X ] es una semejanza a la que podemos aplicar elteorema 7.38, que nos da una unica semejanza f que extiende a i−1 j. Es facilver que es tambien la unica que cumple i f = j.

Nota El teorema anterior admite varias versiones similares. Por ejemplo,podemos cambiar C(X) por C(X), con el unico cambio de que ahora C(X)tiene maximo y mınimo y hay que exigir lo mismo de Y .

Si X tiene maximo y mınimo, definimos C(X) = C(X ′), donde X ′ es elprecontinuo que resulta de eliminar el maximo y el mınimo de X . Entoncesla inmersion densa i : X ′ −→ C(X ′) = C(X) dada por el teorema anterior seextiende trivialmente a una inmersion densa i : X −→ C(X) para la que valeigualmente la condicion de unicidad.

Por ultimo, se pueden considerar los casos intermedios para continuos conmaximo y sin mınimo o viceversa.

En particular, puesto que Q es un precontinuo sin maximo ni mınimo yj : Q −→ R es una inmersion densa, el teorema anterior nos da la semejanza

R ∼= C(Q).

En realidad es facil obtener explıcitamente la semejanza f : R −→ C(Q), ya queno es sino la dada por

f(α) = q ∈ Q | q < α.

Teorema 7.41 Existen unas unicas operaciones +, · : C(Q) × C(Q) −→ C(Q)que extienden a la suma y el producto en Q y que convierten a C(Q) en uncuerpo ordenado.

Demostracion: En el enunciado hay que entender que estamos identi-ficando a Q con su imagen en C(Q), pero, por claridad, en esta prueba noharemos tal identificacion: llamamos Q al cuerpo definido en la seccion 7.2, demodo que tenemos dos inmersiones densas:

Rf

// C(Q)

Q

i1

OO

i2

==④④④④④④④④

de modo que el diagrama es conmutativo, es decir, i1 f = i2, que es lo mismoque decir que la semejanza f deja invariantes a los numeros racionales cuandolos identificamos simultaneamente con i1[Q] e i2[Q]. Notemos que sin las iden-tificaciones es f(α) = q ∈ Q | i1(q) < α. Es claro entonces que si definimosen C(Q)

α+ β = f(f−1(α) + f−1(β)), αβ = f(f−1(α)f−1(β))

Page 237: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.5. Conjuntos ordenados completos 227

tenemos una suma y un producto en C(Q) que convierte a f en un isomorfismode cuerpos ordenados y a i2 en una inmersion densa de cuerpos ordenados.Por lo tanto, tenemos probada la existencia que afirma el enunciado, y falta launicidad. Para probarla observamos lo siguiente:

Sea K un cuerpo ordenado que contenga a Q como subcuerpo denso.Una sucesion xnn∈ω en K converge a x ∈ K si y solo si

rs ∈ Q(r < x < s→∨

m ∈ ω∧

n ≥ m r < xn < s).

En efecto, si se da la convergencia, tomamos ǫ = mıns− x, x− r > 0, conlo que existe un m tal que si n ≥ m entonces |xn−x| < ǫ, luego −ǫ < xn−x < ǫ,luego r − x ≤ −ǫ < xn < x < ǫ ≤ s− x, luego r < xn < s.

Recıprocamente, si se da esta condicion, dado ǫ > 0, podemos tomar r, s ∈ Qtales que x− ǫ < r < x < s < x+ ǫ y existe un m ∈ ω tal que si n ≥ m entoncesr < xn < s, luego x− ǫ < xn < x+ ǫ, luego |xn − x| < ǫ.

El interes de esta caracterizacion es que en ella no intervienen ni la suma niel producto. Solo la relacion de orden. Por lo tanto, podemos concluir que sitenemos dos estructuras de cuerpo ordenado en C(Q) (con la relacion de ordende C(Q) en comun), una sucesion converge respecto de una de ellas si y solo silo hace respecto de la otra, y en ambos casos al mismo lımite.

Por lo tanto, dados α, β ∈ C(Q), existen sucesiones qnn∈ω, rnn∈ω en Qtales que

lımni2(qn) = α, lım

ni2(rn) = β

(en principio respecto de una estructura, luego tambien respecto de la otra). Elteorema 7.24 nos da que las sucesiones i2(qn)+ i2(rn)n∈ω y i2(qn)i2(rn)n∈ω

convergen a α + β y αβ respecto de ambas estructuras, es decir, que ambastienen la misma suma y el mismo producto, luego son la misma estructura.

Esto nos da una definicion alternativa de R:

Definicion 7.42 Llamaremos cuerpo de los numeros reales a la complecionR = C(Q) del cuerpo Q de los numeros racionales, considerado como cuerpoordenado con las unicas operaciones que extienden a las de Q segun el teoremaanterior.

Tecnicamente, no podemos llamar R a dos cosas a la vez,13 pero en lapractica es del todo irrelevante que adoptemos la definicion 7.31 o la anterior,pues si llamamos R1 al cuerpo ordenado definido en 7.31 y R2 al que acabamosde definir, sabemos que son isomorfos como cuerpos ordenados, luego tienenexactamente las mismas propiedades.

13La construccion de R mediante sucesiones se debe a Cantor, mientras que la construccionmediante secciones iniciales es esencialmente de Dedekind.

Page 238: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

228 Capıtulo 7. El sistema numerico

No obstante, en las pocas ocasiones en las que la estructura conjuntistade R pueda ser relevante, la definicion que hace a R = C(Q) es ligeramentemas practica, porque un subconjunto de Q es tecnicamente mas sencillo queuna clase de equivalencia de sucesiones de Cauchy en Q. Por ello, en lo sucesivonos quedaremos con esta ultima definicion. Naturalmente, todos los hechos quehemos demostrado para R con la definicion anterior siguen valiendo trivialmentecon la nueva definicion. De hecho, solo se apoyan en que R es un cuerpo ordenadocompleto.

Llamaremos R = C(Q) = −∞ ∪ R ∪ +∞, que es tambien un continuo.Notemos que los intervalos ]−∞, b[ y ]a,+∞[, considerados como subconjuntosde R coinciden con los intervalos de R considerados como intervalos acotadosen los que ±∞ son el maximo y el mınimo de R.

Nota Hemos probado la existencia de la suma y el producto en C(Q) a partirde la construccion de R mediante sucesiones de Cauchy, pero es posible definirlasdirectamente, haciendo

α+ β = supr + s | r, s ∈ Q ∧ r < α ∧ s < β,y αβ = suprs | r, s ∈ Q ∧ 0 < r < α ∧ 0 < s < β si α, β > 0.

Cuando los dos factores no son positivos hay que definir el producto mediantelas reglas de los signos:

αβ =

−((−α)β) si α < 0, β > 0,−(α(−β)) si α > 0, β < 0,(−α)(−β) si α < 0, β < 0.

(y αβ = 0 si uno de los factores es nulo). Las comprobaciones por este caminoson bastante mas tediosas que las que requiere la construccion mediante sucesio-nes de Cauchy. No obstante, desde un punto de vista conjuntista, tiene ciertasventajas. Ademas de que, como ya hemos comentado, R resulta ser estructural-mente mas sencillo, esta construccion permite definir de la clase de los numerosreales, con su suma, su producto y su relacion de orden, sin necesidad de su-poner AP, aunque sin este axioma no se puede probar que R sea un conjunto.

Ahora tenemos una caracterizacion de R como conjunto ordenado:

Teorema 7.43 Un conjunto ordenado es semejante a R si y solo si tiene laspropiedades siguientes:

a) Esta totalmente ordenado, no tiene maximo ni mınimo y es denso en sımismo.

b) Es completo.

c) Tiene un subconjunto denso numerable.

(En otras palabras, si y solo si es un continuo sin maximo ni mınimo y con unsubconjunto denso numerable.)

Page 239: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.6. Sumas infinitas 229

Demostracion: Trivialmente, todo conjunto ordenado semejante a R tieneestas caracterısticas, porque R las tiene. Recıprocamente, si X es un continuocon un subconjunto denso numerable D, es necesario que D sea un precontinuo,pues, por la propia densidad, entre dos puntos de D debe haber un tercer puntode D, y no puede tener ni maximo ni mınimo, pues por encima de un puntode D tiene que haber uno de X , y entre ambos tiene que haber otro de D (eigualmente para el caso del mınimo).

El teorema 7.9 nos da una semejanza f : Q −→ D, que es una inmersiondensa f : Q −→ X . El teorema anterior implica que i se extiende a unasemejanza F : C(Q) −→ X , luego X ∼= C(Q) = R.

Por ejemplo, si α < β son dos numeros reales, es facil ver que el intervalo]α, β[ cumple las condiciones del teorema anterior, por lo que ]α, β[ ∼= R.

7.6 Sumas infinitas

En cualquier anillo tenemos definidas las sumas de la forma∑

i∈I

ai, donde

I es un conjunto finito. Veamos ahora que podemos definir sumas infinitasde numeros reales. Si queremos que I sea un conjunto arbitrario necesitamosrestringirnos a sumandos positivos:

Definicion 7.44 Si aii∈I es una familia de numeros reales ai ≥ 0, definimos

i∈I

ai = sup∑i∈I0

ai | I0 ⊂ I finito.

Aquı hay que entender que el supremo es en R, de modo que puede ser +∞.

Notemos que, trivialmente, si J ⊂ I, se cumple que∑

i∈J

ai ≤∑

i∈I

ai. Tambien

es facil ver que si 0 ≤ ai ≤ bi entonces∑

i∈I

ai ≤∑

i∈I

bi.

Si I es finito, el hecho de que los ai sean positivos implica claramente que elconjunto

i∈I0

ai | I0 ⊂ I finito

alcanza su maximo cuando I0 = I, por lo que la suma que acabamos de definircoincide con la que ya tenıamos definida.

Si I = I1 ∪ I2 y la union es disjunta, se cumple la relacion

i∈I

ai =∑

i∈I1

ai +∑

i∈I2

ai,

donde hay que entender que una suma con un sumando infinito es, por definicion,infinita. En efecto, si alguno de los dos sumandos de la derecha es +∞, es claroque la suma de la izquierda tambien es infinita y se tiene la igualdad, ası que

Page 240: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

230 Capıtulo 7. El sistema numerico

suponemos que las dos sumas son finitas. Si I10 ⊂ I1, I20 ⊂ I2 son conjuntosfinitos, tenemos que

i∈I10

ai +∑

i∈I20

ai =∑

i∈I10∪I2

0

ai ≤∑

i∈I

ai,

luego∑

i∈I10

ai ≤∑

i∈I

ai −∑

i∈I20

ai, luego∑

i∈I1

ai ≤∑

i∈I

ai −∑

i∈I20

ai, luego

i∈I20

ai ≤∑

i∈I

ai −∑

i∈I1

ai,∑

i∈I2

ai ≤∑

i∈I

ai −∑

i∈I1

ai, y∑

i∈I1

ai +∑

i∈I2

ai ≤∑

i∈I

ai.

Por otra parte, si I0 ⊂ I es finito, entonces

i∈I0

ai =∑

i∈I0∩I1

ai +∑

i∈I0∩I2

ai ≤∑

i∈I1

ai +∑

i∈I2

ai,

luego∑

i∈I

ai ≤∑

i∈I1

ai+∑

i∈I2

ai y tenemos la igualdad. Mas en general, si I =⋃

j∈J

Ij

y la union es disjunta, entonces se cumple la asociatividad generalizada:

i∈I

ai =∑

j∈J

i∈Ij

ai,

donde nuevamente entendemos que un sumatorio con un sumando infinito esinfinito. En efecto, como antes podemos suponer que las sumas sobre los Ij sonfinitas. Si J0 ⊂ J es finito, una simple induccion sobre |J0| basada en el casoprobado anteriormente implica que

j∈J0

i∈Ij

ai =∑

i∈ ∪j∈J0

Ij

ai ≤∑

i∈I

ai,

luego∑

j∈J

i∈Ij

ai ≤∑

i∈I

ai. Recıprocamente, si I0 ⊂ I es finito, existe J0 ⊂ J

finito tal que I0 ⊂ ⋃

j∈J0

Ij , y ası

i∈I0

ai =∑

j∈J0

i∈Ij∩I0

ai ≤∑

j∈J0

i∈Ij

ai ≤∑

j∈J

i∈Ij

ai,

luego∑

i∈I0

ai ≤∑

j∈J

i∈Ij

ai y tenemos la igualdad.

Argumentos similares demuestran que, si a, b > 0,

i∈I

(aai + bbi) = a∑

i∈I

ai + b∑

i∈I

bi.

Sucede que el nivel de generalidad de esta definicion es en parte una meraapariencia:

Teorema 7.45 (AEN) Si aii∈I es una familia de numeros reales positivostal que

i∈I

ai < +∞, entonces el conjunto I∗ = i ∈ I | ai 6= 0 es numerable, y

i∈I

ai =∑

i∈I∗

ai.

Page 241: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.6. Sumas infinitas 231

Demostracion: Para cada i ∈ I∗ sea ni el menor numero natural no nulotal que ai > 1/ni. Sea f : I −→ N la aplicacion dada por f(i) = ni. EntoncesI∗ =

n∈N

f−1[n]. Basta probar que todos los conjuntos f−1[n] son finitos, pues

entonces I∗ es numerable.14 Supongamos que existe un n tal que f−1[n] esinfinito. Entonces, dado m ∈ N, existe I0 ⊂ f−1[n] tal que |I0| = mn, con loque

i∈I

ai ≥∑

i∈I0

ai ≥∑

i∈I0

1n = m,

luego la suma es infinita.

Dado ǫ > 0, existe I0 ⊂ I finito tal que∑

i∈I

ai − ǫ <∑

i∈I0

ai, pero, por las

propiedades de las sumas finitas, es claro que

i∈I

ai − ǫ <∑

i∈I0

ai =∑

i∈I0∩I∗

ai ≤∑

i∈I∗

ai ≤∑

i∈I

ai.

Ası pues, la distancia entre las sumas para I e I∗ es menor que cualquier ǫ > 0,luego es nula.

Por lo tanto, no perdemos generalidad si estudiamos unicamente sumas nu-merables. Cualquier resultado sobre ellas se extiende trivialmente a sumas ar-bitrarias mediante el teorema anterior. Cuando el conjunto de ındices estacontenido en N es costumbre usar notaciones como

∞∑

i=0

ai,∞∑

i=k

ai,∑

i≥k

ai,

con el sentido obvio, reducible trivialmente a la definicion que hemos dado.

Teorema 7.46 Si aii∈ω es una sucesion de numeros reales positivos,

∞∑

i=0

ai = lımn

n∑

i=0

ai.

Demostracion: Dado ǫ > 0, existe un I ⊂ ω finito tal que

∞∑

i=0

ai − ǫ <∑

i∈I

ai ≤∞∑

i=0

ai.

Sea m ∈ ω tal que I ⊂ m, de modo que, si n ≥ m, se cumple

∞∑

i=0

ai − ǫ <∑

i∈I

ai ≤n∑

i=0

ai ≤∞∑

i=0

ai.

El teorema 7.12 implica entonces que∞∑

i=0

ai − ǫ ≤ lımn

n∑

i=0

ai ≤∞∑

i=0

ai. Esto

significa que la distancia entre el lımite y la suma es menor que ǫ, para todoǫ > 0, luego es nula.

14Aquı usamos AEN, porque es necesario elegir una aplicacion de cada conjunto f−1[n] ensu cardinal para justificar que la union es numerable.

Page 242: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

232 Capıtulo 7. El sistema numerico

Notemos que la igualdad del teorema anterior puede tomarse como definicionde una suma infinita numerable, y en tal caso no necesitamos suponer que losterminos de la serie son positivos (aunque entonces el lımite puede no existir, yhay que distinguir entre series convergentes y divergentes y, en caso de conver-gencia, el valor de la suma puede depender del orden en que se enumeran losterminos). No obstante, no vamos a necesitar tales sumas.

Vamos a calcular algunas series infinitas. Para ello empezamos observando:

Teorema 7.47 Si 0 < r < 1, entonces lımn rn = 0.

Demostracion: Tenemos que 1/r > 1, luego 1/r = 1 + s, con s > 0. Esfacil ver15 que 1 + ns ≤ (1 + s)n, luego 1 + ns ≤ 1/rn. Dado ǫ > 0, podemostomar m ∈ ω tal que (1/ǫ − 1)/s < m, con lo que si n ≥ m se cumple que1/ǫ < 1 + ns ≤ 1/rn, luego rn < ǫ.

Teorema 7.48 Si 0 < r < 1, entonces∞∑

n=k

rn =rk

1 − r.

Demostracion: Una simple induccion prueba que, para m ≥ k,

m∑

n=k

rn =rk − rm+1

1 − r.

Si hacemos tener m a infinito, las propiedades de los lımites, junto con el teoremaanterior, implican trivialmente el resultado.

Teorema 7.49 Sea b ≥ 2 un numero natural. Entonces, cada numero realα ∈ [0, 1[ se expresa de forma unica como

α =∞∑

n=1

cnbn,

para cierta sucesion cn∞n=1 de numeros naturales menores que b que no sehaga constante igual a b− 1 a partir de un termino.

Demostracion: Observemos en primer lugar que, si k ≥ 1, por el teoremaanterior tenemos

∞∑

n=k

cnbn

≤∞∑

n=k

b− 1

bn= (b− 1)

b−k

1 − b−1= (b− 1)

b−k+1

b− 1=

1

bk−1.

15Es consecuencia inmediata de la formula del binomio de Newton, pero puede probarsetambien por induccion sobre n, sin mas que tener en cuenta que 1 ≤ (1 + s)n, con lo ques ≤ s(1 + s)n, luego

1 + (n+ 1)s ≤ s+ 1 + ns ≤ s+ (1 + s)n ≤ s(1 + s)n + (1 + s)n = (1 + s)n+1.

Page 243: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

7.6. Sumas infinitas 233

Ademas, la desigualdad es estricta salvo que∧

n ≥ k cn = b−1. Tomando k = 1,esto prueba en particular que todas las series del enunciado16 son numerosen [0, 1[. Veamos que sucesiones distintas determinan numeros distintos. Sicn∞n=1 6= c′n∞n=1, sea k el mınimo natural en que difieren. No perdemosgeneralidad si suponemos que ck < c′k. Entonces

∞∑

n=1

cnbn

=k−1∑

n=1

cnbn

+ckbk

+∞∑

n=k+1

cnbn

<k−1∑

n=1

c′nbn

+ckbk

+1

bk

≤k−1∑

n=1

c′nbn

+c′kbk

≤k−1∑

n=1

c′nbn

+c′kbk

+∞∑

n=k+1

c′nbn

=∞∑

n=1

c′nbn,

luego las series son distintas. Notemos que en la desigualdad estricta hemosusado que no todo cn = b−1. En tal caso tendremos una igualdad si c′k = ck+1 y∧

n > k c′n = 0. Veamos que todo α ∈ [0, 1[ admite una expresion de esta forma.Definiremos la sucesion cn∈ω por recurrencia. Puesto que 0/b ≤ α < b/b,existe un unico numero natural c1 < b tal que c1/b ≤ α < (c1 + 1)/b. Suponga-mos definidos cnkn=1 tales que

k∑

n=1

cnbn

≤ α <k∑

n=1

cnbn

+b

bk+1.

Entonces existe un unico numero natural ck+1 < b tal que

k∑

n=1

cnbn

+ck+1

bk+1≤ α <

k∑

n=1

cnbn

+ck+1 + 1

bk+1,

que es lo mismo quek+1∑

n=1

cnbn

≤ α <k+1∑

n=1

cnbn

+b

bk+2.

Por lo tanto, tenemos una sucesion con la propiedad de que

∣∣∣∣α−

k∑

n=1

cnbn

∣∣∣∣≤ 1

bk.

Hemos visto que la sucesion (1/b)kk∈ω tiende a 0, de donde se sigue inmedia-tamente que

α = lımk

k∑

n=1

cnbn

=∞∑

n=1

cnbn.

No puede ocurrir que la sucesion obtenida sea finalmente igual a b− 1, peroen lugar de justificarlo es mas facil concluir observando que si se diera el casohemos probado que α admite otro desarrollo en serie en el que la ”cola” igual ab − 1 se sustituye por otra igual a 0.

16Esto vale incluso si la sucesion de coeficientes es finalmente igual a b− 1 salvo si k = 1 y∧n ≥ 1 cn = b− 1, en cuyo caso la suma es 1.

Page 244: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

234 Capıtulo 7. El sistema numerico

Definicion 7.50 Si α ∈ R, la sucesion cn∞n=1 dada por el teorema anteriorpara la parte fraccionaria de α recibe el nombre de desarrollo en base b de laparte fraccionaria de α que, junto con el desarrollo de la parte entera dado porla definicion 2.50 constituye el desarrollo en base b de numero real α.

Cuando no se especifica la base se sobrentiende que estamos tomando b = 10y hablamos entonces de la expresion decimal de un numero real. La forma usualde representar las primeras cifras decimales de un numero real es, por ejemplo:√

1 000 = 31.6227 . . . lo que significa que

√1 000 = 3 · 101 + 1 · 100 +

6

101+

2

102+

2

103+

7

104+ · · ·

La existencia de desarrollos decimales proporciona otra demostracion de que

R = 2ℵ0 , pues cada elemento de ω2 constituye el desarrollo decimal (o incluso

en base 3) de un numero real distinto, luego R ≥ 2ℵ0 , y la otra desigualdad sesigue de que R ⊂ PQ.

Observacion Terminamos con una reflexion sobre lo que hemos visto a lolargo de todo el capıtulo: en ningun momento hemos necesitado el axioma deregularidad (salvo a lo sumo para definir 2ℵ0 en ausencia del axioma de eleccion,pero el teorema sobre el cardinal de R podrıa reformularse sin nombrarlo), peroel hecho es que todos los conjuntos numericos que hemos definido son regulares.

Por ejemplo, todos los pares ordenados de numeros naturales estan conteni-dos en Vω , luego ω × ω ⊂ Vω. Si n ∈ Z, por definicion n ⊂ ω × ω ⊂ Vω, luegon ∈ Vω+1, luego Z ⊂ Vω+1 y Z ∈ Vω+2.

Ahora, si m, n ∈ Z, entonces m, m,n ∈ Vω+2, luego (m,n) ∈ Vω+3,luego Z×Z ⊂ Vω+3. Si q ∈ Q, por definicion q ⊂ Z×Z ⊂ Vω+3, luego q ∈ Vω+4,luego Q ⊂ Vω+4, luego Q ∈ Vω+5.

Si definimos los numeros reales como secciones iniciales abiertas de Q, en-tonces si α ∈ R tenemos que α ⊂ Q ⊂ Vω+4, luego α ∈ Vω+5, luego R ⊂ Vω+5

y R ∈ Vω+6. Si construimos R mediante sucesiones de Cauchy, su lugar en lajerarquıa regular es unos peldanos mas alto.

El caso es que si prosiguieramos analizando las construcciones que manejanhabitualmente los matematicos, como los espacios Rn, los espacios ℓp, los espa-cios de funciones holomorfas en un abierto del plano complejo, etc., analisis tansencillos como los que acabamos de realizar mostrarıan que todos ellos estan enalgun Vω+n, para cierto n ∈ ω. En efecto, cada construccion solo aumenta unnumero finito de pasos el rango de los conjuntos involucrados, por lo que nuncallegamos a Vω+ω. La mayor parte de las matematicas actuales se desarrolla dehecho en Vω+ω. Por ello, resulta irrelevante plantearse si existen o no conjuntosno regulares.

Page 245: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo VIII

Elementos de topologıa

En el capıtulo I hemos desarrollado el lenguaje basico de la teorıa de con-juntos, que incluye los conceptos de “relacion”, “funcion”, “operacion” y todoslos relacionados con ellos, y con este lenguaje hemos desarrollado los contenidosque hemos visto hasta ahora. Sin embargo, en este punto resulta convenienteenriquecer nuestro lenguaje basico con el lenguaje de la topologıa conjuntista.La topologıa es una abstraccion de la geometrıa y, si bien una parte de estarama de la matematica proporciona tecnicas muy potentes para trabajar encontextos geometricos, otra parte desarrolla los conceptos topologicos basicosen una direccion completamente opuesta, y permite aplicar razonamientos quetienen su origen en la geometrıa en contextos abstractos totalmente alejados detoda base geometrica intuitiva.

El transito de la topologıa con base geometrica a la topologıa puramenteconjuntista se realiza a traves del concepto de espacio metrico, que ya conoce-mos. Podemos pensar que el concepto mas elemental que formaliza la topologıaes el de “alrededor de un punto”. Si pensamos en los puntos del plano, o delespacio intuitivo, vemos que sabemos dar sentido a afirmaciones sobre si todoslos puntos de “alrededor” de un punto dado cumplen algo. Por ejemplo, pode-mos decir que una esfera contiene a todos los puntos de alrededor de su centro,y esto tiene un sentido muy preciso a pesar de que no tiene ningun sentido decirsi un punto dado es o no uno de los puntos de alrededor de otro.

Mas concretamente, si x es un punto de un espacio metrico M y ǫ > 0 esun numero real, podemos definir la bola abierta de centro x y radio ǫ comoBǫ(x) = y ∈M | d(x, y) < ǫ, de modo que, en el caso del plano o del espaciointuitivo con la distancia intuitiva entre puntos, se trata de el cırculo o la esferade centro x y radio ǫ. La idea basica es que, por pequeno que sea el radio ǫ,podemos decir que la bolaBǫ(x) contiene a todos los puntos de alrededor de x, demodo que afirmar que una propiedad la cumplen todos los puntos de alrededorde x es lo mismo que afirmar que existe un ǫ > 0 tal que todos los puntos deBǫ(x) cumplen la propiedad en cuestion.

Esto nos lleva a su vez a la nocion de entorno: Un subconjunto U ⊂ M esun entorno de un punto x ∈ M si existe un ǫ > 0 tal que Bǫ(x) ⊂ U , y ası,

235

Page 246: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

236 Capıtulo 8. Elementos de topologıa

los entornos de un punto son los conjuntos que contienen a todos los puntos dealrededor del punto. La nocion de “entorno” captura de forma matematicamenteprecisa la nocion intuitiva de “alrededor”. En teorıa toda la topologıa podrıaformularse tomando como base la nocion de entorno debidamente abstraıda desu origen geometrico, pero resulta mas conveniente desde un punto de vistatecnico partir de un concepto relacionado que captura la misma informacion,el concepto de “conjunto abierto”. En un espacio metrico, un conjunto A esabierto si es un entorno de todos sus puntos, es decir, si cuando contiene a unpunto, contiene tambien a todos los puntos de su alrededor.

Por ejemplo, cuando consideramos el conjunto de los puntos de un cırculoen el plano entendiendo que incluye a los de la circunferencia que lo limita, nose trata de un conjunto abierto, pues un punto de la circunferencia esta en elcırculo, pero tiene puntos alrededor que no estan en el cırculo. En cambio, siconsideramos que el cırculo contiene unicamente los puntos que quedan dentrode la circunferencia, pero sin contar a los de esta, entonces tenemos un conjuntoabierto.

El concepto de abierto es equivalente al de entorno en el sentido de quehemos definido “abierto” a partir de “entorno” y, recıprocamente, podemosdefinir “entorno” a partir de “abierto”: un conjunto U es un entorno de unpunto x si y solo si existe un abierto A tal que x ∈ A ⊂ U . Sin embargo, comodecimos, es mas conveniente construir la topologıa sobre el concepto de abierto.

Trabajamos en NBG, aunque indicaremos explıcitamente todo uso del axio-ma de eleccion (AE) o del axioma de eleccion numerable (AEN). Como decostumbre, el axioma de regularidad es totalmente irrelevante.

8.1 Espacios topologicos

La definicion general de espacio topologico es tan abstracta y puramenteconjuntista que nadie reconocerıa en ella su origen geometrico:

Definicion 8.1 Una topologıa en un conjunto X es una familia T ⊂ PX quecumpla las propiedades siguientes:

a) ∅, X ∈ T,

b) Si Aii∈I es una familia de elementos de T, entonces⋃

i∈I

Ai ∈ T,

c) Si A, B ∈ T, entonces A ∩B ∈ T.

Un espacio topologico es un par (X,T), donde X es un conjunto y T es unatopologıa en X . Los elementos de T se llaman subconjuntos abiertos de X .

Ası pues, la definicion de topologıa exige que ∅ y X sean abiertos, que launion de cualquier familia de abiertos sea abierta y que la interseccion de dosabiertos sea abierta. Una simple induccion a partir de esta ultima propiedadnos da que la interseccion de cualquier cantidad finita de abiertos es abierta.

Page 247: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.1. Espacios topologicos 237

Notemos que la propiedad b) podrıa expresarse mas brevemente como que∧

F (F ⊂ T → ⋃F ∈ T).

En la practica escribiremos X en lugar de (X,T) y sobrentenderemos queT es la topologıa del espacio topologico X , teniendo en cuenta que T sera unatopologıa distinta en cada caso.

Un subconjunto U de un espacio topologico X es un entorno de un puntox ∈ X si existe un abierto A tal que x ∈ A ⊂ U .

Observemos que un conjunto A es abierto si y solo si es entorno de todossus puntos. En efecto, si es abierto cumple trivialmente la definicion de entornopara cada uno de sus puntos, mientras que si cumple la condicion sobre entornos,entonces A =

⋃F, donde F = U ∈ T | U ⊂ A, luego A es abierto porque la

union de abiertos es abierta.

Diremos que un espacio topologico X es de Hausdorff si

xy ∈ X(x 6= y →∨

AB ∈ T(x ∈ A ∧ y ∈ B ∧ A ∩B = ∅)).

Es decir, si puntos distintos pertenecen a abiertos disjuntos. (Se dice entoncesque A y B separan a x e y.) Es inmediato ver que en la definicion se puedesustituir la condicion de que A y B sean abiertos por la de que sean entornos dex, de modo que un espacio es de Hausdorff si puntos distintos tienen entornosdisjuntos.

Ejemplos Dado un conjunto X , la topologıa discreta en X es T = PX , y latopologıa trivial es T = ∅, X.

Es inmediato comprobar que ambas son realmente topologıas en X . Res-pecto de la topologıa discreta todos los subconjuntos de X son abiertos, por loque es trivialmente una topologıa de Hausdorff (dados dos puntos distintos x,y ∈ X , tenemos que x, y son abiertos disjuntos que los separan), mientrasque la topologıa trivial tiene unicamente los abiertos exigidos por la definicionde topologıa, y no es de Hausdorff salvo en el caso trivial en que |X | ≤ 1, encuyo caso coincide con la topologıa discreta.

Se dice tambien que un espacio topologico es discreto o trivial si su topologıaes la discreta o la trivial, respectivamente.

Observemos tambien que todo espacio de Hausdorff finito X es discreto. Enefecto, si x ∈ X , sea U un abierto que contenga a x y que sea minimal parala inclusion (existe porque PX es finito). Tiene que ser U = x, porque siexistiera y ∈ U , entonces, por la propiedad de Hausdorff, existirıan abiertosdisjuntos A y B tales que x ∈ A, y ∈ B, pero entonces y /∈ U ∩ A, que serıaentonces un abierto tal que x ∈ U ∩A U , en contra de la minimalidad de U .

Para dar ejemplos mas representativos conviene introducir primero el con-cepto de base de una topologıa:

Page 248: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

238 Capıtulo 8. Elementos de topologıa

Definicion 8.2 Una base de un espacio topologico X es una familia de abier-tos B (llamados abiertos basicos) tal que todo abierto de X se expresa comounion de abiertos basicos.

Aquı hay que entender que ∅ =⋃∅ es siempre union de “cero” abiertos

basicos, luego no hace falta que ∅ sea el mismo un abierto basico. Notemos queuna definicion equivalente es que B ⊂ T es base de X si

A ∈ T∧

x ∈ A∨

B ∈ B x ∈ B ⊂ A,

pues si se cumple esto y A ∈ T, entonces A =⋃F, donde F = B ∈ B | B ⊂ A.

El interes de este concepto se debe a los dos teoremas siguientes:

Teorema 8.3 Si B es una base de un espacio topologico X, se cumplen las dospropiedades siguientes:

a)⋃B = X,

b)∧

AB ∈ B∧

x ∈ A ∩B∨

C ∈ B x ∈ C ⊂ A ∩B.

Demostracion: Como X es abierto, debe expresarse como union de unafamilia F ⊂ B de abiertos basicos, luego X =

⋃F ⊂ ⋃

B ⊂ X y tenemos laigualdad.

Si x ∈ A∩B, donde A y B son abiertos, entonces A∩B es tambien abierto,luego existe un abierto basico C que cumple lo pedido.

Lo interesante es que estas propiedades bastan para que una familia de con-juntos sea la base de una topologıa:

Teorema 8.4 Sea X un conjunto y B ⊂ PX una familia de subconjuntos de Xque tenga las propiedades siguientes:

a)⋃B = X,

b)∧

AB ∈ B∧

x ∈ A ∩B∨

C ∈ B x ∈ C ⊂ A ∩B.

Entonces existe una unica topologıa en X que tiene a B por base, y es la mınima,respecto de la inclusion, para la que los elementos de B son abiertos.

Demostracion: Definimos T = ⋃F | F ⊂ B. La condicion a) afirmaque X ∈ T y trivialmente ∅ =

⋃∅ ∈ T.

Si F ⊂ T, para cada A ∈ F definimos FA = B ∈ B | B ⊂ A, de modo queA =

⋃FA. Sea F∗ =

A∈F

FA ⊂ B. Claramente⋃F =

⋃F∗ ∈ T.

Por ultimo, si A, B ∈ T, sea F = B ∈ B | B ⊂ A ∩ B. Veamos queA ∩ B =

⋃F. Una inclusion es inmediata. Para probar la otra tomamos

x ∈ A ∩ B y, por la hipotesis b) existe un C ∈ B tal que x ∈ C ∈ F, luegox ∈ ⋃

F.La unicidad y la parte final son inmediatas: si T′ es una topologıa en la que

los elementos de B son abiertos, necesariamente T ⊂ T′, luego T es la unicatopologıa de base B.

Page 249: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.1. Espacios topologicos 239

Espacios metricos Si M es un espacio metrico, x ∈M y ǫ > 0, definimos labola abierta de centro x y radio ǫ como

Bǫ(x) = y ∈M | d(x, y) < ǫ.

Vamos a comprobar que la familia B formada por todas las bolas abiertas enM satisface las condiciones del teorema anterior para ser base de una topologıaen M :

Puesto que x ∈ B1(x), es obvio que⋃B = X . Si x ∈ Bǫ1(u) ∩ Bǫ2(v),

tomamos ǫ = mınǫ1 − d(x, u), ǫ2 − d(x, v) > 0 y observamos que

x ∈ Bǫ(x) ⊂ Bǫ1(u) ∩Bǫ2(v),

pues si z ∈ Bǫ(x) entonces d(z, u) ≤ d(z, x) + d(x, u) < ǫ + d(x, u) < ǫ1, eigualmente d(z, v) < ǫ2.

En lo sucesivo consideraremos a todo espacio metrico M como espacio to-pologico con la topologıa que tiene por base a sus bolas abiertas.

Observemos que en el razonamiento anterior hemos visto en particular que six ∈ Bǫ1(u), entonces existe un ǫ > 0 tal que x ∈ Bǫ(x) ⊂ Bǫ1(u). Esto implicaque

A ⊂M(A ∈ T ↔∧

x ∈ A∨

ǫ > 0 Bǫ(x) ⊂ A).

(En principio serıa∧

x ∈ A∨

u ∈M∨

ǫ1 > 0 x ∈ Bǫ1(u) ⊂ A.)

Observemos que todo espacio metrico es un espacio de Hausdorff, pues six, y ∈ M son dos puntos distintos y ǫ = d(x, y) > 0, entonces tenemos queBǫ/2(x) ∩Bǫ/2(y) = ∅.

Definicion 8.5 Si X es un espacio topologico y x ∈ X , una base de entornos(abiertos) de x es una familia B ⊂ T de entornos (abiertos) de x tal que si U esun entorno de x existe B ∈ B tal que x ∈ B ⊂ U .

Por ejemplo, ahora es inmediato que, en un espacio metrico M , la familiade las bolas abiertas de centro x es una base de entornos abiertos del punto x.

En general, si en un espacio topologico X tenemos una familia Bxx∈X

de modo que cada Bx es una base de entornos abiertos de x, es claro queB =

x∈X

Bx es una base de X .

En efecto, si A es abierto y x ∈ A, entonces A es un entorno de x, luegoexiste un U ∈ Bx ⊂ B tal que x ∈ U ⊂ A.

Por ejemplo, teniendo en cuenta que toda bola de centro x en un espaciometrico M contiene una bola de cualquiera de las familias siguientes:

Bǫ0(x) | 0 < ǫ0 < ǫ, Br(x) | r ∈ Q ∧ r > 0, B1/n(x) | n ∈ N ∧ n > 0,

es inmediato que las tres son bases de entornos de x, luego una base de M estaformada por todas las bolas abiertas en M cuyo radio sea a) menor que un ǫ > 0fijo, b) un numero racional positivo o c) de la forma 1/n con n ∈ N no nulo.

Page 250: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

240 Capıtulo 8. Elementos de topologıa

Se dice que un espacio topologico X es metrizable si existe una distanciad : X × X −→ R que induce la topologıa de X . Obviamente, todo espaciometrizable es un espacio de Hausdorff.

Por ejemplo, todo espacio discreto es metrizable, ya que la topologıa discretaen un conjunto X es la topologıa inducida por la metrica discreta, que es ladistancia d : X ×X −→ R dada por

d(x, y) =

1 si x 6= y,0 si x = y.

Es inmediato comprobar que es realmente una distancia, y respecto de ellaB1(x) = x, por lo que x es abierto y, por consiguiente, todo subconjuntode X es abierto, es decir, que la topologıa inducida por d es la discreta.

Hay que tener presente que una misma topologıa puede ser inducida pormetricas distintas:

Dos distancias en un conjunto X se dicen equivalentes si inducen la mismatopologıa. Por ejemplo:

Teorema 8.6 Toda distancia en un conjunto M es equivalente a una distanciaacotada d : M ×M −→ [0, 1].

Demostracion: Basta observar que si d′ es una distancia en M entonces

d(x, y) = mınd′(x, 1), 1

tambien es una distancia en M y como las bolas de radio < 1 para las distanciasd′ y d son las mismas, y hemos visto que forman una base para las topologıasinducidas por cada una de ellas, concluimos que se trata de la misma topologıa.

Presentamos ahora un concepto similar al de base que tambien es util paradefinir topologıas:

Definicion 8.7 Una subbase de un espacio topologico X es una familia S ⊂ T

tal que la familia de las intersecciones finitas de elementos de S es una basede X .

Aquı hay que entender que, al considerar familias de subconjuntos de X ,adoptamos convenio de que

⋂∅ = X .

La diferencia respecto de las bases es que una familia de conjuntos no necesitacumplir ninguna condicion para ser la subbase de una topologıa:

Teorema 8.8 Sea X un conjunto y S ⊂ PX una familia de subconjuntos deX. Entonces existe una unica topologıa en X de la cual S es subbase, y es lamınima, respecto de la inclusion, para la que los elementos de S son abiertos.

Page 251: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.1. Espacios topologicos 241

Demostracion: Sea B = ⋂S | S ⊂ S ∧ S ∧ S finito y veamos que

cumple las condiciones del teorema 8.4. Como X =⋂∅ ∈ B, la primera se

cumple trivialmente. Si A, B ∈ B y x ∈ A ∩ B, entonces A =⋂S, B =

⋂T ,

para ciertos conjuntos finitos S, T ⊂ S. Pero entonces A ∩B =⋂

(S ∪ T ) ∈ S.

Por lo tanto, B es la base de una topologıa en X , la cual tiene obviamentea S por subbase. Si T′ es una topologıa respecto a la que los elementos de S

son abiertos, entonces tambien lo son los elementos de B, luego todos los de T,s decir, T ⊂ T′, y esto nos da la unicidad.

La topologıa de orden SiX es un conjunto totalmente ordenado, la topologıade orden en X es la topologıa que tiene por subbase a los intervalos de la forma

]−∞, b[ y ]a,+∞[ ,

para a, b ∈ X .

Es obvio que una interseccion finita de tales intervalos es un intervalo delmismo tipo (si es que todos ellos son del mismo tipo) o bien ∅, o bien unintervalo abierto ]a, b[, luego una base de la topologıa de orden la forman losintervalos abiertos

]−∞, b[ , ]a,+∞[ , ]a, b[ .

Si X no tiene maximo, todo intervalo de la forma ]a,+∞[ es union de inter-valos ]u, v[, pues, dado x ∈ ]a,+∞[, existe un v > x, luego x ∈ ]a, v[ ⊂ ]a,+∞[.Similarmente ocurre con los intervalos ]−∞, b[ si X no tiene mınimo. Por lotanto, si X no tiene maximo ni mınimo, una base de X la forman por sı soloslos intervalos abiertos ]a, b[. En cambio, si X tiene maximo M , a estos hay queanadir los intervalos ]a,M ] = ]a,+∞[, y si X tiene mınimo m, para tener unabase hay que anadir tambien los intervalos [m, b[ = ]−∞, b[.

En lo sucesivo consideraremos a todo conjunto totalmente ordenado comoespacio topologico con la topologıa de orden. Notemos que son espacios deHausdorff, pues si x < y son dos elementos de X , o bien existe un u ∈ X talque x < u < y, entonces ]−∞, u[ y ]u,+∞[ son entornos disjuntos de x e y,mientras que si no existe tal u, podemos tomar ]−∞, v[ y ]u,+∞[.

Notemos que en R tenemos definida la topologıa inducida por la metrica yla inducida por el orden. Vamos a ver que son la misma. Ello es consecuenciade que, claramente, las bolas abiertas en R son intervalos Bǫ(x) = ]x− ǫ, x+ ǫ[,luego todo abierto metrico es un abierto para la topologıa de orden.

Recıprocamente, si ]a, b[ es un abierto basico en R para la topologıa de ordeny x ∈ ]a, b[, tomamos ǫ = mınx− a, b− x y entonces es claro que

Bǫ(x) = ]x− ǫ, x+ ǫ[ ⊂ ]a, b[ ,

luego todos los abiertos de la topologıa de orden son abiertos metricos.

Llamaremos topologıa usual en R a la topologıa inducida por su distanciacomo cuerpo metrico, que coincide, segun acabamos de ver, con su topologıa de

Page 252: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

242 Capıtulo 8. Elementos de topologıa

orden. En lo sucesivo consideraremos siempre a R como espacio topologico conesta topologıa.

Tambien consideraremos a los ordinales como espacios topologicos con latopologıa de orden.

Topologıa relativa Si X es un espacio topologico e Y ⊂ X , se llama topologıarelativa de Y respecto de X a la topologıa TY = A ∩ Y | A ∈ T.

Veamos que es, en efecto, una topologıa en Y . En primer lugar tenemos que∅ = ∅ ∩ Y ∈ TY , Y = X ∩ Y ∈ TY .

Si F ⊂ TY , consideramos la familia de abiertos

F∗ = U ∈ T | U ∩ Y ∈ F

y llamamos A =⋃F∗ ∈ T. Es facil ver que A∩ Y =

⋃F, con lo que

⋃F ∈ TY .

Por ultimo, dados U , V ∈ TY , existen A, B ∈ T tales que U = A ∩ Y ,V = B ∩ Y , luego U ∩ V = (A ∩B) ∩ Y ∈ TY .

Observemos que si B es una base de X y S es una subbase de X , entonces

BY = B ∩ Y | B ∈ B, SY = S ∩ Y | S ∈ S

son, respectivamente, una base y una subbase de la topologıa relativa.

En efecto, un abierto de la topologıa relativa es de la forma A ∩ Y , dondeA =

⋃F, con F ⊂ B, luego F

∗ = U ∩ Y | U ∈ F ⊂ BY y A∩ Y =⋃F∗. Esto

prueba que BY es base de la topologıa relativa.

Similarmente, si B es la base inducida por S, es facil ver que BY (que yahemos probado que es una base de la topologıa relativa) es la base inducida porSY , luego SY es subbase de la topologıa relativa.

En lo sucesivo consideraremos a los subconjuntos de los espacios topologicoscomo espacios topologicos con la topologıa relativa. Esto es coherente, pues esfacil ver que si X es un espacio topologico y tenemos subconjuntos Z ⊂ Y ⊂ X ,entonces la topologıa relativa de Z respecto de X es la misma que la relativarespecto de Y cuando en Y consideramos la topologıa relativa respecto de X .

A su vez, esto es coherente con el criterio de considerar a los espacios metricoscon la topologıa inducida por la distancia, pues si M es un espacio metrico conuna distancia d : M ×M −→ R y N ⊂ M , entonces la topologıa inducida enN por la distancia d|N×N : N ×N −→ R es la misma que la topologıa relativarespecto de la topologıa inducida en M por la distancia d.

En efecto, es facil ver que si x ∈ N y ǫ > 0, entonces BNǫ (x) = BM

ǫ (x) ∩N ,luego los abiertos basicos de la topologıa metrica en N son abiertos para la to-pologıa relativa, luego todo abierto metrico es abierto para la topologıa relativa.

Recıprocamente, un abierto para la topologıa relativa es de la forma A∩N ,con A abierto en M , luego, para todo x ∈ A ∩ N , existe un ǫ > 0 tal que

Page 253: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.1. Espacios topologicos 243

BMǫ (x) ⊂ A, luego BN

ǫ (x) = BMǫ (x) ∩ N ⊂ A ∩ N , luego A ∩ N es abierto

metrico.

En cambio, si X es un conjunto totalmente ordenado y Y ⊂ X , entoncesla topologıa inducida en Y por la restriccion del orden de X no coincide ne-cesariamente con la topologıa relativa de Y respecto de la topologıa de ordende X .

Ejemplo Sea X = R con la topologıa usual, y sea

Y = −1 ∪ 1/n | n ∈ N ∧ n 6= 0.

Si consideramos a Y con la topologıa relativa, vemos que −1 = Y ∩ ]−2, 0[ esabierto. Pero no es abierto para la topologıa de orden de Y , pues, siendo −1el mınimo de Y , no pertenece a ningun intervalo de la forma ]a, b[ o ]a,+∞[,luego tendrıa que existir un b ∈ Y tal que −1 ∈ ]−∞, b[ ⊂ −1, pero no existetal b, pues ciertamente b = −1 no cumple esto y un intervalo ]−∞, 1/n[ no estacontenido en −1.

En vista de esto, cuando consideremos subconjuntos de conjuntos ordenadoslos consideraremos como espacios topologicos con la topologıa relativa, y no conla topologıa de orden.

En cualquier caso, se cumple lo siguiente:

Teorema 8.9 Si X es un conjunto totalmente ordenado y Y ⊂ X, entoncestodo abierto de Y para la topologıa de orden es abierto para la topologıa relativarespecto de la topologıa de orden de X. Si se cumple una de las condicionessiguientes:

a) Y es un intervalo en X,

b)∧

uv ∈ X(u < v →∨

y ∈ Y u < y < v),

entonces ambas topologıas coinciden.

Demostracion: Es claro que si a ∈ Y entonces ]a,+∞[Y

= ]a,∞[X ∩Y , y

lo mismo vale para intervalos ]−∞, b[, con b ∈ Y , luego todo abierto subbasicopara la topologıa de orden de Y es abierto para la topologıa relativa.

Respecto a la segunda parte, es claro que si Y es un intervalo en X , entoncesY ∩ ]a,+∞[ puede ser ∅, Y o bien ]a,+∞[

Y, pero en cualquier caso es abierto

para la topologıa de orden, e igualmente sucede con los intervalos ]−∞, b[. Porlo tanto, los abiertos subbasicos de la topologıa relativa son abiertos para latopologıa de orden, y esto implica que lo mismo vale para todos los abiertos.

Por otra parte, si se cumple la segunda condicion, entonces Y ∩ ]a,+∞[ esigualmente abierto para la topologıa de orden, pues si u ∈ Y ∩ ]a,+∞[, entoncesa < u, luego existe un y ∈ Y tal que a < y < u, luego

u ∈ ]y,+∞[Y ⊂ Y ∩ ]a,+∞[ .

Page 254: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

244 Capıtulo 8. Elementos de topologıa

Ası pues, de nuevo Y ∩ ]a,+∞[ es abierto para la topologıa de orden y lomismo vale para los intervalos ]−∞, b[, con lo que concluimos igualmente que latopologıa relativa es la topologıa del orden.

Ası, consideraremos como “topologıa usual” en los subconjuntos de R a latopologıa relativa, y ahora sabemos que coincide con la topologıa de orden enlos intervalos y tambien en los conjuntos densos, como Q.

Tambien podemos afirmar que la topologıa relativa de un ordinal respectode otro mayor es la topologıa de orden.

Por ultimo, todo subespacio de un espacio de Hausdorff es trivialmente unespacio de Hausdorff (con la topologıa relativa).

La topologıa producto Consideremos una familia de conjuntos Xii∈I , quenos permite formar el producto cartesiano

i∈I

Xi. Para cada i ∈ I tenemos laproyeccion pi :

i∈I

Xi −→ Xi.

Si cada Xi es un espacio topologico, definimos la topologıa producto en elproducto cartesiano como la que tiene por subbase a los conjuntos de la formap−1i [A], donde A es un abierto en Xi.

Teorema 8.10 Sea Xii∈I una familia de espacios topologicos y sea Bii∈I

una familia tal que Bi sea una base de Xi. Entonces una base de la topologıaproducto la forman los productos

i∈I

Bi tales que existe I0 ⊂ I finito de modo

que∧

i ∈ I0 Bi ∈ Bi y∧

i ∈ I \ I0 Bi = Xi.

Demostracion: Sea T la topologıa que tiene por subbase los conjuntos dela forma p−1

i [B], donde B ∈ Bi. Estos abiertos son abiertos para la topologıaproducto, luego todo abierto de T es abierto para la topologıa producto.

Recıprocamente, un abierto subbasico para la topologıa producto es de laforma p−1

i [A], donde A es abierto en Xi, pero entonces A se puede expresarcomo union de conjuntos de Bi, luego p−1

i [A] es union de abiertos subbasicos deT, luego todo abierto de la topologıa producto es abierto de T. En definitiva, Tes la topologıa producto.

Llamemos B a la familia de los conjuntos descritos en el enunciado. Todoelemento de B es de la forma

i∈I0

p−1i [Bi], luego es un abierto basico de T (luego

de la topologıa producto).

Si probamos que B es base de una topologıa, entonces todos los abiertos deesta topologıa seran abiertos para la topologıa producto, y como cada abiertosubbasico de T esta en B, todo abierto de la topologıa producto sera abiertopara la topologıa de B, y quedara demostrado que B es una base de la topologıaproducto.

Ahora bien, la primera propiedad de 8.4 es inmediata y, si tenemos quex ∈ U ∩ V , donde U =

i∈I0

p−1i [Bi] y V =

i∈I1

p−1i [B′

i], podemos cambiar I0

e I∗ = I1 por I0 ∪ I1 si definimos Bi = Xi para i ∈ I1 \ I0 y B′i = Xi para

Page 255: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.1. Espacios topologicos 245

i ∈ I0 \ I1. Entonces

U ∩V =⋂

i∈I∗

p−1i [Bi]∩

i∈I∗

p−1i [B′

i] =⋂

i∈I∗

(p−1i [Bi]∩p−1

i [B′i]) =

i∈I∗

p−1i [Bi∩B′

i]

y, como x ∈ U ∩ V , tenemos que pi(x) ∈ Bi ∩B′i, luego existe B′′

i ∈ Bi tal quepi(x) ∈ B′′

i ⊂ Bi ∩B′i, luego

x ∈ ⋂

i∈I∗

p−1i [B′′

i ] ⊂ U ∩ V.

Esto prueba que B es una base, y que por tanto lo es de la topologıa producto.

La situacion es conceptualmente mas simple si consideramos productos fi-nitos, pues entonces el teorema anterior afirma que una base de un productoX1 × · · · ×Xn esta formada por los conjuntos de la forma B1 × · · · ×Bn, dondecada Bi esta en una base prefijada de Xi.

Normalmente consideraremos los productos de espacios topologicos como es-pacios topologicos con la topologıa producto. Al tomar subespacios de productostenemos el resultado siguiente de coherencia:

Teorema 8.11 Sea Xii∈I una familia de espacios topologicos y sea Yii∈I

una familia de conjuntos, de modo que cada Yi ⊂ Xi. Entonces Y =∏

i∈I

Yi es un

subconjunto de X =∏

i∈I

Xi. Si consideramos a cada Yi como espacio topologico

con la topologıa relativa, entonces la topologıa producto de Y es la misma quela topologıa relativa respecto de X.

Demostracion: Un abierto basico para la topologıa relativa de Y es

i∈I

Yi ∩∏

i∈I

Ai =∏

i∈I

(Yi ∩ Ai),

donde cada Ai es abierto en Xi y todos salvo una cantidad finita coinciden conXi, pero es claro que el miembro derecho es un abierto basico para la topologıaproducto de Y , y viceversa. Por lo tanto, ambas topologıas coinciden.

Llamaremos topologıa usual de Rn a la topologıa producto, cuando conside-ramos en R la topologıa usual.

Teorema 8.12 Todo producto de espacios topologicos de Hausdorff es un espa-cio de Hausdorff.

Demostracion: Sea X =∏

i∈I

Xi un producto de espacios topologicos de

Hausdorff y sean x, y ∈ X dos puntos distintos. Entonces existe un i ∈ I tal quexi 6= yi, luego existen abiertos disjuntos U , V ∈ Xi tales que xi ∈ U , yi ∈ V , yentonces p−1

i [U ] y p−1i [V ] son abiertos disjuntos en X que separan a los puntos

dados.

Page 256: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

246 Capıtulo 8. Elementos de topologıa

Si Mini=1 es una familia de espacios topologicos metrizables, entonces el

producto M =n∏

i=1

Mi es metrizable, es decir, existe una distancia en el producto

que induce la topologıa producto. De hecho, hay varias opciones. Por ejemplo,podemos considerar d : M ×M −→ R dada por

d(x, y) =n∑

i=1

d(xi, yi).

Se comprueba sin dificultad que d es una distancia en M . Vamos a ver queinduce la topologıa producto. Un abierto basico para la topologıa producto esde la forma B = Bǫ1(x1) × · · · × Bǫn(xn). Veamos que B es abierto para ladistancia d. Para ello tomamos y ∈ B y observamos que Bǫ(y) ⊂ B, dondeǫ = mınǫi − d(yi, xi) | 1 ≤ i ≤ n, pues si z ∈ Bǫ(y), entonces

d(zi, xi) ≤ d(zi, yi) + d(yi, xi) ≤ d(z, y) + d(yi, xi) < ǫ + d(yi, xi) ≤ ǫi,

luego zi ∈ Bǫi(xi), luego z ∈ B. Ası pues, todo abierto para la topologıaproducto es abierto para d.

Recıprocamente, un abierto basico para d es Bǫ(x), y tenemos que probarque es abierto para la topologıa producto. Para ello tomamos y ∈ Bǫ(x) yprobamos que y ∈ Bδ(y1) × · · · × Bδ(yn) ⊂ Bǫ(x), donde δ = (ǫ − d(x, y))/n.En efecto, si z pertenece al producto de bolas, entonces

d(z, x) ≤ d(z, y) + d(y, x) =n∑

i=1

d(zi, yi) + d(y, x) < nδ + d(y, x) = ǫ.

luego y ∈ Bǫ(x). Con esto queda probado que la topologıa metrica es la topo-logıa producto.

Una mınima variante del argumento anterior prueba que lo mismo vale parala distancia dada por

d′(x, y) = maxid(xi, yi).

Por lo tanto, d y d′ son distancias equivalentes en el producto.

Este resultado se puede generalizar ligeramente:

Teorema 8.13 Si Mnn∈ω es una familia numerable de espacios metricos,entonces el producto M =

i∈ω

Mi admite una distancia que induce la topologıaproducto.

Demostracion: Por el teorema 8.6 podemos tomar una distancia di en Mi

que tome valores en [0, 1]. Definimos d : M ×M −→M mediante

d(x, y) =∑

i∈ω

di(xi, yi)

2i≤

i∈ω

1

2i= 2.

Page 257: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.2. Algunos conceptos topologicos. 247

La prueba de que d es una distancia no ofrece dificultad. Veamos que in-duce la topologıa producto. Consideremos un abierto basico para la topologıaproducto, que es de la forma

B =⋂

i<n

p−1i [Bǫi(xi)].

Para probar que es abierto para d tomamos y ∈ B y vamos a ver que Bǫ(y) ⊂ B,donde ǫ = mınǫi−d(yi, xi) | i < n/2n. En efecto, si z ∈ Bǫ(y), entonces, parai < n,

d(zi, yi)

2n≤ d(zi, yi)

2i≤ d(z, y) < ǫ <

ǫi − d(yi, xi)

2n

luegod(zi, xi) ≤ d(zi, yi) + d(yi, xi) < ǫi,

luego zi ∈ Bǫi(xi), luego z ∈ B. Por lo tanto, los abiertos para la topologıaproducto son abiertos para d. Recıprocamente, consideramos un abierto basicopara d, es decir, Bǫ(x) y veamos que es abierto para la topologıa producto.Para ello tomamos y ∈ Bǫ(x) y vamos a encontrar un abierto basico B para latopologıa producto tal que y ∈ B ⊂ Bǫ(x).

Tomamos n ∈ ω tal que

i≥n

1

2i=

1

2n−1<ǫ− d(y, x)

2

y sea δ = (ǫ− d(y, x))/(2n), B =⋂

i<n

p−1i [Bδ(yi)]. Ası, si z ∈ B, tenemos que

d(z, x) ≤ d(z, y) + d(y, x) ≤∑

i∈ω

di(zi, yi)

2i+ d(y, x)

=∑

i<n

di(zi, yi)

2i+∑

i≥n

di(zi, yi)

2i+ d(y, x) < nδ +

i≥n

1

2i+ d(y, x)

≤ ǫ − d(y, x)

2+ǫ− d(y, x)

2+ d(y, x) = ǫ.

Por lo tanto z ∈ Bǫ(x), luego B ⊂ Bǫ(x) y la bola es abierta para la topologıaproducto.

8.2 Algunos conceptos topologicos.

Veamos ahora como el concepto de espacio topologico permite introducir nu-merosos conceptos de gran utilidad para describir su estructura. Empezaremosmostrando que la nocion de convergencia de sucesiones que ya hemos mane-jado en el capıtulo anterior en el contexto de espacios metricos es en realidadtopologica.

Page 258: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

248 Capıtulo 8. Elementos de topologıa

Definicion 8.14 Diremos que una sucesion xnn∈ω en un espacio topologicoX converge a un lımite l ∈ X si para todo entorno U de l

m ∈ ω∧

n ≥ m xn ∈ U,

es decir, si la sucesion entra en todo entorno de l a partir de un termino y yano vuelve a salir.

Notemos que en un espacio trivial, el unico entorno de cualquier punto estodo el espacio, que trivialmente contiene a cualquier sucesion, luego en unespacio trivial toda sucesion converge a cualquier punto. En cambio, en unespacio de Hausdorff, si una sucesion tiene lımite, este es unico. En efecto, sixnn∈ω convergiera a dos lımites l 6= l′, entonces existirıan abiertos disjuntosU , V tales que l ∈ U , l′ ∈ V , pero entonces deberıa haber un m ∈ ω tal que sin ≥ m, entonces xn ∈ U ∩ V , contradiccion.

Por ello, si una sucesion xnn∈ω converge en un espacio de Hausdorff, re-presentaremos su lımite como lım

nxn ∈ X .

Es inmediato comprobar que para que se cumpla la definicion de lımite bastaconsiderar los entornos de l pertenecientes a una base de entornos prefijada. Porejemplo, en un espacio metrico basta considerar las bolas abiertas Bǫ(l), peroentonces la condicion xn ∈ Bǫ(l) equivale a d(xn, l) < ǫ, de donde se sigue quela nocion de convergencia que acabamos de introducir coincide con la definidaen 7.11.

Es inmediato comprobar que si tenemos espacios Y ⊂ X , la convergencia deuna sucesion xnn∈ω contenida en Y a un lımite y ∈ Y se cumple respecto dela topologıa de X si y solo si se cumple respecto de la topologıa de Y . (Aunque,naturalmente, una sucesion en Y puede converger en X a un lımite que no esteen Y . Para productos tenemos el teorema siguiente:

Teorema 8.15 Sea X =∏

i∈I

Xi un producto de espacios topologicos. Una su-

cesion xnn∈ω en X converge a un punto x ∈ X si y solo si cada una de lassucesiones xnin∈ω converge a xi.

Demostracion: Si converge la sucesion en el producto, fijado i ∈ I y unentorno U de xi, tenemos que p−1

i [U ] es un entorno de x, luego existe un m ∈ ωtal que para n ≥ m se cumple xn ∈ p−1

i [U ], luego xni ∈ U , luego xnin∈ω

converge a xi.Recıprocamente, si todas las sucesiones de coordenadas convergen, dado un

entorno U de x, podemos suponer que es un abierto basico

U =∏

i∈I

Ai,

donde cada Ai es abierto en Xi y existe I0 ⊂ I finito tal que si i ∈ I \I0 entoncesAi = Xi. Para cada i ∈ I0, tenemos que Ai es un entorno de xi, luego existeun mi tal que si n ≥ mi, entonces xni ∈ Ai. Tomamos m = maxmi | i ∈ I0,con lo que si n ≥ m, se cumple xni ∈ Ai para todo i ∈ I0, y trivialmente sii ∈ I \ I0, luego xn ∈ U , y esto prueba que la sucesion converge a x.

Page 259: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.2. Algunos conceptos topologicos. 249

Un subconjunto C de un espacio topologico X es cerrado si y solo si X \ Ces abierto. Obviamente, los cerrados tienen las propiedades analogas a las delos abiertos cambiando uniones por intersecciones:

Teorema 8.16 Si X es un espacio topologico, se cumple:

a) ∅, X son cerrados.

b) Si Aii∈I es una familia de elementos de cerrados en X, entonces⋂

i∈I

Ai

es cerrado.

c) Si A, B son cerrados, entonces A ∪B es cerrado.

Observemos que si Y ⊂ X , los cerrados de Y son los conjuntos de la formaC ∩ Y , donde C es cerrado en X . En efecto, en principio son los conjuntos dela forma Y \ (A ∩ Y ), donde A es abierto en X , pero obviamente

Y \ (A ∩ Y ) = Y ∩ (X \A).

Hay una caracterizacion util de los espacios de Hausdorff:

Teorema 8.17 Un espacio topologico X es de Hausdorff si y solo si la diagonal∆ = (x, x) | x ∈ X es cerrada en X ×X.

Demostracion: Si X es de Hausdorff y (x, y) ∈ (X × X) \ ∆, entoncesx 6= y, luego x e y pueden ser separados por abiertos disjuntos U y V . Entonces(x, y) ∈ U × V ⊂ (X ×X) \ ∆, luego el complemento de la diagonal es entornode todos sus puntos, es decir, es abierto, y la diagonal es cerrada.

Recıprocamente, si la diagonal es cerrada, dados dos puntos distintos x,y ∈ X , entonces (x, y) ∈ (X×X) \∆, que es un abierto, luego existe un abiertobasico (x, y) ∈ U ×V ⊂ (X×X)\∆, donde U y V son abiertos, necesariamentedisjuntos, con lo que separan a x e y.

Las propiedades de los abiertos y los cerrados nos permiten definir dos con-ceptos asociados:

Definicion 8.18 Si X es un espacio topologico y A ⊂ X , definimos el interior

A y la clausura A de A como los conjuntos

A =⋃U | U ⊂ A ∧ U abierto, A =

⋂C | A ⊂ C ∧ C cerrado.

Es obvio que

A es el mayor abierto contenido en A (respecto de la inclusion)

y que C es el menor cerrado que contiene a A. En particular

A ⊂ A ⊂ A.

Ademas, A es abierto si y solo si A =

A y A es cerrado si y solo si A = A.

Cuando sea mas conveniente por razones tipograficas representaremos elinterior y la clausura mediante intA y clA, respectivamente.

Los puntos de

A se llaman puntos interiores de A, mientras que los de A sellaman puntos adherentes de A.

El interior y la clausura verifican una relacion fundamental:

Page 260: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

250 Capıtulo 8. Elementos de topologıa

Teorema 8.19 Si A es un subconjunto de un espacio topologico X, entonces

int (X \A) = X \ clA, cl (X \A) = X \ intA.

Demostracion: Como A ⊂ clA, tambien X \ clA ⊂ X \ A, y el terminode la izquierda es abierto, luego X \ clA ⊂ int (X \A).

Por otra parte, int (X \A) ⊂ X \A, luego A ⊂ X \ int (X \A), y el terminode la derecha es cerrado, luego clA ⊂ X \ int(X \A), luego int(X \A) ⊂ X \clA.

La otra igualdad se prueba analogamente.

La interpretacion de los puntos interiores es muy simple: un punto x esinterior a A si y solo si A es un entorno de x. Los puntos adherentes tambientienen su interpretacion:

Teorema 8.20 Si A es un subconjunto de un espacio topologico X, entoncesun punto x ∈ X es adherente a A si y solo si todo entorno de x corta a A.

Demostracion: Supongamos que x es adherente a A. Sea U un entornode x. Existe un abierto G tal que x ∈ G ⊂ U . Basta probar que G ∩ A 6= ∅.Ahora bien, en caso contrario X \ G serıa un cerrado que contiene a A, luegoA ⊂ X \G, mientras que x ∈ A ∩G.

Recıprocamente, si x tiene esta propiedad entonces x ∈ A, ya que de locontrario X \A serıa un entorno de x que no corta a A.

Por lo tanto, podemos decir que los puntos interiores de A son los puntosque tienen todos los puntos de su alrededor en A, mientras que los puntosadherentes de A son los puntos que tienen en A al menos parte de los puntosde su alrededor. En este sentido, los puntos de A \A son puntos que, sin estaren A, estan “pegados a” o “en contacto con” A.

Es espacios metricos tenemos una caracterizacion muy descriptiva de lospuntos adherentes. Necesitamos la definicion siguiente:

Definicion 8.21 Sea M un espacio metrico, sea ∅ 6= A ⊂ M y sea x ∈ M ,definimos la distancia de x a A como

d(x,A) = ınfd(x, y) | y ∈ A.

Teorema 8.22 Sea X un espacio metrico y A ⊂ M un conjunto no vacıo.Entonces A = x ∈M | d(x,A) = 0.

Demostracion: Si d(x,A) = 0, para probar que es adherente basta ver quetoda bola abierta de centro x corta a A. Dado ǫ > 0 tenemos que d(x,A) < ǫ,lo que significa que existe un y ∈ A tal que d(x, y) < ǫ, es decir, y ∈ Bǫ(x) ∩A.El recıproco se prueba igualmente.

Conviene distinguir los puntos adherentes que no son interiores:

Definicion 8.23 Si A es un subconjunto de un espacio topologico X , se llamafrontera de A al conjunto

∂A = A ∩X \A.

Page 261: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.2. Algunos conceptos topologicos. 251

Ası, un punto esta en la frontera de A si una parte de sus puntos de alrededorestan en A y otra parte esta en X \A. Por el teorema anterior:

∂A = A ∩ (X \

A) = A \

A,

de modo que los puntos de la frontera de A son los puntos adherentes que noson interiores.

De esta ultima expresion para la frontera resulta inmediatamente que unconjunto A es abierto si y solo si A ∩ ∂A = ∅, y es cerrado si y solo si ∂A ⊂ A,es decir, los abiertos son los conjuntos que no contienen a “su borde” y loscerrados son los conjuntos que contienen a todo “su borde”.

Observemos que la inclusion A ⊂ A se puede interpretar como que todopunto x ∈ A tiene trivialmente algun punto de su alrededor en A, a saber, elpropio x, pero a veces es relevante que un punto tenga puntos de alrededor enA sin contarlo a el mismo. Esto nos lleva al concepto de punto de acumulacion:

Si A es un subconjunto de un espacio topologico X , un punto x ∈ X es unpunto de acumulacion de A si todo entorno U de x cumple (U \ x) ∩ A 6= ∅.El conjunto de todos los puntos de acumulacion de A se llama conjunto derivadode A, y se representa por A′.

Los puntos de A \A′ se llaman puntos aislados de A.

En otras palabras, x ∈ A es un punto aislado si tiene un entorno U tal queU ∩A = x o, lo que es lo mismo, si es abierto en la topologıa relativa de A.

Un punto aislado en A no tiene ningun punto de su alrededor en A salvo elmismo. Por eso esta trivialmente en A, pero no esta en A′. Obviamente A′ ⊂ A.

Tambien es inmediato que un espacio topologico es discreto si y solo si todossus puntos son aislados.

Para completar el vocabulario topologico basico anadimos una ultima defi-nicion:

Un subconjunto D de un espacio topologico X es denso si D = X .

Esto significa que todo punto de X tiene su alrededor puntos de D. Masconcretamente, que todo entorno de cualquier punto de X corta a D, pero estoequivale claramente a que todo abierto no vacıo de X corte a D, y la condicionse puede restringir a todo abierto basico no vacıo.

En particular, un subconjunto D de un espacio metrico M es denso si y solosi toda bola Bǫ(x) corta a D, lo cual equivale a que para todo x ∈ M y todoǫ > 0 exista un d ∈ D tal que d(x, d) < ǫ, con lo que la definicion de conjuntodenso que acabamos de dar es equivalente, en el caso de espacios metricos, a laque dimos en en 7.11. Tambien es claro que sobre precontinuos equivale a ladada en 7.37.

De todas estas definiciones se siguen muchas propiedades inmediatas. Por

ejemplo, es claro que si A ⊂ B entonces

A ⊂

B y A ⊂ B. (Tenemos que

A ⊂ A ⊂ B y, como

A es un abierto contenido en B, se cumple

A ⊂

B.)

Page 262: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

252 Capıtulo 8. Elementos de topologıa

Tambien es facil ver que int(A ∩ B) = intA ∩ intB, y que A ∪B = A ∪ B,

ası como que si A ⊂ B ⊂ X , entonces AB

= AX ∩B (pero la igualdad analoga

con interiores es falsa en general).

En un espacio de Hausdorff, los conjuntos finitos son cerrados. En efecto,basta probar que los puntos son cerrados, pero si x, y son dos puntos distintos,hay abiertos disjuntos tales que x ∈ U , y ∈ V , luego x ⊂ X \ V , luegox ⊂ X \ V , luego y /∈ x, y esto vale para todo y 6= x, luego x = x.

Para productos tenemos:

Teorema 8.24 Sea Xii∈I una familia de espacios topologicos y sea Yii∈I

una familia tal que cada Yi ⊂ Xi. Entonces

i∈I

Yi =∏

i∈I

Yi.

En particular, el producto de cerrados es cerrado.

Demostracion: Si llamamos X al espacio producto, se cumple que

X \ p−1i [Y i] = p−1

i [Xi \ Y i]

de donde p−1i [Yi] es cerrado, y

i∈I

Yi =⋂

i∈I

p−1i [Y i] es cerrado por ser interseccion

de cerrados. Esto implica que∏

i∈I

Yi ⊂∏

i∈I

Yi.

Recıprocamente, si y ∈ ∏

i∈I

Yi, vamos a probar que esta en la clausura del

producto viendo que todo entorno de y corta al producto. Podemos tomar comoentorno un abierto basico U =

i∈I

Ai, donde cada Ai es abierto en Xi y existe

I0 ⊂ I finito tal que si i ∈ I \ I0 entonces Ai = Xi. Para cada i ∈ I0 tenemosque yi ∈ Ai ∩ Yi, luego existe y′i ∈ Ai ∩ Yi. Definimos

y′i =

y′i si i ∈ I0,yi si i ∈ I \ I0,

Ası y′ ∈ U ∩ ∏

i∈I

Yi 6= ∅, luego y es un punto adherente del producto y tenemos

la igualdad requerida.

Caracterizaciones con sucesiones Todos los conceptos que hemos introdu-cido en esta seccion admiten caracterizaciones en terminos de sucesiones en unaclase de espacios topologicos que incluye a todos los espacios metricos:

Definicion 8.25 Un espacio topologico cumple el primer axioma de numera-bilidad (1AN) si cada uno de sus puntos tiene una base numerable de entornos.

Page 263: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.2. Algunos conceptos topologicos. 253

Notemos que si Unn∈ω es una base de entornos de x, entonces

Unn∈ω

es una base de entornos abiertos de x y, si llamamos Vm =⋂

n≤m

Un, entonces

Vmm∈ω es una base numerable de entornos abiertos de x con la propiedad adi-cional de que

mn ∈ ω (m ≤ n → Vn ⊂ Vm). A las bases en estas condicioneslas llamaremos bases de entornos decrecientes.

Por ejemplo, todo espacio metrico M cumple 1AN, pues cada punto x ∈Mtiene por base decreciente de entornos abiertos a la familia de bolas abiertasB1/n(x)∞n=1.

Teorema 8.26 (AEN) Sea X un espacio que cumpla 1AN, sea A ⊂ X y seax ∈ X. Entonces:

a) x es un punto interior de A si y solo si para toda sucesion xnn∈ω queconverja a x se cumple

m ∈ ω∧

n ≥ m xn ∈ A.

b) x es un punto adherente de A si y solo si existe una sucesion xnn∈ω

convergente a x contenida en A.

c) x es un punto de acumulacion de A si y solo si existe una sucesion xnn∈ω

convergente a x contenida en A \ x.

d) A es denso si y solo si para todo x ∈ X existe una sucesion xnn∈ω

convergente a x contenida en A.

Demostracion: b) Sea Unn∈ω una base decreciente de entornos abiertosde x. Si x ∈ A, entonces Un∩A 6= ∅, luego podemos elegir un punto xn ∈ Un∩A.Es inmediato que la sucesion xnn∈ω esta contenida en A y converge a x.

El recıproco es trivial: si existe la sucesion y U es un entorno de x, entoncesexiste un n tal que xn ∈ U ∩A 6= ∅, luego x es adherente a A.

a) Si x no es un punto interior de A, entonces x ∈ X\

A= X \A, luego porb) existe una sucesion en X \A que converge a x. El recıproco es consecuenciainmediata de la definicion de convergencia.

La prueba de c) es analoga a la de b) y el apartado d) es un caso particularde b).

Vemos, pues, que en este contexto un conjunto A es cerrado cuando esimposible que el lımite de una sucesion contenida en A se salga de A.

La topologıa de orden en los ordinales Consideremos un ordinal α > 0como espacio topologico con la topologıa de orden. Observamos en primer lugarque los puntos aislados de α son el 0 y los ordinales sucesores.

En efecto, por una parte tenemos que 0 = ]−∞, 1[ (o bien 0 = α, si esque α = 1) y, si β+1 < α, entonces β+1 = ]β, β + 2[ (o bien β+1 = ]β,+∞[si es que β + 2 = α). Por lo tanto, 0 y los ordinales sucesores en α son puntosaislados.

Page 264: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

254 Capıtulo 8. Elementos de topologıa

En cuanto a los ordinales lımite, veamos que si λ ∈ α, entonces una base deentornos abiertos de λ es ]δ, λ]δ<λ. Es claro entonces que λ es un punto deacumulacion de α, pues todos sus entornos contienen ordinales < λ.

Ante todo, ]δ, λ] es abierto, pues coincide con ]δ, λ+ 1[ si λ+1 < α o bien con]δ,+∞[ en caso contrario. Si U ⊂ α es un entorno de λ, entonces existen δ, βtales que λ ∈ ]u, v[ ⊂ U , donde u, v son ordinales de α o bien ±∞. Ahora bien,si u = −∞, siempre podemos tomar δ < λ y se cumple que ]δ, λ] ⊂ ]u, v[ ⊂ U .

En particular, α es discreto si y solo si α ≤ ω, y α es 1AN si y solo si1

α ≤ ω1. En efecto, si α > ω1 entonces ω1 ∈ α no admite una base numerablede entornos, pues si Unn∈ω es cualquier familia numerable de entornos deω1, podemos tomar el menor ordinal δn < ω1 tal que ]δn, λ] ⊂ Un. Entoncesδ =

nδn < ω1, y cumple que

n ∈ ω ]δ, λ] ⊂ Un, luego ]δ + 1, λ] es un entorno

de λ que no puede contener ningun entorno Un, luego la familia dada no es unabase de entornos.

Ası pues, los ordinales > ω1 son ejemplos de espacios topologicos no metri-zables.

Observemos por ultimo que si λ es un ordinal lımite, un conjunto C ⊂ λ escerrado en λ en el sentido de la definicion 6.1 si y solo si es cerrado respecto dela topologıa de orden en λ.

En efecto, si C es cerrado para la topologıa de orden y λ′ < λ cumple queC ∩ λ′ no esta acotado en λ′, entonces C corta a todo conjunto ]δ, λ′], luegocorta a todo entorno de λ′, luego λ′ ∈ C = C. Ası pues, C es cerrado en elsentido de 6.1.

Recıprocamente, si C es cerrado segun 6.1 y β ∈ C, entonces todo entornode β corta a C. Si β es un punto aislado, entonces β∩C 6= ∅, luego β ∈ C, ysi β es un ordinal lımite, entonces, para todo δ < β tenemos que ]δ, β]∩C 6= ∅,lo cual significa que β ∩ C no esta acotado en β, luego β ∈ C igualmente.Concluimos que C = C, luego C es cerrado para la topologıa.

8.3 Aplicaciones continuas

Uno de los conceptos mas relevantes que permite formalizar la topologıa esel de aplicacion continua, entendida como una aplicacion que “no desgarra” unconjunto, en el sentido de que transforma los puntos de alrededor de un puntox en los puntos de alrededor de f(x). Con precision:

Definicion 8.27 Una aplicacion f : X −→ Y entre dos espacios topologicoses continua en un punto x ∈ X si para todo entorno U de f(x) se cumple quef−1[U ] es un entorno de x. Diremos que f es continua en un conjunto A ⊂ Xsi es continua en todos los puntos de A. Diremos que f es continua si lo es entodos los puntos de su dominio X .

1Una implicacion usa AEN, al afirmar que δ < ω1.

Page 265: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.3. Aplicaciones continuas 255

En otras palabras, f es continua en x si entre los puntos de alrededor def(x) estan las imagenes de todos los puntos de alrededor de x. La definicionpuede expresarse en terminos de una base de entornos de x y otra de f(x): dadoun entorno basico U de f(x), debe cumplirse que f−1[U ] contenga un entornobasico de x. Si aplicamos esto a una aplicacion entre dos espacios metricostomando un entorno basico de f(x) de la forma Bǫ(f(x)) y un entorno basicode x de la forma Bδ(x), tenemos la caracterizacion siguiente:

Teorema 8.28 Una aplicacion f : M −→ N entre dos espacios metricos escontinua en un punto x ∈M si y solo si

ǫ > 0∨

δ > 0∧

u ∈M(d(x, u) < δ → d(f(x), f(u)) < ǫ).

Es decir, que si queremos que f(u) diste de f(x) menos que ǫ, solo tene-mos que tomar u a una distancia de x menor que δ, o tambien, que puntossuficientemente proximos a x tienen imagenes arbitrariamente proximas a f(x).

En espacios 1AN podemos caracterizar la continuidad en terminos de suce-siones:

Teorema 8.29 (AEN) Sea f : X −→ Y una aplicacion entre espacios to-pologicos y sea x ∈ X un punto con una base numerable de entornos. Entoncesf es continua en x si y solo si para toda sucesion xnn∈ω en X convergente ax se cumple que f(xn)n∈ω converge a f(x).

Demostracion: Si f es continua en x y xnn∈ω converge a x, entonces,dado un entorno U de f(x), tenemos que f−1[U ] es un entorno de x, luego existeun m ∈ ω tal que para n ≥ m se cumple xn ∈ f−1[U ], luego f(xn) ∈ U , luegof(xn)n∈ω converge a f(x).

Recıprocamente, si se cumple la propiedad sobre las sucesiones pero f noes continua en x, entonces existe un entorno U de f(x) tal que f−1[U ] no esentorno de x, es decir, que x no es interior a f−1[U ]. Por el teorema 8.26 (encuya prueba solo se usa que x tiene una base numerable de entornos) existe unasucesion xnn∈ω convergente a x contenida en X \ f−1[U ] (en la prueba se veque es ası), luego f(xn)n∈ω esta contenida en Y \U , luego no puede convergera f(x).

El teorema siguiente es una consecuencia inmediata de la definicion de con-tinuidad:

Teorema 8.30 Si f : X −→ Y y g : Y −→ Z son aplicaciones entre espaciostopologicos, f es continua en un punto x ∈ X y g es continua en f(x), entoncesf g es continua en x. En particular, si f y g son continuas, tambien lo esf g.

Ahora observamos que la continuidad global tiene una caracterizacion global:

Teorema 8.31 Una aplicacion f : X −→ Y entre espacios topologicos es con-tinua si y solo si para todo abierto A de Y se cumple que f−1[A] es abiertoen X.

Page 266: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

256 Capıtulo 8. Elementos de topologıa

Demostracion: Si f es continua y A es abierto en Y , para probar quef−1[A] es abierto en X veamos que es entorno de todos sus puntos. Sea, pues,x ∈ f−1[A]. Entonces f(x) ∈ A, luego A es un entorno de f(x), luego f−1[A]es un entorno de x. Ası pues, f−1[A] es abierto.

Recıprocamente, si U es un entorno de f(x), entonces existe un abierto Atal que f(x) ∈ A ⊂ U , luego x ∈ f−1[A] ⊂ f−1[U ], luego f−1[U ] es un entornode x.

Es claro que para que f sea continua basta con pedir que f−1[A] sea abiertoen X para todo abierto de una base o subbase prefijada de Y .

Ahora es inmediato que si X es discreto o Y es trivial, toda aplicacionf : X −→ Y es continua. Mas en general, notemos que una aplicacion f essiempre continua en los puntos aislados de su dominio, pues si U es un entornode f(x), entonces f−1[U ] es entorno de x, ya que x es abierto.

Por otra parte, toda funcion constante es continua, ya que la antiimagen deun conjunto por una funcion constante es vacıa o todo el espacio.

El teorema siguiente relaciona la continuidad con la topologıa relativa:

Teorema 8.32 Sea f : X −→ Y una aplicacion entre espacios topologicos.

a) Si Z ⊂ X, la inclusion i : Z −→ X es continua, luego si f es continuatambien lo es la restriccion f |Z : Z −→ Y es continua.

b) Si f [X ] ⊂W ⊂ Y , entonces f es continua (en un punto) como aplicacionf : X −→ Y si y solo si lo es como aplicacion f : X −→W .

Demostracion: a) Si A ⊂ X es abierto, entonces i−1[A] = A∩Z es abiertoen Z, luego i es continua. Entonces f |Z = i f es continua por ser composicionde funciones continuas.

Si f : X −→ W es continua, entonces f : X −→ Y lo es porque es lacomposicion de f con la inclusion W −→ Y . Si f : X −→ Y es continua, unabierto de W es de la forma A ∩W , donde A es abierto en Y , pero claramentef−1[A ∩W ] = f−1[A], luego f es continua como aplicacion en W .

Respecto a productos, observemos que de la propia definicion de la topologıaproducto se sigue que esta es la mınima topologıa para la que las proyeccionesson funciones continuas. Mas aun:

Teorema 8.33 Sea X =∏

i

Xi un producto de espacios topologicos. Entonces

cada proyeccion pi : X −→ Xi es continua y una aplicacion f : Y −→ Xentre espacios topologicos es continua si y solo si lo es cada funcion coordenadafi = f pi.

Demostracion: Si f es continua las funciones f pi tambien lo son por sercomposicion de funciones continuas.

Page 267: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.3. Aplicaciones continuas 257

Si cada f pi es continua, sea A =∏

i∈I

Ai un abierto basico de X . Sean

i1, . . . , in los ındices tales que Aij 6= Xij . Entonces tenemos que cada antiimagen

f−1[p−1ij

[Aij ]]

= (f pij )−1[Aij ] es abierta en Y , pero

A =n⋂

j=1

p−1ij

[Aij ] y f−1[A] =n⋂

j=1

f−1[p−1ij

[Aij ]]

es abierto en Y .

Teorema 8.34 Sean X =∏

i∈I

Xi, Y =∏

i∈I

Yi dos productos de espacios to-

pologicos y sea fii∈I una familia de aplicaciones continuas fi : Xi −→ Yi.Entonces la aplicacion f =

i∈I

fi : X −→ Y dada por f(x) = fi(xi)i∈I es con-tinua.

Demostracion: Basta observar que f pYi = pXi fi, luego la composiciones continua, luego f tambien, por el teorema anterior.

Una propiedad que se usa con frecuencia es la siguiente:

Teorema 8.35 Si f, g : X −→ Y son funciones continuas entre espacios to-pologicos e Y es un espacio de Hausdorff, entonces el conjunto

x ∈ X | f(x) = g(x)es cerrado en X. En particular, si f y g coinciden en un conjunto denso,entonces f = g.

Demostracion: Llamemos A al conjunto del enunciado. La aplicacionh : X −→ Y × Y dada por h(x) = (f(x), g(x)) es continua, porque lo son susfunciones coordenadas, y por 8.17 la diagonal ∆ ⊂ Y × Y es cerrada. Bastaobservar que A = h−1[∆].

Si existe D ⊂ X denso tal que f |D = g|D, entonces D ⊂ A, de modo queX = D ⊂ A = A ⊂ X , lo que significa que f = g.

El teorema siguiente es util a menudo para probar que una aplicacion escontinua cuando tiene definiciones diferentes sobre conjuntos diferentes:

Teorema 8.36 Sea f : X −→ Y una aplicacion entre espacios topologicos.Sean C1, . . . , Cn subconjuntos cerrados de X tales que X = C1 ∪ · · · ∪ Cn.Entonces f es continua si y solo si cada f |Ci

es continua.

Demostracion: Una implicacion es obvia. Si las restricciones son conti-nuas, entonces dado un cerrado C de Y , se cumple que

f−1[C] = (f−1[C]∩C1)∪ · · · ∪ (f−1[C]∩Cn) = (f |C1)−1[C]∪ · · · ∪ (f |Cn)−1[C].

Ahora, cada (f |Ci)−1[C] es cerrado en Ci, luego es la interseccion con Ci de

un cerrado de X , luego es la interseccion de dos cerrados en X , luego es cerradoen X . Ası pues, f−1[C] es la union de un numero finito de cerrados de X , luegoes cerrado en X . Esto prueba que f es continua.

Veamos algunos ejemplos concretos de funciones continuas:

Page 268: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

258 Capıtulo 8. Elementos de topologıa

Teorema 8.37 Si M es un espacio metrico y ∅ 6= A ⊂M , entonces la distan-cia d : M ×M −→ R y la aplicacion d( , A) : M −→ R son continuas.

Demostracion: Consideramos en M ×M la distancia dada por

d((x, y), (x′, y′)) = d(x, x′) + d(y, y′),

que hemos probado que induce la topologıa producto en M ×M . Entonces

|d(x, y) − d(x′, y′)| ≤ |d(x, y) − d(x′, y)| + |d(x′, y) − d(x′, y′)|

≤ d(x, x′) + d(y, y′) = d((x, y), (x′, y′)),

es decir, si llamamos P = (x, y) y P ′ = (x′, y′), acabamos de probar qued(d(P ), d(P ′)) ≤ d(P, P ′), lo que permite aplicar el teorema 8.28 con δ = ǫ.

La continuidad de d( , A) en un punto x es consecuencia inmediata de larelacion:

|d(x,A) − d(y,A)| ≤ d(x, y).

Para probarla observamos que si z ∈ A, se cumple d(x, z) ≤ d(x, y)+d(y, z). Deaquı se sigue claramente d(x,A) ≤ d(x, y) + d(y, z), y tomando el ınfimo en zvemos que d(x,A) ≤ d(x, y)+d(y,A). Analogamente, d(y,A) ≤ d(x, y)+d(x,A),de donde se sigue la relacion con valores absolutos.

En particular, el valor absoluto es una aplicacion continua K −→ R en todocuerpo metrico, pues |x| = d(x, 0) (luego es la composicion de la aplicacionK −→ K ×K dada por x 7→ (x, 0), que es continua porque lo son sus funcionescoordenadas, con la distancia d).

Los teoremas 7.24, 8.29 y 8.15 implican que la suma y el producto en todocuerpo metrico K (en particular en R) son aplicaciones continuas K×K −→ K.Tambien es continua la aplicacion K \ 0 −→ K \ 0 dada por x 7→ 1/x.

Para probarlo consideramos una sucesion xnn∈ω en K \ 0 convergente ax ∈ K \ 0 y observamos que

∣∣∣∣

1

xn− 1

x

∣∣∣∣

=|x− xn||xn||x|

.

Sabemos que la sucesion 1/xnn∈ω es de Cauchy (teorema 7.29), luego estaacotada, luego tambien lo esta 1/|xn||x|n∈ω, y tenemos que |xn−x|n∈ω con-verge a 0, luego su producto converge a 0 por 7.28. Esto implica que 1/xnn∈ω

converge a 1/x.

Por ejemplo, por el teorema 8.24 sabemos que Q × Q es denso en R × R,luego el teorema 8.35 implica que la suma y el producto de R son las unicasextensiones posibles de la suma y el producto en Q que convierten a R en uncuerpo metrico.

Es obvio que toda semejanza entre dos conjuntos totalmente ordenados escontinua respecto de las topologıas de orden, pues la antiimagen de un intervaloabierto es tambien un intervalo abierto.

Page 269: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.3. Aplicaciones continuas 259

Lo mismo vale si f : X −→ Y es una biyeccion monotona decreciente, puesentonces

f−1[

]a,+∞[]

=]−∞, f−1(a)

[, f−1

[]−∞, b[

]=

]f−1(b),+∞

[.

En particular, la aplicacion [0,+∞] −→ [0,+∞] dada por x 7→ 1/x, con elconvenio de que 1/0 = +∞ y 1/+∞ = 0 es continua, pues es inmediato que setrata de una biyeccion monotona decreciente.

Tambien es continua la aplicacion√

: [0,+∞[ −→ [0,+∞[, pues se tratade una semejanza. Incluso sigue siendo continua si la extendemos a [0,+∞]mediante

√+∞ = +∞, pues sigue siendo una semejanza.

Teorema 8.38 Una aplicacion f : α −→ β creciente entre dos ordinales escontinua si y solo si para todo ordinal lımite λ ∈ α se cumple que f(λ) =

δ<λ

f(δ).En particular, toda funcion normal es continua.

Demostracion: Toda funcion es continua en los puntos aislados, luego fsera continua si y solo si lo es en los ordinales lımite. Vamos a probar que lacondicion del enunciado equivale a la continuidad de f en λ.

Observemos que la monotonıa de f implica en cualquier caso la desigualdadγ =

δ<λ

f(δ) ≤ f(λ). Supongamos que f es continua en λ pero γ < f(λ). Como

]γ, f(λ)] es un entorno de f(λ), existe δ0 < λ tal que ]δ0, λ] ⊂ f−1[]γ, f(λ)]

],

pero entonces, si δ0 < δ < λ, tenemos que f(δ0) ≤ γ < f(δ0), contradiccion.Ası pues, f(λ) = γ, como habıa que probar.

Si se cumple la condicion del enunciado, un entorno basico de f(λ) es de laforma ]γ, f(λ)], para cierto γ < f(λ), pero por hipotesis γ < f(δ0), para ciertoordinal δ0 < λ, y esto implica que ]δ0, λ[ ⊂ f−1

[]γ, f(λ)]

], pues si δ0 < δ < λ

entonces γ < f(δ0) ≤ f(δ) ≤ f(λ), luego f(δ) ∈ ]γ, f(λ)].

Para terminar introducimos las aplicaciones que conservan todas las propie-dades topologicas:

Definicion 8.39 Una aplicacion f : X −→ Y entre dos espacios topologicoses un homeomorfismo si es biyectiva y tanto f como f−1 son continuas. Sedice que X e Y son homeomorfos si existe un homeomorfismo entre ellos, y serepresenta por X ∼= Y .

Claramente, f es un homeomorfismo si cumple que A ⊂ X es un abierto enX si y solo si f [A] es un abierto en Y , y viceversa. Las propiedades topologicasson las que se definen en ultima instancia a partir de los conjuntos abiertos,luego es claro que dos espacios homeomorfos tienen las mismas propiedadestopologicas.

Es claro que la isometrıas entre espacios metricos y las semejanzas entreconjuntos totalmente ordenados son homeomorfismos.

Page 270: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

260 Capıtulo 8. Elementos de topologıa

Equivalentemente, un homeomorfismo es una aplicacion biyectiva, continuay abierta entre espacios topologicos, donde una aplicacion f : X −→ Y se diceabierta si cuando U ⊂ X es abierto entonces f [U ] tambien lo es.

Un ejemplo de aplicaciones abiertas que no son homeomorfismos lo consti-tuyen las proyecciones de los productos cartesianos:

Teorema 8.40 Las proyecciones pi :∏

i∈I

Xi −→ Xi son aplicaciones abiertas.

Demostracion: Si U =∏

i∈I

Ui es un abierto basico, entonces pi[U ] = Ui

es abierto en Xi, y si G =⋃

j∈J

Uj es una union de abiertos basicos, entonces

pi[G] =⋃

j∈J

pi[Uj ] tambien es abierto.

El producto cartesiano de espacios topologicos es asociativo:

Teorema 8.41 Si Xii∈I es una familia de espacios topologicos y I =⋃

j∈J

Ij es

una descomposicion de I en conjuntos disjuntos dos a dos, entonces la aplicacionf :

i∈I

Xi −→∏

j∈J

i∈Ij

Xi dada por f(x)j = x|Ij es un homeomorfismo.

Demostracion: Claramente f es biyectiva, y es continua, pues si j ∈ Jla funcion coordenada f pj :

i∈I

Xi −→∏

i∈Ij

Xi es continua, pues, para cada

i ∈ Ij tenemos que f pj pi = pi, que es continua.Teniendo en cuenta que f−1(x) =

j∈j

xj , se comprueba igualmente que, si

i ∈ Ij , entonces f−1 pi = pj pi, luego f−1 es continua.

Nota El teorema 7.43 nos da que R es semejante a ]0, 1[, luego son espacioshomeomorfos con la topologıa del orden (la usual). La topologıa de ambosespacios esta inducida por la distancia usual en R, pero R es un espacio metricocompleto, mientras que es facil ver que ]0, 1[ no lo es. Basta considerar lasucesion 1/n∞n=1, que converge en R, luego es de Cauchy en R, luego tambienlo es en ]0, 1[, pero no converge en ]0, 1[.

Esto significa que la completitud de un espacio metrico no es una propiedadtopologica, ni tampoco lo es el concepto de sucesion de Cauchy. Un homeomor-fismo entre ]0, 1[ y R tiene que transformar la sucesion de Cauchy no convergente1/n∞n=1 en una sucesion no convergente en R, pero como R es completo, lasucesion imagen no puede ser de Cauchy. Por lo tanto, “ser una sucesion deCauchy” no es una propiedad que se conserve necesariamente a traves de unhomeomorfismo.

Esto no contradice nada de lo dicho anteriormente, porque lo que sucede esque, al contrario de lo que sucede con el concepto de sucesion convergente, no esposible definir el concepto de sucesion de Cauchy en un espacio metrico a partir

Page 271: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.4. Condiciones de numerabilidad 261

de la topologıa inducida por la distancia, sino que es imprescindible hacer refe-rencia a la distancia en sı. De este modo, dos distancias en un mismo conjuntopueden inducir la misma topologıa, pero de modo que una determine un espaciometrico completo y la otra no. Esto sucede, por ejemplo, si transportamos ladistancia de R a ]0, 1[ a traves de un homeomorfismo. Con ello obtenemos unadistancia que induce la topologıa usual en ]0, 1[, pero que lo convierte en unespacio metrico completo.

Lo que sı que es una propiedad topologica es “ser metrizable” o “ser comple-tamente metrizable”. El espacio topologico ]0, 1[ es completamente metrizable,en el sentido de que su topologıa es la topologıa inducida por una cierta distan-cia que lo convierte en un espacio metrico completo (solo que esa distancia noes la usual, sino la deducida de un homeomorfismo entre ]0, 1[ y R).

8.4 Condiciones de numerabilidad

La mayor parte de los espacios topologicos que surgen de forma natural alestudiar la topologıa de los espacios Rn satisfacen condiciones de numerabilidadque simplifican en gran medida su estudio, a la vez que proporcionan criteriosde eleccion que hacen innecesario el axioma de eleccion o bien hacen que solo serequieran las formas debiles, como AEN o ED.

Ya hemos visto una de estas condiciones: el primer axioma de numerabili-dad 1AN, que satisfacen todos los espacios metricos y que permite caracterizarmediante sucesiones los conceptos topologicos. Otra condicion mas fuerte es elsegundo axioma de numerabilidad:

Definicion 8.42 Un espacio topologico cumple el segundo axioma de numera-bilidad (2AN) si tiene una base numerable.

Es inmediato que, en todo espacio topologico, 2AN → 1AN, pues si B esuna base numerable de un espacio X y x ∈ X , entonces Bx = B ∈ B | x ∈ Bes una base numerable de entornos de X .

Por otra parte, un espacio discreto no numerable es un ejemplo de espacio1AN que no es 2AN.

Tambien es inmediato que todo subespacio Y de un espacio X que sea 1ANo 2AN es tambien 1AN o 2AN, pues si B es una base numerable de X (o unabase numerable de entornos en X de un punto y ∈ Y ) entonces B∩Y | B ∈ Bes una base numerable de Y (o una base numerable de entornos de y en Y ).

Observemos que R cumple el segundo axioma de numerabilidad, pues el con-junto de todos los intervalos ]a, b[ con extremos a, b ∈ Q es una base numerable.

Este hecho se extiende a los espacios Rn y a todos sus subespacios. Mas engeneral:

Teorema 8.43 (AEN) Si Xii∈I es una familia de espacios topologicos quecumplen 1AN (resp. 2AN) e I es numerable, entonces X =

i∈I

Xi cumple tambien1AN (resp. 2AN).

Page 272: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

262 Capıtulo 8. Elementos de topologıa

Demostracion: Consideremos un punto x ∈ X y, para cada i ∈ I, sea Bi

una base numerable de entornos (abiertos) de xi (resp. una base de Xi). Esclaro entonces que el conjunto B formado por todos los conjuntos de la forma⋂

i∈I0

p−1i [Bi] con Bi ∈ Bi forman una base de entornos de x (resp. una base

de X). Basta probar que B es numerable. Ahora bien, tenemos una aplicacionsuprayectiva

I0∈PfI

i∈I0

Bi −→ B,

la dada por Bii∈I0 7→ ⋂

i∈I0

p−1i [Bi], y es facil ver que2 el conjunto de la iz-

quierda es numerable, luego B tambien lo es.

En cambio estas condiciones de numerabilidad no se conservan con productosno numerables:

Teorema 8.44 (AE) Si un producto X =∏

i∈I

Xi cumple 1AN y ningun factor

Xi tiene la topologıa trivial (lo que en particular supone que tiene mas de unpunto), entonces I es numerable.

Demostracion: Para cada i ∈ I elegimos un abierto Ui Xi no vacıo, y unpunto xi ∈ Ui. Con esto formamos un punto x ∈ X . Si B es una base numerablede entornos de x, para cada i ∈ I existe un Bi ∈ B tal que x ∈ Bi ⊂ p−1

i [Ui].Consideramos la aplicacion f : I −→ B dada por f(i) = Bi. Ası

I =⋃

B∈B

f−1[B],

Basta probar que cada conjunto f−1[B] es finito, pues entonces I sera una unionnumerable de conjuntos finitos, luego sera numerable. Ahora bien, dado B ∈ B,entonces x ∈ ⋂

i∈I0

p−1i [Ai] ⊂ B, donde I0 ⊂ I es finito y Ai es abierto en Xi.

Si i ∈ f−1[B] entonces B ⊂ p−1i [Ui], y esto implica que i ∈ I0, pues en caso

contrario podemos tomar y ∈ Xi \Ui y el punto x′ ∈ X que coincide con x salvoque x′i = y cumplirıa x′ ∈ B \ p−1

i [Ui]. Ası pues, f−1[B] ⊂ I0 es finito.

Nota Los unicos usos de AE en la prueba del teorema anterior que no puedenreducirse a AEN son las elecciones de los abiertos Ui y de los puntos xi. Porello, el caso particular siguiente solo requiere AEN:

Si X es un espacio topologico no trivial y el producto XI cumple1AN, entonces I es numerable.

En particular (bajo AEN), espacios como ω12 son ejemplos de espacios queno cumplen 1AN y que, en particular, no son metrizables.

Una condicion de numerabilidad mas debil es la separabilidad:

2Aquı usamos que un producto finito de conjuntos numerables es numerable (lo que norequiere AE), y que la union numerable de conjuntos numerables es numerable (lo que solorequiere AEN para elegir una biyeccion de cada conjunto en ω), lo cual implica en particularque Pf I es numerable.

Page 273: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.4. Condiciones de numerabilidad 263

Definicion 8.45 Un espacio topologico es separable si tiene un conjunto densonumerable.

Es inmediato que 2AN implica la separabilidad, pues si B = Bn | n ∈ ω esuna base numerable de un espacio X y elegimos un punto dn ∈ Bn, el conjuntoD = dn | n ∈ ω corta a cada abierto basico, luego corta a cada abierto, luegoes un conjunto denso numerable.

En el contexto de los espacios metricos la separabilidad equivale a 2AN:

Teorema 8.46 Un espacio metrico cumple 2AN si y solo si es separable.

Demostracion: Si M es un espacio metrico separable, tomamos un con-junto denso D = dn | n ∈ ω. Entonces el conjunto B formado por las bolasB1/m(dn) es una base de M , pues si A es un abierto en M y x ∈ A, entoncesexiste un ǫ > 0 tal que Bǫ(x) ⊂ A y, tomando k ∈ ω tal que 1/k < ǫ/2, podemostomar un n tal que d(dn, x) < 1/k, con lo que x ∈ B1/k(dn) ⊂ Bǫ(x) ⊂ A, yaque si y ∈ B1/k(dn) entonces d(y, x) ≤ d(y, dn) + d(dn, x) < 1/k < ǫ.

Ejemplo La recta de Sorgenfrey S es el conjunto R de los numeros realescon la topologıa que tiene por base a los intervalos [a, b[, con a < b. Es facilcomprobar que se cumplen las condiciones del teorema 8.4, por lo que S esciertamente un espacio topologico.

Se comprueba inmediatamente que es de Hausdorff, que cumple 1AN (porque[a, 1/n[n∈ω\0 es una base de entornos de a) y es separable, pues Q es densoen S. En cambio, no cumple 2AN.

En efecto, si tuviera una base numerable B, para cada x ∈ R \Q tomamos3

Bx ∈ B tal que x ∈ Bx ⊂ [x, x + 1[, pero sucede entonces que la aplicacionf : R\Q −→ B dada por f(x) = Bx es inyectiva, pues si x < y son dos numerosirracionales, entonces x ∈ Bx \By, y ası tenemos una contradiccion.

En particular vemos que S es un espacio 1AN separable no metrizable.

La separabilidad se conserva por productos mejor que 1AN y 2AN:

Teorema 8.47 (AE) El producto de a lo sumo 2ℵ0 espacios topologicos sepa-rables es separable.

Demostracion: Sea X =∏

i∈I

Xi un producto de espacios separables, donde

|I| ≤ 2ℵ0 . Sea Di ⊂ Xi un subconjunto denso numerable. Entonces sabemosque D =

i∈I

Di es denso en X , luego basta probar4 que D contiene un sub-

conjunto denso numerable. Equivalentemente, podemos suponer que cada Xi esnumerable. Tomamos biyecciones gi : ω −→ Xi, que son trivialmente continuas,y determinan una biyeccion continua ωI −→ X .

3Aquı no usamos AE porque estamos eligiendo en un conjunto numerable.4En general, si E ⊂ D ⊂ X, E es denso en D y D es denso en X, entonces E es tambien

denso en X, pues tenemos que D = ED

= E ∩D, luego D ⊂ E ⊂ X, luego X = D ⊂ E ⊂ Xy E = X.

Page 274: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

264 Capıtulo 8. Elementos de topologıa

Consideremos el espacio Y = ω2. A partir de una aplicacion j : I −→ Y in-yectiva podemos construir una aplicacion continua y suprayectiva h : ωY −→ ωI

(la dada por h(y)(i) = y(j(i))). Componiendo ambas obtenemos una aplicacioncontinua y suprayectiva f : ωY −→ X .

Si encontramosD ⊂ ωY denso numerable, entonces f [D] sera un subconjuntodenso numerable de X (si A ⊂ X es abierto no vacıo, entonces f−1[A] es unabierto no vacıo, luego corta a D, luego A corta a f [D]). Ası pues, basta probarque ωY es separable.

Por 8.43 sabemos que Y es un espacio topologico que cumple 2AN. SeaB una base numerable. Sea F el conjunto de todos los subconjuntos finitosde B formados por abiertos disjuntos dos a dos. Claramente F es numerable.Sea D ⊂ ωY el conjunto de todas las funciones f : Y −→ ω tales que existeB = Bi | i < n ∈ F de modo que cada f |Bi

es constante, al igual que f |Y \∪B.Si llamamos DB al conjunto de los f ∈ D determinados por B ∈ F, tenemos

que D =⋃

B∈F

DB y cada DB es numerable, pues si B = Bi | i < n, la

aplicacion n+1ω −→ DB que a cada s ∈ n+1ω le asigna la funcion⋃

i<n

(Bi × s(i)) ∪ ((Y \⋃B) × s(n))

es suprayectiva. Concluimos que D es numerable, y basta probar que es densoen ωY .

Una base de ω es nn∈ω, la cual determina la base de ωY formada porlos abiertos de la forma

i≤k

p−1yi

[ni], donde y0, . . . , yk son puntos de Y distintosdos a dos y ni ∈ ω.

Basta probar que D corta a todos estos abiertos basicos. Esto equivale aencontrar un f ∈ D tal que

i ≤ k f(yi) = ni. Pero, como Y es un espaciode Hausdorff, existen abiertos basicos disjuntos dos a dos B0, . . . , Bn tales queyi ∈ Bi. Ahora basta tomar f =

i≤n

(Bi×ni)∪ ((Y \⋃B)×y0) ∈ D.

Nota La prueba de que ωY es separable solo usa AEN, y la reduccion a estecaso requiere unicamente AEN si I es numerable y no requiere AE en absoluto sitodos los espacios son el mismo. Por lo tanto, con AEN puede probarse que unproducto numerable de espacios separables es separable y que XI es separable

siempre que X es separable y I ≤ 2ℵ0 .

En particular vemos que ωω2 es un espacio separable que no cumple 1AN,

ni por tanto 2AN.

Veamos una ultima condicion de numerabilidad:

Definicion 8.48 Un espacio topologico X cumple la condicion de cadena nu-merable (ccn) si toda familia de abiertos de X disjuntos dos a dos es numerable.

Las familias de abiertos disjuntos dos a dos en un espacio topologico sellaman anticadenas de abiertos.5

5Segun esto, la condicion de cadena numerable deberıa llamarse “condicion de anticadenanumerable”. Su nombre se debe a que admite una formulacion equivalente en terminos decadenas crecientes de abiertos, pero es mas util la formulacion que hemos adoptado.

Page 275: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.4. Condiciones de numerabilidad 265

Todo espacio separable X cumple la ccn, pues si D es denso en X y esnumerable, y F es una familia de abiertos disjuntos dos a dos, podemos definiruna aplicacion F \ ∅ −→ D inyectiva asignando a abierto U ∈ F no vacıo unpunto de U ∩D.

Nuevamente, en espacios metricos la condicion es equivalente a la separabi-lidad y a 2AN:

Teorema 8.49 (AE) Un espacio metrico es 2AN si y solo si cumple la con-dicion de cadena numerable.

Demostracion: Sea M un espacio metrico ccn y, para cada n ∈ ω \ 0,sea An el conjunto de todas las familias de bolas abiertas disjuntas dos a dosde radio 1/n. Podemos considerar a An como conjunto parcialmente ordenadopor la inclusion, y es claro que cumple las hipotesis del lema de Zorn, pues sitenemos una cadena en An, la union de sus elementos es una cota superior.Por lo tanto, existe una anticadena maximal Cn de bolas abiertas de radio 1/n.Que sea maximal significa que si B /∈ Cn es una bola abierta de radio n, nopuede ocurrir que sea disjunta de todos los elementos de Cn, pues entoncesCn ∪ B serıa una anticadena mayor, en contra de la maximalidad de Cn,luego en cualquier caso (tanto si esta en Cn como si no) toda bola abierta deradio 1/n corta a algun elemento de Cn.

Por hipotesis Cn es numerable, al igual que B =⋃

n∈ω\0

Cn. Vamos a probar queB es una base de M .

Dado un abierto U en M y un punto x ∈ U , existe un ǫ > 0 tal quex ∈ Bǫ(x) ⊂ U . Sea n ∈ ω tal que 1/n < ǫ/3. Entonces la bola B1/n(x) corta auna bola B1/n(y) ∈ B. Veamos que x ∈ B2/n(y) ⊂ Bǫ(x) ⊂ U .

Si u ∈ B1/n(x) ∩ B1/n(y), entonces d(x, y) ≤ d(x, u) + d(u, y) < 2/n, luegox ∈ B2/n(y). Por otra parte, si z ∈ B2/n(y), entonces

d(z, x) ≤ d(z, y) + d(y, x) < 1/n+ 2/n = 3/n < ǫ,

luego B2/n(y) ⊂ Bǫ(x).

Sin embargo, la relacion de la condicion de cadena numerable con los pro-ductos es muy peculiar: no es posible demostrar en NBG (supuesto que seaconsistente) que el producto de dos espacios topologicos que cumplan la ccncumpla necesariamente la ccn, (vease el teorema 10.58) pero tampoco es posibledemostrar que sea falso. Y ademas se cumple un teorema muy peculiar:

Teorema 8.50 (AE) Sea X =∏

i∈I

Xi un producto de espacios topologicos tal

que, para todo I0 ⊂ I finito, el producto∏

i∈I0

Xi cumpla la condicion de ca-

dena numerable. Entonces X cumple la condicion de cadena numerable. Enparticular, todo producto de espacios separables cumple la condicion de cadenanumerable.

La segunda parte del teorema es inmediata: si los factores son separables,cualquier producto finito de ellos es separable por 8.47, luego cumple la ccn.

Page 276: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

266 Capıtulo 8. Elementos de topologıa

Una consecuencia de este teorema es que si tomamos como axioma que elproducto de dos espacios topologicos con la ccn cumple tambien la ccn (lo cuales consistente, pues, como hemos indicado, no se puede demostrar lo contrario),entonces una simple induccion prueba que lo mismo vale para productos concualquier numero finito de factores, y el teorema anterior implica entonces queel producto de espacios ccn (sin restriccion alguna sobre el numero de factores)cumple tambien la ccn. Demostraremos este teorema a partir de un resultadopuramente conjuntista:

Definicion 8.51 Un sistema ∆ o una familia cuasidisjunta de raız r es unafamilia F de conjuntos tal que

xy ∈ F(x 6= y → x ∩ y = r).

Teorema 8.52 (AE) Si κ es un cardinal regular no numerable y A es unafamilia de κ conjuntos finitos, entonces existe una familia cuasidisjunta F ⊂ A

con |F| = κ.

Demostracion: Sea An = x ∈ A | |x| = n. Entonces A =⋃

n∈ωAn. Si

|An| < κ para todo n, tambien |A| < κ, luego existe un n ∈ ω (obviamenten > 0) tal que |An| = κ. Equivalentemente, podemos suponer que todos loselementos de A tienen un mismo cardinal n > 0. Probamos el teorema porinduccion sobre n. Si n = 1 es obvio que la propia A es cuasidisjunta de raızr = ∅. Supongamos que toda familia de κ conjuntos con n elementos tiene unasubfamilia cuasidisjunta de cardinal κ y veamos que lo mismo vale para familiasde conjuntos de n+ 1 elementos.

Aplicando el lema de Zorn igual que en la prueba de 8.49, concluimos queexiste una familia maximal M de elementos de A disjuntos dos a dos. Si |M| = κ,entonces es cuasidisjunta de raız ∅ y ya hemos terminado. Supongamos que|M| < κ. Entonces A =

x∈M

x tiene cardinal < κ y todo x ∈ A corta a A, ya

que en caso contrario M ∪ x contradirıa la maximalidad de M. Para cadaa ∈ A, sea Aa = x ∈ A | a ∈ x, de modo que A =

a∈A

Aa. Como |A| < κ,existe un a ∈ A tal que |Aa| = κ.

Sea A′ = x \ a | x ∈ Aa. Entonces A′ es una familia de κ conjuntosde cardinal n (notemos que la aplicacion A −→ Aa dada por x 7→ x \ a esbiyectiva). Por hipotesis de induccion existe F′ ⊂ A′ cuasidisjunta de raız r′

y cardinal κ, y entonces F = x ∪ a | x ∈ F′ ⊂ A es cuasidisjunta de raızr = r′ ∪ a y de cardinal κ.

Demostracion (de 8.50): Supongamos que Ajj∈J es una familia no nu-merable de abiertos en X disjuntos dos a dos. Podemos suponer que son novacıos (pues con ello a lo sumo suprimimos un elemento). Como cada uno con-tiene un abierto basico, no perdemos generalidad si suponemos que son abiertosbasicos, es decir, Aj =

i∈Ij

p−1i [Uij ], donde Ij ⊂ I es finito y cada Uij es abierto

en Xi.Consideramos la familia A = Ij | j ∈ J. Si es numerable, como J no lo

es, existe un r ∈ A tal que J0 = j ∈ J | Ij = r es no numerable. Si, por el

Page 277: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.5. Espacios compactos 267

contrario, A es no numerable, por el teorema anterior contiene un sistema ∆ nonumerable de raız r. Equivalentemente, podemos tomar J0 ⊂ J no numerabletal que

jj′ ∈ J0(j 6= j′ → Ij ∩ Ij′ = r). Notemos que esto es trivialmentecierto en el primer caso.

En definitiva, reduciendo la familia dada si es necesario, no perdemos gene-ralidad si suponemos que Ajj∈J es una familia de abiertos disjuntos dos a dosde modo que

jj′ ∈ J(j 6= j′ → Ij ∩Ij′ = r) (ya sea porque todos los conjuntosIj sean iguales a r o bien porque forman un sistema ∆ de raız r). Notemos queno puede ser r = ∅, pues entonces los Aj no serıan disjuntos dos a dos.

Consideremos ahora los abiertos A∗j =

i∈r

Uij ⊂∏

i∈r

Xi. Vamos a probar que

son disjuntos dos a dos, y con ello tendremos una contradiccion pues estamossuponiendo que el producto finito cumple la ccn. En efecto, si s∗ ∈ A∗

j ∩ A∗j′ ,

podemos construir un s ∈ Ai ∩ Aj sin mas que tomar:

si = s∗i ∈ Uij ∩ Uij′ si i ∈ r = Ij ∩ Ij′ ,si ∈ Uij si i ∈ Ij \ r,si ∈ Uij′ si i ∈ Ij′ \ r,si ∈ Xi si i ∈ I \ (Ij ∪ Ij′ ).

Como Aj ∩ Aj′ = ∅, concluimos que tambien A∗j ∩ A∗

j′ = ∅ y tenemos lacontradiccion.

8.5 Espacios compactos

La compacidad es el mas abstracto de los conceptos topologicos basicos y ala vez el mas potente. Se trata de una condicion de finitud, en el sentido de quelos espacios que la cumplen presentan muchas caracterısticas en comun con losespacios finitos sin limitar por ello el tamano que puede tener el espacio.

Definicion 8.53 Sea X un espacio topologico. Un cubrimiento abierto de Xes una familia C de abiertos de X tal que X =

⋃C. Un subcubrimiento de un

cubrimiento C es un cubrimiento contenido en C.

Un espacio topologico K es compacto6 si de todo cubrimiento abierto de Kse puede extraer un subcubrimiento finito.

Es obvio que si X es un espacio finito, de todo cubrimiento abierto se puedeextraer un subcubrimiento finito. Basta tomar un abierto que contenga a cadauno de los puntos del espacio. Ası pues, todo espacio topologico finito es com-pacto.

Observemos que si B es una base de un espacio topologico K, se cumpleque K es compacto si y solo si todo cubrimiento de K por abiertos basicosadmite un subcubrimiento finito. En efecto, si C es un cubrimiento arbitrario,

6No es raro que se exija la propiedad de Hausdorff en la definicion de compacidad. Aquıno lo hacemos.

Page 278: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

268 Capıtulo 8. Elementos de topologıa

consideramos el conjunto C0 = B ∈ B |∨

U ∈ C B ⊂ U, que es tambien uncubrimiento abierto de K, pues para cada x ∈ K existe un U ∈ C tal que x ∈ U ,y entonces existe un B ∈ B tal que x ∈ B ⊂ U , luego x ∈ B ∈ C0. Por hipotesisC0 admite un subcubrimiento finito B1, . . . , Bn y para cada j = 1, . . . , n existeun Uj ∈ C tal que Bj ⊂ Uj , con lo que U1, . . . , Un es un subcubrimiento finitodel cubrimiento dado.

La compacidad puede caracterizarse en terminos de cerrados en lugar deabiertos:

Una familia F de subconjuntos de un conjunto X tiene la propiedad de lainterseccion finita si para todo F ⊂ F finito se cumple que

⋂F 6= ∅.

Teorema 8.54 Un espacio topologico K es compacto si y solo si toda familiade cerrados de K con la propiedad de la interseccion finita tiene interseccion novacıa.

Demostracion: A cada familia F de cerrados deK le corresponde la familiade abiertos F′ = K \ A | A ∈ F. La condicion

⋂F 6= ∅ equivale a que F′ no

sea un cubrimiento abierto, mientras que la propiedad de la interseccion finitaequivale a que F

′ no admita subcubrimientos finitos, luego la condicion delenunciado equivale a que toda familia de abiertos que no contenga cubrimientosfinitos no es un cubrimiento, es decir, a la compacidad de K.

Hay muchos espacios que no son compactos pero tienen subespacios com-pactos. Por ello resulta util caracterizar la compacidad de un subespacio enterminos de la topologıa de todo el espacio y no de la topologıa relativa. Con-cretamente:

Teorema 8.55 Sea X un espacio topologico y K un subespacio de X. EntoncesK es compacto si y solo si para toda familia C de abiertos (basicos) de X talque K ⊂

⋃C se puede extraer una subfamilia finita que cumpla lo mismo.

Demostracion: Supongamos que K es compacto. Entonces

U ∩K | U ∈ C

es claramente un cubrimiento abierto de K, del que podemos extraer un subcu-brimiento finito de modo que

K = (U1 ∩K) ∪ · · · ∪ (Un ∩K),

luego K ⊂ U1 ∪ · · · ∪ Un.Recıprocamente, si K cumple esta propiedad y C es un cubrimiento abierto

de K, entonces para cada U ∈ C consideramos

U∗ =⋃B ⊂ X | B abierto ∧ B ∩K = U,

de modo que U∗ es abierto en X y U∗ ∩ K = U . Sea C∗ = U∗ | U ∈ C.Entonces K =

⋃C ⊂ ⋃

C∗, luego por hipotesis existe un subcubrimiento finito

Page 279: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.5. Espacios compactos 269

tal que K ⊂ U∗1 ∪· · · ∪U∗

n, luego K = (U∗1 ∩K)∪· · · ∪ (U∗

n ∩K) = U1∪· · ·∪Un.Ası pues, K es compacto.

Si la union de una familia de abiertos de un espacio X contiene a un subes-pacio K, diremos que forma un cubrimiento abierto de K en X . Ası pues, unsubespacio K de X es compacto si y solo si de todo cubrimiento abierto de Ken X puede extraerse un subcubrimiento finito (en X tambien). Aquı estamosconsiderando la topologıa de X , pero deberemos tener siempre presente que lacompacidad es una propiedad absoluta, es decir, que depende exclusivamentede la topologıa del propio espacio K.

La compacidad tiene una caracterizacion muy simple en el caso de la topo-logıa de orden:

Teorema 8.56 Sea X un conjunto totalmente ordenado no vacıo, consideradocomo espacio topologico con la topologıa de orden. Entonces X es compacto siy solo si es completo y tiene maximo y mınimo.

Demostracion: Si X no tiene maximo, entonces ]−∞, x[x∈X es un cubri-miento abierto que no admite un subcubrimiento finito, luego X no es compacto.Por lo tanto, si X es compacto tiene maximo, y analogamente se concluye quetiene mınimo.

Si X no fuera completo el teorema 7.36 nos permite descomponerlo comoX = A∪B, donde A y B son no vacıos, todo elemento de A es menor que todoelemento de B, y ademas A no tiene maximo y B no tiene mınimo. Entonces

A =⋃

a∈A

]−∞, a[ , B =⋃

b∈B

]b,+∞[ ,

lo que prueba que A y B son abiertos. Ademas los intervalos consideradosforman un cubrimiento abierto de X que no tiene un subcubrimiento finito. Porlo tanto, si X es compacto, es completo.

Recıprocamente, supongamos que X es completo y que tiene maximo M ymınimo m. Podemos suponer que m < M , pues si m = M entonces X = m esobviamente compacto. Sea C un cubrimiento abierto de X y sea A el conjuntode los x ∈ X tales que el intervalo [m,x] admite un subcubrimiento finito, esdecir:

A = x ∈ X |∨

C ⊂ C(C finito ∧ [m,x] ⊂⋃C).

Sea s = supA y sea U ∈ C tal que s ∈ U . No puede ser s = m, porque entoncesexistirıa un v ∈ X tal que s ∈ [m, v[ ⊂ U , y podrıamos tomar un U ′ ∈ C tal quev ∈ U ′, y entonces [m, v] ⊂ U ∪ U ′ implicarıa que s < v ∈ A, en contradiccioncon que s es cota superior de A.

Ası pues, m < s, luego existe un u < s tal que ]u, s] ⊂ U . Por definicionde supremo existe un a ∈ A tal que u < a ≤ s, luego existe C ⊂ C finitotal que [m, a] ⊂ ⋃

C, pero cambiando C por C ∪ U tenemos, de hecho, que[m, s] ⊂ ⋃

C, luego s ∈ A.

Ahora basta probar que s = M , pero si fuera s < M existirıa un v ∈ X talque s ∈ ]u, v[ ⊂ U y, tomando U ′ ∈ C tal que v ∈ U ′ y anadiendolo al conjunto

Page 280: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

270 Capıtulo 8. Elementos de topologıa

finito C, obtendrıamos que [m, v] ⊂⋃C, con lo que v ∈ A, lo que contradice

de nuevo a que s es cota superior de A.

En particular, un ordinal es compacto si y solo si no es un ordinal lımite(puesto que todo ordinal es completo como conjunto ordenado, si no es vacıotiene mınimo y tiene maximo si y solo si no es un ordinal lımite).

Los teoremas siguientes muestran la anunciada similitud entre los espacioscompactos y los espacios finitos. Por lo pronto, todo espacio finito es cerradoen un espacio de Hausdorff. El analogo con compactos es el siguiente:

Teorema 8.57 Se cumplen las propiedades siguientes:

a) Si X es un espacio de Hausdorff y K ⊂ X es compacto, entonces K escerrado en X.

b) Si K es un compacto y C ⊂ K es un cerrado, entonces C es compacto.

Demostracion: a) Veamos que X \ K es abierto. Para ello tomamosx ∈ X \K y vamos a probar que X \K es entorno de x. Sea

C = V ⊂ X | V abierto ∧∨

U(U ⊂ X ∧ U abierto ∧ U ∩ V = ∅ ∧ x ∈ U).

Tenemos que C es un cubrimiento abierto de K, pues si v ∈ K existenabiertos disjuntos U , V en X que separan a x y v, lo que implica que v ∈ V ∈ C.Como K es compacto, C admite un subcubrimiento finito V1, . . . , Vn, de modoque K ⊂ V1 ∪ · · · ∪ Vn. Para cada i, existe un abierto Ui tal que x ∈ Ui y

Ui ∩ Vi = ∅. Pero entonces x ∈n⋂

i=1

Ui ⊂ X \K, luego K es cerrado.

b) Si Aii∈I es un cubrimiento abierto de C, entonces Aii∈I ∪ K \ Ces un cubrimiento abierto de K, luego existe un subcubrimiento finito

K = Ai1 ∪ · · · ∪ Ain ∪ (K \ C).

Claramente entonces C ⊂ Ai1 ∪ · · · ∪ Ain , luego C es compacto.

En un conjunto totalmente ordenado, todo subconjunto finito tiene maximoy mınimo. Analogamente:

Teorema 8.58 Si X es un conjunto totalmente ordenado completo, conside-rado como espacio topologico con la topologıa de orden, entonces un subconjuntode X es compacto (con la topologıa relativa) si y solo si es cerrado y acotado(superior e inferiormente), y en tal caso tiene maximo y mınimo.

Demostracion: Supongamos que C ⊂ X es cerrado y acotado. Si a es unacota inferior y b es una cota superior, entonces C ⊂ [a, b]. La topologıa relativade [a, b] es la topologıa de orden y, como conjunto ordenado, [a, b] es claramentecompleto. Por el 8.56 tenemos que [a, b] es compacto, y C tambien lo es por sercerrado en [a, b].

Page 281: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.5. Espacios compactos 271

Recıprocamente, si C es compacto, entonces sabemos que es cerrado. Si notuviera maximo ]−∞, x[x∈X serıa un cubrimiento de C que no admitirıa unsubcubrimiento finito, luego C sı que tiene maximo, e igualmente se prueba quetiene mınimo.

En particular, los subconjuntos compactos de R son los cerrados y acotados.El propio R no es compacto, pero es lo que se llama un espacio localmentecompacto, es decir, un espacio en el que todo punto x tiene una base de entornoscompactos (por ejemplo, los intervalos [x − ǫ, x + ǫ]). Por otra parte, R escompacto y, mas en general, si X es un precontinuo, entonces C(X) es uncontinuo compacto que tiene a X como subconjunto denso.

Si f : A −→ B y A es finito, entonces f [A] tambien es finito. La versiontopologica es:

Teorema 8.59 Si f : K −→ X es una aplicacion continua, K es compacto,entonces f [K] es compacto.

Demostracion: Si Uii∈I es un cubrimiento abierto de f [K] en X , en-tonces f−1[Ui]i∈I es un cubrimiento abierto de K, luego admite un subcubri-miento finito f−1[Uik ]nk=1, pero entonces es claro que Uiknk=1 es un subcu-brimiento finito del cubrimiento dado.

Como consecuencia:

Teorema 8.60 Si f : K −→ X es una aplicacion biyectiva y continua, K escompacto y X es un espacio de Hausdorff, entonces f es un homeomorfismo.

Demostracion: Falta probar que f−1 es continua, pero eso equivale aque si A es abierto en K, entonces f [A] es abierto en X , o tambien, tomandocomplementos, a que si C es cerrado en K, entonces f [C] es cerrado en X , perosi C es cerrado en K, entonces es compacto, luego f [C] es compacto por elteorema anterior, luego f [C] es cerrado en X .

Una aplicacion de un conjunto finito en un conjunto totalmente ordenadoalcanza un valor maximo y un valor mınimo. Igualmente:

Teorema 8.61 Si F : K −→ X es una aplicacion continua de un compacto Ken un conjunto totalmente ordenado, entonces f toma un valor maximo y unvalor mınimo.

Demostracion: Tenemos que f [K] es compacto en X , luego tiene maximoy mınimo por el teorema 8.58.

En un espacio 1AN, podemos caracterizar mediante sucesiones una propie-dad mas debil que la compacidad:

Definicion 8.62 Un espacio topologico es numerablemente compacto si todocubrimiento abierto numerable admite un subcubrimiento finito.

Page 282: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

272 Capıtulo 8. Elementos de topologıa

Obviamente esto equivale a que toda familia numerable de cerrados con lapropiedad de la interseccion finita tenga interseccion no vacıa.

Teorema 8.63 (AEN) Un espacio 1AN es numerablemente compacto si y solosi toda sucesion tiene una subsucesion convergente.

Demostracion: SeaX un espacio numerablemente compacto y sea ann∈ω

una sucesion en K. Sea An = am | m ≥ n. Obviamente

A0 ⊃ A1 ⊃ A2 ⊃ A3 ⊃ A4 ⊃ · · · ,

luego tambien

A0 ⊃ A1 ⊃ A2 ⊃ A3 ⊃ A4 ⊃ · · · ,

y ası tenemos una familia de cerrados con la propiedad de la interseccion finita.Por la compacidad numerable existe un punto x ∈ ⋂

n∈ωAn. Sea Ukk∈ω una

base decreciente de entornos abiertos de x. Para cada k, m ∈ ω, tenemosque Uk ∩ Am 6= ∅, es decir, existe un n ≥ m tal que an ∈ Uk. Esto nospermite construir por recurrencia una subsucesion de ann∈ω. Tomamos n0

como el mınimo numero natural tal que an0 ∈ U0 y definimos nk+1 como elmenor numero natural nk+1 > nk tal que ank+1

∈ Uk+1. Es claro entonces queank

k∈ω converge a x.Supongamos ahora que X tiene la propiedad del enunciado y veamos que es

numerablemente compacto. Sea Unn∈ω un cubrimiento abierto de X . Que-remos probar que admite un subcubrimiento finito. Cambiando cada Un por⋃

i≤n

Ui obtenemos un cubrimiento creciente respecto de la inclusion y basta pro-

bar que Un = X para algun n. Si no fuera ası, eliminando terminos repetidospodrıamos suponer ademas que Un Un+1, para todo n. Entonces podemostomar xn ∈ Un+1 \ Un, y tenemos ası una sucesion xnn∈ω que deberıa teneruna subsucesion convergente a un cierto x ∈ X . Existe entonces un m ∈ ω talque x ∈ Um, pero entonces la convergencia implica que existe un k ≥ m tal quexk ∈ Um, pero eso es imposible.

Las sucesiones caracterizan la compacidad en los espacios 2AN:

Teorema 8.64 (AEN) Un espacio 2AN es compacto si y solo si toda sucesiontiene una subsucesion convergente.

Demostracion: Basta probar que si X es numerablemente compacto, en-tonces es compacto. Pero si C es un cubrimiento abierto de X y B es una basenumerable, para cada x ∈ X podemos tomar7 Bx ∈ B tal que existe un U ∈ C

de modo que x ∈ Bx ⊂ U . Sea B∗ = Bx | x ∈ X, que es un cubrimientonumerable de X , luego tiene un subcubrimiento finito B1, . . . , Bn. Para cadaBi podemos tomar un Ui ∈ F tal que Bi ⊂ Ui, y ası tenemos un subcubrimientofinito del cubrimiento dado.

7Para elegir en un conjunto numerable n se necesita el axioma de eleccion.

Page 283: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.5. Espacios compactos 273

Ejemplo (AEN) El espacio ω1 es 1AN y es numerablemente compacto porel teorema 8.63, ya que una sucesion en ω1 no puede ser cofinal, luego estacontenida en un intervalo [0, α], que es compacto, luego tiene una subsucesionconvergente. Sin embargo ω1 no es compacto, por el teorema 8.56.

Para terminar nos ocupamos del producto de espacios compactos:

Teorema 8.65 (Tychonoff) (AE) Todo producto de espacios compactos escompacto.

Nota Este teorema no solo requiere el axioma de eleccion, sino que de hechoes equivalente a el. En efecto, tomemos una familia Xii∈I de conjuntos novacıos. Aceptando el teorema de Tychonoff vamos a probar que

i∈I

Xi 6= ∅, loque, por la observacion tras 3.27, equivale al axioma de eleccion.

Sea p ∈ V \⋃

i∈I

Xi y sea Yi = Xi∪p. Consideramos a cada Yi como espacio

topologico con la topologıa que tiene por cerrados a Yi, Xi y los conjuntos finitos.Se comprueba sin dificultad que realmente es una topologıa (no de Hausdorff,pues p esta en todo entorno de todo punto de Xi). Ademas Yi es un espaciocompacto, pues, dado un cubrimiento abierto C de Yi, tomamos un punto x ∈ Xi

y un abierto U ∈ C tal que x ∈ U , pero entonces U contiene todos los puntosde Yi salvo a lo sumo un numero finito de ellos, luego tomando un abierto de C

para cada uno de los puntos de Yi \ U obtenemos un subcubrimiento finito.Por lo tanto, tenemos que Y =

i∈I

Yi es compacto. Para cada i ∈ I, sea

Zi = f ∈ Y | f(i) ∈ Xi.

Se trata de un cerrado, pues Y \Zi =⋃

i∈I

p−1i [p] y p es abierto en Yi. Ademas,

la familia Zi | i ∈ I tiene la propiedad de la interseccion finita, pues si I0 ⊂ Ies finito, podemos tomar s ∈

i∈I0

Xi (porque los conjuntos finitos siempre tienen

funciones de eleccion) y extenderlo a Y mediante s(i) = p para i ∈ I \ I0, con loque obtenemos un s ∈ ⋂

i∈I0

Zi. Por la compacidad existe f ∈ ⋂

i∈I

Zi, con lo quef ∈ ∏

i∈I

Xi 6= ∅.

En 10.53 daremos una prueba conceptualmente simple del teorema de Tycho-noff. Aquı daremos un argumento que muestra explıcitamente como intervieneen la prueba el axioma de eleccion, de modo que veremos que en muchos casosparticulares de interes no se necesita realmente. Por ejemplo, veremos que laprueba de que el producto de un numero finito de espacios compactos es com-pacto no requiere AE, y esto es lo unico que requiere la consecuencia siguiente:

Teorema 8.66 Un subconjunto de Rn es compacto si y solo si es cerrado yacotado.

Aquı entendemos que un subconjunto de Rn esta acotado si esta contenidoen un cubo [−M,M ]n, para cierto M > 0.

Page 284: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

274 Capıtulo 8. Elementos de topologıa

Demostracion: Si C es cerrado y C ⊂ [−M,M ]n para cierto M > 0, porel teorema de Tychonoff el cubo es compacto, y C tambien lo es por ser cerradoen un compacto.

Recıprocamente, si C ⊂ Rn es compacto, sabemos que tiene que ser cerrado,y los cubos ]−k, k[

nk∈ω forman un cubrimiento abierto de C, luego tiene quetener un subcubrimiento finito, y si tomamos el maximo k que aparece en dichosubcubrimiento, resulta que C ⊂ ]−k, k[

n ⊂ [−k, k]n, luego esta acotado.

El teorema de Tychonoff es consecuencia inmediata del teorema siguiente:

Teorema 8.67 Sea Xii∈I una familia de espacios topologicos compactos. Su-pongamos que I admite un buen orden y que, si I es infinito, existe una funcionde eleccion sobre el conjunto de todos los cerrados en todos los espacios Xi.Entonces el producto X =

i∈I

Xi es compacto.

Demostracion: No perdemos generalidad si sustituimos I por un ordi-nal α. Podemos suponer que X 6= ∅, pues si no la conclusion es trivial.

Sea P =⋃

β≤α

Xβ, considerado como conjunto parcialmente ordenado por la

inclusion. Definimos la altura de un p ∈ P como alt p = Dp, es decir, el unicoordinal β ≤ α tal que p ∈ Xβ. Ası, los elementos de X son los elementos de Pde altura α.

Para cada p ∈ P llamaremos M(p) = x ∈ X | p ⊂ x. Notemos queM(p) 6= ∅, pues, como estamos suponiendo que X no es vacıo, podemos tomarx ∈ X y, si alt p = β, basta considerar p′ = p ∪ (x|λ\β) ∈M(p).

Fijemos un cubrimiento abierto C de X . No perdemos generalidad si supo-nemos que sus elementos son abiertos basicos del producto.

Sea A el conjunto de todos los p ∈ P tales que M(p) no esta contenido enninguna union finita de abiertos de C. Basta probar que A = ∅, pues entoncesX = M(∅) esta contenido en una union finita de abiertos de C. Suponemos,pues, que A 6= ∅. Notemos que si p ∈ A y q ⊂ p entonces M(p) ⊂M(q), luegoq ∈ A.

Llamaremos Aβ = A ∩ Xβ, el conjunto de los elementos de A de altura β.Veamos que si β < α y s ∈ Aβ , entonces C(s) = t(β) | t ∈ A ∧ s t escerrado en Xβ. Para ello tomamos un a ∈ Xβ \ C(s) y vamos a encontrar unabierto a ∈ U ⊂ Xβ \ C(s).

Sea t = s ∪ (β, a) ∈ Xβ+1. Como t no puede justificar que a ∈ C(s),necesariamente t /∈ A, luego M(t) ⊂ ⋃

G, para cierto G ⊂ C finito. ReduciendoG si es preciso podemos suponer que todo V ∈ G corta a M(t).

Cada V ∈ G es un abierto basico, de la forma⋂

δ∈JV

p−1δ [WV δ], donde JV ⊂ α

es finito y WV δ es abierto en Xδ. Podemos suponer que β ∈ JV anadiendo si espreciso WV β = Xβ. Como V ∩M(t) 6= ∅, existe un x ∈ V tal que x|β+1 = t,luego a = x(β) ∈WV β . Sea U =

V ∈G

WV β , que es un entorno abierto de a.

Page 285: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

8.5. Espacios compactos 275

Veamos que x ∈ X | s ⊂ x ∧ x(β) ∈ U ⊂⋃G.

En efecto, si x ∈ X cumple que s ⊂ x ∧ x(β) ∈ U , sea y ∈ X la aplicacionque coincide con x salvo por que y(β) = a. Entonces t ⊂ y, luego y ∈ M(t),luego existe un V ∈ G tal que y ∈ V =

δ∈JV

p−1δ [WV δ]. Como x(β) ∈ U ⊂ WV β ,

es claro entonces que x ∈ V , luego x ∈⋃G. Por consiguiente U ⊂ Xβ \ C(s),

como habıa que probar.

Veamos ahora que C(s) 6= ∅. En caso contrario, el paso anterior prueba quela familia de todos los abiertos U en Xi tales que x ∈ X | s ⊂ x ∧ x(β) ∈ Uesta contenido en una union finita de elementos de C es un cubrimiento abiertode Xβ (pues hemos probado que cubre a Xβ \C(s)). Por la compacidad de Xβ

podrıamos extraer un subcubrimiento finito Xβ =⋃

k<n

Uk, pero entonces

M(s) =⋃

k<n

x ∈ X | s ⊂ x ∧ x(β) ∈ Uk

estarıa contenido en una union finita de elementos de C, en contra de que s ∈ A.

En particular tenemos que si s ∈ A tiene altura β < α, entonces existe unt ∈ A tal que s t. Si α es finito, esto basta para concluir que existe un p ∈ Ade altura α (pues podemos considerar la maxima altura de un elemento de Ay acabamos de probar que no puede ser menor que α), pero esto es absurdo,porque entonces p ∈ X y M(p) = p no deberıa estar contenido en una unionfinita de elementos de C, y esto contradice que C sea un cubrimiento de X . Asıpues, si α es finito tenemos que A = ∅ y X es compacto.

A partir de aquı suponemos que α es un ordinal infinito y por hipotesiscontamos con una funcion de eleccion e que a cada cerrado C 6= ∅ de cada Xi

le asigna un elemento e(C) ∈ C. Vamos a definir recurrentemente una sucesionsδδ≤α de modo que sδ ∈ Aδ y

δǫ(δ ≤ ǫ < α→ sδ ⊂ sǫ).

Tomamos s0 = ∅. Si δ < α, definimos sδ+1 ∈ Aδ+1 como el unico elementoque cumple sδ ⊂ sδ+1 ∧ sδ+1(δ) = e(C(sδ)). Por ultimo, si λ < α, definimossλ =

δ<λ

sδ y veamos que sλ ∈ Aλ. En principio tenemos que sλ ∈ Xλ,

pero falta probar que sλ ∈ A. En caso contrario, existe G ⊂ C finito tal queM(sλ) ⊂ ⋃

G. Podemos suponer que todo V ∈ G corta a M(sλ).

Como antes, cada V ∈ G es de la forma⋂

δ∈JV

p−1δ [WV δ], donde JV ⊂ α es

finito y WV δ es abierto en Xδ. Sea J =⋃

V ∈G

JV , que es un subconjunto finito

de α. Sea β < λ una cota superior de J ∩λ. Vamos a ver que M(sβ) ⊂ ⋃G, en

contradiccion con que sβ ∈ A. En efecto, observemos en primer lugar que, paratodo V ∈ G, como existe un y ∈ V ∩M(sλ), para cada δ ∈ JV ∩ λ tenemos quesλ(δ) = y(δ) ∈WV δ.

Si x ∈ M(sβ), sea y = sλ ∪ x|α\λ. Entonces y ∈ M(sλ), luego existe un

V ∈ G tal que y ∈ V =⋂

δ∈JV

p−1δ [WV δ], pero entonces x ∈ V , porque x e y solo

Page 286: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

276 Capıtulo 8. Elementos de topologıa

se distinguen bajo λ y x(δ) ∈ WV δ para todo δ ∈ JV ∩ λ. Esto prueba queM(sβ) ⊂ ⋃

G, como habıa que probar.

Con esto concluimos que sλ ∈ Aλ, luego tenemos definida la sucesion sδδ≤α,y en particular sα, que es un elemento de A de altura α, lo que nos lleva a lamisma contradiccion que el caso en que α era finito.

Ası pues, no se necesita AE para demostrar que el producto de una familiafinita de espacios topologicos compactos es compacto, ni tampoco para el casoen que I admite un buen orden y cada Xi es un subespacio compacto de R. Enefecto, en tal caso, en virtud de 8.58, podemos definir una funcion de eleccionsobre los cerrados de los espacios Xi sin mas que tomar e(C) = mınC, luegoes aplicable el teorema anterior. En particular, podemos afirmar sin AE lacompacidad de los espacios [0, 1]α o 2α, para cualquier ordinal α.

Por ultimo, para probar que el producto de una familia numerable de com-pactos es compacto solo necesitamos el principio ED de elecciones dependientes.Esto no se sigue del teorema anterior, sino de una ligera modificacion de la partefinal de la demostracion. En este caso podemos tomar α = ω y basta observarque no necesitamos la funcion de eleccion e para construir la sucesion snn∈ω,sino que basta considerar en A la relacion dada por

t R s↔ s ⊂ t ∧ alt t = alt s+ 1.

Como C(s) 6= ∅, tenemos que∧

s ∈ A∨

t ∈ A tRs, y ED es aplicable. A partirde ahı se define sω =

n∈ωsn y el argumento de la prueba vale sin cambio alguno

para concluir que sω ∈ A, lo que nos lleva a a contradiccion.

Page 287: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo IX

Arboles

El concepto de arbol aparece en contextos matematicos muy dispares, queabarcan desde problemas combinatorios finitistas hasta problemas sobre car-dinales infinitos. De hecho, nosotros nos lo hemos encontrado ya, aunque deforma implıcita, en la demostracion que hemos dado en el capıtulo anterior delteorema de Tychonoff.

Un problema conjuntista destacado en cuyo analisis resulta fundamental elconcepto de arbol es la hipotesis de Suslin, que es una conjetura formulada porM. Suslin en 1920 en el primer numero de la revista Fundamenta Mathematicae.En principio se trataba de un problema de naturaleza topologica, pero G. Ku-repa mostro en 1935 que es equivalente a un problema puramente conjuntistasobre arboles. Dedicamos la primera seccion a analizar el problema de Suslinantes de presentar el concepto de arbol. En todas las secciones excepto la se-gunda, en la que introduciremos los conceptos basicos sobre arboles, usaremosAE sin indicarlo explıcitamente.

9.1 El problema de Suslin

El teorema 7.43 prueba que un conjunto totalmente ordenado es semejantea R si y solo si es un continuo sin extremos separable. Suslin conjeturo que lacondicion de separabilidad puede sustituirse por la condicion de cadena nume-rable:

Hipotesis de Suslin (HS) Todo continuo sin extremos con la condicion decadena numerable es semejante a R.

Sabemos que la condicion de cadena numerable equivale a la separabilidaden espacios metricos, pero, aunque R es ciertamente un espacio metrico, sitenemos un continuo sin extremos con la condicion de cadena numerable, nopodemos asegurar que su topologıa de orden sea metrizable antes de saber si eso no semejante a R, por lo que no podemos asegurar a priori que tenga que serseparable.

277

Page 288: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

278 Capıtulo 9. Arboles

Definicion 9.1 Una recta de Suslin es un continuo sin extremos con la con-dicion de cadena numerable no separable.

En estos terminos la hipotesis de Suslin equivale a la no existencia de rectasde Suslin, y lo que sucede es que no se puede demostrar ni que existan ni queno existan rectas de Suslin. De momento, lo que vamos a probar aquı es queel problema de Suslin es equivalente a un problema topologico mas general, asaber:

Hipotesis de Suslin (HS) Un conjunto totalmente ordenado cumple la c.c.n.(como espacio topologico con la topologıa de orden) si y solo si es separable.1

En efecto:

Teorema 9.2 Son equivalentes:

a) Existe un conjunto totalmente ordenado con la condicion de cadena nu-merable no separable.

b) Existe un conjunto ordenado denso en sı mismo, sin extremos, con lacondicion de cadena numerable y en la que ningun intervalo es separable.

c) Existe una recta de Suslin en la que ningun intervalo es separable.

d) Existe una recta de Suslin.

Demostracion: Solo hay que probar que a) ⇒ b) y que b) ⇒ c).

Sea Y un conjunto totalmente ordenado que cumpla a) y consideremos larelacion en Y dada por x ∼ y si y solo si el intervalo comprendido entre ellos,]x, y[ o ]y, x[, es separable. (Notemos que un intervalo vacıo es separable.) Esinmediato comprobar que se trata de una relacion de equivalencia. LlamamosX al conjunto cociente.

Veamos que si [x] = [y] ∈ X y x < z < y, entonces [x] = [z] = [y].

En efecto, tenemos que ]x, y[ es separable, luego ]x, z[ tambien lo es. (Engeneral, todo subespacio abierto de un espacio separable es separable.)

De aquı se sigue facilmente que si [x1] = [x2] 6= [y1] = [y2], entonces

x1 < y1 ↔ x2 < y2.

Por consiguiente podemos definir la relacion de orden total en X dada por

[x] ≤ [y] ↔ x ≤ y.

Vamos a probar que X cumple b).

1Notemos que un subconjunto D de un precontinuo X es denso (en el sentido topologico)si y solo si

∧xy ∈ X(x < y →

∨d ∈ D x < d < y), pero esto no es cierto en conjuntos

totalmente ordenados cualesquiera. En este contexto hay que entender la densidad en elsentido topologico general.

Page 289: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.1. El problema de Suslin 279

En primer lugar probamos que si I ∈ X entonces I es un subconjunto sepa-rable de Y .

En efecto, sea M una familia maximal de intervalos abiertos no vacıos dis-juntos dos a dos con extremos en I. Como Y cumple la condicion de cadenanumerable, tenemos que M es numerable. Digamos que M = ]xn, yn[ | n ∈ ω.Como xn, yn ∈ I, tenemos que xn ∼ yn, luego ]xn, yn[ es separable. Sea Dn

un subconjunto denso numerable de ]xn, yn[. Sea D =⋃

n∈ωDn ⊂ I numerable.

Veamos que es denso en I.Sea ]x, y[ un intervalo abierto no vacıo con x, y ∈ I. La maximalidad de

M implica que existe un n ∈ ω tal que ]xn, yn[ ∩ ]x, y[ 6= ∅. Esta interseccioncontiene un intervalo no vacıo, luego corta a Dn, luego a D, luego ]x, y[∩D 6= ∅.

En particular concluimos que X tiene al menos dos puntos, pues en otrocaso X = Y y tendrıamos que Y serıa separable.

Veamos que X es denso en sı mismo (en particular es infinito).

Sean [x] < [y] dos elementos de X y supongamos que no hay ningun otroelemento entre ambos. Supongamos que x < z < y. Entonces [x] ≤ [z] ≤ [y],luego [x] = [z] o [z] = [y], luego z ∈ [x] ∪ [y]. Ası pues, ]x, y[ ⊂ [x] ∪ [y]. Como[x] e [y] son subconjuntos separables de Y , tambien lo es su union y tambien loes ]x, y[, luego [x] = [y], contradiccion.

Veamos que X cumple la condicion de cadena numerable.

Supongamos que]

[xα], [yα][

α<ω1es una familia de intervalos de X dis-

juntos dos a dos. Tomando intervalos estrictamente contenidos en los dados,podemos exigir que [xα] 6= [yβ ] para todo α, β < ω1.

Como los intervalos de X son no vacıos, es claro que ]xα, yα[ 6= ∅. Masaun, son disjuntos dos a dos, pues si existe z ∈ ]xα, yα[∩ ]xβ , yβ [, entonces [z] =[xα] ∨ [z] = [yα] y, por otra parte, [z] = [xβ ] ∨ [z] = [yβ], luego [z] = [xα] = [xβ ]o bien [z] = [yα] = [yβ ], pero esto solo es posible si α = β.

Ası pues, la familia ]xα, yα[α<ω1 contradice la condicion de cadena nume-rable de Y .

Veamos que ningun intervalo abierto de X es separable.

Supongamos que un intervalo][x], [y]

[en X tiene un subconjunto denso

numerable dn | n ∈ ω.Sea H =

[x]≤L≤[y]

L ⊂ Y . Es claro que ]x, y[ ⊂ H , luego si probamos que

H es separable tendremos que ]x, y[ tambien lo sera, luego [x] = [y], lo cual esabsurdo, pues hemos tomado [x] < [y].

Observemos que el conjunto de las clases [x] ≤ L ≤ [y] con mas de dos puntosha de ser numerable, pues de cada una de ellas obtenemos un intervalo en Y novacıo con los cuales se forma una anticadena en Y . Sea Lnn<ω el conjuntode estas clases. Sabemos que Ln contiene un conjunto denso numerable Dn.Sea D la union de todos los conjuntos Dn mas un elemento de cada clase dn.Entonces D es denso en H , pues si u < v son elementos de H y ]u, v[ 6= ∅, o

Page 290: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

280 Capıtulo 9. Arboles

bien [u] = [v] = Ln y entonces ]u, v[ ∩ Dn 6= ∅, o bien [u] < [v], en cuyo casoexiste n tal que [u] < dn < [v], con lo que tambien ]u, v[ ∩D 6= ∅.

Ası X cumple b) salvo por el hecho de que puede tener maximo o mınimoelemento. Ahora bien, como X es denso en sı mismo, si eliminamos los posiblesmaximo y mınimo, obtenemos un nuevo conjunto ordenado ya no tiene maximoni mınimo y sigue cumpliendo las otras propiedades.

Ahora veamos que b) implica c). Sea X un conjunto totalmente ordenadoen las condiciones de b) y sea W = C(X) la complecion de X en el sentidode 7.39, que es un continuo tal que existe una inmersion densa i : X −→W .

Si hubiera en W una familia no numerable de intervalos no vacıos disjuntosdos a dos, dentro de cada uno de ellos podrıamos tomar un intervalo no vacıocon extremos en i[X ], y ası obtendrıamos una familia igual en X . Por lo tantoW cumple la condicion de cadena numerable.

Si un intervalo ]S1, S2[ en W tuviera un subconjunto denso numerable, toma-mos x, y ∈ X tales que S1 ≤ i(x) < i(y) ≤ S2 y podrıamos tomar un conjuntodenso numerable D en ]i(x), i(y)[. Para cada intervalo ]D1, D2[ con extremosen D tomamos un punto u ∈ ]x, y[ tal que i(u) ∈ ]D1, D2[. Ası obtenemos unsubconjunto numerable de ]x, y[ que claramente es denso, contradiccion. Asıpues, W es una recta de Suslin sin intervalos separables.

Ası pues, la hipotesis de Suslin es en realidad un problema topologico generalsobre si las topologıas de orden cumplen tambien un resultado que sabemos quees valido para las topologıas metrizables: la equivalencia entre la separabilidady la condicion de cadena numerable. Este problema esta relacionado con otroque ya hemos planteado:2 si el producto de espacios topologicos (o, mas enparticular, de continuos) con la condicion de cadena numerable tiene la condicionde cadena numerable, entonces se cumple HS. En efecto:

Teorema 9.3 Si X es un conjunto totalmente ordenado con la c.c.n. pero noseparable, entonces X ×X no cumple la c.c.n.

Demostracion: Vamos a construir tres sucesiones aαα<ω1 , bαα<ω1 ,cαα<ω1 en X tales que:

a) aα < bα < cα,

b) ]aα, bα[ 6= ∅ 6= ]bα, cα[

c) ]aα, cα[ ∩ bβ | β < α = ∅.

Admitiendo que tenemos tales sucesiones, definimos Uα = ]aα, bα[ × ]bα, cα[y observamos que se trata de una familia de abiertos en X×X no vacıos (por lapropiedad b) y disjuntos dos a dos, pues si β < α, entonces, o bien bβ ≤ aα, encuyo caso ]aβ , bβ[ ∩ ]aα, bα[ = ∅, o bien aα < bβ, en cuyo caso, por c) tenemosque cα ≤ bβ , luego ]bβ, cβ [ ∩ ]bα, cα[ = ∅. Por lo tanto, X × X no cumple lac.c.n.

2Vease las observaciones anteriores y posteriores al teorema 8.50.

Page 291: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.2. Conceptos basicos sobre arboles 281

Veamos, pues, como construir la sucesion. Sea A ⊂ X el conjunto de lospuntos aislados de X . Si a ∈ A entonces a es abierto, luego por la c.c.n.tenemos que |A| ≤ ℵ0. Supongamos definidas aαα<β, bαα<β, cαα<β ,para β < ω1. Entonces D = W ∪ aα | α < β ∪ bα | α < β ∪ cα | α < βes un conjunto numerable, luego X \ D 6= ∅. Como es un abierto no vacıo,contiene un intervalo abierto no vacıo, contendra un intervalo abierto no vacıo]aα, cα[ que, como no contiene puntos aislados, es infinito, luego contiene un bαque lo divide en dos intervalos no vacıos.

9.2 Conceptos basicos sobre arboles

En esta seccion no usaremos AE si no lo indicamos explıcitamente.

Definicion 9.4 Un arbol es un conjunto parcialmente ordenado (A,≤) tal que,para todo x ∈ A, el segmento A<

x = a ∈ A | a < x esta bien ordenado.

Si x ∈ A, se llama altura de x a altAx = ordA<x .

Si α ∈ Ω, se llama nivel α-esimo de A al conjunto

NivαA = x ∈ A | altAx = α.

Se llama altura de A al mınimo ordinal altA = α tal que NivαA = ∅. Esfacil ver que

altA =⋃

x∈A

(altAx+ 1).

Dos elementos x, y ∈ A son compatibles si x ≤ y ∨ y ≤ x. En caso contrariose dice que son incompatibles y se representa por x ⊥ y.

Un subconjunto C ⊂ A es una cadena si sus elementos son compatibles dosa dos, es decir, si esta totalmente ordenado y, por consiguiente, bien ordenado.

Un subconjunto R ⊂ A es una rama si es una cadena maximal respecto a lainclusion.

En general, el lema de Zorn asegura que toda cadena se extiende hasta unarama,3 aunque si el arbol es finito esto mismo se prueba facilmente sin necesidadde AE, y si el arbol es numerable basta con AEN. Llamaremos altura de R a

altAR = ordR =⋃

x∈R

(altAx+ 1).

Un subconjunto C ⊂ A es un camino si es una rama tal que altAC = altA,es decir, si es una rama que corta a todos los niveles no vacıos de A.

Un subconjunto C ⊂ A es una anticadena si sus elementos son incompatiblesdos a dos. Claramente los niveles son anticadenas.

La figura muestra un arbol de altura 6:

3Basta observar que el conjunto de todas las cadenas que contienen a una dada cumple lashipotesis del lema de Zorn.

Page 292: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

282 Capıtulo 9. Arboles

Nivel 0

Nivel 3Rama

Camino

Un subconjunto A′ ⊂ A es un subarbol de A si

x ∈ A∧

y ∈ A′(x < y → x ∈ A′).

Claramente esto implica que A′ tambien es un arbol y si x ∈ A′ entoncesaltAx = altA′x.

Si κ es un cardinal, un κ-arbol es un arbol de altura κ cuyos niveles tienentodos cardinal menor que κ.

Los elementos de altura 0 en un arbol se llaman raıces. El arbol de la figuraanterior tiene una unica raız. La definicion de arbol que hemos dado permiteque un arbol tenga varias raıces, pero un arbol ası es mas bien un conjunto devarios arboles, por lo que en la practica consideraremos siempre arboles con unaunica raız. Mas concretamente:

Diremos que un κ-arbol A esta bien podado si |Niv0A| = 1 y

x ∈ A∧

α < κ(altAx < α →∨

y ∈ NivαA x < y).

En otras palabras, un arbol esta bien podado si tiene una unica raız y desdecualquiera de sus puntos se puede ascender hasta cualquier altura. Casi siemprese puede podar bien un arbol:

Teorema 9.5 (AE) Si κ es un cardinal regular,4 todo κ-arbol tiene un κ-sub-arbol bien podado.

Demostracion: Sea A un κ-arbol y A′ = x ∈ A | |z ∈ A | x < z| = κ.Claramente A′ es un subarbol de A. Ciertamente no es vacıo, pues

A =⋃

x∈Niv0A

y ∈ A | x ≤ y,

y como |Niv0A| < κ, ha de haber un x ∈ Niv0A tal que |y ∈ A | x ≤ y| = κ,es decir, tal que x ∈ A′.

4Si κ = ℵ0 la prueba no requiere AE, pues lo unico que se usa sistematicamente es quetoda union finita de conjuntos finitos es finita.

Page 293: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.2. Conceptos basicos sobre arboles 283

Sea x ∈ A′ y α < κ tal que altAx < α. Sea Y = y ∈ NivαA | x < y.Entonces

z ∈ A | x < z = z ∈ A | x < z ∧ altAz ≤ α ∪ z ∈ A | x < z ∧ altAz > α.

Por definicion de A′, el primer conjunto de la lınea anterior tiene cardinal κ,el segundo tiene cardinal menor que κ, pues esta contenido en

β≤α

NivβA, κ esregular y los niveles tienen cardinal menor que κ.

Por consiguiente, el tercer conjunto ha de tener cardinal κ, pero

z ∈ A | x < z ∧ altAz > α =⋃

y∈Y

z ∈ A | y < z ∧ altAz > α,

y |Y | ≤ |NivαA| < κ, por lo que ha de existir un y ∈ Y tal que5

|z ∈ A | y < z ∧ altAz > α| = κ.

En particular |z ∈ A | x < z| = κ, con lo que y ∈ A′. Ası hemos probadoque

x ∈ A′∧

α < κ(altAx < α→∨

y ∈ NivαA′ x < y).

En particular esto implica que A′ es un κ-arbol. Para estar bien podado solole falta tener una unica raız. Ahora bien, si x ∈ Niv0A

′, es inmediato comprobarque B = y ∈ A′ | x ≤ y es un κ-subarbol bien podado de A′, luego de A.

Nota El teorema anterior es falso para cardinales singulares, pues si tenemosque cf κ = µ < κ y αδδ<µ es una sucesion cofinal en κ, entonces el arbolA =

δ<µ

αδ × δ, con el orden dado por (β, δ) ≤ (β′, δ′) ↔ β ≤ β′ cumple que

altA(β, δ) = β, luego altA = κ, pero es facil ver que no admite subarboles bienpodados (ni tampoco el arbol que resulta de anadir a A un mınimo elemento,para que tenga una unica raız).

Podrıa pensarse que un ℵ0-arbol no tiene necesariamente un camino, es decir,una rama infinita, pues en principio podrıa tener unicamente ramas finitas dealtura arbitrariamente grande, pero ninguna rama infinita, pese a lo cual sualtura serıa infinita. Sin embargo no es ası:

Teorema 9.6 (Konig) (AEN) Todo ℵ0-arbol tiene un camino.6

Demostracion: Sea A un ℵ0-arbol y sea A′ un subarbol bien podado.Entonces hay un x0 ∈ Niv0A

′, hay un x1 ∈ Niv1A′ tal que x0 < x1, hay

un x2 ∈ Niv2A′ tal que x1 < x2, y por recurrencia construimos un conjunto

C = xn | n ∈ ω que claramente es un camino en A.

En general, podemos garantizar la existencia de caminos en un arbol sisuponemos que sus niveles son suficientemente pequenos:

5Notemos que la condicion altAz > α es redundante, pues se sigue de la definicion de Y .6Necesitamos AEN unicamente para concluir que todo ℵ0-arbol es numerable (porque es

union de una cantidad numerable de niveles finitos), pero si aplicamos el teorema de Konig aun arbol que ya sabemos que es numerable no necesitamos AEN, pues no hace falta el axiomade eleccion para elegir elementos de un conjunto numerable.

Page 294: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

284 Capıtulo 9. Arboles

Teorema 9.7 (AE) Si κ es un cardinal regular y µ < κ, todo arbol de altura κcuyos niveles tengan cardinal menor que µ tiene un camino.

Demostracion: Sea A un arbol en las condiciones del enunciado. Si x ∈ Ay δ < altAx, representaremos por x|δ al unico elemento de Nivδ(A) tal quex|δ < x.

Veamos en primer lugar que no perdemos generalidad si suponemos que Ano se ramifica en niveles de altura lımite, es decir, que si a, b ∈ Nivλ(A), paracierto ordinal lımite λ y a 6= b, entonces existe un δ < λ tal que a|δ 6= b|δ.

En efecto, para cada λ < κ, sea Cλ el conjunto de todas las cadenas dela forma x ∈ A | x < a, con a ∈ Nivλ(A). (El problema es que diferenteselementos a pueden determinar la misma cadena C.) Podemos suponer que siC ∈ Cλ entonces C /∈ A (por ejemplo, no perdemos generalidad si suponemosque los elementos de A son pares ordenados de la forma (a, 0), con lo que unacadena C no es ninguno de estos pares). Observemos que |Cλ| ≤ |Nivλ(A)| < µ.

Consideramos ahora A′ = A∪ ⋃

λ<κ

Cλ y definimos en A′ la relacion de orden

que extiende a la de A de modo que si C ∈ Cλ, sus anteriores son sus elementosy las cadenas C′ ∈ Cλ′ tales que C′ ⊂ C y λ′ < λ, y sus posteriores son loselementos de A mayores que todos los elementos de C y las cadenas C′ ∈ Cλ′

con λ < λ′ y C ⊂ C′.

Es facil ver que A′ es un arbol tal que cada elemento de A de altura α tienealtura α + 1 en A′ y Nivλ(A′) = Cλ. Esto hace que A′ siga siendo un κ arboly que sus niveles siguen teniendo cardinal < µ. (Lo que hemos hecho es ponerun nuevo elemento por debajo de cada grupo de elementos de Nivλ(A) con unamisma cadena por debajo, de modo que la ramificacion pasa de producirse enel nivel λ al nivel λ+ 1).

Es claro que si demostramos que A′ tiene un camino, al cortarlo con Atendremos un camino en A.

Ası pues, suponemos que A no se ramifica en niveles lımite. Supongamos enprimer lugar que µ es regular. Para cada λ < κ tal que cf λ = µ, elijamos unxλ ∈ Nivλ(A). Para cada x ∈ Nivλ(A) distinto de xλ existe un δ < λ tal quexλ|δ 6= x|δ. Como |Nivλ(A)| < µ = cf λ, podemos tomar un f(λ) < λ tal quepara todo x ∈ Nivλ(A) \ xλ se cumple que xλ|f(α) 6= x|f(α).

Ahora usamos que E = λ < κ | cf λ = µ es estacionario en κ (teorema6.13) y, como f : E −→ κ es regresiva, por el teorema 6.15 sabemos que esconstante en un conjunto estacionario E′ ⊂ E, en particular no acotado enκ. Digamos que toma el valor γ. Como xλ|γ | γ < λ ∈ E′ tiene cardinalκ, mientras que |Nivγ(A)| < µ, tiene que existir un subconjunto Y ⊂ E′ decardinal κ, luego no acotado, tal que todos los xλ|γ son iguales, para λ ∈ Y .

Pero esto hace que si λ, λ′ ∈ Y , digamos λ < λ′, necesariamente xλ < xλ′ ,pues en caso contrario xλ′ |λ 6= xλ y, como f(λ) = γ, tendrıa que ser xλ′ |γ 6= xλ|γ ,por definicion de f , contradiccion.

Page 295: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.3. Arboles de Aronszajn 285

Ası pues, xλλ∈Y es una cadena, y x ∈ A |∨

λ ∈ Y x < xλ es un caminoen A.

Consideremos ahora el caso en que µ es singular. Para cada α < κ, tenemosque |Nivα(A)|+ < µ es un cardinal regular, luego existe un ν < µ regular talque el conjunto X = α < κ | |Nivα(A)| < ν tiene cardinal κ, luego noesta acotado. Entonces A′ =

α∈X

Nivα(A) es un κ-arbol con todos sus niveles

de cardinal < ν. Por la parte ya probada tiene un camino C, y es claro quex ∈ A |

y ∈ C x < y es un camino en A.

9.3 Arboles de Aronszajn

Los dos ultimos teoremas invitan a conjeturar si las hipotesis del segundono podrıan relajarse para obtener la generalizacion natural del primero, es de-cir, que todo κ-arbol tiene un camino. Sin embargo esto resulta ser falso siconsideramos ℵ1-arboles:

Definicion 9.8 Un arbol de Aronszajn es un ℵ1-arbol cuyas cadenas son todasnumerables, es decir, que no tiene caminos.

Claramente, si A es un arbol de Aronszajn y A′ es un subarbol bien podado,entonces A′ es un arbol de Aronszajn bien podado.

La situacion es curiosa: Imaginemos que estamos en la raız x0 de un arbolde Aronszajn bien podado y nos disponemos a trepar por el lo mas alto quepodamos. Tenemos varias opciones para pasar al nivel 1, pero no importacual tomemos, pues desde cualquier punto x1 del nivel 1 podemos llegar hastacualquier otro nivel. Igualmente no importa a que punto x2 del nivel 2 saltemos,pues desde el se podra llegar seguro a cualquier altura. Pero cuando hayamosdado ω pasos por la ruta x0 < x1 < x3 < · · · podemos encontrarnos con quela rama se acaba aquı, que no hay ningun punto en el arbol mayor que todosestos. Podemos rectificar la ruta desde cualquier paso previo para garantizar quellegamos al nivel ω. Por ejemplo, si estamos dispuestos a cambiar a partir delnivel 2 tomamos un xω > x1 y seguimos el camino x0 < x1 < x′2 < x′3 < · · · < xωformado por los nodos anteriores a xω . A partir de aquı podemos pasar a unxω+1 en el nivel ω + 1, etc., hasta determinar una cadena

x0 < x1 < x′2 < x′3 < · · · < xω < xω+1 < xω+2 < · · ·

pero de nuevo podemos encontrarnos con que esta rama se acaba aquı, y quepara llegar mas arriba hubiera sido necesario desviarse en cualquiera de los pa-sos previos. El hecho de que A sea un arbol de Aronszajn significa precisamenteque, tarde o temprano, hagamos lo que hagamos, terminaremos en una ramanumerable que no puede prolongarse mas. Podemos subir tan alto como quera-mos, pero siempre llegara un momento en que para seguir subiendo tendremosque bajar un poco y cambiar de direccion. Esta es la caracterıstica de los arbolesde Aronszajn.

Page 296: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

286 Capıtulo 9. Arboles

La existencia de arboles tan peculiares es dudosa, pero vamos a disipar laduda construyendo uno.

Definicion 9.9 Si I es un conjunto no vacıo y α un ordinal, llamaremos arbolcompleto I-adico de altura α al conjunto I<α con el orden dado por la inclusion.

Es claro que I<α es un arbol de altura α cuyo nivel β (para β < α) es Iβ .

Teorema 9.10 (Aronszajn) Existe un arbol de Aronszajn.

Demostracion: Partiremos de A = s ∈ ω<ω1 | s es inyectiva, que es unsubarbol de ω<ω1 . Es claro que para cada α < ω1 se cumple que

NivαA = s ∈ αω | s es inyectiva 6= ∅,

luego altA = ℵ1. Si C fuera una cadena no numerable en A entonces f =⋃

a∈C

a

es una funcion, porque los elementos de C son compatibles, y habrıa de serf : ω1 −→ ω inyectiva, lo cual es absurdo. Por lo tanto las cadenas de A sonnumerables. Sin embargo, A no es un arbol de Aronszajn porque sus nivelesson no numerables.

Definimos en cada conjunto αω la relacion de equivalencia dada por

s ≈ t↔ β < α | s(β) 6= t(β) es finito.

Vamos a construir recurrentemente una sucesion sαα<ω1 tal que

a) sα ∈ αω es inyectiva,

b) Si α < β < ω1, entonces sα ≈ sβ |α,

c) ω \ sα[α] es infinito.

Tomamos s0 = ∅. Definido sα, tomamos cualquier n ∈ ω \ sα[α] y es facilver que sα+1 = sα ∪ (α, n) cumple lo pedido. Supongamos definidos sδδ<λ,para un lımite λ < ω1.

Sea αnn<ω una sucesion cofinal creciente en λ. Vamos a definir una su-cesion de aplicaciones inyectivas tn : αn −→ ω tales que t0 = sα0 y para todon ∈ ω se cumpla tn ≈ sαn

∧ tn+1|αn= tn.

Supuesto que esten definidas t0, . . . , tn, definimos tn+1 : αn+1 −→ ω me-diante

tn+1(β) =

tn(β) si β < αn,sαn+1(β) si αn ≤ β y sαn+1(β) /∈ tn[αn],mın(ω \ (tn[αn] ∪ sαn+1 [αn+1])) si αn ≤ β y sαn+1(β) ∈ tn[αn].

Como sαncoincide con tn salvo en un numero finito de casos, solo puede

ocurrir sαn+1(β) ∈ tn[αn] en un numero finito de casos. Por lo tanto se cumplesαn+1 ≈ tn+1.

Page 297: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.3. Arboles de Aronszajn 287

Sea t =⋃

n∈ωtn. Claramente t : λ −→ ω inyectiva. Definimos sλ : λ −→ ω

mediante

sλ(β) =

t(α2n) si β = αn,t(β) en otro caso.

De este modo, si α < λ sera α < αn para cierto n < ω, y entonces sλ|α ≈ tn|α(pues se diferencian a lo sumo en α0, . . . , αn−1), luego sλ|α ≈ sαn

|α ≈ sα.Ademas t(α2n+1) | n ∈ ω ⊂ ω \ sλ[λ], con lo que este ultimo conjunto es

infinito y se cumple todo lo pedido.

Definimos A∗ =⋃

α<ω1

t ∈ NivαA | t ≈ sα. Ası A∗ es un subarbol de A,

pues si x ∈ A∗, y ∈ A, y < x, digamos que altAx = α, altAy = β, entoncesx ≈ sα, luego y = x|β ≈ sα|β ≈ sβ y por consiguiente y ∈ A∗.

Para cada α < ω1 se cumple que sα ∈ NivαA∗, luego altA∗ = ℵ1. Como en

A no hay cadenas numerables, tampoco las hay en A∗. Finalmente,

NivαA∗ = t ∈ αω | t ≈ sα ∧ t inyectiva ⊂ ⋃

x⊂αfinito

t ∈ αω | t|α\x = sα|α\x,

y el miembro derecho es una union numerable de conjuntos numerables. Con-cluimos que A∗ es un arbol de Aronszajn.

Mas en general:

Definicion 9.11 Un κ-arbol de Aronszajn es un κ-arbol cuyas cadenas tienentodas cardinal < κ, es decir, un κ-arbol sin caminos.

En estos terminos hemos probado que no existen ℵ0-arboles de Aronszajn,pero sı ℵ1-arboles de Aronszajn. Por otra parte, es inmediato que si κ es uncardinal singular existen κ-arboles de Aronszajn. El arbol considerado en la notatras el teorema 9.5 es un ejemplo. Para cardinales regulares > ℵ1 la existenciao no de arboles de Aronszajn depende de la aritmetica cardinal. El teoremaanterior admite la generalizacion siguiente:

Teorema 9.12 Sea κ un cardinal regular tal que 2<κ = κ. Entonces existe unκ+-arbol de Aronszajn.

Demostracion: El caso en que κ = ℵ0 se reduce al teorema 9.10, ası quepodemos suponer que κ > ℵ0. Siguiendo el argumento de 9.10, partimos delarbol A = s ∈ κ<κ+ | s es inyectiva, que tiene claramente altura κ+ y todassus cadenas tienen cardinal < κ+. Ahora definimos en cada ακ la relacion dadapor

s ≈ t↔ |β < α | s(β) 6= t(β)| < κ

y construimos recurrentemente una sucesion sαα<κ+ tal que

a) sα ∈ ακ es inyectiva,

b) Si α < β < κ+, entonces sα ≈ sβ |α,

c) sα[α] no es estacionario en κ.

Page 298: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

288 Capıtulo 9. Arboles

Tomamos s0 = ∅. Definido sα, tomamos cualquier δ ∈ κ \ sα[α] y es facilver que sα+1 = sα ∪ (α, δ) cumple lo pedido.

Supongamos definidos sδδ<λ, para un lımite λ < κ+. Sea ν = cf λ ≤ κ.Sea αηη<ν una sucesion cofinal y normal en λ. Podemos suponer que κ < α0.

Para cada η < ν, sea Cη un c.n.a. en κ tal que sαη[αη] ∩ Cη = ∅. Si ν < κ,

sea C =⋂

η<νCη, y si ν = κ, entonces sea C =

η<κCη \ 0. En ambos casos C

es c.n.a. en κ y sαη[αη] ∩ C ⊂ η + 1 < κ.

Definimos una sucesion de aplicaciones inyectivas tη : αη −→ κ \C tales quetη ≈ sαη

y si η < η′ < ν entonces tη′ |αη= tη.

Como sα0 [α0]∩C = ∅, podemos tomar t0 = sα0 : α0 −→ κ\C. Supongamosdefinido tη. Como sαη+1 [αη+1] ∩ C ⊂ η + 2 < κ, tenemos que A = s−1

αη+1[C]

cumple |A| < κ, luego |sαη+1 [αη+1 \ αη] \ C| = κ, luego podemos tomar unconjunto B ⊂ αη+1 \ αη tal que |B| = |A|ℵ0 y sαη+1 [B] ⊂ κ \C. Tomamos unabiyeccion g : A ∪B −→ sαη+1 [B] y definimos

tη+1(β) =

tη(β) si β < αη,sαη+1(β) si β ∈ αη+1 \ (αη ∪A ∪B),g(β) si β ∈ A ∪B.

Es claro entonces que tη+1 : αη+1 −→ κ \ C inyectiva, extiende a tη y ademastη+1 ≈ sαη+1 , pues difieren unicamente en A ∪ B y donde difieren tη y sαη

, locual es un conjunto de cardinal < κ.

En tercer lugar, si estan definidos tηη<λ′ , basta tomar

tλ′ =⋃

η<λ′

tη : αλ′ −→ κ \ C,

claramente inyectiva. Se cumple que tλ′ ≈ sαλ′ , pues

β < αλ′ | tλ′(β) 6= sαλ′ (β) ⊂⋃

η<λ′

β < αη | tη(β) 6= sαλ′ (β)

⊂⋃

η<λ′

(β < αη | tη(β) 6= sαη

(β) ∪ β < αη | sαη(β) 6= sαλ′ (β)

)

y se trata de una union de menos de κ conjuntos de cardinal menor que κ.

Ası pues, podemos definir sλ =⋃

η<νtη : λ −→ κ \ C inyectiva. Trivialmente

sλ[λ] no es estacionario en κ, pues no corta a C y si δ < λ existe un η < ν talque δ < αη < λ, con lo que sλ|δ = tη|δ ≈ sαη

|δ ≈ sδ.

Definimos A∗ =⋃

α<κ+

t ∈ NivαA | t ≈ sα, que es un subarbol de A, luego

no tiene cadenas de cardinal κ y, como sα ∈ NivαA∗, vemos que altA∗ = κ+.

Finalmente,

NivαA∗ = t ∈ ακ | t ≈ sα ∧ t inyectiva ⊂ ⋃

x∈[α]<κ

t ∈ ακ | t|α\x = sα|α\x,

Page 299: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.4. Arboles de Suslin 289

y bajo las hipotesis del teorema tenemos que

|[α]<κ| ≤ κ<κ = (2<κ)<κ = 2<κ) = κ,

|t ∈ ακ | t|α\x = sα|α\x| = |κx| ≤ κ<κ = κ,

luego |NivαA∗| ≤ κ < κ+ y concluimos que A∗ es un κ+-arbol de Aronszajn.

Teniendo en cuenta que la hipotesis del continuo generalizada implica quetodo cardinal infinito cumple 2<κ = κ, ahora es inmediato lo siguiente:

Teorema 9.13 (HCG) Existen κ-arboles de Aronszajn para todo cardinal κno numerable salvo a lo sumo si κ es inaccesible o el sucesor de un cardinalsingular.

El caso del sucesor de un cardinal singular lo consideraremos de nuevo en laseccion siguiente (vease el teorema 9.21 y la nota posterior).

9.4 Arboles de Suslin

Vamos a probar que la existencia de rectas de Suslin es equivalente a laexistencia de un arbol de Suslin:

Definicion 9.14 Un κ-arbol de Suslin es un κ-arbol cuyas cadenas y antica-denas tienen todas cardinal < κ. En particular, todo κ-arbol de Suslin es unκ-arbol de Aronszajn. Un arbol de Suslin es un ℵ1-arbol de Suslin.

Todo κ-subarbol bien podado de un κ-arbol de Suslin es claramente un κ-arbol de Suslin bien podado, luego, si κ es un cardinal regular y existe un κ-arbolde Suslin, tambien existe un κ-arbol de Suslin bien podado.

Diremos que un arbol A esta ramificado si todo x ∈ A tiene extensionesincompatibles, es decir, si el conjunto y ∈ A | x < y no esta totalmenteordenado.

Teorema 9.15 Todo κ-arbol de Suslin bien podado esta ramificado.

Demostracion: Sea A un κ-arbol de Suslin bien podado. Sea y ∈ A. SeaC una cadena maximal que contenga a y. Entonces |C| < κ, luego existe unordinal α < κ tal que altC < α. Como A esta bien podado existe un x ∈ A dealtura α tal que y < x. No puede ocurrir que todos los elementos de C estenbajo x, luego tomando un x′ ∈ C con y < x′ que no este bajo x, tenemos que xy x′ son extensiones incompatibles de y. Por lo tanto A esta ramificado.

Esto tiene interes porque la condicion de Suslin se simplifica un tanto sobrelos arboles ramificados.

Teorema 9.16 Si κ es un cardinal regular y A es un κ-arbol ramificado en elque toda anticadena maximal tiene cardinal < κ, entonces A es un κ-arbol deSuslin.

Page 300: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

290 Capıtulo 9. Arboles

Demostracion: Toda anticadena esta contenida en una anticadena maxi-mal, luego todas las anticadenas de A tienen cardinal < κ. Si A tuviera unacadena de cardinal κ, podrıamos tomarla maximal, llamemosla B. Entonces Bcorta a todos los niveles no vacıos de A. Para cada x ∈ A, sea f(x) > x tal quef(x) /∈ B (existe porque A esta ramificado).

Definimos por recurrencia una sucesion xαα<κ de modo que xα ∈ B yaltAxα ≥ ⋃

β<α

alt f(xα). Ası f(xα)α<κ es una anticadena no numerable en A,

contradiccion.

Finalmente obtenemos la caracterizacion anunciada de la hipotesis de Suslin:

Teorema 9.17 Existe un arbol de Suslin si y solo si existe una recta de Suslin.

Demostracion: Supongamos que A es un arbol de Suslin. Podemos su-poner que esta bien podado. Sea L el conjunto de todas las ramas de A. SiC ∈ L, del hecho de que A esta bien podado se sigue que altC es un ordinallımite. Si α < altC, llamaremos C(α) al unico elemento en C de altura α. Si C,D ∈ L, C 6= D, llamaremos d(C,D) al mınimo ordinal α tal que C(α) 6= D(α).Claramente d(C,D) < altC ∩ altD.

Fijemos un orden total en A y definamos en L el orden ≤ dado por

C ≤ D ↔ C = D ∨ (C 6= D ∧ C(d(C,D)) ≺ D(d(C,D))).

Es claro que la relacion ≤ es reflexiva y antisimetrica. Veamos que es tran-sitiva: Si C ≤ D ≤ E y se da alguna igualdad es claro que C ≤ E. Supongamosque C < D < E. Tenemos las posibilidades siguientes:

C D E C D E C D E C E

D

d(D,E) = d(C,E)

= d(C,D)

d(D,E) = d(C,E)

< d(C,D)

d(C,E) = d(C,D)

< d(D,E)

d(C,D) = d(D,E)

< d(C,E)

Sabemos que C(d(C,D)) ≺ D(d(C,D)), D(d(D,E)) ≺ E(d(D,E)) y hemosde probar que C(d(C,E)) ≺ E(d(C,E)), lo cual es cierto en los tres primeroscasos, mientras que el cuarto contradice las hipotesis.

Es claro que dos ramas cualesquiera son comparables, luego L es un conjuntototalmente ordenado. Veamos que cumple la condicion de cadena numerable.Supongamos que ]Cα, Dα[α<ω1 es una familia de intervalos no vacıos disjuntosdos a dos. Sea Cα < Eα < Dα y sea βα tal que

d(Cα, Eα) ∪ d(Eα, Dα) < βα < altEα.

Page 301: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.4. Arboles de Suslin 291

Vamos a probar que Eα(βα)α<ω1 es una anticadena en A, en contradiccioncon la definicion de arbol de Suslin.

En caso contrario Eα(βα) ≤ Eα′(βα′), para ciertos α, α′ < ω1. Claramenteentonces, Eα(βα) = Eα′(βα) y ası

d(Eα, Eα′) > βα > d(Cα, Eα) ∪ d(Eα, Dα),

luego d(Cα, Eα′) = d(Cα, Eα) y d(Eα, Dα) = d(Eα′ , Dα). Pero entonces lasdesigualdades Cα < Eα < Dα implican Cα < Eα′ < Dα, con lo que

Eα′ ∈ ]Cα, Dα[ ∩ ]Cα′ , Dα′ [ = ∅,

contradiccion.

Veamos, por ultimo, que L no es separable. Supongamos que D es un sub-conjunto denso numerable en L. Las alturas de las ramas de D son ordinalesnumerables. Sea δ < ω1 mayor que cualquiera de ellas y sea x ∈ NivδA. Como Aesta ramificado, existe un ordinal δ < α < ω tal que existen r, s, t ∈ NivαA porencima de x. Tomemos E, F , G ∈ L tales que r ∈ E, s ∈ F , t ∈ G. Podemossuponer E < F < G. Ası, ]E,G[ es un intervalo no vacıo, luego deberıa existirC ∈ ]E,G[∩D. Ahora bien, como x ∈ E∩G, tenemos que δ = altAx < d(E,G),y como d(C,E) < altC < δ (porque C ∈ D y por la definicion de δ), resultaque d(C,E) = d(C,G), de donde se sigue que C es menor que E y G o mayorque ambos, contradiccion.

Por consiguiente, L cumple 9.2 a), lo que implica que existe una recta deSuslin.

Supongamos ahora que existe una recta de Suslin L. Por 9.2 podemos supo-ner que no tiene intervalos separables. Llamemos B al conjunto de los intervalosabiertos no vacıos de L. Vamos a construir una sucesion Bαα<ω1 que cumplalo siguiente:

a) Bα ⊂ B y esta formado por intervalos disjuntos dos a dos,

b)⋃

x∈Bα

x es denso en L,

c) Si α < β < ω1, I ∈ Bα, J ∈ Bβ, entonces o bien I ∩ J = ∅ o bien J I.

Para empezar tomamos como B0 una familia maximal de intervalos disjuntosdos a dos. Por ser maximal

x∈B0

x es denso en L.

Supongamos definido Bα. Para cada I ∈ Bα, sea HI una familia maximalde elementos disjuntos del conjunto K ∈ B | K I. Sea Bα+1 =

I∈Bα

HI .

Es claro que Bα+1 cumple a) y c). Veamos b). Para ello tomamos unintervalo abierto no vacıo J ∈ B y hemos de probar que corta a algun intervalode Bα+1. Sabemos que corta a un I ∈ Bα. Como L es denso en sı mismo, dentrode J ∩ I podemos tomar un intervalo no vacıo estrictamente contenido en I. Dehecho, podemos suponer que J I. Entonces J ha de cortar a algun intervalo

Page 302: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

292 Capıtulo 9. Arboles

de HI ⊂ Bα+1, o si no podrıamos anadirlo a HI contradiciendo la maximalidadde este.

Supongamos definidos Bαα<λ, para un lımite λ < ω1. Sea

H = K ∈ B |∧

δ < λ∧

I ∈ Bδ(I ∩K = ∅ ∨ H I).

Tomamos como Bλ una familia maximal de intervalos disjuntos en H . Enrealidad hemos de probar que H 6= ∅, pero esto esta implıcito en la prueba deque Bλ cumple b). Sea J ∈ B y veamos que corta a un intervalo de Bλ.

Como L cumple la condicion de cadena numerable, cada Bα es numerable,luego

δ<λ

Bδ tambien lo es. Sea E el conjunto de los extremos de los intervalos

de esta union, numerable tambien. Como J no es separable E ∩ J no es densoen J , luego existe un intervalo K1 ∈ B, K1 ⊂ J , K1 ∩ E = ∅.

Como L es denso en sı mismo, podemos tomar K2 ∈ B, K2 K1. EntoncesK2 ∈ H , pues si δ < λ e I ∈ Bδ, los extremos de I estan en E, luego no estanen K1, luego K1 ∩ I = ∅ o bien K1 ⊂ I. Consecuentemente, K2 ∩ I = ∅ o bienK2 I. Por la maximalidad de Bλ, el intervalo K2 ha de cortar a alguno desus intervalos, luego J tambien. Obviamente Bλ cumple a) y c).

Llamemos A =⋃

α<ω1

Bα con el orden dado por la inversa de la inclusion.

Vamos a probar que es un arbol. Tomamos x ∈ A y hemos de ver que A<x

esta bien ordenado. En primer lugar probaremos que esta totalmente ordenado.Tomemos u, v ∈ A<

x . Esto significa que x ⊂ u ∩ v 6= ∅. Es claro entonces queu ⊂ v o v ⊂ u.

Tomemos ahora C ⊂ A<x no vacıo y veamos que tiene mınimo. Sea α el

mınimo ordinal tal que C ∩ Bα 6= ∅. Sea u ∈ C ∩ Bα. Veamos que u esel mınimo de C. En caso contrario (puesto que C esta totalmente ordenado)existirıa v ∈ C tal que v < u, o sea, u v. Digamos que v ∈ Bβ , donde β ≥ αpor la minimalidad de α. Ahora bien, si β = α entonces u y v tendrıan que serdisjuntos, luego β > α, pero entonces tendrıa que ser v u, contradiccion.

Tenemos, pues, que A es un arbol. Una anticadena en A esta formada porintervalos de L disjuntos dos a dos, luego ha de ser numerable.

Si Iαα<ω1 fuera una cadena en A, para α < ω1 se cumplirıa que Iα+1 Iα,y como L es denso en sı mismo Iα\Iα+1 contendrıa un intervalo abierto no vacıoJα. Entonces Jαα<ω1 serıa una familia de intervalos en L disjuntos dos a dos,contradiccion. Por lo tanto A es un arbol de Suslin.

Ası pues, ahora tenemos una expresion alternativa para la hipotesis de Suslin:

Hipotesis de Suslin (HS) No existen arboles de Suslin

Segun ya hemos advertido, en NBG no puede probarse la existencia dearboles de Suslin, pero sı podemos construir uno si suponemos el diamante.Con su ayuda construiremos un arbol de Suslin definiendo un orden adecuadosobre ω1. Primeramente demostramos un hecho tecnico.

Page 303: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.4. Arboles de Suslin 293

Teorema 9.18 Sea κ un cardinal regular y B = (κ,≤∗) un κ-arbol. Para cadaα < κ sea Bα = x ∈ κ | altBx < α y sea A una anticadena maximal de B.Entonces el conjunto

λ < κ | Bλ = λ ∧ Bλ ∩ A es una anticadena maximal en Bλ

es c.n.a. en κ.

Demostracion: Sea C el conjunto del enunciado. Supongamos que λ < κes un ordinal lımite tal que C ∩ λ no esta acotado en λ. Entonces para todox ∈ B se cumple que

x ∈ Bλ ↔ altBx < λ↔∨

δ ∈ C ∩ λ altBx < δ

↔∨

δ ∈ C ∩ λ x ∈ Bδ = δ ↔ x ∈ λ,

luego Bλ = λ.Claramente Bλ ∩ A es una anticadena en Bλ. Si no es maximal existe un

x ∈ Bλ\A incompatible con todos los elementos de Bλ∩A. Entonces altBx < λ,luego existe δ ∈ C ∩ λ tal que altBx < δ. Ası x ∈ Bδ \ A y es incompatiblecon todos los elementos de Bδ, y esto contradice que Bδ ∩A es una anticadenamaximal de Bδ. Ası pues, λ ∈ C y C es cerrado.

Llamemos f(α) = altBα, g(α) =⋃

β∈NivαB

β y sea h(α) un elemento de A compa-

tible con α. De este modo f , g, h : κ −→ κ, el conjunto

D = λ < κ | f [λ] ⊂ λ ∧ g[λ] ⊂ λ ∧ h[λ] ⊂ λ

es c.n.a. y es facil ver que D ⊂ C, luego C no esta acotado.

Teorema 9.19 ♦ → ¬HS.

Demostracion: Sea Aαα<ω1 una sucesion ♦. Vamos a definir una re-lacion de orden ≤∗ en ω1 de modo que B = (ω1,≤∗) sea un arbol de Suslin.Llamaremos

Nα = ω · α+ n | n ∈ ω.Por las propiedades de la aritmetica ordinal, los conjuntos Nαα<ω1 forman

una particion de ω1 en ℵ1 subconjuntos numerables disjuntos dos a dos. Defini-remos ≤∗ de modo que Nα sea el nivel α-esimo de B. De este modo tendremosgarantizado que B sera un ℵ1-arbol. Mas concretamente, vamos construir unarbol B que cumpla las propiedades siguientes:

a)∧

α < ω1 NivαB = Nα,

b) Para cada α < ω1 y cada n < ω se cumple

ω · α+ n ≤∗ ω(α+ 1) + 2n y ω · α+ n ≤∗ ω(α+ 1) + 2n+ 1

y los miembros derechos son los unicos elementos de Nα+1 que extiendenal miembro izquierdo.

c) Si β < α < ω1 y x ∈ Nβ , entonces∨

y ∈ Nα x ≤∗ y.

Page 304: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

294 Capıtulo 9. Arboles

d) Si λ < ω1, Bλ = λ (donde Bλ = α < ω1 | altBα < λ) y Aλ es unaanticadena maximal en Bλ, entonces

x ∈ Nλ

y ∈ Aλ y ≤∗ x.

La propiedad b) afirma que el elemento n-simo del nivel α-esimo tiene exac-tamente dos extensiones en el nivel α+ 1-esimo, a saber, los elementos 2n-simoy 2n+ 1-esimo. La propiedad c) afirma que desde cualquier punto se puede as-cender hasta cualquier altura. La propiedad d) es la que nos dara la propiedadde Suslin.

Razonamos por recurrencia. Definiremos una sucesion de arboles

Bα =⋃

β<α

de modo que cada cual sea un subarbol de los siguientes y cumpla las propiedadesanteriores.

En B1 = N0 la relacion ≤∗ se restringe a ser reflexiva, pues los niveles sonanticadenas. Si λ < ω1 es un ordinal lımite y ≤∗ esta definida en Bδ, para cadaδ < λ, entonces, como

Bλ =⋃

δ<λ

Bδ,

la relacion en Bλ esta completamente determinada (y cumple trivialmente todaslas propiedades requeridas).

Mas aun, si suponemos que ≤∗ esta definida sobre Bα+1 (es decir, hasta elnivel α), la propiedad b) determina completamente su extension a Bα+2. Asıpues, el unico paso no trivial consiste en suponer definida ≤∗ sobre Bλ = ω · λy extenderla a Bλ+1, es decir, determinar que elementos de Bλ son anteriores acada ω · λ+ n ∈ Nλ.

Numeremos los elementos de Bλ = ω · λ = xn | n ∈ ω. Vamos a probarque para cada n ∈ ω existe una cadena B(n) en Bλ tal que xn ∈ Bn y B(n)corta a todos los niveles Nδ para todo δ < λ.

Sea βm(n)m∈ω una sucesion cofinal creciente en λ tal que altxn < β0(n).Sean ym(n)m∈ω tales que ym(n) ∈ Nβm(n) y xn <∗ y0(n) <∗ y1(n) <∗ · · ·(existen por c). Basta tomar B(n) = z ∈ Bλ |

m ∈ ω z <∗ ym(n).

Supongamos momentaneamente que Bλ = λ y que Aλ (de la sucesion ♦)sea una anticadena maximal en Bλ. Entonces cada xn es compatible en Bλ conalgun elemento de Aλ, es decir, existe un a(n) ∈ Aλ anterior o posterior a xn.En cualquier caso existe un y ∈ Bλ tal que xn <∗ y ∧ a(n) <∗ y. Podemosescoger la sucesion ym(n)m∈ω de modo que y0(n) = y, con lo que a(n) ∈ B(n).

Volviendo al caso general, extendemos ≤∗ a Bλ+1 estableciendo que los ele-mentos anteriores a ω ·λ+n son exactamente los de B(n), con lo que ciertamenteω · λ+ n tiene exactamente λ anteriores en Bλ+1, luego Nλ es el nivel λ-esimode Bλ+1. Obviamente Bλ+1 cumple las propiedades a), b) y c). La propiedad

Page 305: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.4. Arboles de Suslin 295

d) tambien se cumple, pues si Bλ = λ y Aλ es una anticadena maximal en Bλ yx ∈ Nλ, entonces x = ω · λ+ n para cierto n ∈ ω y por construccion a(n) ∈ Aλ

cumple a(n) ∈ Bn, es decir, a(n) <∗ x.

Ası pues, tenemos definido un arbolB = (ω1,≤∗) que cumple las propiedadesa), b), c) y d). Por a) es un ℵ1-arbol. Por b) es ramificado, luego para probarque es un arbol de Suslin basta ver que todas sus anticadenas maximales sonnumerables (teorema 9.16). Sea, pues, A una anticadena maximal en B. Por elteorema anterior, el conjunto

C = λ < ω1 | Bλ = λ ∧ Bλ ∩ A es una anticadena maximal en Bλes c.n.a. en ω1. Por ♦, el conjunto α < ω1 | A∩α = Aα es estacionario en ω1,luego existe un λ ∈ C tal que A∩λ = Aλ. Tenemos entonces que Aλ ⊂ A es unaanticadena maximal en Bλ. Ahora bien, por construccion, todos los elementosde Nλ tienen por debajo un elemento de Aλ, pero de hecho todo elemento deB de altura ≥ λ tiene bajo sı un elemento de Nλ, luego un elemento de A.Esto significa que A ⊂ Bλ (mas concretamente, A = Aλ), y en particular esnumerable.

Si meditamos sobre la construccion anterior veremos que esencialmente con-siste en garantizar que una cierta anticadena Aλ no puede extenderse mas alladel nivel λ, haciendo que todos los elementos del nivel λ sean compatibles conella. El diamante hace falta para garantizar que una anticadena maximal arbi-traria del arbol que resulte de la construccion coincidira hasta un cierto nivel λcon Aλ.

El teorema anterior se generaliza sin dificultad al caso de sucesores de car-dinales regulares, si bien necesitamos entonces el caso mas fuerte del diamantede Jensen (el que no se sigue de la HCG):

Teorema 9.20 Sea κ un cardinal regular tal que 2<κ = κ y supongamos que secumple ♦E, donde E = λ < κ+ | cf λ = κ. Entonces existe un κ+-arbol deSuslin.

Demostracion: Sea Aαα∈E una sucesion ♦E . Siguiendo el esquema delteorema anterior, vamos a definir una relacion de orden ≤∗ en κ+ de modo queB = (κ+,≤∗) sea un arbol de Suslin. Llamaremos analogamente

Nα = κ · α+ δ | δ ∈ κ,de modo que los conjuntos Nαα<κ+ forman una particion de κ+ en κ+ sub-conjuntos disjuntos dos a dos de cardinal ≤ κ. La construccion garantizara quese cumplen las propiedades siguientes:

a)∧

α < κ+ NivαB = Nα,

b) Para cada α < κ+ y cada δ < κ se cumple

κ · α+ δ ≤∗ ω(α+ 1) + δ2 y κ · α+ δ ≤∗ ω(α+ 1) + δ2 + 1

y los miembros derechos son los unicos elementos de Nα+1 que extiendenal miembro izquierdo.

Page 306: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

296 Capıtulo 9. Arboles

c) Si β < α < κ+ y x ∈ Nβ , entonces∨

y ∈ Nα x ≤∗ y.

d) Toda cadena maximal en B tiene altura de cofinalidad κ.

e) Si λ < κ+, cf λ = κ, Bλ = λ y Aλ es una anticadena maximal en Bλ,entonces

x ∈ Nλ

y ∈ Aλ y ≤∗ x.

Estas condiciones implican claramente que B es un κ+-arbol ramificado.Vamos a definir recurrentemente una estructura de arbol en cada

Bα =⋃

β<α

Nβ,

de modo que cada Bα contenga como subarboles a los Bβ anteriores y cumplalas condiciones a) – e), entendiendo la d) como que la altura de cada cadenamaximal en Bα es α o tiene cofinalidad κ.

La definicion de ≤∗ sobre B1 = N0 es trivial (cada ordinal solo esta rela-cionado consigo mismo). Tambien es trivial la definicion de ≤∗ sobre cada Bλ

y sobre cada Bα+2 (en cuyo caso la extension viene determinada por la pro-piedad b). Supongamos construido Bλ y veamos como construir Bλ+1. Seaµ = cf λ ≤ κ.

Veamos en primer lugar que todo x ∈ Bλ esta contenido en un camino.En efecto, podemos tomar δαα<µ una sucesion cofinal y normal en λ tal quealtx = δ0. Definimos una sucesion creciente xαα<µ en Bλ de modo quealtxα = δα y x0 = x.

Para ello tomamos x0 = x, supuesto definido xα, tomamos xα+1 ∈ Nδα+1 talque xα ≤∗ xα+1 por la propiedad c), y si tenemos xαα<λ′ , con λ′ < µ ≤ κ,entonces

Cλ′ = p ∈ Bλ |∨

α < λ′ x ≤∗ xαes una cadena en Bλ de altura δλ′ , cuya cofinalidad es cf λ′ ≤ λ′ < κ, luego pord) no es una cadena maximal en Bλ, luego puede prolongarse a una cadena quecontendra un xλ′ de altura δλ′ .

Con esto termina la construccion de la sucesion, la cual nos da a su vez unacadena Cµ de altura λ (es decir, un camino) que contiene a x.

Supongamos ahora que µ = cf λ < κ. Entonces, cada camino C en Bλ estadeterminado por

p ∈ C |∨

α < µ alt p = δα,luego el numero de caminos en Bλ es a lo sumo |µBλ| ≤ κµ ≤ κ<κ = 2<κ = κ.De hecho, el numero de caminos es exactamente igual a κ, pues cada elementode N0 pertenece a un camino distinto. Por consiguiente, podemos fijar unaenumeracion Cδδ<κ de todos los caminos de Bλ y establecer que cada κ ·λ+ δesta por encima de todos los elementos de Cδ y solo de ellos. Esto hace quecada elemento de Nλ tenga altura λ en Bλ+1 y que no haya cadenas maximalesde altura λ, pues todas ellas se extienden a cadenas de altura λ+ 1. Ası Bλ+1

cumple las propiedades a), c), d), y las demas se cumplen trivialmente.

Page 307: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.4. Arboles de Suslin 297

Supongamos ahora que cf λ = κ pero no se cumple que Bλ = λ y que Aλ

es una cadena maximal en Bλ. Entonces repetimos la construccion anteriorpero no con una enumeracion de todos los caminos, sino que enumeramos loselementos de Bλ, digamos xδδ<κ, y elegimos caminos Cδδ<κ de modo quexδ ∈ Cδ. Con esto conseguimos que se sigan cumpliendo las propiedades a) yc), y las demas se cumplen trivialmente.

Por ultimo, supongamos que se cumplen las hipotesis de la propiedad e).Entonces, cada xδ ∈ Bλ es compatible con un elemento de Aλ, lo cual significaque podemos tomar yδ ∈ Bλ y aδ ∈ Aλ de modo que xδ <∗ yδ, aδ <∗ yδ.Entonces, para cada xδ ∈ Bλ elegimos un camino Cδ que contenga a yδ ydefinimos con ellos Bλ+1.

Con esto tenemos construido el κ+-arbol ramificado B. Sea A una antica-dena en B, que podemos suponer maximal. Por el teorema 9.18, el conjunto

C = λ < κ+ | Bλ = λ ∧ Bλ ∩ A es una anticadena maximal en Bλ

es c.n.a. en κ+. Como el conjunto λ ∈ E | A ∩ λ = Aλ es estacionario enκ+, podemos tomar λ ∈ C tal que A ∩ λ = Aλ. Ası Aλ ⊂ A es una anticadenamaximal en Bλ. Ahora bien, todo elemento de B de altura ≥ λ tiene bajo sı unelemento de Nλ, el cual, por la propiedad e), tiene bajo sı un elemento de Aλ,luego un elemento de A. Esto implica que A = Aλ, luego tiene cardinal ≤ κ.

Ası pues, como en el caso de los κ-arboles de Aronszajn, tenemos probadoque es consistente que existan κ-arboles de Suslin (es decir, que no se puedeprobar que no existen) salvo si κ es inaccesible o bien es el sucesor de un cardinalsingular. Vamos a probar ahora que en el ultimo caso tambien es consistente laexistencia de κ-arboles de Suslin y, en particular, de κ-arboles de Aronszajn:

Teorema 9.21 Sea κ un cardinal infinito tal que existe E ⊂ κ+ estacionariode modo que se cumplen κ(E) y ♦E. Entonces existe un κ+-arbol de Suslin.

Demostracion: Sea Aαα∈E una sucesion ♦E y sea Cλλ<κ+ una su-cesion κ(E). Vamos a construir un arbol sobre κ+ siguiendo exactamente elmismo planteamiento de la demostracion del teorema anterior, salvo que ahorala construccion garantizara los hechos siguientes:

a)∧

α < κ+ NivαB = Nα,

b) Para cada α < κ+ y cada δ < κ se cumple

κ · α+ δ ≤∗ ω(α+ 1) + δ2 y κ · α+ δ ≤∗ ω(α+ 1) + δ2 + 1

y los miembros derechos son los unicos elementos de Nα+1 que extiendenal miembro izquierdo.

c) Si β < α < κ+ y x ∈ Nβ , entonces∨

y ∈ Nα x ≤∗ y.

d) Toda cadena de altura lımite λ esta bajo un unico elemento de Nλ.

Page 308: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

298 Capıtulo 9. Arboles

e) Si λ ∈ E, Bλ = λ y Aλ es una anticadena maximal en Bλ, entonces∧

x ∈ Nλ

y ∈ Aλ y ≤∗ x.

El problema es como extender la relacion de orden ≤∗ de Bλ a Bλ+1.

Dado x ∈ Bλ, trataremos de encontrar un camino en Bλ que contenga a x.Sea γλ(α)α<θλ la semejanza de Cλ en su ordinal θλ. Sea αλ(x) el mınimoαλ(x) < θλ tal que x ∈ Bγλ(αλ(x)). Definimos una sucesion pxλ(α)αλ(x)≤α<θλ

como sigue:

• pxλ(αλ(x)) es el mınimo ordinal y ∈ Nγλ(αλ(x)) tal que x ≤∗ y.

• pxλ(α+ 1) es el mınimo ordinal y ∈ Bγλ(α+1) tal que pxλ(α) ≤∗ y.

• pxλ(λ′) es el unico ordinal y ∈ Nγλ(λ′) tal que

α < λ′(αλ(x) ≤ α → pxλ(α) ≤∗ y).

Observemos que el ordinal y requerido existe sin duda en los dos primeroscasos por la propiedad c). Sin embargo, no es evidente que exista en el tercercaso (pero si existe es unico, por la propiedad d). Supongamos de momento queexiste un unico y para cada x, de modo que la funcion pxλ puede ser definida.En tal caso podemos definir

Cxλ = y ∈ Bλ |

α < θλ y ≤∗ pxλ(α),

que claramente es un camino en Bλ que contiene a x. Extendemos la estructurade arbol a Bλ+1 distinguiendo dos casos:

Si no se cumple que λ ∈ E, Bλ = λ y Aλ ∩ λ es una anticadena maximal deBλ, numeramos todos los caminos Cx

λ que hemos construido, digamos Cδλδ<κ,

y establecemos que por encima de cada Cδλ este unicamente κ · λ+ δ.

En caso contrario, consideramos unicamente los caminos correspondientesa ordinales x ∈ Bλ que tienen por debajo un elemento de Aλ. Notemos quepor la maximalidad de Aλ ∩ λ todo elemento de Bλ = λ es compatible con unelemento de Aλ, luego esta en uno de los caminos considerados, luego con estaconstruccion todo elemento de Bλ tiene una extension en Nλ.

Esto termina la construccion de B, que es claramente un κ+-arbol ramifi-cado, supuesto que para todo λ haya sido posible construir las funciones pxλ. Va-mos a probar que esto es ası considerando, por reduccion al absurdo, el mınimoλ para el que existe un x ∈ Bλ que no permite construir la funcion pxλ. Estosolo puede deberse a que existe un λ′ entre αλ(x) y θλ para el que no existe ely requerido.

Tenemos que γλ(λ′) es un punto de acumulacion de Cλ. Por la definicion deκ(E) tenemos que γλ(λ′) /∈ E y que Cγλ(λ′) = Cλ ∩γλ(λ′) = γλ(α) | α < λ′.

Esto significa que la enumeracion de Cγλ(λ′) es simplemente la restriccion aλ′ de la de Cλ, luego la funcion pxγλ(λ′) es el fragmento de pxλ que puede definirse

Page 309: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.5. Arboles de Kurepa 299

hasta que la construccion falla en λ′, y el problema es que el camino Cxγλ(λ′) no

tiene una extension a Nγλ(λ′), pero eso es imposible, porque como γλ(λ′) /∈ E,la construccion al nivel γλ(λ′) se hace de modo que todos los caminos Cx

γλ(λ′)

se prolongan hasta Nγλ(λ′).

Esto prueba que el arbol B esta bien definido y solo falta probar que todaanticadena maximal A cumple |A| ≤ κ. Pero esto se prueba exactamente igualque en 9.20: existe un λ ∈ E tal que Bλ = λ y A ∩ λ = Aλ es una anticadenamaximal en Bλ. Todo elemento de B de altura ≥ λ tiene bajo sı un elementode Nλ, el cual, por la propiedad e), tiene bajo sı un elemento de Aλ, luego unelemento de A. Por lo tanto, A = Aλ cumple |A| ≤ κ.

Nota El teorema 6.36 nos da una situacion alternativa en la que tambienexisten κ+-arboles de Suslin (luego de Aronszajn): 2<κ = κ ∧ 2κ = κ+ ∧ κ.

9.5 Arboles de Kurepa

Hemos visto que en NBG, “con dificultad”, es posible construir ℵ1-arbolesde Aronszajn, es decir, ℵ1-arboles sin caminos, mientras que no es posible pro-bar que existan κ-arboles sin caminos para cardinales regulares mayores. Sinembargo, sı que es posible construir κ-arboles con caminos. Por ejemplo, elpropio κ es un κ-arbol con un camino, y es facil construir κ-arboles con varioscaminos. Con un poco de esfuerzo podemos probar lo siguiente:

Teorema 9.22 Si κ es un cardinal infinito existen κ-arboles con κ caminos.

Demostracion: Vamos a construir un κ-subarbol de <κ2 con κ caminos.Para ello construiremos recurrentemente subarboles Aα de <α2 de modo quecada uno sea un subarbol de los siguientes (con niveles de cardinal < κ) y una

familia Cβαβ<κ de caminos en Aα de modo que si α ≤ α′ entonces Cβ

α ⊂ Cβα′

y ademas los caminos Cβαβ<α sean distintos dos a dos.

Necesariamente, A0 = ∅ y Cβ0 = ∅ para todo β < κ. Supuesto defi-

nido Aα, de modo que todos sus niveles tengan cardinal < κ, definimos Aα+1

anadiendo a Aα las dos prolongaciones de cada s ∈ Aα que toman sobre α elvalor 0 o 1 respectivamente. Es claro entonces que el nivel α de Aα+1 sigueteniendo cardinal < κ.

Definimos Cβα+1 anadiendo a Cβ

α la prolongacion de su elemento de alturaα que toma sobre α el valor 0, salvo en el caso de Cα

α+1, al que le anadimos laextension que sobre α toma el valor 1. De este modo, Cα

α+1 es distinto de todos

los Cβα+1 con β < α, y estos son distintos entre sı, luego todos los Cβ

α+1β<α+1

resultan ser distintos dos a dos.

Supuestos definidos Aδδ<λ, para λ ≤ κ, con sus caminos correspondientes,

definimos Aλ =⋃

δ<λ

Aδ y Cβλ =

δ<λ

Cβδ , que claramente cumplen lo pedido.

Page 310: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

300 Capıtulo 9. Arboles

Ası, el κ-arbol A = Aκ tiene κ caminos distintos Cβκβ<κ.

Sin embargo, en principio un κ-arbol podrıa tener hasta 2κ caminos. Dehecho, <ω2 es un ℵ0-arbol con 2ℵ0 caminos. Kurepa conjeturo que “aguzandoel ingenio” mas que en la demostracion del teorema anterior tendrıa que poderdemostrarse la existencia de un ℵ1-arbol con ℵ2 caminos:

Definicion 9.23 Si κ es un cardinal infinito, un κ-arbol de Kurepa es un κ-arbolcon al menos κ+ caminos. Un arbol de Kurepa es un ℵ1-arbol de Kurepa.

La hipotesis de Kurepa (HK) afirma la existencia de un arbol de Kurepa. Lahipotesis de Kurepa generalizada (HK(κ)) afirma la existencia de un κ-arbol deKurepa.

Una vez mas, resulta que la hipotesis de Kurepa es indecidible en NBG. Paraanalizar la situacion conviene introducir un concepto relacionado:

Una familia κ-Kurepa es un conjunto F ⊂ Pκ tal que |F| ≥ κ+ y

α < κ |A ∩ α | A ∈ F| < κ.

Teorema 9.24 Si κ es un cardinal regular, existe un κ-arbol de Kurepa si ysolo si existe una familia κ-Kurepa.

Demostracion: Si A es un κ-arbol de Kurepa, como todo κ-arbol tienecardinal κ, podemos suponer que A = κ (con un orden adecuado ≤∗). Seaentonces F ⊂ Pκ el conjunto de todos los caminos de A. Ciertamente |F| ≥ κ+.Si α < κ, como κ es regular, la funcion h : α −→ κ que a cada x ∈ α le asignasu altura en A esta acotada, luego existe un δ < κ tal que todos los elementosde α tienen altura < δ. Ası, si A ∈ F, existe un unico y ∈ Nivδ(A), y entoncesα ∩ A = x ∈ α | x <∗ y. Por lo tanto

|A ∩ α | A ∈ F| ≤ |Nivδ(A)| < κ.

Recıprocamente, si F ⊂ Pκ es una familia κ-Kurepa, para cada α < κ ycada B ∈ F sea χα

B ∈ α2 la funcion caracterıstica de B ∩ α y sea

A =⋃

α<κχα

B | B ∈ F ⊂ <κ2.

Si β < α, entonces χαB|β = χβ

B, luego A es un arbol con el orden dado porla inclusion y

Nivα(A) = χαB | B ∈ F,

luego es un κ-arbol, y cada B ∈ F determina un camino distinto, luego es unκ-arbol de Kurepa.

La existencia de arboles de Kurepa se sigue de un principio combinatorio,pero para demostrarlo necesitamos un resultado previo:

Page 311: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

9.5. Arboles de Kurepa 301

Teorema 9.25 Sea κ un cardinal infinito tal que 2<κ = κ. Entonces existe unafamilia A ⊂ Pκ tal que

z ∈ A |x| = κ,∧

xy ∈ A(x 6= y → |x ∩ y| < κ) y|A| = 2κ.

Demostracion: Sea I el conjunto de todos los subconjuntos acotados de κ.Por hipotesis |I| = κ. Si X ⊂ κ, sea AX = X ∩α | α < κ. Si |X | = κ es claroque |AX | = κ y si X 6= Y entonces |AX ∩ AY | < κ. Por lo tanto, si llamamosA′ = AX | X ⊂ κ ∧ |X | = κ, tenemos que A′ cumple las condiciones delenunciado salvo que A′ ⊂ PI en lugar de A′ ⊂ Pκ, pero basta tomar unabiyeccion f : I −→ κ y definir A = f [A] | A ∈ A

′. La familia A cumple lorequerido.

Teorema 9.26 Si κ es un cardinal infinito y se cumple ♦+κ+ , entonces existe

un κ+-arbol de Kurepa con 2κ+

caminos.

Demostracion: Si C ⊂ κ+ y ξ < κ+, definimos

s(C, ξ) = sup((C ∪ 0) ∩ (ξ + 1)).

(Si C es cerrado, es el mayor elemento de C ∪ 0 menor o igual que ξ.) SiA ⊂ κ+, definimos

X(A,C) = ξ ∈ A | ¬∨

η ∈ A s(C, ξ) ≤ η < ξ.

Ası X(A,C) ⊂ A y que si |A| = κ+ y C es c.n.a. entonces |X(A,C)| = κ+. Enefecto, dado α < κ+, podemos tomar β ∈ C tal que β > α y γ ∈ A tal queγ > β. Ası s(C, γ) ≥ β > α, y entonces el mınimo ξ ∈ A tal que ξ ≥ s(C, γ)cumple s(C, ξ) = s(C, γ) > α y ξ ∈ X(A,C).

Sea Sαα<κ+ una sucesion ♦+κ+ y sea F el conjunto de todos los X(A,C)

tales que

a) A ⊂ κ+, |A| = κ+ y C es c.n.a. en κ+,

b)∧

α ∈ C A ∩ α ∈ Sα,

c)∧

α ∈ C C ∩ α ∈ Sα.

Vamos a probar que F es una familia κ+-Kurepa. Veamos que si β < κ+

entonces |X ∩ β | X ∈ F| ≤ κ, para lo cual basta probar a su vez que si A yC cumplen las tres condiciones anteriores entonces |X(A,C) ∩ β| ≤ 1 o bien

α ≤ β∨

x ⊂ β∨

BD ∈ Sα(X(A,C) ∩ β = X(B,D) ∪ x ∧ |x| ≤ 1).

De este modo, los conjuntos X(A,C) ∩ β estan determinados por los a losumo κ elementos de β y por los a lo sumo κ pares de elementos de

α≤β

Sα,luego como maximo habra κ conjuntos de esta forma.

Page 312: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

302 Capıtulo 9. Arboles

En efecto, tomamos α = s(C, β) ≤ β. Si α > 0 entonces α ∈ C. Tomamosentonces B = A ∩ α y D = C ∩ α y llamamos ξ al mınimo elemento de A \ α.Ası

X(A,C) ∩ β =

X(B,D) si ξ ≥ β,X(B,D) ∪ ξ si ξ < β.

En efecto, si ξ′ ∈ X(B,D), entonces ξ′ ∈ A ∩ α, luego s(D, ξ′) = s(C, ξ′) y esclaro que ξ′ ∈ X(A,C). Si ξ < β entonces s(C, ξ) = α, luego ξ ∈ X(A,C) ∩ β.

Recıprocamente, si ξ′ ∈ X(A,C) ∩ β y ξ′ 6= ξ (caso que solo podrıa darsesi ξ < β) entonces entonces ξ′ ∈ A ∩ β. Ademas tiene que ser ξ′ < ξ, puessi fuera ξ < ξ′, serıa s(C, ξ′) = α ≤ ξ < β, con ξ ∈ A, lo que equivale a queξ′ /∈ X(A,C). Esto implica a su vez que ξ′ ∈ A ∩ α = B, por la eleccion de ξ.Es claro entonces que s(C, ξ′) = s(D, ξ′), de donde a su vez ξ′ ∈ X(B,D).

Si α = 0 se cumple que |X(A,C)∩β| ≤ 1, pues si existe un ξ′ ∈ X(A,C)∩β,entonces s(C, ξ′) = 0 y necesariamente ξ = mın(A ∩ β).

Ahora basta probar que |F| = 2κ+

, pues en particular F sera una familiaκ+-Kurepa y la prueba del teorema 9.24 muestra que existe un κ+-arbol deKurepa con 2κ

+

caminos.

Recordemos que ♦+κ+ → ♦κ+ → 2κ = κ+. Por lo tanto 2<κ+

= 2κ = κ+, y

el teorema anterior nos da una familia A ⊂ Pκ+ formada por 2κ+

subconjuntosde κ+ de cardinal κ+, pero cuyas intersecciones tienen cardinal ≤ κ.

Para cada A ∈ A, por la propiedad de las sucesiones ♦+κ+ , existe un C c.n.a.

en κ+ tal que X(A,C) ∈ F, pero si A 6= A′, entonces X(A,C) 6= X(A′, C′),puesto que X(A,C)∩X(A′, C′) ⊂ A∩A′, luego el cardinal de la interseccion es

≤ κ, y si ambos conjuntos fueran el mismo serıa κ+. Ası pues, |F| = 2κ+

.

Por lo tanto, no es posible demostrar en NBG que no existan κ+-arboles deKurepa (pero lo cierto es que tampoco puede probarse que existan).

Page 313: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo X

Algebras de Boole

Introducimos ahora una estructura algebraica que proporciona un contextogeneral para tratar problemas de naturaleza muy diversa, tanto de teorıa deconjuntos propiamente dicha, como de logica, como de topologıa, de analisismatematico o de estadıstica. Trabajamos en NBG sin el axioma de eleccion.

10.1 Conceptos basicos

El ejemplo tıpico de algebra de Boole es PX , donde X es un conjunto arbitra-rio. En PX estan definidas las operaciones de union, interseccion y complementorespecto de X . Si axiomatizamos las propiedades basicas de estas operacionesllegamos a la nocion general de algebra de Boole:

Definicion 10.1 Un algebra de Boole es una cuadrupla (B,∧,∨,′ ), donde B esun conjunto no vacıo, ∧ : B × B −→ B, ∨ : B × B −→ B y ′ : B −→ B de modoque se cumplen las propiedades siguientes:

1) p′′ = p, 5) p ∨ (q ∧ r) = (p ∨ q) ∧ (p ∨ r),2) p ∧ q = q ∧ p, 6) p ∨ (p ∧ q) = p,3) (p ∧ q) ∧ r = p ∧ (q ∧ r), 7) (p ∧ q)′ = p′ ∨ q′,4) p ∧ p = p, 8) p ∨ p′ = q ∨ q′.

A partir de las propiedades 1) y 7) se demuestra que en realidad un algebrade Boole cumple tambien las propiedades que resultan de intercambiar ∧ por ∨en los axiomas anteriores. En total, en un algebra de Boole se cumple:

1) p′′ = p,2) p ∧ q = q ∧ p, p ∨ q = q ∨ p,3) (p ∧ q) ∧ r = p ∧ (q ∧ r), (p ∨ q) ∨ r = p ∨ (q ∨ r),4) p ∧ p = p, p ∨ p = p,5) p ∨ (q ∧ r) = (p ∨ q) ∧ (p ∨ r), p ∧ (q ∨ r) = (p ∧ q) ∨ (p ∧ r),6) p ∨ (p ∧ q) = p, p ∧ (p ∨ q) = p,7) (p ∧ q)′ = p′ ∨ q′, (p ∨ q)′ = p′ ∧ q′,8) p ∨ p′ = q ∨ q′, p ∧ p′ = q ∧ q′.

303

Page 314: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

304 Capıtulo 10. Algebras de Boole

Por ejemplo,

p ∨ q = p′′ ∨ q′′ = (p′ ∧ q′)′ = (q′ ∧ p′)′ = q′′ ∨ p′′ = q ∨ p.

Igualmente se razonan las demas.

Si B es un algebra de Boole, la propiedad 8) establece que existen unos unicoselementos O, 1l ∈ B tales que para todo p ∈ B se cumple p ∧ p′ = O, p ∨ p′ = 1l.Las propiedades siguientes se demuestran sin dificultad:

O′ = 1l, 1l′ = O,p ∧ p′ = O, p ∨ p′ = 1l,p ∨ O = p, p ∧ 1l = p,p ∨ 1l = 1l, p ∧ O = O.

Por ejemplo, p ∨ O = p ∨ (p ∧ p′) = p, por la propiedad 6). Igualmente,p ∨ 1l = p ∨ (p ∨ p′) = (p ∨ p) ∨ p′ = p ∨ p′ = 1l.

Definimos ademas las operaciones

p→ q = p′ ∨ q, p↔ q = (p→ q) ∧ (q → p).

Teorema 10.2 Sea B un algebra de Boole. Entonces la relacion en B dada por

p ≤ q syss p ∧ q = p syss p ∨ q = q

es una relacion de orden parcial (y en lo sucesivo consideraremos a toda algebrade Boole como conjunto parcialmente ordenado con esta relacion). Ademas secumplen los hechos siguientes:

a) p ∧ q es el ınfimo del conjunto p, q,

b) p ∨ q es el supremo del conjunto p, q,

c) p ≤ q syss q′ ≤ p′.

d) O y 1l son el mınimo y el maximo de B respectivamente.

e) p ≤ q syss p→ q = 1l, y (p↔ q) = 1l syss p = q.

f) p = q′ syss p ∧ q = O y p ∨ q = 1l.

Demostracion: Si p ∧ q = p, entonces p ∨ q = (p ∧ q) ∨ q = q, por lapropiedad 6). Igualmente se tiene la otra implicacion.

La relacion ≤ es reflexiva por la propiedad 4. La antisimetrıa es trivial. Encuanto a la transitividad, si p ≤ q y q ≤ r entonces

p ∧ r = (p ∧ q) ∧ r = p ∧ (q ∧ r) = p ∧ q = p,

luego p ≤ r.

Page 315: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.1. Conceptos basicos 305

a) Se cumple que p ∧ q ∧ p = p ∧ p ∧ q = p ∧ q, luego p ∧ q ≤ p. Igualmentep ∧ q ≤ q. Por otra parte, si r ≤ p y r ≤ q entonces p ∧ q ∧ r = p ∧ r = r,luego r ≤ p ∧ q. Esto prueba que p ∧ q es el ınfimo de p, q.

b) es analogo a a).

c) Si p ≤ q entonces p ∧ q = p, luego p′ ∨ q′ = p′, luego q′ ≤ p′.

d) es trivial.

e) Si p ≤ q entonces (p→ q) = p′ ∨ q = p′ ∨ p ∨ q = 1l ∨ q = 1l.

Si (p→ q) = 1l, entonces p′ ∨ q = 1l, luego

p = p ∧ 1l = p ∧ (p′ ∨ q) = (p ∧ p′) ∨ (p ∧ q) = O ∨ (p ∧ q) = p ∧ q.

Ası pues, p ≤ q.

Por ultimo, (p ↔ q) = 1l syss (p → q) = (q → p) = 1l, syss p ≤ q ∧ q ≤ p,syss p = q.

f) Tenemos que

q = 1l ∧ q = (p ∨ p′) ∧ q = (p ∧ q) ∨ (p′ ∧ q) = O ∨ (p′ ∧ q)

= (p′ ∧ p) ∨ (p′ ∧ q) = p′ ∧ (p ∨ q) = p′ ∧ 1l = p′.

Definicion 10.3 Diremos que un algebra de Boole B es degenerada si O = 1l.

Teniendo en cuenta que O y 1l son el mınimo y el maximo de B es claro queB es degenerada si y solo si B = O = 1l.

Vamos a trabajar unicamente con algebras no degeneradas, es decir, en losucesivo entenderemos que “algebra de Boole” significa “algebra de Boole nodegenerada”.

Si B es un algebra de Boole, diremos que un conjunto C ⊂ B es una subalgebrade B si C 6= ∅ y para todo p, q ∈ C se cumple que p ∧ q, p ∨ q, p′ ∈ C. EntoncesC es un algebra con las restricciones de las operaciones de B. Es claro que O y 1lson los mismos en B y en C y que la relacion de orden ≤ en C es la restriccionde la de B.

Obviamente B es una subalgebra de B, las subalgebras de B distintas de lapropia B se llaman subalgebras propias. Ası mismo, O, 1l es una subalgebrade B, a la que llamaremos subalgebra trivial. Un algebra B es trivial si coincidecon su subalgebra trivial, es decir, si B = O, 1l.

Se comprueba inmediatamente que la interseccion de una familia de subalge-bras de un algebra dada B es de nuevo una subalgebra. Por consiguiente, siX ⊂ B, podemos definir la subalgebra generada por X en B como la interseccionde todas las subalgebras de B que contienen a X . La representaremos por 〈X〉.Es claro que si X ⊂ C ⊂ B, donde C es una subalgebra de B, entonces lasubalgebra generada por X en C coincide con la subalgebra generada por Xen B. Si B = 〈X〉 diremos que X es un generador de B.

Page 316: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

306 Capıtulo 10. Algebras de Boole

Ejemplo: Algebras de conjuntos Como ya hemos senalado, si X es unconjunto arbitrario, entonces B = PX es un algebra de Boole tomando comooperaciones:

x ∧ y = x ∩ y, x ∨ y = x ∪ y, x′ = X \ x.

Es una simple rutina comprobar que se cumplen todas las propiedades que exigela definicion de algebra de Boole. Ademas, es claro entonces que

O = ∅, 1l = X, x ≤ y syss x ⊂ y.

En particular vemos que un algebra PX es degenerada si y solo si X = ∅,mientras que PX es trivial si y solo si |X | = 1.

Llamaremos algebras de conjuntos a las subalgebras de un algebra PX . Equi-valentemente, un conjunto B es un algebra de conjuntos sobre un conjunto X siB ⊂ PX y para todo x, y ∈ B se cumple que x ∪ y, x ∩ y, X \ x ∈ B.

De este modo, si B es un algebra de conjuntos sobre X , sus operaciones sonla union, la interseccion y el complemento respecto de X , su relacion de ordenes la inclusion y ademas O = ∅, 1l = X .

Por ejemplo, si X es un espacio topologico, el conjunto B de los subconjuntosde X que son a la vez abiertos y cerrados es un algebra de conjuntos1 sobre X .

Ejemplo Si B es un algebra de Boole y a ∈ B es un elemento no nulo, definimos

Ba = b ∈ B | b ≤ a.

Una comprobacion rutinaria muestra que Ba se convierte en un algebra de Boolecon las mismas operaciones ∧ y ∨ de B y el complemento dado por b′ = a ∧ b′

(donde el b′ de la derecha es la operacion de B). Se cumple ademas que O es elmismo de B y 1l = a. Notemos que Ba no es una subalgebra de B (salvo en elcaso trivial en que a = 1l).

Definicion 10.4 Diremos que una aplicacion h : B −→ C entre algebras deBoole es un homomorfismo de algebras si para todo p, q ∈ B se cumple

h(p′) = h(p)′, h(p ∧ q) = h(p) ∧ h(q), h(p ∨ q) = h(p) ∨ h(q).

Es claro que si se da la primera condicion las otras dos son equivalentes,por lo que es suficiente comprobar una de las dos. Tambien es claro que unhomomorfismo de algebras cumple h(O) = O, h(1l) = 1l y si p ≤ q entoncesh(p) ≤ h(q). Ademas h[B] es una subalgebra de C.

1Los espacios topologicos cuya algebra de abiertos cerrados es trivial, es decir, los que notienen mas abiertos cerrados que ∅ y X, se llaman espacios conexos. Por ejemplo, puedeprobarse que los conjuntos totalmente ordenados conexos con la topologıa de orden son pre-cisamente los continuos. En particular R es conexo.

Page 317: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.1. Conceptos basicos 307

Un monomorfismo, epimorfismo, isomorfismo de algebras es un homomor-fismo inyectivo, suprayectivo o biyectivo, respectivamente. Un automorfismo dealgebras es un isomorfismo de un algebra en sı misma.

La composicion de homomorfismos es un homomorfismo, la inversa de unisomorfismo es un isomorfismo. Todo isomorfismo de algebras es una semejanzade conjuntos parcialmente ordenados y el recıproco tambien es cierto, pues lassemejanzas conservan supremos e ınfimos y si p es un elemento de un algebra, p′

esta caracterizado como el unico elemento q que cumple p ∧ q = O, p ∨ q = 1l.

Terminamos esta seccion con el teorema siguiente:

Teorema 10.5 Toda algebra de Boole finitamente generada es finita.

Demostracion: Sea B un algebra de Boole y sea cii<n una familia finitade elementos de B. Para cada b ∈ B llamamos p(b, 0) = b′ y p(b, 1) = b. Paracada f ∈ n2 llamaremos

af =∧

i∈np(ci, f(i)) ∈ B.

Sea X = f ∈ n2 | af 6= O y para cada x ⊂ X sea bx =∨

f∈xaf . Por ultimo,

llamemos C = bx | x ∈ PX ⊂ B.

Observemos en primer lugar que si f 6= g entonces af ∧ ag = O, pues existeun i tal que f(i) 6= g(i), luego af ∧ ag ≤ xi ∧ x′i = O.

Veamos ahora que bX = 1l. En efecto:

1l =∧

i<n(ci ∨ c′i) =

f∈n2

i<np(ci, f(i)) =

f∈n2af =

f∈Xaf = bX .

Por otra parte, es trivial que b∅ = O, ası como que bx∪y = bx ∨ by. Veamosahora que bx∩y = bx ∧ by. En efecto:

bx ∧ by =∨

f∈xaf ∧

f∈yaf =

(f,g)∈x×y(af ∧ ag).

Como af ∧ ag = O salvo si f = g, esto implica que

bx ∧ by =∨

f∈x∩yaf = bx∩y.

Por ultimo, si llamamos x′ = X \ x, tenemos que bx′ = b′x. En efecto,

bx′ ∧ bx = bx′∩x = O, bx′ ∨ bx = bx′∪x = 1l.

Con esto hemos probado que C es una subalgebra de B y que la aplicacionh : PX −→ C dada por h(x) = bx es un epimorfismo de algebras. De hecho esun isomorfismo, pues si h(x) = h(y) entonces bx∩y′ = bx ∧ b′y = bx ∧ b′x = O,luego x ∩ y′ = ∅ (porque si f ∈ x ∩ y′ entonces O < af ≤ bx∩y′), luego x ⊂ y, eigualmente y ⊂ x.

Page 318: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

308 Capıtulo 10. Algebras de Boole

Para cada i < n, sea xi = f ∈ X | f(i) = 1. Veamos que bxi= ci. En

efecto, si f ∈ xi tenemos que af ≤ ci, luego bxi≤ ci.

Por otra parte, si f ∈ x′i, entonces af ∧ ci = O, luego bc′i ∧ ci = O, es decir,b′xi

∧ ci = O, luego 1l = c′i ∨ bci = ci → bxi, luego ci ≤ bxi

, luego ci = bxi∈ C.

Concluimos que C es el algebra generada por el conjunto xi | i < n, luegoes un algebra finita isomorfa a PX , donde X es un conjunto tal que |X | ≤ 2n.

10.2 Algebras completas

Definicion 10.6 Sea B un algebra de Boole y X ⊂ B. Representaremos por∨

X y∧

X al supremo y al ınfimo deX en B (supuesto que existan). Ciertamenteexisten si X es finito. En particular

∅ = O,∧

∅ = 1l.

Tambien usaremos la notacion∨

i∈Ipi =

pi | i ∈ I,∧

i∈Ipi =

pi | i ∈ I.

Existe una relacion sencilla entre los supremos e ınfimos:

Teorema 10.7 Si B es un algebra de Boole y pii∈I es una familia de elemen-tos de B, entonces

( ∨

i∈Ipi)′

=∧

i∈Ip′i,

(∧

i∈Ipi)′

=∨

i∈Ip′i,

entendiendo que un miembro existe si y solo si existe el otro.

Demostracion: Supongamos que existe∧

i∈Ip′i. Entonces, para cada i ∈ I,

tenemos que∧

i∈Ip′i ≤ p′i, luego pi ≤

( ∧

i∈Ip′i)′

, de modo que el miembro derecho

es una cota superior del conjunto pi | i ∈ I. Si r es cualquier cota superior,

entonces r′ ≤ p′i, luego r′ ≤∧

i∈Ip′i, luego

( ∧

i∈Ip′i)′ ≤ r. Esto prueba que existe

i∈Ipi =

( ∧

i∈Ip′i)′

, luego en definitiva( ∨

i∈Ipi)′

=∧

i∈Ip′i.

Si suponemos que existe el miembro izquierdo se razona analogamente queexiste el miembro derecho. La segunda igualdad se obtiene de la primera apli-cada a la familia p′ii∈I .

Equivalentemente, si definimos el conjunto dual de un conjunto X ⊂ B como

X ′ = p′ | p ∈ X,

el teorema anterior se expresa mediante las igualdades∨

X ′ = (∧

X)′,∧

X ′ = (∨

X)′,

en las que hay que entender que un miembro existe si y solo si existe el otro.

Page 319: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 309

Definicion 10.8 Un algebra de Boole B es completa si todo conjunto X ⊂ Btiene supremo o, equivalentemente por las relaciones anteriores, si todo X ⊂ Btiene ınfimo.

Por ejemplo, si A es un conjunto arbitrario, es claro que PA es un algebracompleta, en la que, para todo X ∈ PA, se cumple

X =⋃X ,

X =⋂X

(con el convenio de que⋂∅ = A).

Los supremos e ınfimos satisfacen la siguiente propiedad distributiva:

Teorema 10.9 Si p0ii∈I , p1jj∈J son dos familias de elementos de un al-gebra de Boole B, entonces

i∈Ip0i ∧

j∈Jp1j =

(i,j)∈I×J(p0i ∧ p1j),

entendiendo que el miembro derecho existe si existen los dos supremos del miem-bro izquierdo.

Demostracion: Vamos a usar varias veces la equivalencia siguiente:

p ∧ q ≤ r ↔ q ≤ r ∨ p′.

En efecto, si p ∧ q ≤ r, entonces

q = q ∧ (p ∨ p′) = (q ∧ p) ∨ (q ∧ p′) ≤ r ∨ p′.

Recıprocamente, si q ≤ r ∨ p′, entonces

p ∧ q ≤ p ∧ (r ∨ p′) = (p ∧ r) ∨ (p ∧ p′) = p ∧ r.

Como

p0i ∧ p1j ≤ p0i ≤∨

i∈Ip0i p0i ∧ p1j ≤ p1j ≤

j∈Jp1j,

vemos que p0i ∧ p1j ≤∨

i∈Ip0i ∧

j∈Jp1j , luego el miembro derecho es una cota

superior del conjunto p0i ∧ p1j | (i, j) ∈ I ×J. Para probar que es la mınima,tomamos una cota r arbitraria. Como p0i ∧ p1j ≤ r, tenemos que p0i ≤ r ∨ p′1jpara todo i, luego

i∈Ip0i ≤ r ∨ p′1j , luego

i∈Ip0i ∧ p1j ≤ r. Similarmente,

p1j ≤ r ∨( ∨

i∈Ip0i

)′, de donde

j∈Jp1j ≤ r ∨

( ∨

i∈Ip0i

)′, y de aquı concluimos que

i∈Ip0i ∧

j∈Jp1j ≤ r.

Esto prueba que el miembro izquierdo es el supremo que en el enunciado apareceen el miembro derecho.

Page 320: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

310 Capıtulo 10. Algebras de Boole

Tomando complementos en la igualdad del teorema anterior aplicada a lasfamilias de los complementos de las sucesiones dadas se obtiene inmediatamentela relacion

i∈Ip0i ∨

j∈Jp1j =

(i,j)∈I×J(p0i ∨ p1j).

En particular, si reducimos la primera familia a un unico elemento, quedan lasrelaciones

p ∧∨

i∈Ipi =

i∈I(p ∧ pi), p ∨

i∈Ipi =

i∈I(p ∨ pi).

Probamos ahora un resultado elemental que es util a menudo:

Teorema 10.10 Si B es un algebra de Boole completa y pαα<γ es una familiade elementos de B (donde γ es un ordinal), existe otra familia qαα<γ tal que∧

α < γ qα ≤ pα,∧

αβ < γ(α 6= β → qα ∧ qβ = O) y∨

α<γqα =

α<γpα.

Demostracion: Basta tomar qα = pα ∧∧

β<αp′β . Obviamente qα ≤ pα y si

α 6= β, digamos β < α, entonces qα ∧ qβ ≤ p′β ∧ pβ = O. Veamos por induccion

sobre α ≤ γ que∨

β<αpα =

β<αqβ . Para α = γ es la tercera propiedad que

tenıamos que probar.Para α = 0 es trivial. Si vale para α, entonces

β<α+1qβ =

β<αqβ ∨ qα =

β<αpβ ∨ (pα ∧

β<αp′β) =

β<α+1pβ .

Si vale para todo α < λ ≤ β, sabemos que∨

β<λqβ ≤

β<λpβ, y, para cada α < λ

pα ≤∨

β<α+1pβ =

β<α+1qβ ≤

β<λqβ ,

luego∨

β<λpβ =

β<λqβ .

Definicion 10.11 Un homomorfismo h : B −→ C entre algebras de Boolecompletas es completo si para todo X ⊂ B se cumple

h( ∨

q∈Xq)

=∨

q∈Xh(q)

(o la igualdad analoga con ınfimos, que es equivalente).

Si B es un algebra de Boole completa y C es una subalgebra de B, diremosque C es una subalgebra completa si para todo X ⊂ C se cumple que

X ∈ C(o, equivalentemente,

X ∈ C).

En tal caso C es completa con la estructura de subalgebra y si X ⊂ C, elsupremo de X en C es el mismo que el supremo en B.

Page 321: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 311

Equivalentemente, C es una subalgebra completa de B si es completa comoalgebra y la inclusion i : C −→ B es un monomorfismo completo.

Es importante tener presente que una subalgebra C de un algebra completaB puede ser completa como algebra pero no ser una subalgebra completa. Estosucede si el supremo en C de un subconjunto X ⊂ C no coincide con el supremoen B. (Vease la nota tras el teorema 10.49).

Si B es un algebra de Boole completa, es inmediato comprobar que la inter-seccion de una familia de subalgebras completas de B es de nuevo una subalgebracompleta. Por consiguiente, si X ⊂ B, podemos definir la subalgebra completagenerada por X como la interseccion de todas las subalgebras completas de Bque contienen a X . La representaremos por 〈X〉c. Si B = 〈X〉c diremos que Besta completamente generada por X o que X es un generador completo de B.

Presentamos ahora una familia muy importante de algebras completas:

Definicion 10.12 Sea X un espacio topologico. Diremos que A ⊂ X es unabierto regular si A = int clA. Definimos A⊥ = X \ clA.

Por ejemplo, ]0, 1[ es un abierto regular en R, mientras que ]0, 1[ ∪ ]1, 2[ nolo es.

En general, es claro que si A ⊂ B ⊂ X entonces B⊥ ⊂ A⊥ y A⊥⊥ ⊂ B⊥⊥.

Observemos que A⊥⊥ = X \ clA⊥ = int(X \ A⊥) = int clA. Ası pues, A esun abierto regular si y solo si A = A⊥⊥.

Teorema 10.13 Sean U y V subconjuntos de un espacio topologico X y supon-gamos que U es abierto. Entonces:

a) U⊥⊥⊥ = U⊥,

b) V ⊥⊥⊥⊥ = V ⊥⊥,

c) (U ∩ V )⊥⊥ = U⊥⊥ ∩ V ⊥⊥.

Demostracion: a) Como U ⊂ clU y U es abierto, de hecho

U ⊂ int clU = U⊥⊥,

de donde U⊥⊥⊥ ⊂ U⊥. Como U⊥ ⊂ clU⊥ y U⊥ es abierto, de hecho

U⊥ ⊂ int clU⊥ = U⊥⊥⊥.

Por consiguiente tenemos la igualdad.

b) Es consecuencia de a) aplicado al abierto U = V ⊥.

c) Como U ∩ V ⊂ U y U ∩ V ⊂ V , se cumple (U ∩ V )⊥⊥ ⊂ U⊥⊥ ∩ V ⊥⊥.

Para tener la otra inclusion basta ver que U⊥⊥ ∩ V ⊥⊥ ⊂ cl (U ∩ V ), puescomo el conjunto de la izquierda es abierto, de hecho esta contenido en el interiordel de la derecha, es decir, en (U ∩ V )⊥⊥.

Page 322: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

312 Capıtulo 10. Algebras de Boole

Sea, pues x ∈ U⊥⊥ ∩ V ⊥⊥ y veamos que todo abierto G tal que x ∈ G cortaa U ∩ V . Tenemos que x ∈ G ∩ U⊥⊥ ∩ V ⊥⊥, y este conjunto es abierto. Comox ∈ U⊥⊥ = int clU ⊂ clU , ha de ser G ∩ U⊥⊥ ∩ V ⊥⊥ ∩ U 6= ∅. Sea, pues,t ∈ G ∩ U⊥⊥ ∩ V ⊥⊥ ∩ U ⊂ V ⊥⊥ = int clV ⊂ clV . Como G ∩ U es un abiertoque contiene a t, ha de ser G ∩ U ∩ V 6= ∅, como tenıamos que probar.

Teorema 10.14 Si X es un espacio topologico, el conjunto R(X) de los abier-tos regulares de X es un algebra de Boole completa con las operaciones dadaspor

p ∧ q = p ∩ q, p ∨ q = (p ∪ q)⊥⊥, p′ = p⊥.

Ademas O = ∅, 1l = X, la relacion de orden es la inclusion y para todo conjuntoA ⊂ R(X) se cumple

A =(⋃

p∈A

p)⊥⊥

,∧

A =(⋂

p∈A

p)⊥⊥

.

Demostracion: Notemos que del teorema anterior apartado c) se sigueque si p, q ∈ R(X) entonces p∩q ∈ R(X), lo cual justifica la definicion de p ∧ q.Del apartado b) se sigue que si p ⊂ X entonces p⊥⊥ ∈ R(X), lo que justifica ladefinicion de p ∨ q. La definicion de p′ es correcta por el apartado a).

Comprobamos las propiedades no obvias de la definicion de algebra:

1) p′′ = p⊥⊥ = p porque p es regular.

5) p ∨ (q ∧ r) = (p ∪ (q ∩ r))⊥⊥ = ((p ∪ q) ∩ (p ∪ r))⊥⊥

= (p ∪ q)⊥⊥ ∩ (p ∪ r)⊥⊥ = (p ∨ q) ∧ (p ∨ r).

6) p ∨ (p ∧ q) = (p ∪ (p ∩ q))⊥⊥ = p⊥⊥ = p.

7) p′ ∨ q′ = (p⊥ ∪ q⊥)⊥⊥ = (X \ cl (p⊥ ∪ q⊥))⊥ = (X \ (cl p⊥ ∪ cl q⊥))⊥

= ((X \ cl p⊥) ∩ (X \ cl q⊥))⊥ = (p⊥⊥ ∩ q⊥⊥)⊥ = (p ∩ q)⊥ = (p ∧ q)′.

8) p ∨ p′ = p′′ ∨ p′ = (p′ ∧ p)′ = ((X \ cl p) ∩ p)⊥ = ∅⊥ = X , para todo p.

Ası pues R(X) es un algebra de Boole. Teniendo en cuenta que ∧ es lainterseccion, es claro que la relacion de orden es la inclusion. Tambien es claroque O = ∅ y 1l = X .

Si A ⊂ R(X), sea s =( ⋃

p∈A

p)⊥⊥ ∈ R(X). Como la union es un abierto,

se cumple que⋃

p∈A

p ⊂ int cl⋃

p∈A

p = s, luego s es una cota superior de A. Si

r ∈ R(X) es una cota superior de A, entonces⋃

p∈A

p ⊂ r, luego s ⊂ r⊥⊥ = r, es

decir, s ≤ r. Esto prueba que s es el supremo de A. Igualmente se razona conel ınfimo.

Notemos que, aunque los elementos de R(X) son subconjuntos de X , no esen general un algebra de conjuntos sobre X , pues la operacion ∨ no es la union.

Page 323: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 313

Complecion de un algebra de Boole Toda algebra de Boole se puedesumergir en un algebra de Boole completa, que es unica salvo isomorfismo siexigimos que la inmersion sea “densa” en un sentido que hemos de especificar.Vamos a demostrar una generalizacion de este hecho.

Definicion 10.15 Un preorden en un conjunto P es una relacion reflexiva ytransitiva. Un conjunto preordenado (c.p.o.) es un par (P,≤), donde P es unconjunto no vacıo y ≤ es un preorden en P.

En particular, todo conjunto parcialmente ordenado es un conjunto preor-denado y, mas en particular, toda algebra de Boole es un c.p.o. Sin embargo,en lo sucesivo, cuando apliquemos a un algebra de Boole B los conceptos quevamos a definir para c.p.o.s, los aplicaremos a B \ O. Por ejemplo:

Si P es un c.p.o., diremos que dos elementos p, q ∈ P son incompatibles si

p ⊥ q ≡ ¬∨

r ∈ P (r ≤ p ∧ r ≤ q).

Entonces, si B es un algebra de Boole, diremos que p, q ∈ B \ O sonincompatibles si no existe r ∈ B \ O tal que r ≤ p ∧ r ≤ q. Puesto quer = p ∧ q siempre cumple r ≤ p ∧ r ≤ q, concluimos que, en un algebra deBoole, dos elementos p y q (no nulos) son incompatibles si y solo si2 p ∧ q = O.

Para conectar la teorıa general sobre c.p.o.s con el caso de las algebras deBoole conviene introducir el concepto siguiente:

Un c.p.o. P es separativo si∧

pq ∈ P (p 6≤ q →∨

r ∈ P (r ≤ p ∧ r ⊥ q)).

Sucede que toda algebra de Boole B es separativa, luego esta hipotesis sobreun c.p.o. no supone ninguna restriccion a la hora de aplicar los resultados alcaso de algebras de Boole.

En efecto, cuando decimos que B es separativa queremos decir en realidadque lo es B \ O y, ciertamente, si p, q ∈ B \ O y p 6≤ q, tomamos r = p ∧ q′

y comprobamos que r 6= O pues si p ∧ q′ = O entonces p → q = p′ ∨ q = 1l,luego p ≤ q. Ası, existe un r ∈ B \ O que claramente cumple r ≤ p ∧ r ⊥ q.

Si P es un c.p.o. y D ⊂ P, diremos que D es denso en P si∧

p ∈ P∨

d ∈ D d ≤ p.

Una aplicacion i : P −→ Q entre dos c.p.o.s es una inmersion si cumple:

a)∧

p1p2 ∈ P (p1 ≤ p2 → i(p1) ≤ i(p2)),

b)∧

p1p2 ∈ P (p1 ⊥ p2 → i(p1) ⊥ i(p2)).

Diremos que i es una inmersion completa si ademas cumple

c)∧

q ∈ Q∨

p ∈ P∧

p∗ ∈ P(p∗ ≤ p→ ¬i(p∗) ⊥ q),

y en estas circunstancias diremos que p es una reduccion de q a P.

2Obviamente, si p = O ∨ q = O se cumple tambien que p ∧ q = O. En tal caso diremostambien que p y q son incompatibles, es decir, extendemos ası a B la relacion de incompatibi-lidad, que en principio se aplica a B \ O.

Page 324: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

314 Capıtulo 10. Algebras de Boole

Una inmersion i : P −→ Q es densa si i[P] es denso en Q.

Es inmediato comprobar que la composicion de inmersiones (resp. inmersio-nes completas, resp. densas) es tambien una inmersion (resp. completa, densa).

Vamos a ver como se particularizan estos conceptos al caso de algebras deBoole. Para empezar observamos lo siguiente:

Teorema 10.16 Si i : P −→ Q es una inmersion entre conjuntos parcialmenteordenados separativos, entonces i es inyectiva y cumple

p1p2 ∈ P (p1 ≤ p2 ↔ i(p1) ≤ i(p2)).

Demostracion: Sean p1, p2 ∈ P tales que i(p1) ≤ i(p2). Hemos de probarque p1 ≤ p2. En caso contrario, como P es separativo existirıa r ≤ p1 tal quer ⊥ p2. Entonces i(r) ≤ i(p1) ∧ i(r) ⊥ i(p2), contradiccion. Teniendo en cuentaque, por hipotesis, la relacion en P es antisimetrica (no es solo un preorden), deaquı se sigue que i es inyectiva.

Ası pues, bajo las hipotesis del teorema (que se cumplen para algebras deBoole) tenemos que i : P −→ i[P] es una semejanza, con lo que podemos identi-ficar a P con un subconjunto de Q.

La definicion de inmersion completa es algo tecnica, pero captura exclu-sivamente en terminos de la relacion de orden el concepto de monomorfismocompleto entre algebras de Boole completas:

Teorema 10.17 Sean B y C dos algebras de Boole completas. Entonces, unaaplicacion h : B −→ C es un monomorfismo completo (en el sentido de conservarsupremos) si y solo si h(O) = O y su restriccion a B \ O es una inmersioncompleta B \ O −→ C \ O en el sentido de c.p.o.s.

Demostracion: Si h es un monomorfismo completo, claramente es unainmersion y si q ∈ C \ O entonces p =

r ∈ B | q ≤ h(r) es una reduccionde q a B. En efecto, h(p) =

h(r) | r ∈ B ∧ q ≤ h(r) ≥ q > O, luego p > O.Si t ≤ p es no nulo pero h(t) ∧ q = O, entonces q ≤ h(t′), luego p ≤ t′ (pordefinicion de p), y ası t ≤ p ∧ p′ = O, contradiccion.

Supongamos ahora que h es una inmersion completa en el sentido de c.p.o.s.Como B es un c.p.o. separativo, el teorema anterior nos da que h es inyectiva ypara todo p, q ∈ B \ O

p ≤ q ↔ h(p) ≤ h(q), p ∧ q = O ↔ h(p) ∧ h(q) = O.

Notemos ademas que h(1l) = 1l. En efecto, en caso contrario h(1l)′ 6= O,luego podemos tomar una reduccion p de h(1l)′ a B. Como p ≤ p, tenemos que¬h(p) ⊥ h(1l)′, luego r = h(p) ∧ h(1l)′ 6= O, pero p ≤ 1l, luego h(p) ≤ h(1l), yası tenemos que r ≤ h(1l)′ ∧ r ≤ h(p) ≤ h(1l), luego r ≤ h(1l)′ ∧ h(1l)′ = O,contradiccion.

Page 325: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 315

Sea p ∈ B \ O y veamos que h(p′) = h(p)′. Como p ∧ p′ = O, sabemosque h(p) ∧ h(p′) = O, luego h(p′) ≤ h(p)′. Si no se da la igualdad, tendra queser q = h(p)′ ∧ h(p′)′ 6= O. Sea r una reduccion de q a B. Necesariamenter ∧ p 6= O o r ∧ p′ 6= O. Veamos que ambos casos llevan a contradiccion.

Si r ∧ p 6= O, entonces h(r ∧ p) ≤ h(p), luego h(r ∧ p) ∧ q = O, en contrade que r sea una reduccion de q.

Si r ∧ p′ 6= O entonces h(r ∧ p′) ≤ h(p′) y tambien h(r ∧ p′) ∧ q = O.

Ası pues, h conserva complementos. Si probamos que h conserva ınfimosde conjuntos arbitrarios tendremos en particular que conserva ınfimos de pares,luego h sera un monomorfismo completo. Sea, pues, X ⊂ B. Para cada p ∈ Xtenemos que

p∈Xp ≤ p, luego h

( ∧

p∈Xp)

≤ h(p), luego h( ∧

p∈Xp)

≤∧

p∈Xh(p).

Si se diera la desigualdad estricta existirıa un s ∈ C \ O tal que

s ≤∧

p∈Xh(p) y s ∧ h

( ∧

p∈Xp)

= O.

Sea t una reduccion de s a B. Si p ∈ X ha de ser t ≤ p, pues en caso contrariot ∧ p′ 6= O y h(t ∧ p′) ∧ s ≤ h(p′) ∧ h(p) = h(p)′ ∧ h(p) = O, en contradiccioncon que t es una reduccion de s. Ası pues, t ≤

p∈Xp, pero entonces

s ∧ h(t) ≤ s ∧ h( ∧

p∈Xp)

= O,

lo que de nuevo contradice que t sea una reduccion de s.

Necesitaremos el resultado siguiente:

Teorema 10.18 Si i : P −→ Q es una inmersion completa de c.p.o.s y Q esseparativo, entonces i[P] tambien lo es.

Demostracion: Supongamos que i(p1) 6≤ i(p2). Entonces existe un r ∈ Qtal que r ≤ i(p1) y r ⊥ i(p2). Sea s una reduccion de r a P. Entonces ¬i(s) ⊥ r,luego ¬i(s) ⊥ i(p1), luego ¬s ⊥ p1, es decir, existe p ∈ P tal que p ≤ s y p ≤ p1.Entonces i(p) ≤ i(p1) y basta probar que i(p) ⊥ i(p2), pues esto prueba que i[P]es separativo. Ahora bien, en caso contrario ¬p ⊥ p2, luego existe p∗ ≤ p ≤ s,p∗ ≤ p2, luego ¬i(p∗) ⊥ r, i(p∗) ≤ i(p2), luego ¬i(p2) ⊥ r, contradiccion.

Nos ocupamos ahora de las inmersiones densas y empezamos con un hechoelemental:

Teorema 10.19 Toda inmersion densa entre c.p.o.s es una inmersion com-pleta.

Page 326: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

316 Capıtulo 10. Algebras de Boole

Demostracion: Si i : P −→ Q es una inmersion densa y q ∈ Q, entoncesexiste un p ∈ P tal que i(p) ≤ q, y es inmediato que p es una reduccion de qa P, pues si p∗ ≤ p, entonces i(p∗) ≤ i(p) ≤ q, luego ¬i(p∗) ⊥ q.

Veamos ahora que un algebra de Boole completa esta totalmente determi-nada por cualquiera de sus subconjuntos densos:

Teorema 10.20 Sean B y C dos algebras de Boole completas, sea D ⊂ B unsubconjunto denso y sea j : D −→ C una inmersion completa. Entonces jse extiende a un unico monomorfismo completo j∗ : B −→ C, que sera unisomorfismo si j es densa.

Demostracion: Notemos que al decir queD es denso en B hay que entenderque D ⊂ B \ O es denso en B \ O. La unicidad se debe a que, para todop ∈ B, se cumple que

p =∨

q ∈ D | q ≤ p.En efecto, si llamamos r al supremo, es claro que r ≤ p, y si no se diera laigualdad es que p ∧ r′ 6= O, luego existe un q ∈ D tal que q ≤ p ∧ r′, luegoq ≤ r por definicion de r y tambien q ≤ r′, luego q ≤ r ∧ r′ = O, contradiccion.

Por lo tanto, si existe j∗, necesariamente

j∗(p) =∨

j(q) | q ∈ D ∧ q ≤ p,

lo que nos da la unicidad.Veamos ahora que definiendo j∗ de este modo cumple lo pedido. Ante todo,

si p ∈ D entonces

j(p) ≤∨

j(q) | q ∈ D ∧ q ≤ p ≤ j(p),

luego j∗(p) = j(p), es decir, j∗ extiende a j.

Si p ∈ B \ O, entonces existe q ∈ D tal que q ≤ p y por consiguienteO < j(q) ≤ j∗(p). Ası pues, j∗ se restringe a una aplicacion B\O −→ C\O.Veamos que es una inmersion.

Si p1, p2 ∈ B cumplen p1 ≤ p2, entonces

j(q) | q ∈ D ∧ q ≤ p1 ⊂ j(q) | q ∈ D ∧ q ≤ p2,

luego j∗(p1) ≤ j∗(p2).

Si, por el contrario, p1 ∧ p2 = O, entonces, para cada q ∈ D, q ≤ p1 tenemosque

j(q) ∧ j∗(p2) =∨

j(q) ∧ j(r) | r ∈ D ∧ r ≤ p2 = O,

pues q y r son incompatibles en D, luego j(q) y j(r) son incompatibles C, porquej es una inmersion. Por consiguiente

j∗(p1) ∧ j∗(p2) =∨

j(q) ∧ j∗(p2) | q ∈ D ∧ q ≤ p1 = O.

Page 327: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 317

Ası pues, j∗ es una inmersion de c.p.o.s. Veamos que es completa. Si q ∈ C,sabemos que tiene una reduccion d a D, pero esta es tambien una reducciona B, pues si p ≤ d, podemos tomar d′ ∈ D tal que d′ ≤ p ≤ d, luego ¬j(d′) ⊥ q,es decir, que existe un r ∈ C \ O tal que r ≤ q y r ≤ j(d′) = j∗(d′) ≤ j∗(p),luego ¬j∗(p) ⊥ q.

Por 10.17 sabemos que j∗ : B −→ C es un monomorfismo completo, y yahemos visto que es la unica extension posible de j.

Supongamos ahora que j es una inmersion densa y veamos que j∗ es su-prayectiva. Para ello tomamos r ∈ C y definimos s =

p ∈ D | j(p) ≤ r.Entonces, como ya sabemos que j∗ conserva supremos,

j∗(s) =∨

j(p) | p ∈ D ∧ j(p) ≤ r ≤ r.

Si no se diera la igualdad existirıa un q ∈ C no nulo de manera que q ≤ r yq ∧ j∗(s) = O. Como j es densa podemos tomarlo de la forma q = j(p), paracierto p ∈ D. Entonces p ≤ s, luego q = j(p) = j∗(p) ≤ j∗(s), contradiccion.

En particular, si j : B −→ C es una inmersion densa entre algebras de Boolecompletas, se trata de hecho de un isomorfismo.

En efecto, tenemos que j : B −→ j[B] es una semejanza, y el teoremaanterior nos dice que debe extenderse a un isomorfismo j∗ : B −→ C, lo cualsolo es posible si j es ya un isomorfismo.

Ahora ya estamos en condiciones de completar, no ya un algebra de Boole,sino cualquier c.p.o.:

Definicion 10.21 Sea P un c.p.o. Para cada p ∈ P sea Bp = q ∈ P | q ≤ p.Es inmediato comprobar que estos conjuntos son la base de una topologıa en P.En particular podemos considerar el algebra R(P) de los abiertos regulares de P,que por 10.14 es un algebra de Boole completa.

Es claro que los subconjuntos de P densos para la topologıa que acabamosde definir son precisamente los que hemos definido como tales.

Teorema 10.22 Sea P un c.p.o. Entonces:

a) La aplicacion iP : P −→ R(P) dada por i(p) = B⊥⊥p es una inmersion

densa.

b) Si j : P −→ B es una inmersion completa (resp. densa) de P en un algebrade Boole completa B, entonces existe un unico monomorfismo completo(resp. isomorfismo) j∗ : R(P) −→ B tal que el diagrama siguiente esconmutativo:

R(P)j∗

// B

P

iP

OO

j

==④④④④④④④④④

Page 328: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

318 Capıtulo 10. Algebras de Boole

En particular R(P) es, salvo isomorfismo, la unica algebra de Boole completaen la que P puede sumergirse densamente. La llamaremos complecion de P.

Demostracion: a) Notemos que si p ∈ P, entonces

p ∈ Bp ⊂ B⊥⊥p 6= ∅ = O,

luego iP : P −→ R(P) \ O.

Sean p, q ∈ P. Si p ≤ q entonces Bp ⊂ Bq, luego B⊥⊥p ⊂ B⊥⊥

q , es decir,i(p) ≤ i(q).

Si p ⊥ q, entonces Bp ∩ Bq = ∅, luego B⊥⊥p ∩ B⊥⊥

q = (Bp ∩ Bq)⊥⊥ = ∅,

luego i(p) ∧ i(q) = O.Esto prueba que i es una inmersion. Veamos que es densa. Si A ∈ R(P)\O,

entonces A es un abierto no vacıo, luego es union de abiertos basicos. Enparticular existe un p ∈ P tal que Bp ⊂ A. Entonces B⊥⊥

p ⊂ A⊥⊥ = A, es decir,i(p) ≤ A.

Observemos que b) es inmediato si P es un conjunto parcialmente ordenadoseparativo (en particular si es un algebra de Boole), pues en tal caso iP es unasemejanza en su imagen, luego podemos definir j′ = i−1

P j : iP[P] −→ B, que es

claramente una inmersion completa (resp. densa) que por el teorema anterior seextiende a un monomorfismo completo (resp. isomorfismo) j∗ : R(P) −→ B queclaramente es el unico que hace conmutativo el diagrama del enunciado.

Para probar el caso general veamos que si i : P −→ Q, i′ : P −→ Q′ soninmersiones suprayectivas en dos conjuntos parcialmente ordenados separativos,entonces existe una unica semejanza f : Q −→ Q′ tal que i f = i′.

Admitiendo esto, como Q = iP[P] y Q′ = j[P] son conjuntos parcialmenteordenados separativos (por 10.18), existe una semejanza j′ : iP[P] −→ j[P] talque iP j′ = j, y podemos concluir igualmente.

Veamos que si r, s ∈ Q, entonces

r ≤ s↔∧

t ∈ Q(¬t ⊥ r → ¬t ⊥ s).

Si r ≤ s ∧ ¬t ⊥ r, entonces existe u ∈ Q tal que u ≤ t ∧ u ≤ r ≤ s, luego¬t ⊥ s. Recıprocamente, si r 6≤ s, existe un t ∈ Q tal que t ≤ r ∧ t ⊥ s (porqueQ es separativo), luego ¬t ⊥ r pero t ⊥ s.

Lo mismo vale para Q′, luego, dados p, q ∈ P, se cumple

i(p) ⊥ i(q) ↔ p ⊥ q ↔ i′(p) ⊥ i′(q).

En consecuencia

i(p) ≤ i(q) ↔∧

r ∈ P(¬i(r) ⊥ i(p) → ¬i(r) ⊥ i(q))

↔∧

r ∈ P(¬i′(r) ⊥ i′(p) → ¬i′(r) ⊥ i′(q)) ↔ i′(p) ≤ i′(q).

Page 329: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 319

Como las relaciones en Q y Q′ son antisimetricas, esto implica que

i(p) = i(q) ↔ i′(p) = i′(q).

De aquı se sigue que la aplicacion f : Q −→ Q′ dada por f(i(p)) = i′(p) estabien definida y es una semejanza.

En particular toda algebra de Boole B se puede completar, es decir, se puedesumergir como subalgebra densa en una unica algebra de Boole completa R(B).Mas en general, todo c.p.o. separativo P es semejante a un subconjunto denso deun algebra de Boole completa R(P). (Si no es separativo existe una inmersiondensa, pero no es inyectiva, luego no es una semejanza en la imagen.)

Algebras atomicas Ahora podemos dar una caracterizacion algebraica delas algebras de la forma PA.

Definicion 10.23 Si P es un c.p.o., un elemento p ∈ P es un atomo si no existenq, r ∈ P tales que q ≤ p ∧ r ≤ p ∧ q ⊥ r.

Diremos que P es no atomico si no tiene atomos. Diremos que P es atomicosi el conjunto de sus atomos es denso.

Si B es un algebra de Boole, un elemento b ∈ B no nulo es un atomo si noexiste ningun c ∈ B tal que O < c < b. En efecto, si sucede esto es obvio que bes un atomo, y si existe un c en estas condiciones, entonces d = b ∧ c′ cumpled 6= O, c ≤ b ∧ d ≤ b ∧ c ⊥ d, luego b no es un atomo.

En particular, los atomos de un algebra PA son los conjuntos de la formaa, con a ∈ A, y es claro que PA es un algebra atomica.

Teorema 10.24 Un algebra de Boole B es isomorfa a un algebra PA si y solosi es atomica y completa.

Demostracion: Obviamente, si B ∼= PA, entonces B es atomica y com-pleta. Supongamos ahora que B es atomica y completa y sea A el conjunto desus atomos. Consideramos la aplicacion h : B −→ PA dada por

h(b) = a ∈ A | a ≤ b.

Se comprueba inmediatamente que si b ≤ c entonces h(b) ⊂ h(c), ası comoque si b ⊥ c entonces h(b)∩h(c) = ∅. Por lo tanto, h es una inmersion. Ademas,como h(a) = a, se trata de una inmersion densa, y una inmersion densa entrealgebras de Boole completas es un isomorfismo.

Ejercicio: Probar que toda algebra de Boole finita es isomorfa a un algebra PA.

Teorema 10.25 Si i : P −→ Q es una inmersion densa de c.p.o.s, se cumpleque P es atomico (resp. no atomico) si y solo si lo es Q.

Page 330: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

320 Capıtulo 10. Algebras de Boole

Demostracion: Si a ∈ P es un atomo, entonces i(a) tambien lo es, puessi existen q, r ∈ Q tales que q ≤ i(a) ∧ r ≤ i(a) ∧ p ⊥ r, podemos suponerque q = i(u) ∧ r = i(v). Entonces ¬u ⊥ a ∧ ¬v ⊥ a, luego existen u′, v′ demodo que u′ ≤ u ∧ u′ ≤ a ∧ v′ ≤ v ∧ v′ ≤ a, pero u ⊥ v, luego u′ ⊥ v′, lo quecontradice que a sea un atomo. El recıproco es trivial. Por lo tanto, tenemosque P es no atomico si y solo si lo es Q.

Si Q es no atomico y p ∈ P, entonces existe un atomo a ∈ Q tal que a ≤ i(p),luego existe un a′ ∈ P tal que i(a′) ≤ a. Entonces ¬p ⊥ a′, luego existe una′′ ∈ P tal que a′′ ≤ p ∧ a′′ ≤ a′. De i(a′) ≤ a se deduce inmediatamente quei(a′) es un atomo, luego a′ tambien lo es, luego a′′ tambien lo es, y esto implicaque P es no atomico.

Si P es no atomico y q ∈ Q, existe un p ∈ P tal que i(p) ≤ q y existe unatomo a ∈ P tal que a ≤ p, luego i(a) ≤ q es un atomo en Q que prueba que Qes no atomico.

En particular, un c.p.o. P es atomico o no atomico si y solo si lo es sucomplecion R(P).

Condiciones de cadena Vamos a dar un criterio util para probar la comple-titud de un algebra de Boole. Partimos de una propiedad mas debil:

Definicion 10.26 Si κ es un cardinal infinito, diremos que un algebra de BooleB es κ-completa si todo subconjunto de B de cardinal menor que κ tiene supremo(o, equivalentemente, ınfimo).

Y ahora vamos a dar una condicion que complementa la κ-completitud parallegar a la completitud. Conviene definirla para c.p.o.s arbitrarios:

Una anticadena en un c.p.o. P es un conjunto A ⊂ P formado por elementosincompatibles dos a dos.

Si κ es un cardinal, un c.p.o. P cumple la condicion de cadena κ (c.c.κ)si toda anticadena en P tiene cardinal < κ. En particular, la c.c.ℵ1 se llamacondicion de cadena numerable.

Es inmediato que si f : P −→ Q es una inmersion densa de c.p.o.s, entoncesP cumple la c.c.κ si y solo si la cumple Q. En particular P cumple la c.c.κ si ysolo si la cumple su complecion R(P).

Teorema 10.27 (AE) Si B es un algebra de Boole κ-completa y cumple lacondicion de cadena κ entonces B es completa.

Demostracion: Tomemos X ⊂ B y veamos que X tiene supremo. SeaY = p ∈ B |

q ∈ X p ≤ q. Sea A una anticadena maximal en Y . Claramentetambien es una anticadena en B, luego por hipotesis |A| < κ y existe

A.Veamos que este supremo es tambien el supremo de X .

Si p ∈ X ⊂ Y pero p 6≤∨

A, entonces O 6= p ∧ (∨

A)′ ≤ p, de dondeconcluimos que p ∧ (

A)′ ∈ Y y es incompatible con todos los elementos

Page 331: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 321

de A. Esto permite extender A a una anticadena mayor, en contradiccion consu maximalidad. Ası pues,

A es una cota superior de X .Si t es una cota superior de X , tambien lo es de Y , luego de A, luego

A ≤ t.Esto prueba que

A es la menor cota superior de X .

Distributividad en algebras completas La generalizacion natural del teo-rema 10.9 no se cumple en toda algebra de Boole completa:

Definicion 10.28 Si κ y µ son cardinales, un algebra de Boole completa B esκ-µ-distributiva si cuando pα,β(α,β)∈κ×µ es una familia de elementos de B secumple que

α<κ

β<µpαβ =

f∈κµ

α<κpαf(α).

(o la formula equivalente que resulta de intercambiar supremos e ınfimos).

Se dice que B es κ-distributiva (o κ-∞-distributiva) si es κ-µ-distributivapara todo µ. Se dice que B es completamente distributiva si es κ distributivapara todo κ.

En estos terminos, el teorema 10.9 afirma que toda algebra de Boole completaes 2-distributiva. Las algebras PA son completamente distributivas, pues estoequivale a la relacion

α<κ

β<µ

Aαβ =⋃

f∈κµ

α<κAαf(α),

que se comprueba sin dificultad. Sin embargo, solo las algebras de tipo PA soncompletamente distributivas:

Teorema 10.29 Un algebra de Boole completa es completamente distributivasi y solo si es isomorfa a un algebra PA.

Demostracion: Sea B un algebra de Boole completa y completamentedistributiva.3 Para cada b ∈ B, j ∈ 2, sea

pb,j =

b si j = 1,b′ si j = 0.

Entonces∨

j∈2pb,j = 1l, luego

b∈B

j∈2pb,j = 1l, luego la distributividad nos da que

f∈2B

b∈B

pbf(b) = 1l.

Llamemos af =∧

b∈B

pbf(b). Basta probar que cada ab no nulo es un atomo, pues

entonces, si x ∈ B es no nulo, tenemos que

x = x ∧ 1l =∨

f∈2B(x ∧ af ),

luego existe un f ∈ 2B tal que x ∧ af 6= O, luego x ∧ af = af , luego O < af ≤ x.

3La demostracion no requiere el axioma de eleccion si modificamos la definicion de distri-butividad sustituyendo los cardinales κ y µ por dos conjuntos cualesquiera I y J .

Page 332: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

322 Capıtulo 10. Algebras de Boole

Supongamos, pues, que af 6= O. Dado b ∈ B no nulo, si f(b) = 1 entoncesaf ≤ pb1 = b, mientras que si f(b) = 0 tenemos que af ≤ b′. Esto implica queno puede existir un c ∈ B tal que O < c < af , ya que entonces serıa c < af < c′,contradiccion. Por lo tanto af es un atomo.

Suponiendo AE, para enunciar la κ-distributividad no es necesario que todaslas sucesiones pαββ<µ tengan el mismo conjunto de ındices µ, sino que es facilver que equivale a que

α<κ

i∈Iα

pαi =∨

f∈∏

α<κ

α<κpαf(α).

Vamos a caracterizar esta propiedad, para lo cual necesitamos algunos con-ceptos:

Una particion P de un algebra de Boole completa B es una anticadena P talque

P = 1l.

Si P , Q son particiones de B, diremos que P es un refinamiento de Q si∧

p ∈ P∨

q ∈ Q p ≤ q.

Observemos, por ultimo, que respecto a la topologıa en B considerada en ladefinicion 10.21, un conjunto D ⊂ B es un abierto denso si

b ∈ B(b 6= O →∨

d ∈ D d ≤ b) ∧∧

d ∈ D∧

b ∈ B(O < b ≤ d→ b ∈ D).

Teorema 10.30 (AE) Si B es un algebra de Boole completa y κ un cardinal,las afirmaciones siguientes son equivalentes:

a) B es κ-distributiva.

b) La interseccion de κ abiertos densos es abierta densa.

c) Todo conjunto de κ particiones de B admite un refinamiento comun.

Demostracion: a) ⇒ b) Sea Dαα<κ una familia de abiertos densos. Esinmediato queD =

α<κDα es abierto. Para probar que es denso, tomamos u ∈ B

no nulo. En la prueba de 10.20 hemos visto que∨

d∈Dα

d = 1l, luego∨

d∈Dα

(u ∧ d) = u,luego

u =∧

α<κ

d∈Dα

(u ∧ d) =∨

f∈∏

α<κ

α<κ(u ∧ f(α)).

Si llamamos uf =∧

α<κ(u ∧ f(α)), alguno de ellos tiene que ser no nulo, pues

el supremo de todos ellos es u. Si fijamos uno no nulo, tenemos claramente queuf ∈ D, uf ≤ u, lo que prueba que D es denso.

b) ⇒ c) Sea Pαα<κ una familia de particiones de B. Para cada α, sea

Dα = u ∈ B |∨

v ∈ Pα u ≤ v.

Page 333: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 323

Entonces Dα es claramente abierto, y ademas es denso, pues si b ∈ B no es nulo,entonces

p∈Pα

p = 1l, luego∨

p∈Pα

(b ∧ p) = b, luego algun b ∧ p 6= O y b ∧ p ∈ Dα,

b ∧ p ≤ b.Sea D =

α<κDα, que por hipotesis es abierto denso, y sea P una familia

maximal de elementos de D incompatibles dos a dos (existe por el lema de Zorn).Basta probar que P es una particion, pues en tal caso es obvio que refina a todaslas particiones dadas. Concretamente, solo tenemos que probar que

P = 1l.En caso contrario, sea s =

P y sea d ∈ D tal que d ≤ s′. Claramente, d esincompatible con todos los elementos de P , lo que contradice la maximalidadde P .

c) ⇒ a) Sea pαii∈Iα para α < κ una sucesion de κ familias de elementosde B. Observemos que si f ∈ ∏

α<κIα, entonces

uf =∧

α<κpαf(α) ≤ pαf(α) ≤

i∈Iα

pαi,

luego uf ≤∧

α<κ

i∈Iα

pαi, luego

f∈∏

α<κ

α<κpαf(α) ≤

α<κ

i∈Iα

pαi.

Llamemos u al miembro derecho y veamos que se da la igualdad. Observemosque

f∈∏

α<κ

α<κpαf(α) =

f∈∏

α<κ

α<κpαf(α) ∧ u =

f∈∏

α<κ

α<κ(pαf(α) ∧ u)

α<κ

i∈Iα

pαi =∧

α<κ

i∈Iα

pαi ∧ u =∧

α<κ

i∈Iα

(pαi ∧ u).

Por lo tanto, cambiando cada pαi por pαi ∧ u, podemos suponer sin perdidade generalidad que pαi ≤ u, luego todos los elementos pαi estan en el algebra Bu.Esta algebra cumple la hipotesis c), porque si qαii∈Iα son particiones de Bu,entonces, al anadir u′ a cada una de ellas, tenemos particiones de B, y eliminandode un refinamiento comun de todas ellas los elementos que no cumplan q ≤ uobtenemos un refinamiento comun de todas las particiones dadas de Bu. Asıpues, cambiando B por Bu, no perdemos generalidad si suponemos que u = 1l.

Por el teorema 10.10 podemos construir anticadenas qαii∈Iα de maneraque qαi ≤ pαi y

i∈Iα

qαi =∨

i∈Iα

pαi = 1l. Sea P una particion que refine a todas las

particiones qαii∈Iα . Entonces, para cada p ∈ P existe una funcion f tal quew ≤ qαf(α) ≤ pαf(α), luego w ≤

α<κpαf(α), luego

1l =∨

P ≤∨

f∈∏

α<κ

α<κpαf(α),

luego el supremo de la derecha es 1l, como habıa que probar.

Page 334: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

324 Capıtulo 10. Algebras de Boole

Arboles como c.p.o.s Observemos que si (A,≤) es un arbol, el conjuntoP = A con la relacion inversa

p ≤∗ q ↔ q ≤ p

es un conjunto parcialmente ordenado en el que la relacion de incompatibilidades la misma que ya tenıamos definida.

En efecto, si se cumple ¬p ⊥ q en el sentido definido para arboles, tenemosque p ≤ q ∨ q ≤ p, luego q ≤∗ p ∨ p ≤∗ q, luego ciertamente ¬p ⊥ q en elsentido de c.p.o.s. Si ¬p ⊥ q en el sentido de c.p.o.s, existe un r ∈ A tal quer ≤∗ p ∧ r ≤∗ q, es decir, p, q ∈ A≤

r , que esta bien ordenado, luego p y q soncomparables, luego ¬p ⊥ q en el sentido de arboles.

De este modo, cada arbol A en estas condiciones determina un algebra deBoole completa R(A).

Es facil ver que P es separativo si cuando un p ∈ Nivα(A) tiene una extensionen Nivα+1(A), de hecho tiene al menos dos, ası como que P es no atomico si ysolo si A esta ramificado.

Si (A,≤∗) es un arbol de Suslin bien podado, (P,≤) es el mismo A con elorden inverso y B = R(P) es su complecion, tenemos que B es un algebra deBoole completa no atomica con la condicion de cadena numerable. Vamos aprobar (usando AE) que ademas es ℵ0-distributiva.

Observemos en primer lugar que si D es abierto denso en B, entonces, comoP es denso en B, es claro que D∗ = D∩P es abierto denso en P. Vamos a probarque existe un α < ω1 tal que D∗ contiene todos los elementos de A de altura≥ α.

Sea C una anticadena maximal contenida en D∗. Como tambien es unaanticadena en A, tiene ser numerable. Sea α < ω1 tal que todos los elementosde C tengan altura < α. Si p ∈ A tiene altura ≥ α, existe d ∈ D∗ tal qued ≤ p y por la maximalidad de C existe un d∗ ∈ D∗ compatible con d, luegocon p. Ahora bien, la compatibilidad en P (por ser el c.p.o. asociado a un arbol)equivale a que d∗ ≤∗ p ∨ p ≤∗ d∗, pero el segundo caso es imposible, porquela altura de p es mayor, luego d∗ ≤∗ p, es decir, p ≤ d∗ y, como D∗ es abierto,p ∈ D∗.

Sea ahora Dnn∈ω una familia de abiertos densos en B, sea αn < ω1 tal queD∗

n contenga todos los elementos de A de altura ≥ αn y sea α =⋃

nαn < ω1.

Entonces D∗ =⋂

nD∗

n contiene todos los elementos de A de altura ≥ α. Como A

esta bien podado, es inmediato que D∗ es denso en P y como D∗ ⊂ D =⋂

nDn,

es claro que D es denso en B, y obviamente es abierto. Esto prueba que B esℵ0-distributiva.

Definicion 10.31 Un algebra de Suslin es un algebra de Boole completa, noatomica, con la condicion de cadena numerable y ℵ0-distributiva.

Page 335: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.2. Algebras completas 325

Hemos probado la mitad del teorema siguiente:

Teorema 10.32 (AE) Existe un arbol de Suslin si y solo si existe un algebrade Suslin.

Demostracion: Si existe un arbol de Suslin existe uno bien podado, yhemos probado que su complecion es un algebra de Suslin. Supongamos ahoraque B es un algebra de Suslin y vamos a definir recurrentemente los niveles deun ω1-arbol A ⊂ B \ O con el orden inverso de B.

Mas concretamente, vamos a construir una sucesion de arboles ramificadosAαα≤ω1 de altura α de modo que cada nivel de Aα es una particion de B.De este modo, A = Aω1 sera un ω1-arbol ramificado en el que dos elementosincompatibles en A seran tambien incompatibles en B, luego todas las anticade-nas en A lo seran de B y, por consiguiente, seran numerables, y A sera un arbolde Suslin por 9.16.

Definimos A1 = 1l. Supuesto definido Aδ para todo δ < λ, basta tomarAλ =

δ<λ

Aδ. Si tenemos Aδ y δ = α + 1, para cada p ∈ Nivα(A), como

no es un atomo, existe O < p0 < p, luego podemos tomar p1 = p ∧ p′0 ytenemos que p = p0 ∨ p1 y p0 ∧ p1 = O. Es claro entonces que si hacemosNivα+1(A) =

p∈Nivα(A)

p0, p1, ciertamente los elementos de este conjunto tienen

altura α+1 en el arbol, son incompatibles dos a dos, cada elemento de Nivα(A)tiene dos extensiones incompatibles y ademas

p∈Nivα+1(A)p = 1l,

puesto que cada p ∈ Nivα(A) cumple p = p0 ∨ p1 ≤∨

p∈Nivα+1(A)p, y basta tomar el

supremo en p.Supongamos finalmente que tenemos definido un arbol Aλ de altura λ cuyos

niveles son particiones de B. La distributividad de B nos da que

δ<λ

p∈Nivδ(A)p = 1l =

f

δ<λf(δ),

donde f varıa en∏

δ<λ

Nivδ(A). Claramente, pf =∧

δ<λf(δ) = O salvo si f recorre

una cadena Cf de Aλ, en cuyo caso pf tiene por debajo (en el arbol A, o porencima en B) exactamente a los elementos de Cf . Por lo tanto, si definimos

Nivλ(A) = pf | f ∈∏

δ<λ

Nivδ(A) ∧ pf 6= O,

tenemos que cada elemento de este conjunto tiene ciertamente altura λ en elarbol Aλ+1, y Nivλ(A) es una particion de B, pues ciertamente su supremo es1l y, si f 6= g, entonces existe un δ tal que f(δ) 6= g(δ), luego f(δ) ⊥ g(δ), luegopf ⊥ pg.

En particular, no es posible demostrar en NBG la existencia de arboles deSuslin.

Page 336: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

326 Capıtulo 10. Algebras de Boole

10.3 Ideales y filtros

Veamos ahora que toda algebra de Boole admite una estructura de anillo:

Teorema 10.33 toda algebra de Boole B tiene estructura de anillo conmutativoy unitario con las operaciones dadas por

p+ q = (p ∧ q′) ∨ (p′ ∧ q) = (p ∨ q) ∧ (p ∧ q)′ = (p↔ q)′, p · q = p ∧ q.

El elemento neutro de la suma es O y el del producto es 1l. Ademas, se cumpleque

b ∈ B b = −b.

Demostracion: Se trata de una comprobacion rutinaria. La parte masfarragosa es demostrar la asociatividad de la suma:

(p+ q) + r = ((p+ q) ∧ r′) ∨ ((p+ q)′ ∧ r)

= (((p ∧ q′) ∨ (p′ ∧ q)) ∧ r′) ∨ (((p ∨ q) ∧ (p′ ∨ q′))′ ∧ r)

= (p ∧ q′ ∧ r′) ∨ (p′ ∧ q ∧ r′) ∨ (((p ∨ q)′ ∨ (p′ ∨ q′)′) ∧ r)

= (p ∧ q′ ∧ r′) ∨ (p′ ∧ q ∧ r′) ∨ (((p′ ∧ q′) ∨ (p ∧ q)) ∧ r)

= (p ∧ q′ ∧ r′) ∨ (p′ ∧ q ∧ r′) ∨ (p′ ∧ q′ ∧ r) ∨ (p ∧ q ∧ r),

y es claro que esta expresion no se altera si intercambiamos las posiciones de p,q, r, luego si partimos de p+ (q + r) llegamos al mismo resultado.

En lo sucesivo consideraremos siempre a las algebras de Boole como anilloscon estas operaciones. En las algebras de conjuntos la suma que acabamos deintroducir se corresponde con la operacion conjuntista conocida como diferenciasimetrica:

X Y = (X \ Y ) ∪ (Y \X) = (X ∪ Y ) \ (X ∩ Y ).

Observemos que, al igual que hemos definido la suma y el producto a partirde las operaciones booleanas ∧, ∨ y ′, tambien podemos definir las operacionesbooleanas a partir de la suma y el producto:

x ∧ y = xy, x ∨ y = x+ y + xy, x′ = x+ 1l.

Esto se traduce en que una aplicacion f : B −→ C es un homomorfismo dealgebras si y solo si es un homomorfismo de anillos.

Ejercicio: Un anillo booleano es un anillo conmutativo y unitario B que cumpleademas la propiedad

∧b ∈ B bb = b. Probar que toda algebra de Boole es un anillo

booleano, y que todo anillo booleano se convierte en un algebra de Boole con lasoperaciones ∧, ∨ y ′ dadas por las relaciones precedentes.

Los ideales de las algebras de Boole tienen una caracterizacion muy simpleen terminos de las operaciones del algebra, una caracterizacion que ya hemosconsiderado en el caso particular de las algebras PX :

Page 337: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.3. Ideales y filtros 327

Definicion 10.34 Si B es un algebra de Boole, un ideal de B es un conjuntoI ⊂ B que cumpla las propiedades siguientes:

a) O ∈ I ∧ 1l /∈ I,

b)∧

p ∈ I∧

q ∈ B (q ≤ p→ q ∈ I),

c)∧

pq ∈ I p ∨ q ∈ I.

Diremos que es un ideal primo si ademas cumple

d)∧

p ∈ B p ∈ I ∨ p′ ∈ I.

Un filtro de B es un conjunto F ⊂ B que cumpla las propiedades siguientes:

a) O /∈ F ∧ 1l ∈ F ,

b)∧

p ∈ F∧

q ∈ B (p ≤ q → q ∈ F ),

c)∧

pq ∈ F p ∧ q ∈ F .

Diremos que es un ultrafiltro si ademas cumple

d)∧

p ∈ B p ∈ F ∨ p′ ∈ F .

Es claro entonces que I es un ideal (resp. un ideal primo) si y solo si elconjunto dual I ′ es un filtro (resp. un ultrafiltro) y que F es un filtro (resp. unultrafiltro) si y solo si F ′ es un ideal (resp. un ideal primo).

Notemos tambien que los ideales y los filtros definidos en 6.10 son los idealesy los filtros de las algebras PX .

Hemos definido ası el concepto de ideal de un algebra para que la definicionno dependa del teorema 10.33, pero en realidad los ideales de un algebra deBoole B en este sentido son simplemente los ideales de B como anillo distintosdel propio B. Ademas, los ideales primos en este sentido coinciden con los idealesprimos en el sentido de la teorıa de anillos, y tambien con los ideales maximales.

En efecto, si I es un ideal en este sentido y x, y ∈ I, entonces x+ y ≤ x ∨ y,luego x + y ∈ I, y si x ∈ B ∧ y ∈ I, entonces xy ≤ y, luego xy ∈ I. Estoprueba que I es un ideal en el sentido de la teorıa de anillos. Recıprocamente,si I 6= B es un ideal en este sentido general, ciertamente O ∈ I ∧ 1l /∈ I,si p ∈ I ∧ q ∈ B ∧ q ≤ p, entonces q = qp ∈ I, y si p, q ∈ I, entoncesp ∨ q = p+ q+pq ∈ I, luego I es un ideal en el sentido de la definicion anterior.

La afirmacion sobre ideales primos y maximales sera inmediata despues dela observacion siguiente:

Si B es un algebra de Boole e I es un ideal de B, representaremos por B/Ial anillo cociente correspondiente, que tiene estructura de algebra de Boole conlas operaciones dadas por

[p] ∧ [q] = [p ∧ q], [p] ∨ [q] = [p ∨ q], [p]′ = [p′].

Page 338: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

328 Capıtulo 10. Algebras de Boole

En efecto, es facil probar que las operaciones estan bien definidas, aunquetenemos una justificacion indirecta, pues pueden definirse a partir de la suma yel producto, que ya sabemos que estan bien definidas:

[p] ∧ [q] = [p][q], [p] ∨ [q] = [p] + [q] + [p][q], [p]′ = [p] + 1l.

Una vez esta justificado que las operaciones estan bien definidas, cada pro-piedad de la definicion de algebra de Boole se cumple en B/I como consecuenciainmediata de que se cumple en B.

Ası pues, nos referiremos a B/I como el algebra cociente determinada por I.Si F es un filtro en B, representaremos por B/F al algebra cociente determinadapor el ideal dual F ′.

Notemos que si I es un ideal y F es su filtro dual, la congruencia moduloI (es decir, la relacion de equivalencia que determina el cociente B/I = B/F )viene dada por

p+ q ∈ I syss p↔ q ∈ F.

Observemos tambien que, como en la definicion de ideal hemos exigido que1l /∈ I, las algebras cociente son no degeneradas. Ahora es inmediato que I esun ideal primo (en el sentido de la definicion anterior) si y solo si B/I = O, 1l,pero es claro que el algebra trivial O, 1l es la unica algebra que es un dominioıntegro (pues si un algebra B contiene un tercer elemento p, entonces pp′ = O,luego p es un divisor de cero y B no es un dominio ıntegro), luego en particulares tambien la unica algebra que es un cuerpo. Ahora el teorema 1.34 implicainmediatamente que los ideales primos de un algebra en el sentido de la definicionanterior coinciden con los ideales primos y maximales en el sentido general dela teorıa de anillos.

A su vez, esto implica que un filtro F en un algebra de Boole B es unultrafiltro si y solo si es maximal, en el sentido de que no existe ningun filtroF G B.

Diremos que un subconjunto X de un algebra de Boole B tiene la pro-piedad de la interseccion finita si para cualquier conjunto finito de elementosx1, . . . , xn ∈ X se cumple x1 ∧ · · · ∧ xn 6= O.

Diremos que un conjunto x1, . . . , xn de elementos de B es un cubrimientofinito si x1 ∨ · · · ∨ xn = 1l.

El teorema siguiente se demuestra sin dificultad:

Teorema 10.35 Sea B un algebra de Boole.

a) La interseccion de una familia de ideales/filtros de B es un ideal/filtro.

b) Si X ⊂ B tiene la propiedad de la interseccion finita, entonces el conjunto

(X)f = p ∈ B | existen n ∈ ω y x1, . . . , xn ∈ X tales que x1 ∧ · · · ∧ xn ≤ p

es un filtro de B que contiene a X y esta contenido en cualquier otro filtrode B que contenga a X. Se le llama filtro generado por X.

Page 339: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.3. Ideales y filtros 329

c) Si X ⊂ B no contiene cubrimientos finitos, entonces el conjunto

(X)i = p ∈ B | existen n ∈ ω y x1, . . . , xn ∈ X tales que p ≤ x1 ∨ · · · ∨ xn

es un ideal de B que contiene a X y esta contenido en cualquier otro idealde B que contenga a X. Se le llama ideal generado por X.

d) Si f : B −→ C es un homomorfismo de algebras y F e I son un filtro y unideal duales en C, entonces f−1[F ] y f−1[I] son un filtro y un ideal dualesen B.

Ejemplo Si B = PA y a ∈ A, entonces el filtro generado por el atomo a es

(a)f = X ∈ PA | a ∈ X

y es inmediato que se trata de hecho de un ultrafiltro. Los ultrafiltros de estaforma se llaman ultrafiltros fijos, mientras que los que no son de esta formase llaman ultrafiltros libres. Observemos que si un filtro F de B contiene unatomo a entonces (a)f ⊂ F , luego F = (a)f , porque (a)f es maximal. Enparticular un ultrafiltro es fijo si y solo si contiene un atomo a.

Recıprocamente, si un ultrafiltro F es libre, entonces cada atomo a estaen el ideal dual F ′, luego cada conjunto finito esta en F ′ (porque la union finitade elementos de F ′ esta en F ′). Notemos que

I = X ∈ PA | X es finito

es un ideal en PA, cuyo filtro dual es el formado por los conjuntos cofinitos:

F = X ∈ PA | A \X es finito.

Acabamos de justificar que un ultrafiltro F es libre si y solo si F ⊂ F .

La existencia de ultrafiltros libres no puede demostrarse sin AE, pero unaaplicacion elemental del lema de Zorn (comparese con 3.29) nos da los teoremassiguientes:

Teorema 10.36 (de los ideales primos) (AE) Todo ideal en un algebra deBoole puede extenderse hasta un ideal primo.

Teorema 10.37 (de los ultrafiltros) (AE) Todo filtro en un algebra de Boolepuede extenderse hasta un ultrafiltro.

En particular, los ultrafiltros en PA que extienden al filtro F formado porlos conjuntos cofinitos son ultrafiltros libres.

Dedicaremos la seccion siguiente a estudiar los ultrafiltros de un algebrade Boole. Terminamos esta seccion dando condiciones suficientes para que unalgebra cociente sea completa basandonos en el teorema 10.27:

Page 340: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

330 Capıtulo 10. Algebras de Boole

Definicion 10.38 Sea B un algebra de Boole, sean I, F un ideal y un filtro enB, respectivamente, y sea κ un cardinal infinito.

I es κ-completo si todo subconjunto de I de cardinal menor que κ tienesupremo y este pertenece a I.

F es κ-completo si todo subconjunto de F de cardinal menor que κ tieneınfimo y este pertenece a F .

Obviamente un ideal es κ-completo si y solo si lo es su filtro dual, y viceversa.

Teorema 10.39 (AE) Sea κ un cardinal infinito, B un algebra de Boole κ-completa e I un ideal κ-completo de B. Entonces el algebra cociente B/I esκ-completa. Ademas, para todo X ⊂ B tal que |X | < κ se cumple

p∈X[p] =

[ ∨

p∈Xp].

Demostracion: Todo subconjunto de B/I de cardinal menor que κ es dela forma Y = [p] | p ∈ X, donde X ⊂ B, |X | < κ. Claramente

[ ∨

p∈Xp]

es una

cota superior de Y .Si [q] es otra cota superior, entonces [p] ≤ [q] para todo p ∈ X , es decir,

p ∧ q′ ∈ I. Por la completitud de I concluimos que

( ∨

p∈Xp)

∧ q′ =∨

p∈X(p ∧ q′) ∈ I,

luego[ ∨

p∈Xp]≤ [q]. Esto prueba que

[ ∨

p∈Xp]

es el supremo de Y .

Consideramos ahora la condicion de cadena κ:

Definicion 10.40 Sea B un algebra de Boole, I un ideal de B y κ un cardinalinfinito. Diremos que I cumple la condicion de cadena κ o que es κ-saturado siel algebra cociente B/I cumple la c.c.κ.

Teorema 10.41 (AE) Sea κ un cardinal infinito, sea B un algebra de Booleκ-completa e I un ideal κ-completo de B. Entonces I cumple la c.c.κ si y solosi toda anticadena en B \ I tiene cardinal menor que κ.

Demostracion: Una implicacion es obvia. Supongamos que I cumplela condicion del enunciado y sea [pα]α<κ una anticadena en B/I. Podemossuponer ademas que

α < κ pα /∈ I. Ası, si α < β < κ entonces pα ∧ pβ ∈ I.Definimos

qβ = pβ ∧∧

α<βp′α.

Ası, si α < β < κ tenemos que qα ∧ qβ ≤ pα ∧ p′α = O, luego qββ<κ esuna anticadena en B. Hemos de probar que esta, de hecho, en B \ I.

Notemos que si α < β entonces pβ ∧ pα ∈ I, luego por la completitud de Iresulta que pβ ∧

α<βpα ∈ I.

Page 341: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.4. Espacios de Stone 331

Si qβ ∈ I entonces pβ = (pβ ∧∧

α<βp′α) ∨ (pβ ∧

α<βpα) ∈ I, contradiccion,

luego ciertamente tenemos una anticadena en B \ I, lo que a su vez contradicela saturacion de I. El recıproco es evidente.

Por consiguiente, el teorema 10.27 nos da que el cociente de un algebraκ-completa sobre un ideal κ-completo y κ-saturado es un algebra completa.

10.4 Espacios de Stone

A la hora de demostrar que un algebra de Boole satisface determinadasrelaciones, como la asociatividad de la suma, demostrada en la prueba del teo-rema 10.33, tenemos que recurrir en principio a las identidades de la definicionde algebra, mientras que si nos restringimos al caso de un algebra de conjuntospodemos justificar las igualdades como igualdades conjuntistas, es decir, to-mando un elemento arbitrario de un miembro y probando que esta en el otro, yviceversa, lo cual suele ser mas sencillo. Ahora vamos a probar que este metodoes general, pues toda algebra de Boole es isomorfa a un algebra de conjuntos.

En esta seccion usaremos el axioma de eleccion, pero conviene observar queunicamente lo haremos a traves del teorema 10.36, o de 10.37, que es equivalente.

Definicion 10.42 Sea B un algebra de Boole. Llamaremos S(B) al conjuntode todos los ultrafiltros de B. Para cada p ∈ B definimos

Cp = x ∈ S(B) | p ∈ x, B = Cp | p ∈ B.

Teorema 10.43 (Teorema de representacion de Stone) Si B es un algebrade Boole, entonces B es un algebra de conjuntos sobre S(B) y la aplicacionh : B −→ B dada por h(p) = Cp es un isomorfismo de algebras.

Demostracion: Dados p, q ∈ B, se cumple que

x ∈ Cp ∩ Cq syss p ∈ x ∧ q ∈ x syss p ∧ q ∈ x syss x ∈ Cp∧q.

Ası pues, Cp∧q = Cp ∩ Cq. Por otra parte,

x ∈ S(B) \ Cp syss p /∈ x syss p′ ∈ x syss x ∈ Cp′ ,

luego Cp′ = S(B) \ Cp.

Esto prueba que B es un algebra de conjuntos y que h : B −→ B es unepimorfismo de algebras. Para probar que h es inyectiva basta comprobar quesi h(p) = ∅ entonces4 p = O. En efecto, si Cp = ∅ tenemos que p no pertenecea ningun ultrafiltro de B, pero todo elemento no nulo de un algebra genera unfiltro que, a su vez, por 10.37, esta contenido en un ultrafiltro. Por consiguientep = O.

Veamos ahora que el teorema de Stone se puede refinar notablemente:

4Esto es cierto para todo homomorfismo de anillos: si h(u) = 0 → u = 0 entonces h es unmonomorfismo, pues si h(u) = h(v), entonces h(u− v) = 0, luego u− v = 0, luego u = v.

Page 342: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

332 Capıtulo 10. Algebras de Boole

Definicion 10.44 Sea B un algebra de Boole. Entonces, por ser un algebra deconjuntos, B es la base de una topologıa sobre S(B). Llamaremos espacio deStone del algebra B al espacio S(B) con la topologıa generada por B.

Teorema 10.45 Sea B un algebra de Boole. Entonces S(B) es un espacio deHausdorff compacto cero-dimensional5 y B es su algebra de abiertos-cerrados.Por consiguiente, el teorema de representacion de Stone afirma que toda algebrade Boole es isomorfa al algebra de abiertos-cerrados de su espacio de Stone.

Demostracion: Sean x, y ∈ S(B), x 6= y. Entonces existe un p ∈ x tal quep /∈ y, luego p ∈ x, p′ ∈ y, luego x ∈ Cp ∧ y ∈ Cp′ , y ciertamente Cp ∩ Cp′ = ∅,luego Cp y Cp′ son entornos disjuntos de x e y. Esto prueba que S(B) es unespacio de Hausdorff.

Consideremos un cubrimiento abierto de S(B) que, por las observaciones trasla definicion 8.53, podemos considerarlo formado por abiertos basicos, es decir,de la forma Cpp∈I , con I ⊂ B. Si el cubrimiento no admite subcubrimientosfinitos, dados p1, . . . , pn ∈ I, tendrıamos que Cp1 ∪· · ·∪Cpn

6= S(B) = C1l, luegop1 ∨ · · · ∨ pn 6= 1l, luego I no contiene cubrimientos finitos de B, luego generaun ideal que esta contenido en un ideal primo P de B. Llamemos x ∈ S(B) a suultrafiltro dual.

Entonces, si p ∈ I, tenemos que p ∈ P , luego p′ ∈ x, luego x /∈ Cp, yesto contradice que Cpp∈I sea un cubrimiento de S(B). Por lo tanto S(B) escompacto.

Claramente los elementos de B son abiertos-cerrados en S(B) y falta probarque son todos los abiertos-cerrados. En efecto, cualquiera de ellos entonces esunion de abiertos de S(B), pero por compacidad es union de un numero finitode ellos, luego esta en B.

Los teoremas siguientes demuestran que hay una correspondencia naturalentre las algebras de Boole y los espacios compactos cero-dimensionales.

Teorema 10.46 SeaK un espacio compacto cero-dimensional y sea B su algebrade abiertos-cerrados. Entonces K es homeomorfo a S(B).

Demostracion: Sea f : K −→ S(B) dada por f(x) = C ∈ B | x ∈ C.Claramente f(x) es un ultrafiltro en B y f es suprayectiva, pues si p ∈ S(B)entonces p es una familia de cerrados en K con la propiedad de la interseccionfinita, luego existe un x ∈ K que pertenece a todos los elementos de p, es decir,tal que p ⊂ f(x). Por la maximalidad de p ha de ser f(x) = p.

Si x, y son puntos distintos en K, entonces existe un C ∈ B tal que x ∈ C,y /∈ C, luego C ∈ f(x) \ f(y), lo que prueba que f es inyectiva.

Es facil ver que para todo A ∈ B se cumple f−1[A] = A, lo que prueba quef es continua y, por compacidad, un homeomorfismo.

5Un espacio topologico compacto es cero-dimensional si tiene una base formada porabiertos-cerrados.

Page 343: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.4. Espacios de Stone 333

Teorema 10.47 Sea f : B −→ C un homomorfismo de algebras de Boole.Entonces la aplicacion f∗ : S(C) −→ S(B) dada por

f∗(x) = p ∈ B | f(p) ∈ x

es continua. Ademas f es inyectiva si y solo si f∗ es suprayectiva y f es supra-yectiva si y solo si f∗ es inyectiva.

Demostracion: Es inmediato comprobar que f∗(x) ∈ S(B). Ademas(f∗)−1[Cp] = Cf(p), luego f∗ es continua.

Si f es inyectiva e y ∈ S(B), es facil ver que f(p) | p ∈ y tiene la propiedadde la interseccion finita en C, luego esta contenido en un ultrafiltro x ∈ S(C).Es facil comprobar ası mismo que f∗(x) = y.

Si f∗ es suprayectiva y p ∈ B es no nulo, entonces p esta contenido en unultrafiltro y ∈ S(B), que tendra una antiimagen x ∈ S(C). Ası p ∈ y = f∗(x),luego f(p) ∈ x, luego f(p) 6= O. Ası pues, f es inyectiva.

Si f es suprayectiva y f∗(x) = f∗(y), para ciertos x, y ∈ S(C), entoncespara todo p ∈ B se cumple f(p) ∈ x syss f(p) ∈ y, pero esto significa que x = y,luego f∗ es inyectiva.

Si f∗ es suprayectiva entonces es un homeomorfismo en la imagen, luego,dado q ∈ C, se cumple que f∗[Cq] es abierto en f∗[S(C)], con lo que f∗[Cq] =f∗[S(C)] ∩ A, donde A es un abierto en S(B). Tenemos que A es union deabiertos basicos de B, los cuales forman un cubrimiento abierto del compactof∗[Cq], luego podemos extraer un subcubrimiento finito cuya union es un abiertobasico Cp tal que f∗[Cq] ⊂ Cp ⊂ A. Por consiguiente f∗[Cq] = f∗[S(C)] ∩ Cp.Esto implica que Cq = (f∗)−1[Cp], luego

x ∈ S(C)(x ∈ Cq ↔ f∗(x) ∈ Cp),

luego∧

x ∈ S(C)(x ∈ Cq ↔ p ∈ f∗(x)),

luego∧

x ∈ S(C)(x ∈ Cq ↔ f(p) ∈ x),

luego∧

x ∈ S(C)(x ∈ Cq ↔ c ∈ Cf(p)),

y esto significa que Cq = Cf(p), por lo que f(p) = q. Ası pues, f es suprayectiva.

Teorema 10.48 Sean B y C dos algebras de Boole y sea f : S(B) −→ S(C)una aplicacion continua. Entonces la aplicacion f∗ : C −→ B que a cada q ∈ Cle asigna el unico p ∈ B tal que f−1[Cq] = Cp es un homomorfismo de algebras.Ademas f∗∗ = f . Si g : B −→ C es un homomorfismo de algebras, tambien secumple que g∗∗ = g.

Page 344: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

334 Capıtulo 10. Algebras de Boole

Demostracion: No tiene ninguna dificultad probar que f∗ es un homo-morfismo. Si x ∈ S(B), entonces

f∗∗(x) = q ∈ C | f∗(q) ∈ x = q ∈ C | x ∈ Cf∗(q) = q ∈ C | x ∈ f−1[Cq]

= q ∈ C | f(x) ∈ Cq = q ∈ C | q ∈ f(x) = f(x).

Si g : B −→ C es un homomorfismo de algebras y p ∈ B, entonces g∗∗(p) = qes equivalente a las formulas siguientes:

(g∗)−1[Cp] = Cq∧

x ∈ S(C)(p ∈ g∗(x) ↔ q ∈ x)∧

x ∈ S(C)(g(p) ∈ x↔ q ∈ x)∧

x ∈ S(C)(x ∈ Cg(p) ↔ x ∈ Cq),

Cg(p) = Cq,

luego g∗∗(p) = q syss g(p) = q, es decir, g∗∗ = g.

En definitiva, tenemos que a cada algebra de Boole le corresponde un espaciocompacto cero-dimensional (su espacio de Stone) y a cada espacio compactocero-dimensional le corresponde un algebra de Boole (su algebra de abiertos-cerrados). Ademas los homomorfismos de algebras se corresponden con lasaplicaciones continuas, de modo que los isomorfismos se corresponden con loshomeomorfismos. De este modo algebras isomorfas tienen espacios de Stonehomeomorfos y viceversa.

Nota Esto nos da una prueba alternativa mas breve del teorema 10.5: ComoS(O, 1l)) consta de un unico punto, los puntos de S(B) se corresponden biunıvo-camente con las aplicaciones continuas S(O, 1l) −→ S(B), que a su vez se co-rresponden con los homomorfismos B −→ O, 1l. Si B es finitamente generada,cada homomorfismo esta determinado por las imagenes de un generador finito,luego hay un numero finito de homomorfismos, luego S(B) es finito, luego Btambien.

Existe una correspondencia biunıvoca entre los filtros de un algebra de BooleB y los cerrados de su espacio de Stone. Concretamente, para cada filtro F , elepimorfismo canonico p : B −→ B/F se corresponde con una aplicacion inyectivay continua p∗ : S(B/F ) −→ S(B) que determina el cerrado CF = p∗[S(B/F )].Recıprocamente, si C ⊂ S(B) es un cerrado, la inclusion i : C −→ S(B) secorresponde con un epimorfismo i∗ : B −→ C, donde C es el algebra de abiertos-cerrados de C. Entonces FC = (i∗)−1[1l] es un filtro en B y es facil ver queestas dos correspondencias que hemos definido son mutuamente inversas.

Observemos para terminar que si B es un algebra de Boole y p ∈ B, entoncesp es un atomo si y solo si no tiene extensiones no nulas, si y solo si Cp no contieneestrictamente abiertos no vacıos, si y solo si Cp = x para cierto x ∈ S(B),que sera un punto aislado. Recıprocamente, todo punto aislado determina unabierto basico de S(B) que a su vez determina un atomo de B. Es facil ver

Page 345: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.5. Aplicaciones a la topologıa 335

que estas correspondencias son mutuamente inversas, de modo que existe unabiyeccion entre los atomos de un algebra de Boole y los puntos aislados de suespacio de Stone.

Un algebra de Boole es atomica si y solo si el conjunto de sus atomos esdenso, lo cual equivale a que los puntos aislados en S(B) sean un conjuntodenso.

Teorema 10.49 Un algebra de Boole B es completa si y solo si su espacio deStone es extremadamente disconexo, es decir, las clausuras de sus abiertos sonabiertas.

Demostracion: Supongamos que B es completa y seaA un abierto en S(B).Entonces A es union de una familia X de abiertos-cerrados. Sea S el supremo deX en el algebra de abiertos cerrados. Claramente A ⊂ S y, como S es cerrado,clA ⊂ S. El abierto S \ clA ha de ser vacıo, o de lo contrario contendrıa unabierto-cerrado no vacıo B, y entonces S \B serıa una cota superior de X menorque S, lo cual es imposible. Por consiguiente clA = S es abierto.

Recıprocamente, si S(B) es extremadamente disconexo y X es una familiade abiertos-cerrados en S(B), es facil ver que cl

A∈X

A es el supremo de X .

Nota Observemos que si B es un algebra de Boole completa, entonces elalgebra C de abiertos-cerrados de S(B) es una subalgebra de PS(B), y es com-pleta, pero no es necesariamente una subalgebra completa de PS(B), pues elsupremo de una familia de elementos de C no es necesariamente su union (quees su supremo en PS(B)), sino la clausura de su union. Si los supremos coin-cidieran con las uniones (luego los ınfimos con las intersecciones), entonces Cserıa completamente distributiva y B tambien. Por lo tanto, si partimos deun algebra B que no sea completamente distributiva, tenemos un ejemplo desubalgebra de un algebra completa que es completa pero no es una subalgebracompleta.

10.5 Aplicaciones a la topologıa

Terminamos el capıtulo con algunas aplicaciones a la topologıa de los con-ceptos que acabamos de introducir. No usaremos el axioma de eleccion si no loespecificamos.

Convergencia de filtros En primer lugar mostraremos que los filtros pue-den sustituir a las sucesiones en las caracterizaciones de algunos conceptos to-pologicos en espacios no necesariamente 1AN.

Definicion 10.50 Un filtro en un espacio topologico X es un filtro en el algebraPX . Diremos que un filtro F converge a un punto x ∈ X si contiene a todos losentornos de x. Diremos que x ∈ X es un punto de acumulacion de un filtro Fsi x ∈ ⋂

A∈F

A.

Page 346: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

336 Capıtulo 10. Algebras de Boole

Veamos algunas propiedades elementales:

a) Si F converge a x entonces x es un punto de acumulacion de F , pues siA ∈ F y U es un entorno de x, tenemos que U ∈ F , luego A ∩ U ∈ F ,luego A ∩ U 6= ∅, luego x ∈ A.

b) Si F es un ultrafiltro y x es un punto de acumulacion de F , entonces Fconverge a x. En efecto, si U es un entorno de x pero U /∈ F , entonces

X \ U ∈ F , luego x ∈ X \ U = X\

U , pero esto contradice que U sea unentorno de X .

c) Si X es un espacio de Hausdorff, cada filtro tiene a lo sumo un lımite,pues si x 6= y son dos puntos de X , tienen entornos disjuntos U y V , y nopueden estar ambos en un mismo filtro.

d) Un espacio X es compacto si y solo si todo filtro tiene un punto de acu-mulacion.

En efecto, si X es compacto y F es un filtro, la familia A | A ∈ F tienela propiedad de la interseccion finita, luego existe x ∈ ⋂

A∈F

A, y x es unpunto de acumulacion de F .

Si los filtros tienen puntos de acumulacion y F es una familia de cerradoscon la propiedad de la interseccion finita, entonces F esta contenida en unfiltro F = (F)f , y si x es un punto de acumulacion de F , tenemos quex ∈

A∈F

A 6= ∅, luego X es compacto.

La propiedad siguiente se apoya en AE en la forma del teorema de losultrafiltros (TU):

e) [TU] Un espacio X es compacto si y solo si todo ultrafiltro converge a unpunto.

En efecto, si X es compacto, entonces todo ultrafiltro tiene un puntode acumulacion, y hemos visto que converge a el. Recıprocamente, si Fes un filtro en X , por el teorema de los ultrafiltros esta contenido en unultrafiltro U , y si U converge a x, sabemos que es un punto de acumulacionde U , y trivialmente tambien lo es de F .

Si f : X −→ Y es una aplicacion, sabemos que induce un homomorfismo dealgebras f∗ : PY −→ PX dado por f∗(A) = f−1[A], luego para cada filtro Fen X tenemos definida su imagen

f(F ) = (f∗)−1[F ] = A ∈ PY | f−1[A] ∈ F,

que sabemos que es un filtro, y de hecho un ultrafiltro si F lo es.

Teorema 10.51 Una funcion f : X −→ Y entre espacios topologicos es conti-nua en un punto x ∈ X si y solo si para todo filtro F en X que converge a x secumple que f(F ) converge a f(x).

Page 347: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.5. Aplicaciones a la topologıa 337

Demostracion: Si f es continua en X y F converge a x dado un entornoU de f(x) sabemos que f−1[U ] es un entorno de X , luego f−1[U ] ∈ F , luegoU ∈ f(F ), luego F converge a f(x).

Recıprocamente, si se cumple esta propiedad y sea F el conjunto de losentornos de x, que claramente es un filtro y converge a x, luego f(F ) converge af(x). Si U es un entorno de f(x), entonces U ∈ f(F ), luego f−1[U ] ∈ F , luegof−1[U ] es un entorno de x y f es continua.

Teorema 10.52 Sea X =∏

i∈I

Xi un producto de espacios topologicos y sea

x ∈ X. Un filtro F en X converge a x si y solo si cada filtro pi(X) converge axi, donde pi : X −→ Xi es la proyeccion i-esima.

Demostracion: Si F converge a x, el teorema anterior nos da que cadapi(F ) converge a xi. Si convergen las proyecciones, basta probar que cadaabierto basico B =

i∈I

p−1i [Ai] que contenga a x esta en F . Ahora bien, si

x ∈ B, entonces xi ∈ Ai, luego Ai es un entorno de xi, luego Ai ∈ pi(F ), luegop−1i [Ai] ∈ F , luego B ∈ F , porque la interseccion finita de elementos de F esta

en F . Por lo tanto, F converge a x.

Con esto ya podemos dar una prueba sencilla del teorema de Tychonoff:

Teorema 10.53 (Tychonoff) (AE) Todo producto X =∏

i∈I

Xi de espacioscompactos es compacto.

Demostracion: Basta probar que todo ultrafiltro F en X converge. Paraello consideramos las proyecciones pi(F ), que son ultrafiltros en cada Xi, luegoconvergen. Elijamos un xi ∈ Xi tal que pi(F ) converja a xi. Entonces Fconverge a x.

Nota En la prueba del teorema anterior hemos usado AE en dos ocasiones:primero al elegir un xi al que converja cada pi(X) y luego al aplicar la caracte-rizacion de los compactos en terminos de ultrafiltros. Ahora bien, si los espaciosXi son de Hausdorff, entonces cada pi(F ) tiene un unico lımite, luego podemossuprimir el primer uso de AE, y el segundo requiere unicamente el teorema delos ultrafiltros, luego tenemos que (TU) implica que el producto de espacios deHausdorff compactos es compacto.

Condiciones de cadena en productos La segunda aplicacion que vamos aver esta relacionada con la conservacion de las condiciones de cadena en pro-ductos de espacios topologicos.

En general, diremos que un espacio X cumple la condicion de cadena κ sitoda familia de abiertos disjuntos dos a dos tiene cardinal < κ (de modo que lacondicion de cadena numerable es la condicion de cadena ℵ1).

Page 348: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

338 Capıtulo 10. Algebras de Boole

Vamos a probar que el problema de si la condicion de cadena κ se conservaen productos equivale a que se conserve en c.p.o.s.

Si P y Q son c.p.o.s, consideraremos a P × Q como c.p.o. con el preordendado por

(p, q) ≤ (p′, q′) ↔ p ≤ p′ ∧ q ≤ q′.

Teorema 10.54 (AE) Si κ es un cardinal infinito, las afirmaciones siguientesson equivalentes:

a) Existen espacios topologicos con la condicion de cadena κ cuyo productono cumple la condicion de cadena κ.

b) Existen dos c.p.o.s con la condicion de cadena κ cuyo producto no cumplela condicion de cadena κ.

c) Existen dos espacios de Hausdorff compactos con la condicion de cadena κcuyo producto no cumple la condicion de cadena κ.

Demostracion: Si X e Y son espacios topologicos que cumplen a), toma-mos como P y Q los conjuntos de abiertos no vacıos de X e Y respectivamente,ordenados con la inclusion. Ası dos abiertos son incompatibles si y solo si sondisjuntos, por lo que P y Q son c.p.o.s con la condicion de cadena κ. ComoX × Y no cumple la condicion de cadena κ, existe una anticadena de cardi-nal κ, que podemos tomar formada por abiertos basicos, es decir, de la formapα × qαα<κ. Entonces (pα, qα)α<κ es una anticadena en P×Q.

Supongamos ahora existen c.p.o.s P y Q que cumplen b). Sean B1 y B2

sus respectivas compleciones, que son dos algebras de Boole completas con lacondicion de cadena κ. El producto B1 × B2 es un c.p.o. que no cumple lacondicion de cadena κ, pues si (pα, qα)α<κ es una anticadena en P×Q, es claroque (i(pα), i(qα))α<κ es una anticadena en B1×B2 (donde i representa en cadacomponente a la inmersion densa del correspondiente c.p.o. en su complecion).

Ası pues, podemos partir de dos algebras de Boole completas. Mas aun,considerando los correspondientes espacios de Stone, tenemos dos espacios com-pactos cero-dimensionales X1 y X2 cuyas algebras de abiertos cerrados B1 y B2

cumplen la condicion de cadena κ, mientras que B1 × B2 no la cumple.Es obvio que X1 y X2 cumplen la condicion de cadena κ como espacios

topologicos, mientras que X1 ×X2 no la cumple, pues si (Uα, Vα)α<κ es unaanticadena en B1×B2 entonces Uα×Vαα<κ es una familia de abiertos disjuntosen X1 ×X2.

En 9.3 demostramos que el producto de una recta de Suslin por sı mismano tiene la c.c.n., luego en particular ♦ implica que el producto de espaciostopologicos no conserva en general la c.n.n. Ahora estamos en condiciones deprobar esto mismo suponiendo unicamente la hipotesis del continuo:

Definicion 10.55 Si A y B son conjuntos cualesquiera, usaremos la notacion

A⊗B = a, b | a ∈ A ∧ b ∈ B

Page 349: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.5. Aplicaciones a la topologıa 339

Si κ es un cardinal infinito y K ⊂ [κ]2, llamaremos

P(κ,K) = F ∈ Pfκ | [F ]2 ⊂ K,

y lo consideraremos como conjunto parcialmente ordenado con la relacion in-versa de la inclusion.

Notemos que si α ∈ κ, entonces [α]2 = ∅, por lo que se cumple trivialmenteque α ∈ P(κ,K). Si K1 ∩K2 = ∅, entonces P(κ,K1) × P(κ,K2) no cumplela c.c.κ, pues (α, α) | α ∈ κ es una anticadena.

Teorema 10.56 (AE) Sea κ un cardinal infinito, A un conjunto, Iαα<κ

una familia de conjuntos de cardinal κ y, para cada α < κ, sea Eαi i∈Iα una

familia de subconjuntos finitos de A tal que, para todo elemento a ∈ A, elconjunto i ∈ Iα | a ∈ Eα

i es finito. Entonces existe una familia Aδδ<κ desubconjuntos de A disjuntos dos a dos tal que

αδ < κ |i ∈ Iα | Eαi ⊂ Aδ| = κ.

Demostracion: Sea f : κ3 −→ κ biyectiva. Vamos a construir una sucesioniηη<κ por recurrencia de modo que si η = f(α, δ, ǫ), entonces iη ∈ Iα y, sillamamos Eη = Eα

iη , los conjuntos Eη son disjuntos dos a dos.

Supuesto definido iββ<η, tenemos que E =⋃

β<η

Eβ tiene cardinal ≤ |η| < κluego, si η = f(α, δ, ǫ), el conjunto

i ∈ Iα | Eαi ∩ E 6= ∅

tiene tambien cardinal< κ (porque cada elemento de E corta a un numero finitode conjuntos Eα

i ). Como |Iα| = κ, podemos tomar iη ∈ Iα tal que Eαiη ∩E = ∅.

Ası pues, tenemos construida la sucesion indicada y, si hacemos iαδǫ = if(α,δ,ǫ),tenemos que los conjuntos Eα

iαδǫ

son disjuntos dos a dos. Ahora basta definir

Aδ =⋃

α,ǫ<κEα

iαδǫ,

y claramente se cumple lo pedido.

Teorema 10.57 (Galvin, Laver) (AE) Si κ es un cardinal infinito tal que2κ = κ+, entonces existen conjuntos parcialmente ordenados P1 y P2 que cum-plen la c.c.κ+ pero P1 × P2 no la cumple.

Demostracion: Por la observacion previa al teorema anterior basta en-contrar conjuntos disjuntos K1, K2 ⊂ [κ+]2 tales que P(κ∗,Ki) satisfagan lac.c.κ+.

Para cada γ < κ+ vamos a definir conjuntos disjuntos K1(γ),K2(γ) ⊂ γ yluego definiremos

Ki = β, γ ∈ [κ+]2 | β ∈ Ki(γ).

Page 350: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

340 Capıtulo 10. Algebras de Boole

Sea Xηη<κ+ una enumeracion de todas las sucesiones de longitud κ desubconjuntos finitos de κ+ disjuntos dos a dos, de modo que Xη = xǫηǫ<κ.Notemos que el numero de tales sucesiones es

≤ (Pfκ+)κ = (κ+)κ = 2κκ+ = κ+,

donde hemos usado que 2κ = κ+, y la otra desigualdad es cierta siempre.

Vamos a construir recurrentemente los conjuntos Ki(γ) de modo que secumpla lo siguiente:

(∗) Si i ∈ 1, 2, η < γ,⋃

ǫ<κxǫη ⊂ γ, a ∈ Pfγ y |ǫ < κ | xǫη ⊗ a ⊂ Ki| = κ,

entonces |ǫ < κ | xǫη ⊗ a ⊂ Ki ∧ xǫη ⊂ Ki(γ)| = κ o, equivalentemente,

|ǫ < κ | xǫη ⊗ (a ∪ γ) ⊂ Ki| = κ.

Supongamos definidos K1(β) y K2(β) para todo β < γ que cumplan lapropiedad anterior cambiando γ por β. Aquı hay que entender que xǫη ⊗ a ⊂ Ki

significa que si u, v ∈ xǫη ⊗ a, con u < v < β, entonces u ∈ K(v).

Sea (iα, ηα, aα)α<κ una enumeracion de todas las ternas que cumplan (∗),con repeticiones, si hubiera menos de κ. Aplicamos el teorema anterior conA = γ, Iα = ǫ < κ | xǫηα

⊗ aα ⊂ Kiα y Eαǫ = xǫηα

(que para un α fijo sonconjuntos disjuntos dos a dos). Obtenemos entonces κ conjuntos, aunque nosbasta tomar dos de ellos, K1(γ) y K2(γ) ⊂ γ, disjuntos, que cumplen (∗).

Con esto tenemos definidos K1 y K2. Veamos ahora que los conjuntos par-cialmente ordenados Pi = P(κ+,Ki) cumplen la c.c.κ+. Fijamos i ∈ 1, 2 yconsideremos una familia Eǫǫ<κ+ de elementos de Pi. Tenemos que probarque existen ǫ < ǫ′ < κ+ tales que Eǫ ∪ Eǫ′ ∈ Pi, es decir, que [Eǫ ∪ Eǫ′ ]

2 ⊂ Ki.Por el lema de los sistemas ∆ (teorema 8.52) podemos suponer que existe

E ⊂ κ+ finito tal que Eǫ ∩ Eǫ′ = E para todo ǫ < ǫ′ < κ+. Entonces losconjuntos Fǫ = Eǫ \ E son disjuntos dos a dos. Como

[Eǫ ∪ Eǫ′ ]2 = [Eǫ]

2 ∪ [Eǫ′ ]2 ∪ Fǫ ⊗ Fǫ′ ,

basta encontrar ǫ < ǫ′ < κ+ tales que Fǫ ⊗ Fǫ′ ⊂ Ki.

Sea η < κ+ tal que xǫη = Fǫ, para todo ǫ < κ, sea γ0 < κ+ tal que⋃

ǫ<κxǫη ⊂ γ0

y η < γ0. Como los conjuntos Fǫǫ<κ+ son disjuntos dos a dos, existe unǫ′ < κ+ tal que Fǫ′∩γ0 = ∅. Digamos que Fǫ′ = γ1 < · · · < γn. Aplicamos (∗)n veces, con (γ, a) = (γ1,∅), (γ2, γ1), . . . , (γn, γ1, . . . , γn−1). Concluimosque |ǫ < κ | xǫη ⊗ Fǫ′ ⊂ Ki| = κ. En particular, tomando cualquier ǫ de esteconjunto, tenemos que ǫ < ǫ′ y Fǫ ⊗ Fǫ′ ⊂ Ki.

Ası pues:

Teorema 10.58 (AE) Si κ es un cardinal infinito y 2κ = κ+, existen dosespacios topologicos compactos de Hausdorff con la c.c.κ+ cuyo producto nocumple la c.c.κ+.

Page 351: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.5. Aplicaciones a la topologıa 341

Los espacios βD Terminamos describiendo brevemente los espacios de Stonemas sencillos, los de las algebras PD, para un conjunto arbitrario D 6= ∅. Entoda esta seccion usaremos tacitamente el axioma de eleccion o, mas concreta-mente, el teorema de los ultrafiltros.

Definicion 10.59 Representaremos por βD el espacio de Stone del algebra deBoole PD. Sabemos que es un espacio de Hausdorff compacto extremadamentedisconexo (por 10.49).

A cada d ∈ D podemos asociarle el ultrafiltro Ud = X ∈ PD | d ∈ X,de modo que la aplicacion D −→ βD dada por d 7→ Ud es inyectiva. Esto nospermite identificar cada elemento de D con el ultrafiltro principal que genera,y considerar D ⊂ βD.

Sabemos que los abiertos basicos de βD son los conjuntos de la forma

CA = x ∈ βD | A ∈ x,

para cada A ⊂ D, ası como que la aplicacion A 7→ CA es un isomorfismo entrePD y el algebra de abiertos cerrados de βD.

Observemos que, a traves de la identificacion A ⊂ D ⊂ βD, sucede que CA

no es sino la clausura de A en βD.En efecto, si d ∈ A, entonces A ∈ Ud, luego Ud ∈ CA. A traves de la

identificacion esto no es sino la inclusion A ⊂ CA y, como CA es cerrado, dehecho A ⊂ CA. Por otro lado, si x ∈ CA, un entorno basico de x es de la formaCB , para cierto B ⊂ D tal que B ∈ x, y entonces, como tambien A ∈ x, tenemosque A ∩ B ∈ x, y ∅ 6= A ∩ B ⊂ CA∩B = CA ∩ CB , luego A ∩ CB 6= ∅. Por lotanto, x ∈ A.

Ası pues, a partir de aquı escribiremos siempre A en lugar de CA.

En particular D = βD, luego D es denso en βD.

Notemos tambien que A ∩ D = A, pues si d ∈ A ∩ D, esto significa queA ∈ Ud, luego d ∈ A.

Como los puntos son cerrados, tenemos que d = d, luego d es unabierto basico de βD y, en particular, es abierto en D. Concluimos que latopologıa que βD induce en D es la discreta6 y que D es abierto en βD.

El teorema siguiente resume parte de lo que hemos obtenido hasta aquı juntocon una propiedad fundamental de βD:

Teorema 10.60 Si D es un conjunto no vacıo, entonces βD es un espaciode Hausdorff compacto que contiene a D como subespacio abierto discreto.Ademas, toda aplicacion f : D −→ K en un espacio de Hausdorff compactotiene una unica extension continua f : βD −→ K.

6En topologıa se dice que βD es una compactificacion del espacio discreto D, es decir, unespacio de Hausdorff compacto que contiene a D como subconjunto denso.

Page 352: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

342 Capıtulo 10. Algebras de Boole

Demostracion: Solo falta demostrar la ultima propiedad. Dada una apli-cacion f : D −→ K, para cada x ∈ βD consideramos el ultrafiltro

f∗(x) = A ∈ PK | f−1[A] ∈ x.

Como K es compacto y de Hausdorff, hemos visto que f∗(x) converge a ununico punto f(x) ∈ K, lo que nos define una aplicacion f : βD −→ K.

Se trata de una aplicacion continua, pues si G ⊂ K es abierto y x ∈ f−1[G],entonces f(x) ∈ G. Podemos tomar un abierto G′ tal que7

f(x) ∈ G′ ⊂ G′ ⊂ G.

Entonces G′ ∈ f∗(x) (por definicion de convergencia de un filtro), luegoA = f−1[G′] ∈ x, luego x ∈ A ⊂ f−1[G]. En efecto, la ultima inclusion se debe

a que si y ∈ A, entonces f−1[G′] ∈ y, luego G′ ∈ f∗(y), luego f(y) ∈ G′ ⊂ G.

Por lo tanto, f−1[G] es entorno de x y, por consiguiente, es abierto.

Por ultimo, si d ∈ D, tenemos que f∗(d) = A ∈ PK | f(d) ∈ A, queclaramente converge a f(d), luego f(d) = f(d), con lo que f extiende a f .

La unicidad de la extension es inmediata, pues si dos aplicaciones continuascoinciden sobre un subconjunto denso son iguales.

Nota Las propiedades del teorema anterior determinan βD como espacio to-pologico salvo homeomorfismo, en el sentido de que si β′D es otro espacio deHausdorff compacto que contiene a D como subespacio denso discreto y satis-face la misma propiedad de extension, entonces la identidad en D se extiende aun homeomorfismo βD −→ β′D.

En general, la existencia de un (unico) espacio de Hausdorff compacto βXque contiene a X como subespacio denso con la propiedad de que toda funcioncontinua f : X −→ K, para cualquier espacio de Hausdorff compacto K, ad-mite una unica extension a βX puede demostrarse para una familia de espaciostopoogicos X mucho mas amplia que la de los espacios discretos, a saber, losllamados espacios completamente regulares, y la compactificacion βX recibe elnombre de compactificacion de Stone-Cech del espacio X .

Ası pues, el espacio βD que estamos considerando es lo que en topologıa seconoce como compactificacion de Stone-Cech del espacio discreto D.

Vamos a calcular el cardinal de βD. Obviamente, si D es finito, entonces D

es cerrado en βD, luego βD = D. SiD es infinito, es inmediato que |βD| ≤ 22|D|

.Vamos a probar que se da la igualdad. De hecho probaremos algo ligeramentemas fuerte:

7Esto se sigue de que K es un compacto de Hausdorff: para cada y ∈ K \ G existenabiertos disjuntos Uy, Vy tales que f(x) ∈ Uy, y ∈ Vy . Basta tomar un subcubrimiento finitoVy1 , . . . , Vyn del compacto K \G y tomar G′ =

⋂Uyi , H =

⋃Vyi . Ası

f(x) ∈ G′ ⊂ G′⊂ K \H ⊂ G.

Page 353: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

10.5. Aplicaciones a la topologıa 343

Definicion 10.61 Si D es un conjunto infinito, un ultrafiltro uniforme en D esun ultrafiltro U en D tal que todos sus elementos tienen cardinal |D|.

Teorema 10.62 (Pospısil) Si D es un conjunto infinito, existen 22|D|

ultra-filtros uniformes en D.

Demostracion: Diremos que C ⊂ PD es una familia uniformemente in-dependiente de subconjuntos de D si para todos los X1, . . . , Xm, Y1, . . . , Yn ∈ Cdistintos dos a dos se cumple que

X1 ∩ · · · ∩Xm ∩ (D \ Y1) ∩ · · · ∩ (D \ Yn)

tiene cardinal |D|. Vamos a probar que existe una familia uniformemente inde-pendiente de cardinal 2|D|. Es claro que podemos sustituir D por cualquier otroconjunto del mismo cardinal, ası que sustituimos D por P = PfD × PfPfD.

Para cada u ⊂ D definimos

Xu = (A,B) ∈ P | A ∩ u ∈ B,

y llamamos C = Xu | u ∈ PD. Vamos a probar que C cumple lo pedido. Enprimer lugar, si u 6= v son dos subconjuntos de D, entonces Xu 6= Xv, pues si,por ejemplo, d ∈ u\v, basta tomar A = d y B = A, con lo que (A,B) ∈ Xu,pero (A,B) /∈ Xv. Por lo tanto |C| = 2|D|.

Tomemos ahora u1, . . . , um, v1, . . . , vn subconjuntos de D distintos dos a dosy fijemos elementos dij ∈ (ui \ vj) ∪ (vj \ ui) y sea A ⊂ D finito que contenga atodos los dij . Observemos que hay |D| conjuntos A posibles. Entonces tenemosque A ∩ ui 6= A ∩ vj y, si llamamos B = A ∩ ui | i = 1, . . . ,m, entonces(A,B) ∈ Xui

\Xvj , luego la interseccion

Xu1 ∩ · · · ∩Xum∩ (P \Xv1) ∩ · · · ∩ (P \Xvn)

contiene a todos los pares (A,B), que son |D|, luego la interseccion tiene cardinal|D| = |P |.

Fijemos, pues, una familia uniformemente independiente C de subconjuntosde D con cardinal 2|D|. Para cada f : C −→ 2, sea

Gf = X ∈ PD | |D \X | < |D| ∪ X ∈ C | f(X) = 1 ∪

D \X | X ∈ C ∧ f(X) = 0.Observamos que Gf tiene la propiedad de la interseccion finita, pues la

interseccion de un numero finito de elementos de Gf es de la forma X ∩ Y ,donde |D \X | < |D| y |Y | = |D| y, si fuera X ∩ Y = ∅, entonces Y ⊂ D \X ,contradiccion.

Por lo tanto, el teorema 10.35 nos da que Gf esta contenido en un filtro en Dque a su vez esta contenido en un ultrafiltro Uf , necesariamente uniforme, puesUf contiene a los complementarios de todos los conjuntos de cardinal menor que|D|, luego no puede contener a ninguno de ellos.

Page 354: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

344 Capıtulo 10. Algebras de Boole

Por ultimo basta observar que si f 6= g entonces Uf 6= Ug, pues si, porejemplo, X ∈ C cumple f(X) = 1 y g(X) = 0, entonces X ∈ Uf y D \X ∈ Ug.

Como consecuencia inmediata:

Teorema 10.63 Si D es un conjunto infinito, entonces |βD| = 22|D|

.

Definicion 10.64 Si D es un conjunto infinito, llamamos D∗ = βD \D, que esun espacio de Hausdorff compacto con la topologıa inducida de βD. Una basees la formada por los abiertos-cerrados A∗ = A ∩D∗ = A \ A, donde A recorrelos subconjuntos de D.

Observemos que A∗ = ∅ si y solo si A es finito, pues, ciertamente, si A esfinito entonces A = A, y si A es infinito, el conjunto

A ∪ X ∈ PD | |D \X | < ℵ0

tiene la propiedad de la interseccion finita, luego esta contenido en un filtro quea su vez esta contenido en un ultrafiltro no principal x ∈ A \A.

Por otro lado, todo abierto-cerrado de D∗ es de la forma A∗, para ciertoA ⊂ D. En efecto, en principio es union de conjuntos de la forma A∗, pero porcompacidad la union se puede tomar finita, pero una union finita de conjuntosde la forma A∗ es tambien un conjunto A∗.

En definitiva, la aplicacion p : PD −→ B∗ dada por A 7→ A∗ es un epimor-fismo en el algebra B∗ de abiertos-cerrados de D∗ tal que p(A) = O ↔ A esfinito. De aquı se sigue a su vez que si llamamos Fin = PfD al ideal de lossubconjuntos finitos de PD, entonces p : PD/Fin −→ B∗ dada por p([A]) = A∗

es un isomorfismo de algebras de Boole, lo que a su vez se traduce en que D∗

es homeomorfo al espacio de Stone del algebra PD/Fin.

Observemos que el algebra PD/Fin no es completa, por lo que D∗ no esextremadamente disconexo.

En efecto, basta considerar una particion Dnn∈ω de D en conjuntos in-finitos. Si dn = [Dn] ∈ PD/Fin, tenemos que el conjunto dn | n ∈ ωno tiene supremo, ya que si c = [C] es una cota superior, esto significa quedn ≤ c, es decir, que Dn \C es finito, luego si elegimos xn ∈ Dn ∩C, llamamosX = xn | n ∈ ω y tomamos c∗ = [C \ X ] 6= O, sucede que dn ≤ c∗, puesDn \ (C \ X) = (Dn \ C) ∪ xn es finito, pero no se cumple c ≤ c∗, puesX ⊂ C \ (C \X) es infinito.

Una ultima observacion es que βω es separable, luego cumple la c.c.n., mien-tras que el teorema 9.25 implica que ω∗ contiene 2ℵ0 abiertos disjuntos dos ados.

Ejercicio: Probar que si A ⊂ D entonces A es homeomorfo a βA. En particular si Aes infinito A∗ tambien lo es. Concluir que D∗ no tiene puntos aislados.

Page 355: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Capıtulo XI

Elementos de teorıa de

modelos

Hasta ahora hemos estudiado distintas “estructuras” definibles sobre un con-junto (la estructura de conjunto ordenado, la estructura de anillo, cuerpo, cuerpoordenado, algebra de Boole, etc.) Aquı vamos a mostrar como es posible estu-diar hasta cierto punto todas estas estructuras dentro de un marco comun, eldeterminado por la teorıa de modelos. Notemos que hemos adoptado la cos-tumbre de representar por + y · las operaciones de un anillo cualquiera, si bienestos signos representan conjuntos distintos segun el anillo considerado. Estoes lo que habitualmente se llama un “abuso de notacion”, pero ahora le dare-mos un sentido mas profundo al mostrar que podemos considerar a + y · comounos signos de un unico “lenguaje formal” susceptibles de ser interpretados deforma distinta en cada anillo. Por ejemplo, en el contexto que vamos a presentarpodremos considerar

xy (x + y = y + x)

como un unico objeto matematico (una formula de un determinado lenguajeformal) de la que podremos decir que es verdadera en el modelo que resulta deespecificar que las variables x, y deben recorrer los numeros reales y el signo+ debe interpretarse como la suma usual, pero que es falsa en el modelo queresulta de especificar que las variables x, y deben recorrer los elementos de ω1 yel signo + debe interpretarse como la suma de ordinales. Pero en ambos casosestamos hablando del mismo objeto matematico “

xy (x+ y = y+ x)” y no deobjetos distintos que representamos por conveniencia con la misma notacion.

No usaremos AE sin indicarlo explıcitamente.

11.1 Lenguajes y modelos

Para enunciar las propiedades que definen una estructura como la de ani-llo ordenado necesitamos hacer referencia a relaciones (como ≤), a funciones

345

Page 356: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

346 Capıtulo 11. Elementos de teorıa de modelos

(como +) y a conjuntos especıficos (como 0, 1), ası como a elementos arbi-trarios (x, y, . . . ) y a relaciones logicas entre ellos. Vamos a definir ahorauna familia de lenguajes cuyos signos puedan adaptarse a las estructuras quepretenden describir:

Definicion 11.1 Un lenguaje formal (de primer orden) es una octupla ordenada

L = (V, F,R, r,¬,→,∧

,=),

tal que

a) V es un conjunto infinito a cuyos elementos llamaremos variables de L,

b) F es un conjunto arbitrario (tal vez vacıo) a cuyos elementos llamaremosfuntores de L,

c) R es un conjunto arbitrario a cuyos elementos llamaremos relatores de L,

d) Los conjuntos V , F y R son disjuntos dos a dos.

e) r : F ∪ R −→ ω, de modo que si s ∈ F ∪ R y r(s) = n diremos que s esun relator (o funtor) n-adico. Exigimos que no haya relatores 0-adicos, ya los funtores 0-adicos los llamaremos constantes de L.

f) ¬, →,∧

, = son conjuntos arbitrarios a los que llamaremos, respectiva-mente, negador, implicador, generalizador e igualador de L. Exigimos quesean distintos entre sı y que no pertenezcan a V ∪F ∪R, salvo el igualador,que tiene que ser un relator diadico.1

Si L es un lenguaje formal, representaremos por Varl(L) al conjunto de lasvariables de L, representaremos por Const(L) al conjunto de las constantes de L,y si n > 0 representaremos por Fnn(L) y Reln(L) los conjuntos de funtores yrelatores n-adicos de L. Llamaremos signos de L a los elementos de

Sig(L) = Var(L) ∪ Const(L) ∪ ⋃

n∈ω\0

Fnn(L) ∪ ⋃

n∈ω\0

Reln(L) ∪ ¬,→,∧

.

Llamaremos cadenas de signos de L a los elementos de

Cad(L) = Sig(L)<ω ,

es decir, a las sucesiones finitas de signos de L. Consideramos la aplicacionℓ : Cad(L) −→ ω que a cada cadena de signos le asigna su longitud, es decir, sudominio.

Tenemos definida la operacion Cad(L) × Cad(L) −→ Cad(L) dada por layuxtaposicion, es decir, que si ζ1, ζ2 ∈ Cad(L), definimos ζ1ζ2 como la sucesionde dominio ℓ(ζ1) + ℓ(ζ2) dada por

(ζ1ζ2)i =

(ζ1)i si i < ℓ(ζ1),(ζ2)i−ℓ(ζ1) si ℓ(ζ1) ≤ 1 < ℓ(ζ1) + ℓ(ζ2).

1En ausencia de AE exigiremos ademas que los conjuntos V , R y F sean bien ordenables.

Page 357: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.1. Lenguajes y modelos 347

Se comprueba sin dificultad que es una operacion asociativa, por lo quepodemos considerar yuxtaposiciones de la forma ζ1 · · · ζn.

En general no distinguiremos entre los signos y las cadenas de signos delongitud 1 de un lenguaje formal, es decir, por ejemplo, entre el signo = y lacadena de signos (0,=) (la sucesion de dominio 1 = 0 cuyo unico terminoes =). Ası, si x e y son dos variables de un lenguaje L y consideramos lacadena de signos x = y que resulta de yuxtaponerlas con el signo =, debemostener presente que la operacion de yuxtaposicion esta definida sobre cadenas designos y no sobre signos, por lo que x = y es la cadena de signos

(0, x)(0,=)(0, y) = (0, x), (1,=), (2, y).

Ejemplo: El lenguaje de la teorıa de anillos Definimos el lenguaje formalde la teorıa de anillos (unitarios) como el lenguaje formal La que tiene unconjunto numerable de variables, dos constantes 0 y 1 y dos funtores diadicos + y· (aparte del igualador y los demas signos logicos). Notemos que no explicitamosque conjunto es concretamente cada signo de La. Podrıamos hacerlo, pero serıadel todo irrelevante.2 Si a La le anadimos un relator diadico ≤ tenemos ellenguaje Lao de la teorıa de anillos ordenados.

Un modelo de un lenguaje formal L es un par (M, I), dondeM es un conjuntono vacıo al que llamaremos universo del modelo e I es una aplicacion definidasobre el conjunto

Const(L) ∪ ⋃

n∈ω\0

Fnn(L) ∪ ⋃

n∈ω\0

Reln(L)

tal que:

a) Si c ∈ Const(L) entonces I(c) ∈M .

b) Si f ∈ Fnn(L) entonces I(f) : Mn −→M .

c) Si R ∈ Reln(L) entonces I(R) ⊂ Mn, de modo que I(=) sea la identidaden M .

En la practica escribiremos M en lugar de (M, I) y c, f , R en lugar deI(c), I(f), I(R). De este modo, especificar un modelo de un lenguaje formalL significa especificar un universo M (un conjunto de objetos de los que vamosa hablar con dicho lenguaje) y asociar a cada constante, cada funtor y cadarelator un significado, de modo que el significado de una constante es un objeto

2Notemos que hasta ahora usabamos el signo + para referirnos indistintamente a diversasoperaciones, y era fundamental saber a cual de ellas nos referıamos en cada momento, puesla suma de ordinales no tiene las mismas propiedades que la suma de numeros reales. En estecontexto la situacion es la opuesta. Ahora + solo pretende ser un signo de un lenguaje formal,y es totalmente irrelevante que conjunto concreto definimos como +. A continuacion veremoscomo asignar un significado a cada signo de un lenguaje formal, de modo que lo relevante nosera nunca que conjunto es +, sino que efecto tiene asignar a un mismo (e irrelevante) signo+ diversos significados, como la suma de ordinales o la suma de numeros reales.

Page 358: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

348 Capıtulo 11. Elementos de teorıa de modelos

del universo del modelo, el significado de un funtor n-adico es una funcion den argumentos en el universo del modelo y el significado de un relator n-adicoes una relacion de n argumentos en el universo del modelo.3 Los modelos noatribuyen ningun significado a los signos ¬, →,

porque vamos a hacer quetengan un significado fijo independiente del modelo que consideremos. A lasvariables no se les asigna un significado porque nuestra intencion es que puedanvariar de significado incluso tras haber fijado un modelo.

Ejemplo Un modelo del lenguaje de la teorıa de anillos viene determinadopor un conjunto A, dos objetos 0, 1 ∈ A y dos operaciones + : A × A −→ A,· : A × A −→ A. Notemos que no es necesario que (A, +, ·) sea un anillo paraser un modelo del lenguaje de la teorıa de anillos. Veremos enseguida que losanillos son los modelos de la teorıa de anillos, pero aun no hemos definido loque esto significa. Para tener un modelo del lenguaje de la teorıa de anillosordenados tenemos que especificar ademas una relacion binaria ≤.

Observemos estos tres ejemplos de cadenas de signos de La:

== +¬ →, 1 · 1 + 1 + 0 1 + 1 = 0 → 1 + 1 + 1 = 1.

La diferencia entre la primera y las otras dos es que a estas les podemosasociar un significado (respecto de un modelo que fije una interpretacion paralos signos involucrados), y a su vez la segunda se distingue de la tercera enque el significado de la segunda debe ser un objeto del modelo considerado,mientras que el significado de la tercera debe ser un valor de verdad (verdaderoo falso). A las cadenas de signos como la segunda del ejemplo anterior (las quepretenden representar objetos) las llamaremos terminos y a las que pretendenser afirmaciones, como la tercera, las llamaremos formulas.

Para definir con precision los conjuntos de terminos y formulas de un lenguajeformal L emplearemos el teorema de recursion sobre la relacion bien fundadaen Cad(L) dada por ζ1R ζ2 ↔ ℓ(ζ1) < ℓ(ζ2). Ası, para definir el conjunto delos terminos definimos una funcion f : Cad(L) −→ 2 de modo que los terminosseran las cadenas con imagen 1. En la practica, esto significa que podemosdefinir cuando una cadena es un termino supuesto que tengamos definido cuandolas cadenas de longitud menor son terminos. La definicion es:4

a) Las variables y las constantes de L son terminos.

b) Si t1, . . . , tn son terminos de L y f es un funtor n-adico de L, entoncesft1 · · · tn es un termino de L.

3Hasta ahora solo habıamos trabajado con relaciones binarias, pero si tenemos R ⊂ Mn,podemos ver a R como una relacion n-adica en M en el sentido de que, dada una n-tupla(a0, . . . , an−1) ∈ Mn, podemos decir que (a0, . . . , an−1) cumplen la relacion R si y solo si

R(a0, . . . , an−1) ≡ (a0, . . . , an−1) ∈ R.

4Mas precisamente, f(ζ) = 1 si y solo si ζ es una variable o una constante o existe unfuntor n-adico f y cadenas t1, . . . , tn de longitud menor que ζ de modo que f(ti) = 1 paratodo i y ζ = ft1 · · · tn.

Page 359: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.1. Lenguajes y modelos 349

El mismo planteamiento justifica la siguiente definicion recurrente de formula:

a) Si t1, . . . , tn son terminos de L y R es un relator n-adico de L, entoncesRt1 · · · tn es una formula de L.

b) Si α, β son formulas de L, tambien lo son ¬α y → αβ.

c) Si α es una formula de L y x es una variable, tambien es una formula∧

xα.

Representaremos por Term(L) y Form(L) a los conjuntos de terminos yformulas de L, respectivamente.

Convenios de notacion En la practica, en lugar de escribir = t1t2 escribi-remos5 t1 = t2, en lugar de ¬(t1 = t2) escribiremos t1 6= t2 y en lugar de → αβescribiremos α → β. Definimos tambien:

α ∨ β = ¬α → β, α ∧ β = ¬(¬α ∨ ¬β),

α ↔ β = (α → β) ∧ (β → α),∨

xα = ¬∧

x¬α.Tambien abreviaremos

xy en lugar de∧

x∧

y o∨

xy en lugar de∨

x∨

y.En cada lenguaje particular consideraremos tambien convenios de notacion si-milares con sus signos particulares. Por ejemplo, en el lenguaje de la teorıa deanillos convendremos en escribir t1 + t2 en lugar de +t1t2, e igualmente conel producto (aunque a menudo abreviaremos t1 · t2 incluso a t1t2). Ası pues,cuando hablemos de una formula como

xy (x + y = y + x)

nos estamos refiriendo a la cadena de signos

(0,∧

), (1, x), (2,∧

), (3, y), (4,=), (5,+), (6, x), (7, y), (8,+), (9, y), (10, x).

No obstante, la sucesion concreta de los signos de un determinado termino oformula sera siempre irrelevante.

Ahora veamos como cada modelo determina un significado para cada terminoy cada formula de un lenguaje formal. En realidad nos falta atribuirle un signi-ficado a las variables, lo cual lo haremos mediante el concepto de valoracion:

Una valoracion de un lenguaje formal L en un modelo M de L es unaaplicacion v : Var(L) −→ M .

De este modo, cada valoracion asigna un significado a cada variable de L.

5Esto no significa que alteremos la cadena de signos, es decir, si x e y son variables,representamos por x = y la sucesion finita cuyo primer signo es =, su segundo signo es xy su tercer signo es y. La razon para que “oficialmente” la formula x = y sea la sucesion(0,=), (1, x), (2, y), en este orden, es que ası no necesitamos considerar los parentesis comosignos de un lenguaje formal, sino que estos solo hacen falta para evitar ambiguedades en losconvenios de notacion.

Page 360: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

350 Capıtulo 11. Elementos de teorıa de modelos

Si v es una valoracion de L en M , x es una variable de L y a ∈M , definimosvax como la valoracion que coincide con v salvo por que vax(x) = a.

Ahora definimos por recurrencia el objeto denotado por un termino t en unmodelo M respecto de una valoracion v, y que representaremos por M(t)[v]:

a) Si x es una variable, M(x)[v] = v(x).

b) Si c es una constante, M(c)[v] = c.

c) Si f es un funtor n-adico y t1, . . . , tn son terminos,

M(ft1 · · · tn)[v] = f(M(t1)[v], . . . ,M(tn)[v]).

Similarmente queremos definir la relacion M α[v] que significa que laformula α es satisfecha en M respecto de la valoracion v, pero no es posiblehacerlo por recurrencia sobre la longitud de α, como hemos hecho hasta ahora,sino que necesitamos una relacion que involucre las valoraciones en el modelo.Concretamente, en el conjunto Form(L)×Val(M), donde Val(M) es el conjuntode todas las valoraciones en M , definimos la relacion dada por

(α, v)R (β,w) ↔ ℓ(α) < ℓ(β),

que claramente esta bien fundada. Aplicando el teorema de recursion a estarelacion, podemos definir una funcion F : Form(L) × Val(M) −→ 2 de modoque M α[v] sea por definicion F (α, v) = 1, y en la practica esto supone quepodemos definir M α[v] supuesto definido M β[w] para toda formula β delongitud menor que α y para toda valoracion w. La definicion es la siguiente:

a) M Rt1 · · · tn[v] si y solo si R(M(t1)[v], . . . ,M(tn)[v]).

b) M ¬α[v] si y solo si no M α[v].

c) M (α → β)[v] si y solo si no M α[v] o bien M β[v].

d) M ∧

xα[v] si y solo si para todo a ∈M se cumple M α[vax].

En particular, M t1 = t2[v] si y solo si6 M(t1)[v] = M(t2)[v]. A partir delas definiciones que hemos dado de los signos logicos es facil demostrar:

a) M (α ∨ β)[v] si y solo si M α[v] o M β[v].

b) M (α ∧ β)[v] si y solo si M α[v] y M β[v].

c) M (α ↔ β)[v] si y solo si M α[v] y M β[v] o bien no M α[v] y noM β[v].

d) M ∨

xα[v] si y solo si existe un a ∈M tal que M α[vax].6No debemos confundir el signo = de un lenguaje L (que es lo que representa = en la relacion

M t1 = t2[v] y es un conjunto) con el signo = metamatematico que es el signo = que venimosusando a lo largo de todo este libro (que es lo que representa = en M(t1)[v] = M(t2)[v] yque es un signo logico, no un conjunto). Lo mismo vale para los signos ¬, →,

∧,∨, etc., que

ahora tienen dos interpretaciones segun el contexto: bien como signos de un lenguaje formal(conjuntos) bien como signos metamatematicos (signos logicos, que no son conjuntos).

Page 361: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.1. Lenguajes y modelos 351

Nota A pesar del aspecto tecnico de estas definiciones, debemos tener presenteque en la practica M(t)[v] no es mas que el objeto que normalmente entendemosque significa t cuando “lo leemos”, e igualmente M α[v] significa lo quenormalmente entendemos al “leer” α. Por ejemplo,

M ∧

x (x · y = y · x)[v] syss para todo a ∈M M (x · y = y · x)[vax]

syss para todo a ∈M M(x · y)[vax] = M(y · x)[vax]

syss para todo a ∈M M(x)[vax] ·M(y)[vax] = M(y)[vax] ·M(x)[vax]

syss∧

a ∈M a · v(y) = v(y) · a.En definitiva, al ver

x (xy = yx) uno “lee” que “y conmuta con todo x”y, en efecto, la interpretacion de esta formula en un modelo M respecto de unavaloracion v es que el objeto v(y) denotado por la variable y conmuta con todoslos a ∈M .

Necesitamos un ultimo concepto sintactico en relacion con los lenguajes for-males, y es el de variable libre. El conjunto Vlib(t) de las variables libres de untermino t de un lenguaje formal L se define como el conjunto de las variablesde L que figuran entre los signos de t. El conjunto de las variables libres de unaformula se define por recurrencia:

a) Vlib(Rt1, . . . , tn) = Vlib(t1) ∪ · · · ∪ Vlib(tn),

b) Vlib(¬α) = Vlib(α),

c) Vlib(α→ β) = Vlib(α) ∪ Vlib(β),

d) Vlib(∧

xα) = Vlib(α) \ x.

A partir de aquı se demuestra inmediatamente que

a) Vlib(α ∨ β) = Vlib(α) ∪ Vlib(β),

b) Vlib(α ∧ β) = Vlib(α) ∪ Vlib(β),

c) Vlib(α↔ β) = Vlib(α) ∪ Vlib(β),

d) Vlib(∨

xα) = Vlib(α) \ x.

En la practica, las variables libres de una formula son las variables queaparecen en ella sin estar afectadas por un cuantificador.

Los terminos y formulas sin variables libres de un lenguaje formal se llamanrespectivamente designadores y sentencias.

Representaremos por Sent(L) el conjunto de todas las sentencias de L.

Un resultado basico es que M(t)[v] y M α[v] solo dependen de los valoresque toma la valoracion v sobre las variables libres en t y en α, respectivamente.En efecto:

Page 362: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

352 Capıtulo 11. Elementos de teorıa de modelos

Teorema 11.2 Sean t y α un termino y una formula de un lenguaje formal L,sea M un modelo de L y sean v y w dos valoraciones de L en M .

a) Si v y w coinciden en Vlib(t), entonces M(t)[v] = M(t)[w].

b) Si v y w coinciden en Vlib(α), entonces M α[v] si y solo si M α[w].

Demostracion: a) Por induccion sobre la longitud de t. Si t = x es unavariable, entonces Vlib(t) = x, luego

M(t)[v] = v(x) = w(x) = M(t)[w].

Si t = c es una constante, entonces M(t)[v] = c = M(t)[w].Si t = ft1 · · · tn y el teorema se cumple para cada ti, entonces v y w coinciden

sobre cada conjunto Vlib(ti), luego usando la hipotesis de induccion

M(t)[v] = f(M(t1)[v], . . . ,M(tn)[v]) = f(M(t1)[w], . . . ,M(tn)[w]) = M(t)[w].

b) Razonamos igualmente por induccion sobre la longitud de α. Si es dela forma α = Rt1 · · · tn, entonces v y w coinciden sobre todos los conjuntosVlib(ti), y podemos aplicar a):

M Rt1 · · · tn[v] syss R(M(t1)[v], . . . ,M(tn)[v])

syss R(M(t1)[w], . . . ,M(tn)[w]) syss M Rt1 · · · tn[w].

Si vale para α y β es inmediato que vale para ¬α y α → β. Supongamosfinalmente que la formula es de tipo

xα. Entonces, por hipotesis v y wcoinciden sobre las variables libres de α salvo a lo sumo en x.

M ∧

xα[v] syss para todo a ∈M M α[vax]

syss para todo a ∈M M α[wax] syss M

xα[w],

donde hemos usado que vax y wax coinciden en todas las variables libres de α,

por lo que hemos podido aplicar la hipotesis de induccion.

Usaremos la notacion t(x1, . . . , xn) y α(x1, . . . , xn) para representar terminosy formulas cuyas variables libres esten entre x1, . . . , xn, y entonces escribiremos

M(t)[a1, . . . , an], M α[a1, . . . , an]

en vez de M(t)[v] o M α[v], donde v es cualquier valoracion tal que v(xi) = ai.

Cuando consideremos formulas concretas, sustituiremos cada variable por suinterpretacion entre corchetes. Por ejemplo,

M [a] + [b] = [b] + [a]

significara M (x+ y = y + x)[v], donde v(x) = a, v(y) = b.

Si M es un modelo de un lenguaje formal L y α es una formula de L, diremosque α es verdadera en M , y lo representaremos por M α si se cumple M α[v]para toda valoracion v de L en M . Diremos que α es falsa en M si no se cumpleM α[v] para ninguna valoracion v o, equivalentemente, si ¬α es verdadera.

El teorema anterior implica que toda sentencia es verdadera o falsa en todomodelo.

Page 363: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.2. Teorıas formales 353

11.2 Teorıas formales

Definicion 11.3 Sea L un lenguaje formal y sea Γ ⊂ Form(L) un conjunto deformulas. Diremos que M es un modelo de Γ (y lo representaremos por M Γsi M es un modelo de L tal que

α ∈ Γ M α.

Diremos que α es una consecuencia logica de Γ si α es verdadera en todomodelo de Γ.

Una teorıa sobre un lenguaje formal L es un conjunto T de sentencias de L

tal que si α ∈ Sent(L) y T α, entonces α ∈ T .

Si Γ ⊂ Sent(L) es claro que

T (Γ) = α ∈ Sent(L) | Γ α

es una teorıa. Si una teorıa T cumple T = T (Γ) se dice que Γ es un conjuntode axiomas para la teorıa T .

Si M es un modelo de L, tambien es claro que

T (M) = α ∈ Sent(L) |M α

es una teorıa sobre L.

Ejemplos Ahora podemos definir la teorıa de anillos (conmutativos unitarios)como la teorıa determinada por los axiomas de la definicion de anillo (conmu-tativo unitario), es decir:

xyz((x+ y) + z = x+ (y + z))∧

xy (x+ y = y + x)∧

x (x + 0 = x)∧

x∨

y (x+ y = 0)∧

xyz ((xy)z = x(yz))∧

xy (xy = yx)∧

xyz (x(y + z) = xy + xz)∧

x x · 1 = x.

Si a estos axioma anadimos los de la definicion de anillo ordenado tendremosla teorıa de anillos ordenados, si les anadimos

x(x 6= 0 →∨

y xy = 1) tenemosla teorıa de cuerpos, si anadimos ambos tenemos la teorıa de cuerpos ordenados,etc.

Sobre un lenguaje con un unico relator diadico ≤ podemos definir la teorıade conjuntos parcialmente ordenados, o la teorıa de conjuntos totalmente orde-nados, etc., sobre un lenguaje con funtores ∧, ∨ y ′ y constantes O, 1l podemosdefinir la teorıa de algebras de Boole, etc.

Es claro que los modelos de la teorıa de anillos (conmutativos unitarios)son precisamente los anillos conmutativos unitarios, los modelos de la teorıa dealgebras de Boole son las algebras de Boole, etc.

Page 364: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

354 Capıtulo 11. Elementos de teorıa de modelos

Es inmediato que las afirmaciones siguientes son equivalentes para cualquierconjunto Γ de sentencias de un lenguaje formal L:

a) Existe α ∈ Sent(L) tal que Γ α y Γ ¬α.

b) Γ no tiene modelos.

c) T (Γ) = Sent(L).

Cuando Γ cumple esto se dice que es contradictorio, y en caso contrario sedice que es consistente. Notemos que Γ es consistente o contradictorio si y solosi lo es T (Γ).

Diremos que Γ es completo si para toda α ∈ Sent(L) se cumple Γ α o bienΓ ¬α. Nuevamente, Γ es completo si y solo si la teorıa T (Γ) es completa.

Es inmediato que si ∆ ⊂ Γ ⊂ Sent(L) y Γ es consistente, entonces ∆ tambienlo es (porque todo modelo de Γ lo es tambien de ∆). Ahora vamos a probar quesi todo ∆ ⊂ Γ finito es consistente, entonces Γ tambien lo es. Este resultadono es trivial y requiere una forma debil del axioma de eleccion. Mas adelantedaremos una prueba conceptualmente mas simple, mientras que la que vamos aver ahora usa la forma mas debil posible de AE.

Diremos que Γ es finitamente consistente si todo ∆ ⊂ Γ finito es consistente.

Teorema 11.4 Sea L un lenguaje formal y Γ ⊂ Sent(L) finitamente consis-tente. Entonces existe un lenguaje formal L′ que resulta de anadir a L unconjunto de constantes y existe un conjunto Γ′ finitamente consistente de sen-tencias de L

′ tal que Γ ⊂ Γ′ y para toda formula φ(x) de L′ con x como unica

variable libre, existe una constante c tal que la sentencia7∨

xφ(x) → φ(c) estaen Γ′.

Demostracion: Vamos a definir recurrentemente una sucesion de lenguajesformales Lnn∈ω y una sucesion Γnn∈ω de conjuntos de sentencias de cadaLn. Partimos de L0 = L y Γ0 = Γ.

Supongamos definidos Ln y Γn y definimos Ln+1 como el lenguaje que resultade anadir a Ln una constante cφ para cada formula φ(x) de Ln con una unicavariable libre.8 Definimos Γn+1 como la union de Γn y el conjunto de todas lassentencias de la forma

xφ(x) → φ(cφ).Finalmente, definimos L′ como el lenguaje formal cuyos signos son los de L

mas las constantes de todos los lenguajes Ln y Γ′ =⋃

n∈ωΓn. Basta probar que

cada Γn es finitamente consistente, pues claramente entonces lo sera tambienΓ′. Razonamos por induccion sobre n. Para n = 0 se cumple por hipotesis.Supongamos que Γn es finitamente consistente y sea ∆ ⊂ Γn+1 finito. Pongamos

7Por φ(c) entendemos la sentencia que resulta de cambiar cada aparicion de la variable xen φ por la constante c.

8No necesitamos AE para definir Ln+1. Por ejemplo, podemos definir α como el rango delconjunto de los signos de Ln y definir cφ = (φ, α), con lo que tenemos la garantıa de que cφno es ningun signo de L, ya que su rango es mayor que el de cualquiera de ellos.

Page 365: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.2. Teorıas formales 355

que ∆ = ∆0∪∆1, donde ∆0 ⊂ Γn y ∆1 esta formado por sentencias de la forma∨

xφ(x) → φ(cφ), donde φ ∈ Form(Ln).

Como Γn es finitamente consistente, existe un modelo M de Ln tal queM ∆0. Extendemos M a un modelo de Ln+1 del modo siguiente: si laformula

xφ(x) → φ(cφ) esta en ∆1 y M ∨

xφ(x), elegimos9 un a ∈ M talque M φ[a] y definimos cφ = a. Si ¬M

xφ(x) o bien∨

xφ(x) → φ(cφ)no esta en ∆1, definimos cφ como un elemento cualquiera prefijado de M . Esclaro entonces que (la extension de) M satisface M ∆, lo que prueba queΓn+1 es finitamente consistente. Notemos que aquı es esencial que a formulas φdiferentes les corresponden constantes cφ diferentes, por lo que no puede darse elcaso de que tengamos que dar distintas interpretaciones a una misma constante.

Teorema 11.5 Sea L un lenguaje formal y sea T una teorıa L tal que:

a) T es finitamente consistente.

b) T es completa.

c) Para cada formula φ(x) de L con x como unica variable libre existe unaconstante c tal que

xφ(x) → φ(c) ∈ T .

Entonces T es consistente.

Demostracion: Sea C el conjunto de todas las constantes de L (que nopuede ser vacıo, por la condicion c). Definimos en C la relacion de equivalenciadada por c ∼ c′ ↔ (c = c′) ∈ T .

Se trata ciertamente de una relacion de equivalencia, pues (c = c) ∈ T , luegoc ∼ c, si c ∼ c′ entonces (c = c′) ∈ T , luego T (c′ = c), luego (c′ = c) ∈ T ,luego c′ ∼ c, y si c ∼ c′ y c′ ∼ c′′ entonces (c = c′) ∈ T y (c′ = c′′) ∈ T , luegoT c = c′′, luego (c = c′′) ∈ T , luego c ∼ c′′.

Definimos M como el conjunto cociente de C respecto de la relacion ∼. Deeste modo

[c] = [c′] ↔ (c = c′) ∈ T.

Vamos a dotar a M de estructura de modelo de L. Para cada constante cde L definimos c = [c]. Para cada relator n-adico R de L definimos

R([c1], . . . , [cn]) ↔ Rc1 · · · cn ∈ T.

La definicion es correcta, pues si [ci] = [c′i] y R([c1], . . . , [cn]), entonces

(ci = c′i) ∈ T y Rc1 · · · cn ∈ T,

luego T Rc′1 · · · c′n, luego Rc′1 · · · c′n ∈ T . Ademas, por la definicion de Mresulta que la relacion asociada al igualador es la identidad en M .

9Se trata de un numero finito de elecciones, por lo que no necesitamos AE.

Page 366: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

356 Capıtulo 11. Elementos de teorıa de modelos

Similarmente, si f es un funtor n-adico en L, definimos f : Mn −→ Mmediante

f([c1], . . . , [cn]) = [c] ↔ (fc1 · · · cn = c) ∈ T.

Esto es correcto, pues existe una constante c tal que

(∨

x fc1 · · · cn = x→ fc1 · · · cn = c) ∈ T

y trivialmente T ∨

x fc1 · · · cn = x, luego (fc1 · · · cn = c) ∈ T . Por otraparte, si (fc1 · · · cn = c) ∈ T y (fc1 · · · cn = c′) ∈ T entonces (c = c′) ∈ T , luego[c] = [c′].

Veamos ahora que si t(x1, . . . , xn) es un termino de L, entonces

M t([c1], . . . , [cn]) = [c] syss (t(c1, . . . , cn) = c) ∈ T.

Razonamos por induccion sobre la longitud de t. Si t = xi es inmediato que

M [ci] = [c] syss (ci = c) ∈ T.

El argumento cuando t = c′ es casi identico. Si t = ft1 · · · tm y el resultado valepara los tj , entonces tomamos constantes c′j tales que T contenga la sentencia

x tj(c1, . . . , cn) = x→ tj(c1, . . . , cn) = c′j.

Como T ∨

x tj(c1, . . . , cn) = x, resulta que (tj(c1, . . . , cn) = c′j) ∈ T . Porhipotesis de induccion M tj([c1], . . . , [cn]) = [c′j ].

Entonces M (ft1 · · · tm)([c1], . . . , [cn]) = [c] si y solo si

f(M(t1)[[c1], . . . , [cn]], . . . ,M(tm)[[c1], . . . , [cn]]) = c

si y solo si f([c′1], . . . , [c′m]) = c, si y solo si (fc′1 · · · c′n = c) ∈ T , si y solo si

T t(c1, . . . , cn) = c syss (t(c1, . . . , cn) = c) ∈ T.

Seguidamente probamos que, para toda formula φ(x1, . . . , xn) de L, se cum-ple

M φ[[c1], . . . , [cn]] syss φ(c1, . . . , cn) ∈ T.

En efecto, si φ = Rt1 · · · tm, y M φ[[c1], . . . , [cn]], tenemos que existenconstantes c′j tales que T contiene las sentencias

x x = tj(c1, . . . , cn) → c′j = tj(c1, . . . , cn).

Claramente entonces T c′j = tj(c1, . . . , cn), luego y hemos probado que enton-ces M [c′j ] = tj([c1], . . . , [cn]). Por lo tanto, M Rt1 · · · tm([c1], . . . , [cn]) si ysolo si

R(M(t1)([c1], . . . , [cn]), . . . ,M(tm)([c1], . . . , [cn])) syss R([c′1], . . . , [c′m])

syss Rc′1 · · · c′n ∈ T syss T Rt1 · · · tm([c1], . . . , [cn]) syss φ(c1, . . . , cn) ∈ T .

Page 367: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.2. Teorıas formales 357

Si φ = ¬α y el resultado vale para α, entonces

M ¬α[[c1, . . . , cn]] syss ¬M α[[c1], . . . , [cn]] syss α(c1, . . . , cn) /∈ T

syss ¬α(c1, . . . , cn) ∈ T . En el ultimo paso usamos que T es finitamente con-sistente y completa, pues por la completitud sabemos que α(c1, . . . , cn) ∈ T o¬α(c1, . . . , cn) ∈ T y por la consistencia finita no se pueden dar los dos casos ala vez.

Si φ = (α → β), entonces (suponiendo que α y β cumplen el resultado yusando que ¬α tambien lo cumple, como ya hemos probado),

M φ[[c1], . . . , [cn]] syss ¬M α[[c1], . . . , [cn]] ∨M β[[c1], . . . , [cn]]

syss α(c1, . . . , cn) /∈ T ∨ β(c1, . . . , cn) ∈ T syss T φ(c1, . . . , cn)

syss φ(c1, . . . , cn) ∈ T .

Finalmente, si φ =∧

xα(x, x1, . . . , xn) y el resultado vale para α,

M φ[[c1], . . . , [cn]] syss∧

c ∈ Const(L) M α[[c], [c1], . . . , [cn]]

syss∧

c ∈ Const(L) α(c, c1, . . . , cn) ∈ T.

Veamos que esto implica que∧

xα(x, c1, . . . , cn) ∈ T . En caso contrario,como existe una constante c tal que

x¬α(x, c1, . . . , cn) → ¬α(c, c1, . . . , cn) ∈ T,

resulta que si∧

xα(x, c1, . . . , cn) /∈ T , entonces ¬∧

xα(x, c1, . . . , cn) ∈ T , luegoT

x¬α(x, c1, . . . , cn), luego T ¬α(c, c1, . . . , cn), luego α(c, c1, . . . , cn) /∈ T ,contradiccion.

Recıprocamente, si∧

xα(x, c1, . . . , cn) ∈ T y c ∈ Const(L), entonces es claroque T α(c, c1, . . . , cn), luego α(c, c1, . . . , cn) ∈ T .

En particular hemos probado que si φ es una sentencia de L se cumple

M φ↔ φ ∈ T,

luego M T y T es consistente.

Ahora podemos probar (sin AE):

Teorema 11.6 (Teorema de compacidad (version numerable)) Si L esun lenguaje formal numerable (es decir, con una cantidad numerable de signos),un conjunto Γ de sentencias de L es consistente si y solo si es finitamenteconsistente.

Demostracion: Razonamos en principio sin la hipotesis de numerabilidad.Si Γ es finitamente consistente, entonces, por el teorema 11.4, existe un lenguajeL′, que resulta de anadir a L un conjunto de constantes, y un conjunto Γ′ de

Page 368: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

358 Capıtulo 11. Elementos de teorıa de modelos

sentencias que contiene a Γ y que cumple las hipotesis a) y c) del teorema an-terior. Supongamos que existe una teorıa T completa y finitamente consistentetal que Γ′ ⊂ T . Entonces T cumple las hipotesis del teorema anterior, luego Tes consistente, es decir, existe un modelo M de L′ tal que M T . En particulartenemos que M Γ. Pero es claro que si consideramos el modelo M0 de L

que se obtiene de M sin mas que eliminar las interpretaciones de las constantesnuevas de L′, entonces M0 Γ, luego Γ es consistente.

Ası pues, el problema es extender Γ′ a una teorıa completa sin perder laconsistencia finita. Vamos a probar que esto es posible cuando L es numerabley mas adelante probaremos que con AE es posible en general.

Si L es numerable, todos los lenguajes Ln que se construyen en la pruebade 11.4 son numerables tambien. Para probar esto basta observar que si Ln esnumerable, entonces el conjunto de sus formulas con una unica variable librees tambien numerable, luego tambien lo es el conjunto de constantes que sele anaden para formar Ln+1. Mas aun, la prueba del teorema 4.35 muestraque podemos construir una biyeccion explıcita entre un conjunto infinito A yA<ω, por lo que podemos construir recurrentemente biyecciones fn entre lossignos de Ln y ω, lo que a su vez permite probar que el lenguaje L′ tambien esnumerable. A su vez, lo es el conjunto de sus sentencias, que podemos numerarcomo φnn∈ω.

Construimos ahora por recurrencia una sucesion Γ′nn∈ω de conjuntos fini-

tos de sentencias de L′. Tomamos Γ′0 = ∅ y, supuesto definido Γ′

n, definimos

Γ′n+1 =

Γ′n ∪ αn si Γ′ ∪ Γ′

n ∪ φn es finitamente consistente,Γ′n en caso contrario.

Es claro que Γ ∪ Γ′n es finitamente consistente para todo n.

Llamamos T =⋃

n∈ωΓ′n. Veamos que cumple lo requerido. En primer lugar,

Γ′ ⊂ T , pues si φ ∈ Γ′, entonces existe un n tal que φ = φn. Por construccionΓ ∪ Γ′

n es finitamente consistente, luego Γ ∪ Γ′n ∪ φn = Γ ∪ Γ′

n tambien lo es,luego tenemos que φ = φn ∈ Γ′

n+1 ⊂ T .

Tambien es claro que T es finitamente consistente.

Veamos ahora que si φ es una sentencia, entonces φ ∈ T o bien ¬φ ∈ T .Esto implica claramente que T es una teorıa y que es completa.

Sean m, n tales que φ = φm, ¬φ = φn. Supongamos, por ejemplo, quem < n (el caso contrario es analogo). Si φ /∈ T , entonces φm /∈ Γ′

m+1, luegoΓ∪Γ′

m ∪φ no es finitamente consistente, luego existe ∆ ⊂ Γ∪Γ′m ∪φ finito

y contradictorio. Necesariamente φ ∈ ∆, puesto que Γ ∪ Γ′m es finitamente

consistente. Por otra parte, Γ ∪ Γ′n es finitamente consistente y contiene a

∆ \ φ. Si ∆′ ⊂ Γ ∪ Γ′n ∪ ¬φ es finito, entonces (∆ ∪ ∆′) \ φ,¬φ es un

subconjunto finito de Γ∪Γ′n, luego tiene un modelo M , luego M ∆\φ, pero

no puede ser M φ, porque ∆ es contradictorio, luego M ¬φ, luego M ∆′,luego Γ ∪ Γ′

n es finitamente consistente, luego ¬φ ∈ Γ′n+1 ⊂ T .

En realidad hemos probado la version numerable de un teorema importante:

Page 369: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.2. Teorıas formales 359

Teorema 11.7 (Teorema de Lowenheim-Skolem) Si una teorıa T sobreun lenguaje formal numerable tiene un modelo, entonces tiene un modelo (deuniverso) numerable.

Demostracion: Si T tiene un modelo, entonces es consistente, luego esfinitamente consistente, luego tiene por modelo el construido en la prueba delteorema 11.5 (a partir de un lenguaje numerable). Es claro que el universo dedicho modelo es numerable.

Ejemplo Consideremos a R como modelo del lenguaje (numerable) de lateorıa de anillos ordenados y es T = T (R). Se trata de una teorıa consistente,luego tiene un modelo numerable K, de modo que T (K) = T (R). Es claroentonces que K es un cuerpo ordenado numerable, luego no es isomorfo a R(ni como cuerpo, ni como modelo, que es lo mismo), pero satisface exactamentelas propiedades que R expresables en el lenguaje La. Mas adelante volveremossobre esto.

Veamos ahora como probar el teorema de compacidad para lenguajes ar-bitrarios. Vamos a probar que es equivalente a la siguiente version debil delteorema de los ultrafiltros 10.37:

Teorema de los Ultrafiltros (TU) Todo filtro en un conjunto puede exten-derse a un ultrafiltro.

Obviamente, este teorema es equivalente a la version correspondiente paraideales primos: todo ideal en un conjunto puede extenderse a un ideal primo.Para probar la equivalencia incluiremos una afirmacion intermedia:

Principio de coherencia Sea A un conjunto y F una familia de funcionesdefinidas sobre subconjuntos finitos de A con valores en 0, 1 de modo quetoda restriccion de toda funcion de F esta en F y para todo subconjunto finitode A existe al menos una funcion en F con dicho dominio, existe una funcionf : A −→ 2 tal que, para todo x ⊂ A finito, se cumple f |x ∈ F.

Teorema 11.8 Las afirmaciones siguientes son equivalentes a (TU):

a) Toda algebra de Boole tiene un ultrafiltro (resp. un ideal primo).

b) Todo filtro (resp. ideal) en un algebra de Boole puede extenderse a unultrafiltro (resp. ideal primo).

c) El principio de coherencia.

d) El teorema de compacidad: Un conjunto Γ de sentencias de un lenguajeformal L es consistente si y solo si es finitamente consistente.

Page 370: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

360 Capıtulo 11. Elementos de teorıa de modelos

Demostracion: Notemos que, por dualidad, las dos versiones de a) y b)son equivalentes entre sı.

a) ⇒ b) Si F es un filtro en un algebra de Boole B, consideramos un ultrafiltroU del algebra cociente B/F y el epimorfismo canonico p : B −→ B/F . EntoncesU = p−1[U ] es un ultrafiltro en B que contiene a F .

b) ⇒ TU es evidente.

TU ⇒ c) Sea F un conjunto de funciones definidas en subconjuntos finitosde A segun las condiciones del principio de coherencia, sea I el ideal formadopor los subconjuntos finitos de A. Para cada x ∈ I, sea Fx el conjunto (finito)de todas las aplicaciones t ∈ F tales que Dt = x. Sea Z el conjunto de todaslas funciones z tales que

a) Dz ⊂ I.

b)∧

x ∈ Dz z(x) ∈ Fx.

c)∧

xy ∈ Dz (z(x) ∪ z(y) : x ∪ y −→ 2).

Para cada x ∈ I, sea Zx = z ∈ Z | x ∈ Dz 6= ∅ y notemos que si x, y ∈ Ientonces Zx ∩ Zy 6= ∅, pues existe t ∈ F tal que Dt = x ∪ y y basta tomarz = (x, t|x), (y, t|y), que cumple z ∈ Zx ∩ Zy. Por lo tanto,

F = X ∈ PZ |∨

x ∈ I Zx ⊂ X

es un filtro en Z. Por hipotesis esta contenido en un ultrafiltro U . Para cadax ∈ I, si Fx = t1, . . . , tn, entonces

Zx = Zt1 ∪ · · · ∪ Ztn ,

donde, para cada t ∈ F, llamamos Zt = z ∈ Zx | z(x) = t. Como la unionesta en U y es disjunta, existe un unico t ∈ Fx tal que Zt ∈ U (si Zti /∈ U paratodo i, entonces Z \ Zti ∈ U , luego ∅ = Zx ∩

i

(Z \ Zti) ∈ U).

Llamemos tx : x −→ 2 al unico elemento de Fx tal que Ztx ∈ U . Si x, y ∈ I,tenemos que Ztx , Zty ∈ U , luego Ztx ∩Zty ∈ U , luego existe z ∈ Ztx ∩Zty , luegoz(x) = tx, z(y) = ty, luego tx ∪ ty es una funcion. Esto implica que

f =⋃

x∈I

tx : A −→ 2

es una funcion que cumple lo requerido.

c) ⇒ d) Segun lo visto en la primera parte de la prueba del teorema 11.6, paraprobar el teorema de compacidad basta probar que todo conjunto finitamenteconsistente Γ de sentencias de un lenguaje formal L puede extenderse a unateorıa T finitamente consistente y completa.

Sea A = Sent(L) y sea F el conjunto de las funciones t definidas sobresubconjuntos finitos de A de modo que existe un modelo M de Γ ∩Dt tal que

φ ∈ Dt (t(φ) = 1 ↔M φ).

Page 371: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.2. Teorıas formales 361

La consistencia finita de Γ implica que F para todo subconjunto finito deA existe una funcion en F que lo tiene por dominio, por lo que F cumple lashipotesis del principio de coherencia, y podemos concluir que existe f : A −→ 2tal que f |x ∈ F para todo x ⊂ A finito. Definimos

T = φ ∈ A | f(φ) = 1

y es claro que Γ ⊂ T . Ademas T es una teorıa completa, porque si φ ∈ A,tenemos que f |φ,¬φ ∈ F, luego existe un modelo M Γ ∩ φ,¬φ, y entonces

f(φ) = 1 ↔M φ↔ ¬M ¬φ↔ ¬f(¬φ) = 1,

luego φ ∈ T o bien ¬φ ∈ T .

d) ⇒ a) Sea B un algebra de Boole y consideremos un lenguaje formal Lque tenga como constantes los elementos de B, ası como un relator monadico f .Consideramos el conjunto Γ formado por las sentencias siguientes de L:

a) ¬fO, f1l,

b) fb ∨ fb′, para cada b ∈ B,

c) fb1 ∧ · · · ∧ fbn → f(b1 ∧ · · · ∧ bn), para todos los b1, . . . , bn ∈ B.

Observemos que Γ es finitamente consistente, pues si ∆ ⊂ Γ es finito, elconjunto X ⊂ B de las constantes que aparecen en las sentencias de ∆ esfinito. Sea C la subalgebra de B generada por X , que por 10.5 es finita, yobviamente tiene un ultrafiltro U (basta tomar un filtro maximal respecto de lainclusion). Podemos convertir a C en un modelo de ∆ sin mas que interpretarcada constante como ella misma y el relator f como la pertenencia a U .

Por lo tanto, tenemos que Γ es consistente, es decir, que tiene un modelo M ,y eso implica que el conjunto

U = b ∈ B |M fb

es un ultrafiltro de B.

Es inmediato que TU es equivalente a que toda algebra es isomorfa a unalgebra de conjuntos, pues toda algebra de conjuntos B tiene un ultrafiltro:basta tomar x ∈

⋃B y definir U = A ∈ B | x ∈ A.

Una version equivalente del teorema de compacidad es la siguiente:

Teorema 11.9 (TU) Si Γ es un conjunto de sentencias de un lenguaje formalL y φ es una sentencia de L tal que Γ φ, entonces existe ∆ ⊂ Γ finito tal que∆ φ.

Demostracion: En caso contrario, para cada ∆ ⊂ Γ finito tendrıamos que∆ ∪ ¬φ serıa consistente, luego por el teorema de compacidad Γ ∪ ¬φ serıaconsistente, pero esto contradice que Γ φ.

Page 372: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

362 Capıtulo 11. Elementos de teorıa de modelos

En particular si Γ es contradictorio (tomando como φ una contradiccion)concluimos que tiene un subconjunto finito contradictorio, pero esto es el teo-rema de compacidad, que es, pues, equivalente al teorema anterior.

En la nota tras el teorema de Tychonoff (teorema 10.53) hemos observado queTU implica que el producto de espacios de Hausdorff compactos es compacto.Ahora podemos demostrar el recıproco:

Teorema 11.10 TU es equivalente a que, para todo conjunto I, el espacio 2I

(con el producto de la topologıa discreta en 2) es compacto.

Demostracion: Sea B un algebra de Boole. Para cada b ∈ B, consideramosla aplicacion hb : 2 −→ b, b′ dada por hb(0) = b′, hb(0) = b. Tenemos entoncesun homeomorfismo h : 2B −→ X =

b∈B

b, b′ dado por h(f)(b) = hb(f(b)). Por

hipotesis 2B es compacto, luego X tambien lo es.

Sea C una subalgebra finita de B y sea I un ideal primo en C. Definimos

CI = f ∈ X |∧

c ∈ C f(u) ∈ I,

que es abierto y cerrado no vacıo en X , al igual que

BC =⋃CI | I es un ideal primo de C.

Observemos que la familia formada por todos los BC tiene la propiedad dela interseccion finita, ya que si C1, . . . ,Cn son subalgebras finitas de B, entoncesla subalgebra C generada por la union es finita (por 10.5) y entonces

BC ⊂ BC1 ∩ · · · ∩BCn,

ya que si f ∈ BC existe un ideal primo I de C tal que f ∈ CI , pero entoncesIi = I ∩ Ci es un ideal primo en Ci y f ∈ CIi ⊂ BCi

. Como X es compacto,existe f ∈ ⋂

C

BC. Sea I0 = f(b) | b ∈ B.

Vamos a probar que I0 es un ideal primo en B. Ante todo, si b ∈ B tenemosque f(b) ∈ b, b′ ∩ I0, es decir, que b ∈ I0 o bien b′ ∈ I0.

Para cada b ∈ B, consideramos el algebra C generada por b y sea I un idealprimo en ella tal que f ∈ CI . Entonces O = f(O) ∈ I, luego O ∈ I0 y f(b) ∈ I0,luego f(b) 6= 1l, luego 1l /∈ I0.

Si f(b) ∈ I0 y c ≤ f(b), consideramos el algebra C generada por b y c yconsideramos un ideal primo I en C tal que f ∈ CI . Entonces f(b) ∈ I, luegoc ∈ I, luego c = f(c) ∈ I0.

Finalmente, si f(b), f(c) ∈ I0, consideramos el algebra C generada por b yc y tomamos un ideal primo I tal que f ∈ CI . Entonces f(b), f(c) ∈ I, luegof(b) ∨ f(c) ∈ I, luego f(b) ∨ f(c) = f(f(b) ∨ f(c)) ∈ I0.

Con esto queda probado que I0 es un ideal primo.

Mas aun:

Page 373: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.2. Teorıas formales 363

Teorema 11.11 (TU) Todo producto de espacios compactos de Hausdorff novacıos es no vacıo.

Demostracion: Sea X =∏

i∈I

Xi un producto de espacios de Hausdorffcompactos no vacıos.

Sea Z el conjunto de todas las funciones f tales que

Df ⊂ I ∧∧

i ∈ Df f(i) ∈ Xi.

Para cada i ∈ I, sea Zi = f ∈ Z | i ∈ Df. Es claro que los conjuntos Zi

forman una familia de subconjuntos de Z con la propiedad de la interseccionfinita, luego generan un filtro que, a su vez, esta contenido en un ultrafiltro U .

Para cada i ∈ I, es facil ver que el conjunto

Ui = A ∈ PXi | f ∈ Z | i ∈ Df ∧ f(i) ∈ A ∈ U

es un ultrafiltro en Xi. (Aquı usamos que, como Zi ∈ U , se cumple Xi ∈Ui.) Por las propiedades tras la definicion 10.50 tenemos que Ui tiene un unicolımite xi, con lo que hemos determinado un punto x ∈ X .

Algebras de Lindenbaum Los axiomas que definen las algebras de Boolepueden interpretarse como las propiedades de la union, la interseccion y el com-plemento de conjuntos, pero tambien como propiedades de las sentencias deuna teorıa formal. La relacion precisa entre las algebras de Boole y la logicase realiza a traves del concepto de algebra de Lindenbaum, que presentamos acontinuacion:

Definicion 11.12 Sea T una teorıa sobre un lenguaje formal L. Definimos enSent(L) la relacion de equivalencia dada por

α ∼ β syss T α ↔ β.

Observemos que esto equivale tambien a que, en cada modelo de T , lassentencias α y β sean ambas verdaderas o ambas falsas, por lo que claramentees una relacion de equivalencia.

Llamaremos BT al conjunto cociente de Sent(T ) respecto de la relacion deequivalencia que acabamos de definir.

De este modo, si p ∈ BT , en cada modelo de T las sentencias de p son todasverdaderas o todas falsas, y si p, q ∈ BT cumplen p 6= q, existe un modelo en elque las sentencias de p son verdaderas y las de q falsas o viceversa.

Es inmediato que las operaciones ∧, ∨ y ′ en BT dadas por

[α] ∧ [β] = [α ∧ β], [α] ∨ [β] = [α ∨ β], [α]′ = [¬α]

estan bien definidas (en el sentido de que no dependen de los representanteselegidos para calcularlas) y convierten a BT en un algebra de Boole con

1l = T, O = 1l′.

Page 374: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

364 Capıtulo 11. Elementos de teorıa de modelos

(Ası, 1l esta formado por las sentencias de T , es decir, las sentencias que sonverdaderas en todo modelo de T , mientras que O contiene a todas las sentenciasque son falsas en todo modelo de T .)

El algebra BT se llama algebra de Lindenbaum de la teorıa T .

Es claro que el algebra BT es degenerada si y solo si T es contradictoria,mientras que BT es trivial (es decir, cumple BT = O, 1l) si y solo si T escompleta.

Esto sucede, por ejemplo, con todas las teorıas de la forma T (M), para unmodelo M .

Segun las definiciones de → y ↔ dadas para algebras de Boole arbitrarias,es claro que

[α] → [β] = [α → β], [α] ↔ [β] = [α ↔ β].

A su vez, [α] ≤ [β] equivale a que siempre que α es verdadera en un modelo deT sucede que β tambien lo es.

Teorema 11.13 (TU) Si T es una teorıa consistente sobre un lenguaje for-mal L, los filtros del algebra BT se corresponden biunıvocamente con las teorıasconsistentes que contienen a T . La correspondencia viene dada por

F 7→ TF = α ∈ Sent(L) | [α] ∈ F, T ′ 7→ FT ′ = [α] ∈ BT | α ∈ T ′.

Demostracion: Observemos que TF es una teorıa, pues si TF φ entoncesexiste ∆ ⊂ TF finito tal que ∆ φ, luego, si ∆ = δ1, . . . , δn, tenemos que[δ1 ∧ · · · ∧ δn] ∈ F y [δ1 ∧ · · · ∧ δn] ≤ [φ], luego [φ] ∈ F , luego φ ∈ TF .

Ademas TF es finitamente consistente, pues si α1, . . . , αn ∈ TF , entonces[α1 ∧ · · · ∧ αn] ∈ F , luego [α1 ∧ · · · ∧ αn] 6= O, luego la conjuncion tieneun modelo, que tambien sera un modelo de α1, . . . , αn. Por el teorema decompacidad TF es consistente.

El resto del teorema es inmediato.

En particular, los ultrafiltros de BT (es decir, los puntos del espacio de StoneS(BT )) se corresponden con las teorıas (consistentes) completas que contienena T o, equivalentemente, a las teorıas de la forma T (M), donde M es un modelode T .

Si Γ es un conjunto de sentencias finitamente consistentes, entonces el con-junto X = [α] ∈ BT | α ∈ Γ tiene propiedad de la interseccion finita, luegogenera un filtro F que se corresponde con la teorıa axiomatizada por Γ.

Ordenes totales Sabemos que AE equivale a que todo conjunto puede serbien ordenado. Con TU podemos demostrar que todo conjunto puede ser total-mente ordenado. Podemos probar un poco mas:

Teorema 11.14 (TU) Todo orden parcial en un conjunto X puede extendersehasta un orden total.

Page 375: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.2. Teorıas formales 365

Demostracion: Sea ≤ el orden parcial dado en X . Consideremos unlenguaje formal L que tenga como constantes a los elementos de X y ademasun relator diadico . Sea Γ el conjunto formado por las sentencias siguientes(donde p, q, r son constantes cualesquiera):

a) p p,

b) p q ∧ q ≤ p→ p = q,

c) p q ∧ q r → p r,

d) p q ∨ q p,

e) p q si p ≤ q.

Si ∆ es un subconjunto finito de Γ, sea X0 ⊂ X el conjunto (finito) detodas las constantes que aparecen en alguna sentencia de ∆. Entonces X0 esun conjunto finito parcialmente ordenado por ≤, y es facil ver que ≤ puedeextenderse a un orden total en X0 (por ejemplo, como la relacion < esta bienfundada, podemos considerar su rango y definir x ≤∗ y ↔ rang(x) ≤ rang(y)).Con tal extension, X0 se convierte en un modelo de ∆, luego Γ es finitamenteconsistente y, por lo tanto, consistente. Si M es un modelo de Γ, entonces larelacion en X dada por

p ≤∗ q ↔M p q

es un orden total en X que extiende al orden dado ≤.

Como consecuencia inmediata:

Teorema 11.15 (TU) Toda familia de conjuntos finitos tiene una funcion deeleccion.

Demostracion: Basta considerar un orden total ≤ en⋃X , de modo que

cada x ∈ X esta totalmente ordenado (luego bien ordenado, al ser finito) por larestriccion de ≤, luego si no es vacıo podemos escoger en el su mınimo elemento.

Observemos que el teorema anterior es un caso particular de 11.11.

Modelos infinitos Una teorıa formal puede tener unicamente modelos finitos.Por ejemplo, si una teorıa consistente contiene entre sus sentencias a

uvwxyz∧

s(s = u ∨ s = u ∨ s = v ∨ s = x ∨ s = y ∨ s = z),

entonces todos sus modelos tendran a lo sumo 6 elementos. Si exigimos ademasque u, v, w, x, y, z sean distintos dos a dos, podemos exigir que todos los modelostengan exactamente 6 elementos. Ahora bien, el teorema de compacidad implicaque ninguna teorıa puede garantizar que todos sus modelos sean finitos sinimponer una cota concreta (finita) al cardinal de dichos modelos:

Page 376: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

366 Capıtulo 11. Elementos de teorıa de modelos

Teorema 11.16 (TU)10 Si una teorıa T tiene modelos finitos de cardinal ar-bitrariamente grande, entonces tiene modelos infinitos.

Demostracion: Sea L el lenguaje de T y sea L′ el lenguaje que resulta de

anadir a L un conjunto numerable de constantes cnn∈ω. Sea Γ el conjuntode sentencias de L′ formado por las sentencias de T y las de la forma cm 6= cn,para todo m 6= n.

Entonces Γ es finitamente consistente, pues si ∆ es un subconjunto finitode Γ, sea k el numero de constantes cn que aparecen en las sentencias de ∆.Por hipotesis, T tiene un modelo M de cardinal mayor que k, y dicho modeloM se convierte en un modelo de ∆ sin mas que interpretar las k constantes cnque aparecen en las sentencias de ∆ como k elementos distintos de M y el restode ellas como cualquier elemento prefijado de M .

Por el teorema de compacidad Γ tiene un modelo M , que en particular esun modelo de T en el que las constantes cn | n ∈ ω tienen interpretacionesdistintas dos a dos, luego M es infinito.

En la seccion siguiente incidiremos en este uso del teorema de compacidadpara construir modelos de cardinal grande de una teorıa dada.

11.3 Submodelos, inmersiones

Estudiamos ahora las aplicaciones que relacionan dos modelos de un mismolenguaje formal.

Definicion 11.17 Una inmersion i : N −→M entre dos modelos de un mismolenguaje formal L es una aplicacion que verifica las propiedades siguientes:

a) Para toda constante c de L se cumple que i(N(c)) = M(c).

b) Para todo relator n-adico R de L se cumple que∧

a1 . . . an ∈ N(N(R)(a1, . . . , an) ↔M(R)(i(a1), . . . , i(an))).

c) Para todo funtor n-adico f de L se cumple que∧

a1 . . . an ∈ N(i(N(f)(a1, . . . , an)) = M(f)(i(a1), . . . , i(an))).

Observemos que la propiedad b) aplicada al igualador implica que toda in-mersion es inyectiva. Una inmersion biyectiva es un isomorfismo de modelos.Por ejemplo, una inmersion entre dos anillos unitarios (vistos como modelosdel lenguaje de la teorıa de anillos) no es mas que un monomorfismo de anillosunitarios en el sentido algebraico usual.

Diremos que un modelo N es un submodelo de un modelo M del mismolenguaje formal si N ⊂M y la inclusion es una inmersion.

Supongamos que M es un modelo de un lenguaje L y que N ⊂ M es unsubconjunto de M con las propiedades siguientes:

10Si el lenguaje de la teorıa es numerable, este teorema no requiere TU, pues podemos usarla version 11.6 del teorema de compacidad.

Page 377: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.3. Submodelos, inmersiones 367

a) M(c) ∈ N para toda constante c de L.

b) M(f)|Nn : Nn −→ N , para todo funtor n-adico f de L.

Entonces N admite una unica estructura de submodelo de M . De hecho,esta es una definicion alternativa de submodelo.

Por ejemplo, los submodelos de un anillo unitario (visto como modelo dellenguaje de la teorıa de anillos) son simplemente los subanillos unitarios (esdecir, con la misma unidad) en el sentido algebraico usual.

De las definiciones se sigue inmediatamente que la imagen de una inmersiones un submodelo y que, equivalentemente, una inmersion entre dos modelos esun isomorfismo de uno en un submodelo del otro.

Teorema 11.18 Si i : N −→ M es una inmersion entre dos modelos de unmismo lenguaje formal L, t(x1, . . . , xn) es un termino de L y a1, . . . an ∈ N ,entonces

i(N(t)[a1, . . . , an]) = M(t)[i(a1), . . . , i(an)].

Demostracion: Por induccion sobre la longitud de t. Si t = xi es unavariable tenemos simplemente que

i(N(xi)[a1, . . . , an]) = i(ai) = M(xi)[i(a1), . . . , i(an)].

Si t = c es una constante queda

i(N(c)[a1, . . . , an]) = i(N(c)) = M(c) = M(c)[i(a1), . . . , i(an)].

Si t = ft1 · · · tm y el teorema es cierto para t1, . . . , tm entonces

i(N(t)[a1, . . . , an]) = i(N(f)(N(t1)[a1, . . . , an], . . . , N(tm)[a1, . . . , an]))

= M(f)(i(N(t1)[a1, . . . , an]), . . . , i(N(tm)[a1, . . . , an])

= M(f)(M(t1)[i(a1), . . . , i(an)], . . . ,M(tm)[i(a1), . . . , i(an)])

= M(t)[i(a1), . . . , i(an)].

Con esto podemos probar que dos modelos isomorfos satisfacen las mismassentencias:

Teorema 11.19 Si i : N −→ M es un isomorfismo entre dos modelos de unmismo lenguaje formal L, φ(x1, . . . , xn) es una formula de L y a1, . . . , an ∈ N ,entonces

N φ[a1, . . . , an] syss M φ[i(a1), . . . , i(an)].

Page 378: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

368 Capıtulo 11. Elementos de teorıa de modelos

Demostracion: Por induccion sobre la longitud de φ. Si φ = Rt1 · · · tm,usamos el teorema anterior:

N φ[a1, . . . , an] syss N(R)(N(t1)[a1, . . . , an], . . . , N(tm)[a1, . . . , an])

syss M(R)(i(N(t1)[a1, . . . , an]), . . . , i(N(tm)[a1, . . . , an]))

syss M(R)(M(t1)[i(a1), . . . , i(an)]), . . . , N(tm)[i(a1), . . . , i(an)])

syss M φ[i(a1), . . . , i(an)].

Si φ ≡ ¬α, entonces, aplicando a α la hipotesis de induccion:

N φ[a1, . . . , an] syss ¬N α[a1, . . . , an] syss ¬M α[i(a1), . . . , i(an)]

syss M φ[i(a1), . . . , i(an)].

El caso φ = α → β es similar. Supongamos por ultimo que φ =∧

xα.Entonces

N φ[a1, . . . , an] syss∧

a ∈ N N α[a, a1, . . . , an]

syss∧

a ∈ N M α[i(a), i(a1), . . . , i(an)]

syss∧

a ∈M M α[a, i(a1), . . . , i(an)] syss M φ[i(a1), . . . , i(an)],

donde hemos usado que, como i es biyectiva, cuando a recorre N se cumple quei(a) recurre M .

Definicion 11.20 Diremos que dos modelos M y N de un mismo lenguajeformal L son elementalmente equivalentes si satisfacen las mismas sentencias,es decir, si para toda sentencia φ de L se cumple que

M φ↔ N φ.

Usaremos la notacion M ∼= N para indicar que M y N son isomorfos (esdecir, que existe un isomorfismo entre ellos), y la notacion M ≡ N para indicarque son elementalmente equivalentes. Acabamos de probar que si N ∼= Mentonces N ≡M . Pronto veremos ejemplos de que el recıproco no es cierto.

El teorema anterior no es valido para inmersiones arbitrarias, pero hay in-mersiones que lo cumplen sin ser isomorfismos:

Definicion 11.21 Una inmersion elemental i : N −→ M entre dos modelosde un mismo lenguaje formal L es una aplicacion tal que para toda formulaφ(x1, . . . , xn) de L se cumple

a1 · · · an ∈ N(N φ[a1, . . . , an] ↔ M φ[i(a1), . . . , i(an)]).

Page 379: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.3. Submodelos, inmersiones 369

Observemos que esto implica que i es una inmersion. En efecto, para de-mostrar que conserva a una constante c basta considerar la formula x = c, paraprobar que conserva un relator n-adico R basta considerar la formula Rx1 · · ·xny para probar que conserva un funtor n-adico f basta considerar la formulax = fx1 · · ·xn.

Diremos que N es un submodelo elemental de un modelo M (y lo represen-taremos por N ≺ M) si N ⊂ M y la inclusion i : N −→ M es una inmersionelemental. A su vez esto equivale a que para toda formula φ(x1, . . . , xn) de L

se cumple

a1 · · · an ∈ N(N φ[a1, . . . , an] ↔M φ[a1, . . . , an]).

En particular, N es un submodelo de N .

Notemos que si existe una inmersion elemental i : N −→M o, en particular,si N ≺M , entonces N ≡M .

Ejemplo Consideremos a R como modelo del lenguaje de la teorıa de anillos.Entonces Q es un submodelo de R, pero no es un submodelo elemental. Porejemplo, si φ(x) =

y x = y · y entonces R φ[2] pero Q ¬φ[2].

El teorema siguiente proporciona una caracterizacion muy importante de lossubmodelos elementales. Su interes radica en que solo involucra la nocion desatisfaccion en un modelo en vez de en dos.

Teorema 11.22 Un subconjunto N ⊂M de un modelo M de un lenguaje for-mal L es un submodelo elemental si y solo si para toda formula φ(x, x1, . . . , xn)de L se cumple

a1 · · · an ∈ N(∨

a ∈MM φ[a, a1, . . . , an] →∨

a ∈ NM φ[a, a1, . . . , an]).

Demostracion: Veamos en primer lugar que N es un submodelo. Si ces una constante de L entonces

a ∈ MM (x = c)[a], luego por hipotesis∨

a ∈ NM (x = c)[a], lo que equivale a que M(c) ∈ N .Similarmente, si f es un funtor n-adico de L y a1, . . . , an ∈ N , entonces

es claro que∨

a ∈ MM x = fx1 · · ·xn[a, a1, . . . , an], luego por hipotesistambien se cumple

a ∈ NM x = fx1 · · ·xn[a, a1, . . . , an], lo cual equivale aque M(f)(a1, . . . , an) ∈ N . Esto prueba que N es ciertamente un submodelode M , luego la inclusion i : N −→M es una inmersion.

Ahora probamos que para toda formula φ(x1, . . . , xn) de L y todos losa1, . . . , an ∈ N se cumple

N φ[a1, . . . , an] ↔M φ[a1, . . . , an].

Lo demostramos por induccion sobre φ. Los primeros casos son identicos alos de la demostracion de 11.19 (teniendo en cuenta que aquı podemos omitirla inmersion i, porque es la inclusion). Solo hay que considerar el caso en que

Page 380: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

370 Capıtulo 11. Elementos de teorıa de modelos

φ =∧

xα y que el teorema es valido para α. Por los casos precedentes tambienvale para ¬α. Por consiguiente,

N ∧

xα[a1, . . . , an] ↔∧

a ∈ NN α[a, a1, . . . , an]

↔ ¬∨

a ∈ NN ¬α[a, a1, . . . , an] ↔ ¬∨

a ∈ NM ¬α[a, a1, . . . , an]

↔ ¬∨

a ∈MM ¬α[a, a1, . . . , an] ↔ M ∧

xα[a1, . . . , an].

El recıproco es muy simple: si N es un submodelo elemental,

a ∈M M φ[a, a1, . . . , an] →M ∨

xφ(x)[a1, . . . , an]

→ N ∨

xφ(x)[a1, . . . , an] →∨

a ∈ N N φ[a, a1, . . . , an]

→∨

a ∈ N M φ[a, a1, . . . , an].

De aquı podemos obtener una tecnica para construir submodelos elementales.Para ello necesitamos algunas definiciones:

Definicion 11.23 SeaM un modelo de un lenguaje formal L y fijemos un ordentotal en el conjunto de las variables de L. Para cada formula φ(x0, . . . , xn) conn + 1 variables libres (ordenadas de modo que x0 < x1 < · · · < xn) diremosque una funcion hφ : Mn −→ M es una funcion de Skolem para φ si cuandoa1, . . . , an ∈M y

a ∈MM φ[a, a1, . . . , an] entonces

M φ[hφ(a1, . . . , an), a1, . . . , an].

Claramente (suponiendo AE) toda formula φ con al menos dos variableslibres tiene una funcion de Skolem, que en general no sera unica. Seleccionamosuna funcion de Skolem hφ para cada formula de L con al menos dos variableslibres.

Si X ⊂ M definimos N0(X) = X y Nk+1(X) = Nk(X) ∪⋃

φ

hφ[Nk(X)],

donde hay que entender que si la formula φ tiene n+ 1 variables libres entonceshφ[Nk(X)] es en realidad hφ[Nk(X)n]. El nucleo de Skolem de X en M (respectoa las funciones de Skolem escogidas) es

N(X) =⋃

k∈ω

Nk(X).

Teorema 11.24 (AE) Si M es un modelo de un lenguaje formal L y X ⊂Mes un conjunto no vacıo, entonces X ⊂ N(X) ≺M y |N(X)| = |X | · |L| (donde|L| es el cardinal del conjunto de signos de L).

Demostracion: Es claro que el cardinal del conjunto de formulas de L (conal menos dos variables libres) es exactamente |L|. Por lo tanto hay |L| funcionesde Skolem. De aquı se sigue facilmente que |N(X)| = |X |·|L|. Solo queda probar

Page 381: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.3. Submodelos, inmersiones 371

que N(X) ≺M . Usaremos el teorema anterior. Para ello tomamos una formulaφ(x, x1, . . . , xn) junto con a1, . . . , an ∈ N(X) y suponemos que

a ∈MM φ[a, a1, . . . , an].

No perdemos generalidad si suponemos que n ≥ 1, pues en caso contrariocambiamos φ(x) por φ(x) ∧ x1 = x1, y tomamos cualquier a1 ∈ N(X), ası comoque las variables estan ordenadas respecto del orden prefijado en el conjunto detodas ellas). Existira un k ∈ ω tal que a1, . . . , an ∈ Nk(X). Por lo tantoa = hφ(a1, . . . , an) ∈ N(X) cumple a ∈ N(X) ∧M φ[a, a1, . . . , an].

En particular tenemos:

Teorema 11.25 (Teorema descendente de Lowenheim-Skolem) (AE)Si M es un modelo de un lenguaje formal L y κ es un cardinal que cumple|L| ≤ κ ≤ |M |, entonces M tiene un submodelo elemental de cardinal κ.

(Basta tomar N(X), donde X ⊂M tiene cardinal κ.)

Combinando esto con el teorema de compacidad obtenemos:

Teorema 11.26 (Teorema ascendente de Lowenheim-Skolem) (AE)SiM es un modelo infinito de un lenguaje formal L y κ ≥ |M ||L| es un cardinal,entonces existe una inmersion elemental de M en un modelo de cardinal κ.

Demostracion: Sea L′ un lenguaje que tenga una nueva constante ca paracada a ∈M , sea M ′ el modelo M extendido a modelo de L′ interpretando cadaconstante ca como a. Sea T ′ = T (M ′). Sea L′′ el lenguaje que resulta de anadira L

′ un conjunto de constantes dαα<κ. sea Γ′′ el conjunto formado por lassentencias de T ′ mas todas las de la forma dα 6= dβ , para todo par de ordinalesα 6= β.

Entonces Γ′′ es finitamente consistente, pues si ∆ es un subconjunto finitode Γ′′ un modelo de ∆ se obtiene extendiendo M ′ de modo que las constantes dαque aparezcan en ∆ se interpreten como objetos distintos en M ′, y las que noaparezcan en ∆ como un mismo objeto cualquiera de M .

Por el teorema de compacidad existe un modelo M ′′ de Γ′′, en el cual lasconstantes dα tienen interpretaciones distintas, luego |M ′′| ≥ κ. En particular,M ′′ es un modelo de T ′.

Sea i : M −→M ′′ la aplicacion dada por i(a) = M ′′(ca). Claramente es unainmersion elemental, pues

M φ[a1, . . . , an] →M ′ φ(ca1 , . . . , can) → M ′′ φ(ca1 , . . . , can

)

→M ′′ φ[i(a1), . . . , i(an)].

Sea X ⊂ M ′′ cualquier conjunto de cardinal κ y sea N = N(i[M ] ∪X) M ′′.Entonces |N | = κ y se cumple que i : M −→ N . Ademas es claro que i tambienes una inmersion elemental en N , pues

M φ[a1, . . . , an] →M ′′ φ[i(a1), . . . , i(an)] → N φ[i(a1), . . . , i(an)].

Page 382: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

372 Capıtulo 11. Elementos de teorıa de modelos

Combinando los dos teoremas anteriores vemos que si una teorıa tiene unmodelo infinito, entonces tiene modelos de todos los cardinales mayores o igualesque el cardinal de su lenguaje formal.

La definicion del nucleo de Skolem no es constructiva por la eleccion arbitra-ria de las funciones de Skolem. El teorema siguiente nos da una representacionde los elementos de un nucleo de Skolem que compensa en parte este inconve-niente. Primero necesitamos una definicion.

Definicion 11.27 Sea M un modelo de un lenguaje formal L. Supongamosescogidas unas funciones de Skolem para M . Sea L el lenguaje formal queresulta de anadirle a L un funtor Fφ por cada funcion de Skolem hφ. Es claroque M se convierte en un modelo de L sin mas que establecer M(Fφ) = hφ.Los terminos de L construidos unicamente con variables y funtores Fφ se llamanterminos de Skolem.

Teorema 11.28 SeaM un modelo de un lenguaje formal L y X un subconjuntono vacıo. Entonces

N(X) = M(t)[a1, . . . , an] | t es un termino de Skolem ∧ a1, . . . , an ∈ X.

Demostracion: Veamos que M(t)[a1, . . . , an] ∈ N(X) por induccion sobrela longitud de t. Si t = xi es una variable entonces M(t)[a1, . . . , an] = ai ∈ X .Si t = Fφt1 · · · tm, donde cada ti es un termino de Skolem, entonces

M(t)[a1, . . . , an] = hφ(M(t1)[a1, . . . , an], . . . ,M(tm)[a1, . . . , an]).

Por hipotesis de induccion cada M(ti)[a1, . . . , an] esta en N(X), luego to-dos ellos estan en un cierto Nk(X), para un numero natural k suficientementegrande, y entonces es claro que M(t)[a1, . . . , an] ∈ Nk+1(X).

Recıprocamente, vamos a probar por induccion sobre k que cada Nk(X) estacontenido en el conjunto del enunciado. Para k = 0 es trivial. Si vale para k,tomamos a ∈ Nk+1(X) y distinguimos dos casos: si a ∈ Nk(X) concluimos porhipotesis de induccion; en caso contrario a ∈ hφ[Nk(X)], para cierta funcion deSkolem hφ, es decir, existen b1, . . . , bm ∈ Nk(X) tales que a = hφ(b1, . . . , bm).Por hipotesis de induccion bi = M(ti)[a1, . . . , an], para ciertos a1, . . . , an ∈ X yciertos terminos de Skolem ti. Por consiguiente

a = M(Fφ)(M(t1)[a1, . . . , an], . . . ,M(tm)[a1, . . . , an])

= M(Fφt1 · · · tm)[a1, . . . , an],

luego se cumple la conclusion con el termino de Skolem t = Fφt1 · · · tm.

Como aplicacion demostramos lo siguiente:

Teorema 11.29 SeaM un modelo de un lenguaje formal L y X un subconjuntono vacıo. Sea N = N(X). Entonces las restricciones a N de las funciones deSkolem de M son funciones de Skolem para N y el nucleo de Skolem de X enN respecto a estas restricciones es N .

Page 383: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.4. Ultraproductos 373

Demostracion: Si φ(x0, x1, . . . , xn) es una formula de L (con una orde-nacion de sus variables), es claro que hφ|Nn : Nn −→ N . Como N ≺ M , sia1, . . . , an ∈ N y

a ∈ NN φ[a, a1, . . . , an],

tambien∨

a ∈MM φ[a, a1, . . . , an],

luegoM φ[hφ(a1, . . . , an), a1, . . . , an],

y de nuevo porque N ≺ N concluimos que

N φ[hφ(a1, . . . , an), a1, . . . , an].

Esto prueba que hφ es una funcion de Skolem para φ en N . Por el teoremaanterior, si a ∈ N entonces a = M(t)[a1, . . . , an], donde t es un termino deSkolem y a1, . . . , an ∈ X . Ahora bien, es claro que N es un submodelo deM (no necesariamente elemental) cuando consideramos a ambos como modelosde L, luego por el teorema 11.18 tenemos que a = N(t)[a1, . . . , an], luego elteorema anterior nos da que a esta en el nucleo de Skolem de X en N .

11.4 Ultraproductos

Presentamos ahora otra tecnica de construccion de modelos que proporcionauna demostracion mas natural del teorema de compacidad y, sobre todo, unadescripcion mas util y manejable de los modelos construidos.

Definicion 11.30 Sea Mii∈I una familia de modelos de un lenguaje formalL y sea U un ultrafiltro en I. Definimos en

i∈I

Mi la relacion dada por

f =U g ↔ i ∈ I | f(i) = g(i) ∈ U.

Se comprueba sin dificultad que =U es una relacion de equivalencia, por loque podemos considerar el conjunto cociente, al que llamaremos ultraproductode la familia dada, y lo representaremos por

i∈I

UMi.

Definimos en el ultraproducto M la siguiente estructura de modelo de L:

• Si c es una constante de L, definimos M(c) = [c], donde c ∈∏

i∈I

Mi es lafuncion dada por c(i) = Mi(c).

• Si R es un relator n-adico de L, entonces

M(R)([f1], . . . , [fn]) ↔ i ∈ I |Mi(R)(f1(i), . . . , fn(i)) ∈ U.

• Si F es un funtor n-adico de L, entonces M(F )([f1], . . . , [fn]) = [f ], donde

f(i) = Mi(F )(f1(i), . . . , fn(i)).

Se comprueba sin dificultad que estas relaciones y funciones estan bien defi-nidas, ası como que el igualador se interpreta como la igualdad.

Page 384: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

374 Capıtulo 11. Elementos de teorıa de modelos

Nota Observemos que si el ultrafiltro U es principal, es decir, si

U = A ∈ PI | i0 ∈ A,

entonces [f ] = [g] ↔ f(i0) = g(i0), por lo que la aplicacion φ :∏

i∈I

UMi −→ Mi0

dada por φ([f ]) = f(i0) es biyectiva, y claramente es un isomorfismo de modelos.Por lo tanto en este caso la construccion no aporta nada.

Teorema 11.31 (Teorema fundamental de los ultraproductos) (AE)Consideremos una familia Mii∈I de modelos de un lenguaje formal L y sea Uun ultrafiltro en I. Si φ(x1, . . . , xn) ∈ Form(L) y f1, . . . , fn ∈ ∏

i∈I

Mi, entonces

i∈I

UMi φ[[f1], . . . , [fn]] ↔ i ∈ I |Mi φ[f1(i), . . . , fn(i)] ∈ U.

En particular, si φ es una sentencia,

i∈I

UMi φ↔ i ∈ I |Mi φ ∈ U.

Demostracion: Sea t(x1, . . . , xn) un termino de L y f1, . . . , fn ∈∏

i∈I

Mi.Veamos que

(∏

i∈I

UMi

)

(t)[[f1], . . . , [fn]] = [g],

donde g(i) = Mi(t)[f1(i), . . . , fn(i)].

Lo probamos por induccion sobre la longitud de t. Si t(x1, . . . , xn) = xi,entonces el miembro izquierdo es [fi], y g = fi, luego se cumple la igualdad.

Si t(x1, . . . , xn) = c, donde c es una constante de L, entonces el miembroizquierdo es [c] y g = c, luego se cumple la igualdad.

Si t(x1, . . . , xn) = Ft1(x1, . . . , xn) · · · tr(x1, . . . , xn), donde F es un funtorr-adico de L, entonces

(∏

i∈I

UMi

)

(t)[[f1], . . . , [fn]]

=(∏

i∈I

UMi

)

(F )((

i∈I

UMi

)

(t1)[[f1], . . . , [fn]], . . . ,(∏

i∈I

UMi

)

(tr)[[f1], . . . , [fn]])

=(∏

i∈I

UMi

)

(F )([g1], . . . , [gr]) = [g],

donde gj(i) = Mi(tj)[f1(i), . . . , fn(i)] (por hipotesis de induccion) y

g(i) = Mi(F )(g1(i), . . . , gr(i)) = Mi(t)[f1(i), . . . , fn(i)].

Veamos ahora el teorema por induccion sobre la longitud de φ.

Page 385: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.4. Ultraproductos 375

Si φ(x1, . . . , xn) = Rt1(x1, . . . , xn) · · · tr(x1, . . . , xn), donde R es un relatorr-adico de L, entonces

i∈I

UMi φ[[f1], . . . , [fn]]

↔(∏

i∈I

UMi

)

(R)((

i∈I

UMi

)

(t1)[[f1], . . . , [fn]], . . . ,(∏

i∈I

UMi

)

(tr)[[f1], . . . , [fn]])

↔(∏

i∈I

UMi

)

(R)([g1], . . . , [gr]),

donde, segun hemos probado, gj(i) = Mi(tj)[f1(i), . . . , fn(i)]. Esto equivale a

i ∈ I |Mi(R)[g1(i), . . . , gr(i)] ∈ U ↔ i ∈ I |Mi φ[f1(i), . . . , fn(i)] ∈ U.

Si φ(x1, . . . , xn) = ¬ψ(x1, . . . , xn) y el teorema vale para ψ, entonces

i∈I

UMi φ[[f1], . . . , [fn]] ↔ ¬∏

i∈I

UMi ψ[[f1], . . . , [fn]]

↔ i ∈ I |Mi ψ[f1(i), . . . , fn(i)] /∈ U

↔ i ∈ I |Mi φ[f1(i), . . . , fn(i)] ∈ U.

Si φ(x1, . . . , xn) = ψ(x1, . . . , xn) → χ(x1, . . . , xn) y el teorema vale para ψy χ, probaremos la coimplicacion de las negaciones, es decir, que

¸

i∈I

UMi (ψ → χ)[[f1], . . . , [fn]]

↔ i ∈ I |Mi (ψ → χ)[f1(i), . . . , fn(i)] /∈ U

En efecto,¸

i∈I

UMi (ψ → χ)[[f1], . . . , [fn]]

↔ ∏

i∈I

UMi ψ[[f1], . . . , [fn]] ∧ ¬∏

i∈I

UMi χ[[f1], . . . , [fn]]

↔ i ∈ I |Mi ψ[f1(i), . . . , fn(i)] ∈ U

∧ i ∈ I |Mi ¬χ[f1(i), . . . , fn(i)] ∈ U

↔ i ∈ I |Mi ψ[f1(i), . . . , fn(i)] ∩ i ∈ I |Mi ¬χ[f1(i), . . . , fn(i)] ∈ U

↔ i ∈ I | ¬Mi (ψ → χ)[f1(i), . . . , fn(i)] ∈ U

↔ i ∈ I |Mi (ψ → χ)[f1(i), . . . , fn(i)] /∈ U.

Si φ(x1, . . . , xn) =∧

xψ(x, x1, . . . , xn) y el teorema vale para ψ, probaremostambien la coimplicacion de las negaciones:

¸

i∈I

UMi ∧

xψ[[f1], . . . , [fn]]

↔ i ∈ I | Mi ∧

xψ[f1(i), . . . , fn(i)] /∈ U.

Page 386: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

376 Capıtulo 11. Elementos de teorıa de modelos

En efecto:

¸

i∈I

UMi ∧

xψ[[f1], . . . , [fn]] ↔∨

f ∈ ∏

i∈I

Mi¸

i∈I

UMi ψ[[f ], [f1], . . . , [fn]]

↔∨

f ∈ ∏

i∈I

Mi i ∈ I |Mi ψ[f(i), f1(i), . . . , fn(i)] /∈ U

↔∨

f ∈ ∏

i∈I

Mi i ∈ I |Mi ¬ψ[f(i), f1(i), . . . , fn(i)] ∈ U. (11.1)

Basta probar que esto equivale a

i ∈ I |Mi ∨

x¬ψ[f1(i), . . . , fn(i)] ∈ U, (11.2)

pues claramente esto equivale a i ∈ I |Mi ∧

xψ[f1(i), . . . , fn(i)] /∈ U .

Si f cumple (11.1), es claro que el conjunto de (11.1) esta contenido en elconjunto de (11.2). Como el primero esta en U el segundo tambien. Recıproca-mente, si se cumple (11.2), para cada i en el conjunto de (11.2) sea11 f(i) ∈Mi

tal que Mi ¬ψ[f(i), f1(i), . . . , fn(i)] y para los demas i ∈ I tomamos f(i) ∈Mi

arbitrario. Es claro que f cumple (11.1).

Hay un caso particular del teorema anterior que tiene especial interes:

Definicion 11.32 Si M es un modelo de un lenguaje formal L, I es un con-junto y U es un ultrafiltro en I, se define la ultrapotencia UltU (M) como elultraproducto

i∈I

UM , que es tambien12 un modelo de L.

Definimos ademas jU : M −→ UltU (M) mediante jU (a) = [ca], donde ca esla funcion constante dada por

i ∈ I ca(i) = a.

Del teorema anterior se sigue inmediatamente:

Teorema 11.33 Sea M un modelo (que admita un buen orden) de un lenguajeformal L y U un ultrafiltro en un conjunto I. Entonces jU : M −→ UltU (M)es una inmersion elemental.

Demostracion: Si φ(x1, . . . , xn) ∈ Form(L) y a1, . . . , an ∈M , entonces

M φ[a1, . . . , an] ↔ i ∈ I |M φ[ca1(i), . . . , can(i)] ∈ U

↔ UltU (M) φ[jU (a1), . . . , jU (an)].

Como aplicacion del teorema de los ultraproductos demostramos el teoremade compacidad:

11Este es el unico punto de la prueba donde se usa AE.12El teorema fundamental restringido a ultrapotencias se cumple sin suponer AE si supo-

nemos en su lugar que M admite un buen orden, pues esto es todo lo que requiere en estecaso la construccion de la funcion f en la parte final de la prueba.

Page 387: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.4. Ultraproductos 377

Teorema 11.34 (Teorema de compacidad) (AE)13 Un conjunto Γ de sen-tencias de un lenguaje formal L es consistente si y solo si es finitamente con-sistente.

Demostracion: Sea I el conjunto de todos los subconjuntos finitos de Γ.Para cada ∆ ∈ I sea M∆ un modelo de L tal que M∆ ∆ y sea

I∆ = E ∈ I | ME ∆.

Sea S = I∆ | ∆ ∈ I. Claramente S cumple la propiedad de la interseccionfinita, pues si ∆1, . . . ,∆n ∈ I y ∆ = ∆1 ∪ · · · ∪ ∆n, entonces

I∆ ⊂ I∆1 ∩ · · · ∩ I∆n,

y ademas ∆ ∈ I∆ 6= ∅. Por consiguiente S genera un filtro en I, que a su vezesta contenido en un ultrafiltro U . Si φ ∈ Γ, entonces

∆ ∈ I |M∆ φ = Iφ ∈ S ⊂ U,

luego por el teorema fundamental∏

∆∈I

UM∆ φ, es decir,∏

∆∈I

UM∆ Γ.

Admitiendo que TU no implica AE (esto puede ser probado), el teoremasiguiente tiene como consecuencia que TU no implica el teorema fundamentalsobre ultraproductos, ni siquiera su restriccion a ultrapotencias.

Teorema 11.35 (TU) El axioma de eleccion es equivalente a que, para todomodelo M de un lenguaje formal, UltU (M) es elementalmente equivalente a M .

Demostracion: Sea X un conjunto y vamos a probar que tiene una funcionde eleccion. Si llamamos X ′ = a× a | a ∈ X, basta encontrar una funcionde eleccion en X ′. Alternativamente, podemos suponer que los elementos de Xson disjuntos dos a dos y disjuntos de X . Tampoco perdemos generalidad sisuponemos que todos los elementos de X son no vacıos. Sea M = X ∪⋃

X .

Consideramos un lenguaje formal L con un relator diadico R y dotamos aM de estructura de modelo de L interpretando R como la relacion R tal queaRx se cumple cuando a ∈ x ∧ x ∈ X o bien a = x ∈ ⋃

X .

Supongamos que X no admite una funcion de eleccion y sea I el conjuntode los Y ⊂ X que sı que admiten una funcion de eleccion. Obviamente I es unideal en X (aquı usamos que X no admite una funcion de eleccion). Sea F = I ′

el filtro dual y sea U un ultrafiltro que lo contenga.

Por hipotesis UltU (M) es elementalmente equivalente a M . Claramente

M ∧

x∨

a aRx,

13Marcamos la prueba con AE porque esta prueba usa AE, pero ya hemos visto que puededemostrarse suponiendo solo TU.

Page 388: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

378 Capıtulo 11. Elementos de teorıa de modelos

luego lo mismo vale en UltU (M). Sea d : X −→ X la identidad y sea conside-remos la clase [d] ∈ UltU (M). Tenemos que existe una f : X −→ M tal que[f ] R [d], es decir, que

a ∈ X | f(a) R d(a) ∈ U

o, lo que es lo mismo,

A = a ∈ X | f(a) ∈ a ∈ U,

pero A tiene una funcion de eleccion, luego A ∈ I ⊂ U ′, contradiccion.

Modelos no estandar de la aritmetica de Peano La aritmetica de Peano(de primer orden) es la teorıa formal AP construida sobre el lenguaje Lap cuyossignos eventuales son una constante 0, un funtor monadico ′ y dos funtoresdiadicos + y ·, y cuyos axiomas son las sentencias:

(AP1)∧

x x′ 6= 0(AP2)

xy(x′ = y′ → x = y)(AP3)

x x+ 0 = x(AP4)

xy(x + y′ = (x + y)′)(AP5)

x x · 0 = 0(AP6)

xy(xy′ = xy + x)(AP7)

x1 · · ·xn(φ(0) ∧∧

x(φ(x) → φ(x′)) →∧

xφ(x)),

donde φ es cualquier formula con variables libres x1, . . . , xn.

Es inmediato que el conjunto N de los numeros naturales es un modelo deAP cuando la constante 0 se interpreta como el numero natural cero, el funtor ′

se interpreta como la funcion n 7→ n+1 y los funtores + y · se interpretan comola suma y el producto de numeros naturales.

Para cada n ∈ N, podemos definir recurrentemente el termino 0(n) de Lap

mediante 0(0) = 0 y 0(n+1) = (0(n))′, de modo que

0(0) = 0, 0(1) = 0′, 0(2) = 0′′, . . .

Es claro entonces que N(0(n)) = n. Un modelo M de AP se dice no estandarsi existe un c ∈M que no es de la forma M(0(n)), para ningun n ∈ N.

El teorema de compacidad implica la existencia de modelos no estandar deAP, pues basta extender Lap con una constante c y considerar el conjunto desentencias Γ = AP ∪ c 6= 0(n) | n ∈ N, que es finitamente consistente, puestodo subconjunto finito de Γ tiene por modelo a N sin mas que interpretar ccomo un numero natural suficientemente grande, y un modelo de Γ es un modelono estandar de AP.

Podemos construir un modelo no estandar (relativamente) explıcito de APmediante una ultrapotencia de N: si U es un ultrafiltro no principal en ω,entonces M = UltU (N) es un modelo no estandar de AP, pues un ejemplo de

Page 389: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

11.4. Ultraproductos 379

numero natural no estandar es [d], donde d : N −→ N es la identidad. En efecto,para cada n ∈ N tenemos que M(0(n)) = [cn], y como

i ∈ N | cn(i) 6= d(i) = N \ n ∈ U,

concluimos que M 0(n) 6= [d].

En AP podemos definir la formula x ≤ y =∨

z y = z + x, de modo que

N 0(m) ≤ 0(n) syss m ≤ n.

En la ultrapotencia M se cumple que M 0(n) ≤ [d] para todo n ∈ N, ya que

i ∈ N | N cn(i) ≤ d(i) = N \ n ∈ U.

Por lo tanto, en M se cumple que [d] es un numero natural infinitamente grande.(De hecho, no es difıcil probar que en cualquier modelo no estandar de AP losnumeros naturales no estandar son mayores que los numeros estandar.)

Analisis no estandar Similarmente, si fijamos un ultrafiltro U en N y de-finimos R∗ = UltU (R) (considerando a R como modelo de la teorıa de anillosordenados), obtenemos un cuerpo ordenado elementalmente equivalente a R quecontiene numeros naturales infinitamente grandes, pero tambien a sus inversos,que son numeros reales infinitamente pequenos, o infinitesimos, que se com-portan como los infinitesimos que manejaban los analistas de los siglos XVII yXVIII.

Mas precisamente, si identificamos a R con su imagen por la inmersion ele-mental jU : R −→ R∗, entonces R es un subcuerpo de R∗, y podemos definirun infinitesimo como un ǫ ∈ R∗ tal que |ǫ| < 1/n, para todo n ∈ N. Entonces,tenemos que en R∗ hay infinitesimos no nulos.

Page 390: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS
Page 391: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Bibliografıa

[1] Barwise, J. (editor), Handbook of Mathematical Logic, North Holland,Amsterdam, 1977.

[2] Devlin, K.J. Constructibility, Springer, Berlın (1984)

[3] Engelking, R, General Topology, Helderman, Berlın (1989)

[4] Galvin, F. Chain conditions and products, Fund. Math, 108, 1 (1980),33–48.

[5] Givant, S., Halmos, P., Introduction to Boolean algebras, Springer,(2009)

[6] Howard, P.E., lLos’ theorem and the Boolean prime ideal theorem implythe axiom of choice, Proc. Amer. Math. Soc. 49, 2 (1975).

[7] Jech, T.J. The Axiom of Choice, North Holand, Amsterdam, 1973.

[8] — Set Theory, Academic Press, New York, 1978.

[9] Kunen, K. Combinatorics, (en Barwise).

[10] — Set Theory. An Introduction to Independence Proofs, North Holland,Amsterdam, 1985.

[11] Pohlers, W. Proof Theory, The first step to impredicativity, Springer,Berlin (2009).

[12] Sikorski, R. Boolean Algebras. Springer Verlag, Berlin, 1969.

381

Page 392: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

Indice de Materias

abierta (aplicacion), 260abierto, 236abierto regular, 311acumulacion (punto de), 251adherente (punto), 249AEN, 90aislado (punto), 251alef (funcion), 106algebra

cociente, 328de Boole, 303

completa, 309de conjuntos, 306de Lindenbaum, 364de Suslin, 324degenerada, 305

altura, 281anillo, 28

cociente, 37ordenado, 30

arquimediano, 196anticadena, 264, 281, 320antisimetrica (relacion), 21aplicacion, 11arbol, 281

bien podado, 282completo, 286de Aronszajn, 285, 287de Kurepa, 300de Suslin, 289ramificado, 289

Aronszajn (arbol de), 285asimetrica (relacion), 21asociativa (propiedad), 27atomo, 319automorfismo, 307

Axiomade comprension, 4de eleccion, 88

de Godel, 150numerable, 90

de extensionalidad, 2de infinitud, 48de la union, 16de partes, 19de reemplazo, 15de regularidad, 85del conjunto vacıo, 6del par, 9

base, 238de entornos, 239de numeracion, 68

bet (funcion), 147bien fundada

clase, 40relacion, 75

bien ordenable (conjunto), 103bien podado (arbol), 282bola abierta, 239buen orden, 25Burali-Forti (antinomia de), 55

cadena, 281camino, 281Cantor (forma normal de), 70cardinal, 101, 103

de Mahlo, 166fuertemente inaccesible, 146lımite, 128

fuerte, 146regular, singular, 128sucesor, 128

382

Page 393: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

INDICE DE MATERIAS 383

cero-dimensional, 332cerrado, 249

en un ordinal, 151clase, 2

propia, 8clausura, 77, 249

transitiva, 77cociente (clase), 21cofinal (aplicacion), 124cofinalidad, 124compacto, 267

numerablemente, 271compatibilidad

en un arbol, 281en un c.p.o., 313

complecion, 213, 318complemento, 5completamente distributiva, 321completitud, 330

de un algebra, 320completo

conjunto, 354conjunto ordenado, 208

composicion, 13condicion de cadena, 320, 330

numerable, 264conexa

clase, 40relacion, 21

conjuntista (relacion), 76conjunto, 2

dual, 308conmutativa (propiedad), 27consecuencia logica, 353consistente, 354constante, 346continua (funcion), 254continuo, 223

funcion del, 136contradictorio, 354convergencia, 201, 248

de filtros, 335cota, 23creciente (funcion), 24cuadrado κ, 176cuasidisjunta (familia), 266

cubrimiento, 267, 269cuerpo, 29

metrico, 200

decreciente (funcion), 24degenerada (algebra), 305denso, 223

conjunto, 201, 251en sı mismo, 197

derivada (de una funcion normal),182

derivado (conjunto), 251designador, 351diamante ♦, 169diferencia, 5

simetrica, 326disjuntas (clases), 6distancia, 199

a un conjunto, 250dominio, 11dual (conjunto), 308

ED (elecciones dependientes), 86elementalmente equivalentes, 368entero (numero), 192entorno, 237epimorfismo

de algebras, 307de anillos, 34

epsilon (numero), 71equipotencia, 97espacio

compacto, 267de Hausdorff, 237metrico, 200topologico, 236

estacionario (conjunto), 157exponenciacion

de cardinales, 112de ordinales, 64

formula, 349Feferman-Schutte (ordinal de), 188filtro, 327

en un conjunto, 155finitamente consistente, 354finito (conjunto), 90

Page 394: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

384 INDICE DE MATERIAS

de Dedekind, 116frontera, 250fuertemente crıtico (ordinal), 187funcion, 11

de Skolem, 370normal, 56

funtor, 346

Hartogs (alef de), 111Hausdorff (formula de), 136hipotesis

de Kurepa, 300de los cardinales singulares, 142de Suslin, 277del continuo, 113

homeomorfismo, 259homomorfismo

de algebras de Boole, 306de anillos, 34

ordenados, 35

ideal, 36, 327en un conjunto, 155maximal, 37primo, 37, 327

imagen, 11inclusion, 13incompatibilidad

en un arbol, 281en un c.p.o., 313

ınfimo, 23infinita (clase), 107

de Dedekind, 116inmersion, 313, 366

completa, 313densa, 223, 314elemental, 368isometrica, 200, 201

interior, 249punto, 249

interseccion, 5diagonal, 154

intervalo, 221inversa, 12inverso (elemento), 27irreflexiva (relacion), 21

isometrıa, 200, 201isomorfismo, 366

de algebras, 307de anillos, 34

ordenados, 35

Kurepaarbol de, 300hipotesis de, 300

lımitede una sucesion, 201, 248ordinal, 46

lenguaje formal, 346lexicografico (orden), 60ley de composicion interna, 27

metrica discreta, 240Mahlo (cardinal de), 166maximal, 23maximo, 23minimal, 23mınimo, 23minuspotencia, 97modelo, 347, 353monotona (funcion), 24monomorfismo

de algebras, 307de anillos, 34

numeroentero, 192natural, 46racional, 196real, 218, 227

neutro (elemento), 27nivel (en un arbol), 281normal (funcion), 56

operacion, 27orden canonico en Ω × Ω, 56ordinal

de un conjunto, 54numero, 45sucesor, lımite, 46

par, 9

Page 395: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

INDICE DE MATERIAS 385

ordenado, 10parte entera, fraccionaria, 196partes, 18particion, 322pertenencia, 2precontinuo, 223preorden, 313primer axioma de numerabilidad, 252principio

de elecciones dependientes, 86de buena ordenacion, 93de numerabilidad, 93

productocardinales

infinito, 121cartesiano, 11de cardinales, 107de ordinales, 61

punto de acumulacion (de un filtro),335

raız cuadrada, 218racional (numero), 196rama, 281ramificado, 289rango, 11

de un conjunto regular, 83real (numero), 218, 227reflexiva (relacion), 20regresiva (aplicacion), 158regular

cardinal, 128conjunto, 82

relacion, 20de equivalencia, 21de orden, 22

relator, 346restriccion, 12

saturacion, 330seccion inicial abierta, 224segundo axioma de numerabilidad,

261semejanza, 24sentencia, 351separable, 263

separativo (preorden), 313simetrica (relacion), 21singular (cardinal), 128sistema ∆, 266Sorgenfrey (recta de), 263Stone (espacio de), 332subalgebra, 305subarbol, 282subbase, 240subcubrimiento, 267submodelo, 366

elemental, 369subsucesion, 205sucesion (convergente, de Cauchy),

201suma

de cardinales, 107infinita, 120

de ordinales, 58supremo, 23Suslin

algebra de, 324arbol de, 289hipotesis de, 277, 278, 292recta de, 278

termino, 348teorıa, 353Teorema

de Cantor, 99, 113de Cantor-Bernstein, 99de compacidad, 357, 377de Fodor, 158de induccion transfinita, 48, 49de Konig, 137de Lowenheim-Skolem, 371de los intervalos encajados, 219de los ultrafiltros, 359de recursion transfinita, 49de Silver, 161de Solovay, 160de Stone, 331de Tychonoff, 273, 337general de induccion transfinita,

76, 80

Page 396: CarlosIvorraCastillo TEOR´IA DE CONJUNTOS

general de recursion transfinita,78, 81

topologıa, 236de orden, 241discreta, 237producto, 244relativa, 242trivial, 237usual de R, 241

transitivaclase, 40, 76relacion, 21

ultrafiltro, 327fijo, libre, 329uniforme, 343

ultrapotencia, 376ultraproducto, 373unıvoca (clase), 11union, 5

valor absoluto, 31, 200valoracion, 349variable, 346

libre, 351Veblen (funciones de), 185

Zorn (lema de), 93