diseño de bases de datos
DESCRIPTION
Diseño de Bases de DatosTRANSCRIPT
NOTAS Universitarias | 1
Universidad de Ibagué
Facultad de Ingeniería
Programa de Ingeniería de Sistemas
Diseño de Base de Datos
Carlos Andrés Lugo González
Febrero 2011
NOTAS Universitarias | 2
Notas Universitarias ISSN 2216-0302 Diseño de Bases de Datos Facultad de Ingeniería Programa de Ingeniería de Sistemas Universidad de Ibagué Ibagué, Colombia. Febrero de 2011
Presidente del Consejo Superior Eduardo Aldana Valdés Rector Alfonso Reyes Alvarado Vicerrectora Nidia Chaparro Cuervo © Universidad de Ibagué, 2011 © Carlos Andrés Lugo González, 2011 Correspondencia Universidad de Ibagué, Oficina de publicaciones Calle 67, Carrera 22. Tel. (57 8) 2709400 Ibagué -Tolima, Colombia. www.unibague.edu.co [email protected]
Esta obra no puede reproducirse sin la autorización expresa
y por escrito de la Universidad de Ibagué
NOTAS Universitarias | 3
Carlos Andrés Lugo González es Ingeniero de Sistemas de la Universidad
Distrital Francisco José de Caldas. Cuenta con una especialización en
Teleinformática de la Universidad de Ibagué. Ha participado en encuentros y
conferencias como “Tendencias en ingeniería de software e inteligencia artificial” y
“Euro – American Conference On Telematics and Information Systems”. Ha
estado vinculado a la Universidad de Ibagué por 11 años. Es docente de tiempo
completo en el área de Ingeniera de sistemas.
NOTAS Universitarias | 4
NOTAS Universitarias | 5
Contenido
Introducción
1. Conceptos generales de bases de datos
1.1 ¿Qué es una base de datos?
1.2 Sistema gestor de base de datos
1.3 Actores de la base de datos
1.4 Conceptos básicos
1.5 Modelo de datos
1.5.1 Característica estática
1.5.2 Característica dinámica
1.6 Restricciones de integridad
1.6.1 Clasificación de las restricciones
1.7 Proceso de diseño de una base de datos
2. Modelo entidad / interrelación
2.1 Elementos del modelo entidad / interrelación
2.2 Restricciones de integridad
2.3 Elementos de un tipo interrelación
2.3.1 Dependencia en existencia y en identificación
2.4 Control de redundancia
2.4.1 Atributos derivados
2.4.2 Interrelaciones redundantes
2.5 Interrelaciones de grado superior a 2
2.6 Restricciones sobre interrelaciones adicionales
2.7 Generalización
2.8 Esquematización con herramientas CASE
2.9 Ejercicios
3. Modelo de datos relacional
3.1 Intensión y extensión de una relación
3.2 Restricciones del modelo relacional
3.2.1 Restricciones semánticas
3.2.2 Clasificación de las restricciones según los elementos a los que
afecta la condición
3.3 Paso del modelo E/R al relacional
3.3.1 Paso de una asociación muchos a muchos entre dos entidades
NOTAS Universitarias | 6
3.3.2 Asociaciones uno a uno
3.3.3 Paso de herencia a relaciones uno a muchos
3.3.4 Asociaciones recursivas (a la misma tabla)
3.3.5 Ejemplo de manejo de productos
3.4 Ejercicios
4. Lenguaje de consulta estructurado SQL
4.1 Instrucciones DDL
4.1.1 Instrucción CREATE
4.1.2 Instrucción ALTER
4.1.3 Instrucción RENAME
4.1.4 Instrucción TRUNCATE
4.1.5 Instrucción DROP
4.2 Instrucciones DML
4.2.1 Instrucción INSERT
4.2.2 Instrucción UPDATE
4.2.3 Instrucción DELETE
4.3 Instrucciones DCL
4.3.1 Instrucción GRANT
4.3.2 Instrucción REVOKE
4.4 Instrucciones de control de transacciones
4.4.1 Instrucción COMMIT
4.4.2 Instrucción SAVEPOINT
4.4.3 Instrucción ROLLBACK
4.5 Instrucciones de recuperación de datos
4.5.1 Instrucción SELECT
4.6 Proceso de Respaldo y Recuperación 4.7 Ejercicios
Bibliografía
NOTAS Universitarias | 7
Introducción
En la actualidad, la gestión de bases de datos es un área fundamental para el desarrollo
profesional del ingeniero de sistemas moderno, debido en gran medida a que todas las
organizaciones requieren de almacenar información. Cualquier empresa, sin importar su
naturaleza, debe gestionar información y, más específicamente almacenarla, con el fin de
procesarla y acceder a ella en todo momento y fundamentalmente al tomar las decisiones
que permiten cumplir los objetivos.
El ingeniero de sistemas actual debe estar en capacidad de diseñar e implementar
una base de datos que cumpla con las características de eficiencia y eficacia que garanticen
el correcto almacenamiento y posterior consulta de la información para la cual se crea la
base de datos. Este proceso de diseño e implementación no es tarea fácil y necesita de la
experticia y conocimiento que solo la práctica puede ofrecer.
Estas Notas Universitarias ofrecen al lector un punto de partida sencillo para
iniciar en el proceso de diseño e implementación de las bases de datos. Brinda los
conceptos básicos necesarios para que, a partir de los diferentes modelos de datos, el
estudiante cree una base de datos que satisfaga las necesidades del potencial cliente y/o
usuario que así lo requiera.
El documento está organizado en cuatro capítulos. El primer capítulo se centra en
la conceptualización inicial de las bases de datos, se presentan conceptos generales y de
gran importancia para los posteriores capítulos. En el capítulo dos se muestra el modelo
de datos Entidad Interrelación, de mucha importancia para el proceso de diseño y muy
flexible en términos de las capacidades que ofrece. En el siguiente capítulo se ofrece el
modelo de datos relacional, el cual es el más utilizado actualmente por la mayoría de
motores de bases de datos comerciales; su correcta comprensión es fundamental para el
ingeniero que desee realizar un buen diseño de base de datos. Por último, el capítulo
cuarto se refiere al lenguaje de consulta unificado SQL, el cual es un lenguaje que permite
implementar el diseño creado, utilizando el modelo de datos relacional.
Este documento es el resultado del estudio de diferentes autores y de la experiencia
en el desarrollo de base de datos reales; muchas de las ilustraciones y referencias están
basadas en el libro Diseño de Bases de Datos Relacionales de los autores Miguel Piatitini y
Marcos. A ellos, nuestros más sinceros agradecimientos y reconocimiento. Esperamos que
este documento sea de buen provecho para el potencial lector y satisfaga la sed de
conocimientos que lo impulsa a estudiar.
El Autor.
NOTAS Universitarias | 8
NOTAS Universitarias | 9
1 Conceptos generales de bases de datos
1.1 ¿Qué es una base de datos?
Muchas definiciones podemos encontrar de base de datos, entre ellas:
Colección organizada de información.
Conjunto de datos relacionados entre sí.
Colección compartida de datos lógicamente relacionados, junto con una
descripción de estos datos, que están diseñados para satisfacer las necesidades
informáticas de una organización.
Cualquiera de las anteriores definiciones es válida y de acuerdo a la complejidad del
sistema de base de datos a desarrollar, podemos añadir nuevas características a la
definición.
\
Figura 1. Representación grafica de una base de datos
Algunas características que deben poseer las bases de datos son:
Las BASE DE DATOS representan algún aspecto del mundo real (Minimundo).
Una BASE DE DATOS es un conjunto de datos lógicamente coherente con cierto
significado inherente.
Toda BASE DE DATOS se diseña, construye y puebla con datos para un propósito
especifico.
1.2 Sistema gestor de base de datos SGBASE DE DATOS
Un Sistema Gestor de Base de Datos o DBMS Data Base Managenment System; es un
conjunto de programas (software) que permite a los usuarios definir, crear, mantener y
controlar una BASE DE DATOS. Algunas de las funcionalidades que debe prestar un SGBASE
DE DATOS son:
Permite a los usuarios definir la Base de Datos, usualmente mediante un Lenguaje
de definición de datos que permita crear modificar y eliminar los objetos de la base
de datos como las tablas, vistas, etc.
NOTAS Universitarias | 10
Permite a los usuarios realizar operaciones sobre los datos como insertar,
actualizar, eliminar y consultar.
Proporciona un acceso controlado a la base de datos que puede incluir
o Un sistema de seguridad de los datos (que evita que usuarios no
autorizados accedan a la información).
o Un sistema de integridad de la información (que mantiene la coherencia de
los datos almacenados).
o Un sistema de control de concurrencia (que permite el acceso compartido a
la base de datos).
o Un sistema de respaldo y recuperación de la información (que restaura la
base de datos a un estado previo coherente después de cada fallo hardware
o software).
o Un sistema de control de redundancia (que reduzca al mínimo la
redundancia de datos en la base de datos).
Un SGBASE DE DATOS ofrece una representación conceptual de los datos, es decir que el
software gestor de base de datos debe tener la capacidad de plasmar de alguna forma la
representación conceptual de los datos. En términos informales un modelo de datos es un
tipo de abstracción de los datos con que se obtiene esa representación conceptual. Dentro
de cada base de datos existe una parte denominada catalogo del sistema, es aquí donde se
almacenan los Metadatos o diccionario de datos (los datos acerca de los datos) y estos
describen la estructura de la BASE DE DATOS primaria.
1.3 Actores de la base de datos
Distintos roles y personas deben interactuar para llevar a buen término la construcción de
una base de datos, la separación de tareas es fundamental en cualquier tipo de proyecto ya
que especializa y organiza los procesos dentro del proceso de desarrollo; a continuación se
describen los principales actores dentro del desarrollo y construcción de una base de
datos:
DBA: Data Base Administrator. El administrador de la BASE DE DATOS se encarga
de administrar los recursos de la base de datos; el administrador es responsable de
la gestión de la base de datos que incluye procesos como el control de la seguridad
y la asignación de roles y privilegios a los usuarios, el control de la integridad de los
datos en caso de fallas de hardware y software, el mantenimiento y fiabilidad del
sistema y la certeza de garantizar el mejor rendimiento posible de las aplicaciones
de la base de datos y la base de datos en sí.
Diseñador de la base de datos: En general existen dos tipos de diseñadores de
bases de datos; el diseñador lógico y el diseñador físico de la base de datos. El
diseñador lógico se encarga de identificar los objetos de la base de datos como las
NOTAS Universitarias | 11
entidades y sus atributos, las relaciones entre estas y las restricciones que operan
sobre los datos. El diseñador físico es el encargado de materializar físicamente el
diseño lógico de la base de datos, utilizando las estructuras más adecuadas según el
motor de base de datos que se utilice. En términos generales en diseñador lógico se
encarga de él que mientras que el diseñador físico se encarga del cómo.
Usuario final: Son las personas o sistemas que necesiten tener acceso a la base de
datos para consultarla y realizar transacciones, se pueden dividir en 2 grandes
tipos:
o Avanzado: Están familiarizados con el diseño de la base de datos y con el
motor de base de datos; usualmente utilizan un lenguaje de consulta de alto
nivel como SQL para realizar las transacciones a la base de datos.
o General: Usualmente no conocen la base datos y utilizan las aplicaciones de
usuario para interactuar con ésta.
Analista de sistemas y desarrolladores de aplicaciones: Determinan los requisitos
de los usuarios finales y desarrollan aplicaciones que satisfagan dichos
requerimientos, usualmente para este fin utilizan un lenguaje de programación de
propósito general como Java, VB.Net, etc.
1.4 Conceptos básicos
Para continuar es necesario hacer claridad respecto a algunas definiciones utilizadas a lo
largo de este documento, entre las que encontramos:
Dato: Unidad de información mínima, símbolo con significado limitado.
Información: Conjunto organizado de datos interpretados con mayor significado
que los datos.
Modelar: Consiste en definir un mundo abstracto y teórico tal que las conclusiones
que se puedan sacar del, coincidan con las manifestaciones aparentes del mundo
real; al igual que en otras disciplinas, modelar consiste en representar el mundo
real a través de de un modelo.
Modelo de Datos: Es un dispositivo de abstracción que “nos permite ver el bosque
en oposición a los arboles”; proporciona mecanismos de abstracción que permiten
la representación de aquella parcela del mundo real cuyos datos nos interesa
registrar y que comúnmente conocemos como universo en discurso o minimundo.
Es realmente el conjunto de reglas y mecanismos que nos permiten aplicar una
serie de abstracciones con el fin de crear un modelo a partir del problema que
queremos solucionar.
Abstracción: Consiste en separar por medio de una operación intelectual las
cualidades de un objeto para considerarlas aisladamente o para considerar el
mismo objeto en su pura esencia o noción. Este proceso oculta detalles
insignificantes y se fija en lo esencial, busca propiedades comunes, reduce la
NOTAS Universitarias | 12
complejidad y ayuda a la comprensión del mundo real. Cuando se realiza un
proceso de abstracción se lleva del mundo real al mundo conceptual, enfocándonos
en lo esencial apara solucionar el problema informático.
1.5 Modelo de datos
Un modelo de datos es el conjunto de conceptos, reglas y convenciones bien definidas que
nos permiten aplicar una serie de abstracciones a fin de describir y manipular los datos del
minimundo que deseamos almacenar en la bases de datos. Es equivalente al mismo
modelo lógico que se entiende como cualquier tipo de modelo en el campo de las bases de
datos, el modelo de datos no es igual a esquema de datos.
Lenguaje de Datos = Modelo de Datos + Sintaxis
SQL = Modelo de Datos Relacional + Sintaxis
Se entiende como ejemplar a la base de datos en determinado momento, como una
fotografía de ella. El modelo de datos debe poseer como mínimo 2 características, la
característica estática y la dinámica.
1.5.1 Característica estática
La característica estática es la encargada de definir la base de datos en su componente
estático, es decir en los objetos y componente que no cambian (no cambian mucho) a lo
largo del tiempo, está compuesta por:
Elementos permitidos: Son los elementos estáticos (estructuras) que conforman el
modelo, varían de acurdo al modelo, en general son:
o Objetos, son las entidades, relaciones (NO confundir con asociaciones), etc.
o Asociaciones, son la interrelaciones entre los objetos como las entidades.
o Propiedades, son las características de un objeto como una entidad
(atributos, campos, etc).
o Dominios, son los posibles valores que puede tomar un atributo o
propiedades, se define como un conjunto homogéneo de valores.
Elementos NO permitidos o Restricciones: Las restricciones son limitaciones
impuestas por el mismo modelo de datos o por el mundo real con el fin de
promover la integridad de los datos; un ejemplo de restricción es que no haya
registros duplicados (iguales) en una entidad o que un curso tenga máximo 20
alumnos matriculados. Existen dos tipos de restricciones:
o Restricciones inherentes: Son aquellas impuestas por el modelo de datos,
por ejemplo “toda entidad debe tener un nombre”.
NOTAS Universitarias | 13
o Restricciones de integridad o semánticas: Son aquellas que permiten
plasmar las reglas o restricciones del mundo real. Un ejemplo es una
restricción que limite el número de retiros diarios que puede realizar un
cliente de un banco en su cuenta. Las restricciones semánticas pueden ser:
Reconocidas por el modelo de datos: Son aquellas impuestas por el
mundo real pero gestionadas por el modelo de datos, por ejemplo
que el género de un empleado se “M” o “F”.
Ajenas al modelo de datos: Son aquellas impuestas por el mundo
real pero no gestionables por el modelo de datos, por ejemplo
asegurar que solo los mayores de edad pueden estar casado.
Usualmente para este tipo de restricciones se utilizan las
aplicaciones de la base de datos.
1.5.2 Característica dinámica
Es la encargada de efectuar las operaciones en la base de datos; estas operaciones tienen 2
componentes:
Localización: Consiste en ubicar un ejemplar (registro) o un conjunto de
ejemplares (de acuerdo a una condición) en un objeto de la base de datos
(usualmente una entidad).
Acción: Consiste en realizar la acción especificada en él o los ejemplares (registros)
previamente ubicados mediante la localización, y puede ser la recuperación de los
datos o la modificación de los mismos, mediante una inserción, actualización o
eliminación.
LOCALIZACIÓN <condición>
ACCIÓN <objetivo>
Donde LOCALIZACIÓN y ACCIÓN son comandos del lenguaje del modelo de datos.
1.6 Restricciones de integridad
Las restricciones de integridad son las reglas que debemos implementar basándonos en el
mundo real; inicialmente las restricciones pueden ser:
Restricciones propias: Son las restricciones semánticas que pueden ser
especificadas en el propio modelo de datos y representadas en el esquema de datos
(los diagramas).
NOTAS Universitarias | 14
Restricciones ajenas: Son las restricciones que no son soportadas por el modelo de
datos y usualmente deben ser implementadas por aplicaciones independientes a la
base de datos.
Las restricciones de integridad tienen tres componentes principales:
La operación: se refiere a la operación de inserción, actualización o eliminación
cuya ejecución genera la comprobación de la restricción.
Condición: que se debe cumplir, es una expresión lógica simple (que retorna
verdadero o falso) y que dependiendo del resultado dispara la acción subsecuente.
Acción: Que se debe hacer de pendiendo el resultado de la condición, en caso que
la condición sea verdadera, lo más usual es que la acción sea de rechazo de la
operación.
1.6.1 Clasificación de las restricciones
Las restricciones se clasifican como se puede apreciar en la figura 2.
Figura 2. Clasificación de las Restricciones
Adaptado de [1]
NOTAS Universitarias | 15
Restricciones Inherentes: Son las que el modelo de datos impone, como que cada entidad
debe tener como mínimo un atributo.
Restricciones Semánticas: Son aquellas que modelan el mini universo, son las
restricciones que impone el mundo real que se está analizando para la creación de la base
de datos.
Restricciones Propias: Son definidas al definir el es esquema de la base de datos, pueden
ser manejadas por el modelo de datos.
Restricciones Ajenas: Son las restricciones que no puede manejar por si solo el modelo de
datos, se implementan en los programas de la aplicación (capa lógica).
Restricciones de Lenguaje de Propósito General: Son las restricciones ajenas
implementadas mediante un lenguaje de propósito general como C++, Java, VB.Net, etc.
Restricciones del Lenguaje del SGBD: Son las restricciones ajenas implementadas
mediante un lenguaje asociado a un motor de base de datos como PL/SQL de Oracle o
Transact-SQL de Microsoft.
Restricciones de Acción General: Son las restricciones donde es preciso programar estilo
método para determinar la acción que hay que llevar a cabo, son muy parecidas a las
restricciones ajenas con lenguaje de programación del motor de base de datos.
Procedimientos Almacenados: Se definen de forma procedimental, son las que se
asemejan más a las “restricciones ajenas” al modelo.
Disparadores: Se desencadenan cuando sucede cierta condición, se declaran como
procedimientos y se disparan automáticamente cuando un evento de inserción,
actualización o eliminación ocurre.
Restricciones Acción específica: Esta implícita en la misma restricción (generalmente la
negativa genera un rechazo).
Restricciones de Condición General: Generan rechazo siempre y cuando sean falsas; se
definen como una proposición lógica.
Restricciones de verificación: Son especificas a un elemento del esquema.
NOTAS Universitarias | 16
Restricciones de Aserción: Igual que las anteriores pero afectan a varios objetos
simultáneamente.
Restricciones de Condición Específica: Son opciones proporcionadas por el propio
modelo. No especifica los componentes relativos a la restricción.
1.7 Proceso de diseño de una base de datos
Conjunto de etapas necesarias para pasar de una determinada realidad (mini universo) a
la base de datos que representa. La etapas en el diseño se presentan en la figura numero 3.
MUNDO REAL
(Cualquier problema informático, como el de una entidad bancaria, universidad, etc.)
UNIVERSO DEL DISCURSO
(Visión del problema informático bajo el problema especifico a resolver)
MODELADO CONCEPTUAL DE DATOS
(Modelo E/R de la solución del problema informático)
MODELADO LÓGICO
(Modelo de la solución de la base de datos, Modelo Relacional)
MODELADO INTERNO
(Modelo de estructuras internas de la base de datos como los índices, secuencias, etc.)
ALMACENAMIENTO FÍSICO
(Estructuras físicas de almacenamiento, como tablas, atributos, etc.)
Figura 3. Etapas del diseño de una Base de Datos.
Adaptado de [1]
NOTAS Universitarias | 17
2 Modelo entidad / interrelación
El modelo entidad interrelación es un modelo de datos usado como base para una vista
unificada de los datos, adoptando el enfoque más natural del mundo real que consiste en
entidades e interrelaciones.
2.1 Elementos del modelo entidad interrelación
Los elementos encontrados en el modelo entidad interrelación son los siguientes:
Entidad: Cualquier objeto real o abstracto que existe en el universo y acerca del
cual queremos almacenar información en la base de datos. Haciendo un paralelo
con el modelo Orientado a Objetos, podemos decir que la entidad (en términos
generales) es la misma clase si omitimos las operaciones. Existen 2 tipos de
entidades.
o Entidad regular: Cuyos ejemplares (registros de la entidad) existen por sí
mismos. La representación de este tipo de entidad es un rectángulo con el
nombre de la entidad dentro de él. El ejemplo de una materia ilustra este
tipo de entidad, ya que una materia (con ciertas consideraciones) tiene
existencia propia.
Figura 4. Entidad Regular
o Entidad débil: Cuyos ejemplares dependen de que exista cierto ejemplar en
otro tipo entidad. La representación de este tipo de entidad es un
rectángulo de línea doble con el nombre de la entidad dentro de él. Un
curso se considera una entidad débil debido a que para poder existir, debe
existir previamente una materia de la cual se cree el curso.
Figura 5. Entidad Débil
NOTAS Universitarias | 18
Reglas de las entidades:
Las entidades deben cumplir ciertas reglas que hagan valida su existencia, entre ellas
encontramos:
Tienen que tener existencia propia, es decir que la existencia de sus ejemplares (los
registros) debe tener existencia sin ninguna dependencia (aunque eso no es cierto
en el caso de las entidades débiles).
Cada ejemplar debe poder distinguirse de otro, es decir que no deben existir dos
ejemplares exactamente iguales en la misma entidad.
Todos los ejemplares de la misma entidad debe tener las mismas propiedades, es
decir que todos los ejemplares de la entidad deben obligatoriamente tener valores
en las propiedades de la entidad, así alguno(s) valor(es) sean NULL.
Interrelación: Es una asociación, vinculación o correspondencia entre entidades;
en términos generales es muy parecida a una entidad, con la connotación de que su
existencia se debe a la vinculación entre entidades. Dos entidades pueden poseer
más de dos interrelaciones. La representación de una interrelación es a través de
un rombo.
El modelo E/R tiene como restricción inherente que solo permite establecer
interrelaciones entre entidades, NO están permitidas entre Entidad - Interrelación
ni entre Interrelación - Interrelación.
Figura 6. Interrelación “Imparte”
NOTAS Universitarias | 19
Figura 7. Interrelación “Imparte” y “Recibe”
Dominio: Es el conjunto de posibles valores que puede tomar cierta propiedad de
una entidad o interrelación. Se puede definir por:
o Intención: Especificando el tipo de dato.
o Extensión: Declarando el valor de cada elemento, ej.: azul, rojo, verde.
Los dominios tienen existencia propia independiente de cualquier otro elemento.
Atributo: Cada una de las propiedades o características que tiene una entidad o
interrelación. Se representa con una línea y circulo la entidad o interrelación a la
que pertenece. El número de atributos de una entidad o interrelación es n, es decir
cualquier número entre 1 e infinito.
Figura 8. Representación de los atributos
NOTAS Universitarias | 20
En la figura 8 se puede apreciar dos atributos pertenecientes a la entidad profesor, el
primer atributo llamado nombre es un atributo simple, el segundo atributo llamado fec
nac. Es un atributo compuesto (es decir que a su vez está compuesto de atributos). Los
atributos a diferencia de los dominios NO tienen vida propia, es decir están ligados al tipo
entidad o interrelación correspondiente. Adicionalmente es necesario aclarar que las
entidades e interrelaciones poseen atributos y los ejemplares toman valores para cada
atributo.
2.2 Restricciones de integridad
La principal restricción inherente (es decir las restricciones propias del modelo de datos y
no las que impone el mundo real) del modelo de datos entidad interrelación E/R, prohíbe
que haya interrelaciones entre interrelaciones, es decir que una interrelación solo podrá
existir entre dos entidades; también obliga a que todas las entidades posean un
identificador o nombre único en todo el esquema de la base de datos. Otras importantes
restricciones son:
Restricción sobre Valores: Se establecen mediante la definición del dominio, cada
valor solo puede pertenecer a un conjunto definido.
Restricción sobre Atributos (IC): Entre todos los atributos de un tipo entidad existe
uno o varios (simples y/o compuestos) que identifican unívocamente cada uno de
los ejemplares de esta entidad. A cada uno de de estos conjuntos de atributos se les
denomina Identificador Candidato (IC); todo IC debe cumplir la condición de ser
unívoco y mínimo. Se dividen en dos grupos:
o Identificador Principal: Es aquel que por razones ajenas al modelo de datos
es considerado el atributo “principal” de la entidad.
o Identificadores Alternos: El resto de atributos candidatos que no son el
identificador principal.
Figura 9. Representación de los atributos Candidatos
NOTAS Universitarias | 21
Restricción sobre Atributos (otros): Otras restricciones aplican sobre los atributos,
como los atributos multivaluados, que son aquellos que pueden tomar más de un
solo valor; ej.: una materia se puede impartir en dos a más idiomas. Los atributos
opcionales son aquellos que pueden tener valores nulos lo cual indica que el valor
de ese atributo es NULL.
Figura 10. Atributos regulares, multivaluados y opcionales.
La cardinalidad es el rango de valores que puede tomar en este caso un atributo y
generalmente tiene un valor mínimo y máximo. Como se puede observar, en el modelo de
datos E/R un atributo puede ser multivaluados. Sin embargo, en el modelo de datos
relacional (siguiente capítulo) esto no está permitido.
Figura 11. Cardinalidad de los atributos.
2.3 Elementos de un tipo interrelación
Los elementos que componen a una interrelación son:
NOTAS Universitarias | 22
Nombre: Lo distingue unívocamente del resto de elementos; debe ser único y
descriptivo de la entidad, usualmente es un sustantivo en singular (con contadas
excepciones).
Grado: Es el número de entidades que participan en un tipo interrelación. De este
concepto podemos deducir que el número de entidades que asocia una
interrelación no es necesariamente 2, puede ser 1, 3, etc.
Tipo correspondencia: Es el número máximo de ejemplares de una entidad que
pueden estar asociados en una determinada interrelación, con un ejemplar de otro
tipo.
Figura 12. Ejemplos de interrelación.
Papel (“Rol”): Es la función que cada uno de los tipos entidad realiza en el tipo
interrelación.
Figura 13. Roles entre la Interrelación.
NOTAS Universitarias | 23
Cardinalidad de un tipo entidad: se define como el número máximo y mínimo de
ejemplares de un tipo entidad que pueden estar interrelacionados con un ejemplar
de otro.
Figura 14. Cardinalidad entre la Interrelación.
Atributos de las interrelaciones
Ciertas consideraciones deben tenerse en cuenta cuando se analizan los atributos de una
interrelación, por ejemplo, cuando en una interrelación 1:N se tiene un atributo asociado,
este atributo se lleva a la entidad cuya cardinalidad es N. Cuando la interrelación es 1:1 es
muy conveniente conservar el atributo dependiendo de la interrelación. Los atributos de
las Interrelaciones N:M son propios de la misma y no de las entidades vinculadas por la
interrelación.
Ejercicio: Graficar dos ejemplos de los posibles casos en los que un atributo esté presente
en la interrelación.
2.3.1 Dependencia en existencia y en identificación
Existen 2 tipos de interrelación, las regulares y las débiles, según estén asociando a dos
entidades regulares, o a una entidad débil con una entidad (débil o regular),
respectivamente. La interrelación débil tiene dos divisiones, la dependencia en existencia
y en identificación.
Dependencia en existencia: cuando los ejemplares de un tipo entidad débil no
pueden existir si desaparece el ejemplar de tipo entidad regular del cual dependen.
NOTAS Universitarias | 24
Es decir que el ejemplar de la entidad débil no puede crearse si no se ha creado
previamente el ejemplar de la entidad regular a la que está asociada.
Figura 15. Dependencia en existencia.
Dependencia en identificación: además de la condición anterior, los ejemplares del
tipo entidad débil no se pueden identificar por sí mismos y exigen añadir el
identificador principal del tipo entidad regular del cual dependen. Es decir que el
identificador principal de la entidad débil está compuesto de forma total o parcial
por el identificador candidato de la entidad regular a la cual está asociado.
NOTAS Universitarias | 25
Figura 16. Dependencia en identificación.
2.4 Control de redundancia
La redundancia (duplicidad innecesaria de los datos) es un factor predominante de una
buena base de datos; es imperativo reducir al mínimo (lo ideal sería evitarla totalmente) la
redundancia en nuestra base de datos y para esto existen técnicas aplicables desde el
mismo modelo de base de datos utilizado. Debemos analizar la existencia de redundancia
por los problemas de inconsistencias a los que puede dar lugar; se dice que un elemento
del esquema es redundante cuando puede ser eliminado sin pérdida de semántica, es
decir, sin pérdida del significado de los datos en la propia base de datos. Existen dos tipos
de redundancia, en los atributos (derivados) y en las interrelaciones (derivadas).
2.4.1 Atributos derivados
Son aquellos que se obtienen a partir de otros ya existentes, son calculados, por lo que
aunque son redundantes, no son inconsistentes siempre y cuando se indique su
procedencia y la fórmula para hallarlos. Usualmente este tipo de atributos son creados con
fines de eficiencia de la base de datos, como ejemplo podemos analizar una entidad
bancaria con sus cuentas y las transacciones que generan estas cuentas, en la figura 17 se
observa la relación entre la entidad CUENTA y la TRANSACCION; si se quisiera calcular el
saldo de la cuenta sería posible hacerlo a través de la suma y resta de acuerdo a la
NOTAS Universitarias | 26
naturaleza de las transacciones, sin embrago y considerando el posible número de
transacciones, esta operación podría ser muy costosa computacionalmente generando
retrasos en la consulta. Lo mal útil sería crear un atributo saldo en la entidad CUENTA y
actualizarlo constantemente cada vez que se haga una transacción.
Figura 17. Ejemplo entidad bancaria.
Un atributo derivado se puede calcular en 2 momentos distintos:
Al actualizar: Es decir que cada vez que se genere una operación de inserción,
actualización o eliminación, se actualice el atributo calculado (real).
Al consultar: Es decir que se actualice solamente cuando se realice una consulta al
atributo calculado (virtual).
2.4.2 Interrelaciones redundantes
Se dice que una interrelación es redundante cuando su eliminación no implica la pérdida
de semántica (del significado de los datos en la base de datos) porque existe la posibilidad
de realizar la misma asociación de ejemplares por medio de otras interrelaciones.
Se considera condición necesaria aunque no suficiente que haga parte de un ciclo.
En el ejemplo de la figura 18 se puede apreciar como existe una interrelación redundante;
si consideramos que un curso se encuentra adscrito a un departamento y que un profesor
dicta uno o varios cursos, su puede asumir que los cursos que dicta un determinado
profesor lo hacen miembro (directo o indirecto) del departamento al cual pertenece el
curso, en ese caso la interrelación “pertenece” entre el profesor y el departamento se hace
redundante ya que su eliminación no implica la pérdida de semántica en el esquema.
En la figura 19 se puede apreciar el caso contrario, en donde no es posible eliminar
la interrelación entre el docente y el departamento sin pérdida de semántica; esto ocurre
porque un curso ya no está adscrito a un solo departamento sino a varios, haciendo que la
interrelación entre el profesor y el departamento sea necesaria con el fin de determinar a
qué departamento está adscrito un profesor.
NOTAS Universitarias | 27
Figura 18. Interrelación redundante.
Figura 19. Interrelación NO redundante.
Existen otros casos en donde la interrelación, a pesar de poder ser deducida por
otras, no se puede eliminar ya que posee atributos o que por razón ajenas al modelo sea
conveniente conservarlas como prever un futuro cambio en la base de datos. Se debe
comprobar que si se elimina la interrelación, la semántica se conserve en ambos sentidos y
que no se pierdan atributos.
NOTAS Universitarias | 28
Condiciones para eliminar una interrelación
Existir un ciclo.
Que las interrelaciones del ciclo sean equivalentes semánticamente, es decir que al
eliminar una interrelación el significado de los datos en la base de datos sea
equivalente con las demás interrelaciones.
Que se puedan asociar los ejemplares de las dos entidades que estaban
interrelacionadas, aun habiendo eliminado la interrelación; si esto no es posible y
un ejemplar de una entidad no se puede relacionar con otro ejemplar de otra
entidad, la interrelación no se puede eliminar.
Que la interrelación o bien no tenga atributos, o bien estos puedan ser transferidos
a fin de no perder la semántica.
2.5 Interrelaciones de grado superior a 2
Lo más conveniente en el modelo es que existan interrelaciones de grado 2, pero esto no es
posible siempre. En ocasiones se puede descomponer una interrelación de grado n en una
más simple, pero para esto es preciso analizar correctamente la semántica.
En el ejemplo de la Figura 20 podemos apreciar como una interrelación de grado 3
no se puede eliminar ya que se perdería la semántica; en este ejemplo, un profesor imparte
diferentes temas en muchos cursos. Si se elimina la interrelación de grado 3 por las tres
interrelaciones de grado 2, no se podría determinar exactamente qué temas entran en un
curso específico. Por el contrario, en la Figura 21 podemos apreciar una interrelación de
grado 3 que es posible reemplazar por 3 interrelaciones de grado 2 sin pérdida de
semántica, ya que la información de qué cursos imparte el profesor, qué alumnos tiene
como asistente un curso y a qué estudiantes da clase el profesor es consistente de
cualquiera de las dos formas.
NOTAS Universitarias | 29
Figura 20. Interrelación de grado 3 que no se puede reemplazar.
Figura 21. Interrelación de grado 3 que sí se puede reemplazar.
2.6 Restricciones sobre interrelaciones adicionales
NOTAS Universitarias | 30
Existen restricciones sobre interrelaciones adicionales a las mencionadas anteriormente
que permiten al modelo plasmas mejor la realidad del mundo del problema que se está
analizando, aunque lo recomendable es crear un modelo lo más simple posible. Existen
ocasiones en las que este tipo de restricciones aplican de forma adecuada.
Restricción de exclusividad: Este tipo de restricción aplica cuando el ejemplar del
tipo entidad solo puede pertenecer a uno de los tipos de la interrelación, pero en el
momento que pertenezca a uno ya no podrá formar parte del otro. Un caso especial
es cuando se asocian más de dos entidades y se considera la cardinalidad. En la
Figura 22 se observa cómo un empleado se relaciona con un departamento por
medio de dos posibles interrelaciones. Si dirige el departamento, no puede asistirlo
y caso contrario. En la Figura 23 también se observa una restricción de
exclusividad con la cardinalidad respecto a las dos interrelaciones.
Figura 22. Ejemplo de Interrelación de exclusividad.
NOTAS Universitarias | 31
Figura 23. Ejemplo de Interrelación de exclusividad.
Restricción de exclusión: todo ejemplar de la primera entidad que este unido a la
segunda entidad mediante la primera interrelación, no podrá estar unido al mismo
ejemplar de la segunda entidad mediante la segunda interrelación. En la Figura 24
se observa el ejemplo de un empleado que o dirige o asiste a un departamento pero
que al momento de dirigir un departamento no podrá asistirlo y viceversa.
Figura 24. Ejemplo de Interrelación de exclusión.
NOTAS Universitarias | 32
Restricción de inclusividad: todo ejemplar de la primera entidad que participa en
unos de los dos tipos de interrelación tiene necesariamente que participar en la
otra. En la Figura 25 se observa el ejemplo en donde un empleado que dirige un
departamento tiene que haber asistido a (en este caso) mínimo 3 departamentos.
Figura 25. Ejemplo de Interrelación de inclusividad.
Restricción de inclusión: es aún más fuerte que la restricción de Inclusividad,
específica que para que un ejemplar exista en una interrelación previamente
debería existir en la otra. En el ejemplo de la Figura 26 se especifica que para
dirigir un departamento se debió asistirlo previamente.
Figura 26. Ejemplo de Interrelación de inclusión.
NOTAS Universitarias | 33
2.7 Generalización
Se considera un caso especial de interrelación entre varios tipos entidad (subtipos) y un
tipo más general (supertipo) cuyas características son comunes a todos los subtipos. La
generalización en el modelo E/R es en esencia la misma del modelo orientado a objetos.
El concepto base de la generalización consiste en observar las características
generales de varias entidades y agruparlas en una sola que posee todas estas
características, a esta entidad se le denomina supertipo; a partir de esta entidad se crean
diferentes entidades “especializadas” que poseen sus propios atributos y heredan los
atributos del supertipo, a estas entidades se les denomina subtipos.
Existen diferentes características en la generalización de a cuerdo a la relación que
existe o puede existir entre los ejemplares de las entidades involucradas. Estas
características son:
Solapamiento: ocurre si un mismo ejemplar del supertipo puede pertenecer a más
de un subtipo.
Exclusividad: ocurre si un ejemplar del supertipo solo puede pertenecer a uno de
los subtipos.
Totalidad: si todo ejemplar del supertipo tiene que pertenecer a algún subtipo
Parcialidad: si un ejemplar del supertipo no tiene que pertenecer a algún subtipo.
Para representar la exclusividad se utiliza un arco en la relación de la entidad
supertipo y los subtipos y un círculo para representar la jerarquía total como se puede
apreciar en los ejemplos de las figuras 27 y 28.
Figura 27. Ejemplo de Generalización.
NOTAS Universitarias | 34
Tanto un docente como una secretaria son empleados (Generalización).
Un mismo empleado no puede ser a la vez un docente y una secretaria
(exclusividad o disyunción).
Todo empleado tiene que ser obligatoriamente un docente o una secretaria
(totalidad).
Figura 28. Ejemplo de Generalización.
Un curso dirigido y un curso virtual son cursos (Generalización).
Un mismo curso no puede ser al mismo tun curso dirigido y un curso virtual
(exclusividad o disyunción).
Un curso puede ser curso dirigido o curso virtual o ninguno de los dos
(parcialidad).
Dimensión temporal en el modelo E/R
Las bases de datos almacenan información en el tiempo y considerando que no debe
borrarse información de estas, la mejor forma de modelar “el tiempo” es a través de
atributos fecha que almacenen las fechas de los acontecimientos y el manejo de estados en
los ejemplares de cada entidad.
NOTAS Universitarias | 35
2.8 Esquematización con herramientas CASE
Una herramienta CASE (Computer Aided Software Engineering) es “un software
destinadas a aumentar la productividad en el desarrollo de software reduciendo el costo de
las mismas en términos de tiempo y de dinero”1. Dependiendo de la herramienta CASE
utilizada, la forma de representación cambia un poco, aunque en general todas siguen el
mismo patrón.
Por ejemplo en Power Designer2, la representación de los atributos de una entidad
o interrelación se hacen dentro el objeto no con círculos y líneas. A continuación se
presenta un ejemplo de los objetos manejados en el modelo E/R de acuerdo a su
representación en la herramienta CASE Power Designer; la Figura 29 representan una
entidad con sus atributos, la Figura 30 una interrelación con sus atributos y la Figura 31 el
uso de la generalización.
Figura 29. Entidad con atributos
.
Figura 30. Interrelación con atributos
1 http://es.wikipedia.org/wiki/Herramienta_CASE
2 http://www.sybase.com/products/modelingdevelopment/powerdesigner
CURSO
CODIGOCUR
NOMBRECUR
INTHORARIACUR
ESTADOCUR
<pi> Number
Variable characters (50)
Number
Variable characters (2)
<M>
CPCURSO
...
<pi>
INSCRIPCION
CODIINSCRIPCION
FECHAINSCRIPCION
ESTADOINSCRIPCION
Number
Date
Variable characters (2)
NOTAS Universitarias | 36
Figura 31. Generalización
El ejemplo de la Figura 32 reúne los diferentes objetos del modelo E/R en un esquema que
relaciona un curso con programa académico y alumno.
Figura 32. Esquema de ejemplo E/R.
2.9 Ejercicios
ES UN
CURSO
CODIGOCUR
NOMBRECUR
INTHORARIACUR
ESTADOCUR
<pi> Number
Variable characters (50)
Number
Variable characters (2)
<M>
CPCURSO
...
<pi>
CURSOVIRTUAL
DESCHERRAMIENTACV
NUMMODULOSCV
Variable characters (200)
Number
ES UN
pertenece
0,n
0,n
CURSO
CODIGOCUR
NOMBRECUR
INTHORARIACUR
ESTADOCUR
<pi> Number
Variable characters (50)
Number
Variable characters (2)
<M>
CPCURSO
...
<pi>
INSCRIPCION
CODIINSCRIPCION
FECHAINSCRIPCION
ESTADOINSCRIPCION
Number
Date
Variable characters (2)
CURSOVIRTUAL
DESCHERRAMIENTACV
NUMMODULOSCV
Variable characters (200)
Number
ALUMNO
CODIGOALUM
NOMBREALUM
DIRECCIONALUM
GENEROALUM
ESTADOALUM
<pi> Number
Variable characters (50)
Variable characters (50)
Variable characters (1)
Variable characters (2)
<M>
<M>
<M>
<M>
CPALUMNO
...
<pi>
PROGRAMAACADEMICO
CODPROGACA
NOMBRPROGACA
FECHREGCALPRGACA
ESTAPROGACA
<pi> Number
Variable characters (50)
Date
Variable characters (2)
<M>
<M>
<M>
<M>
PKPROGRAMAACADEMICO
...
<pi>
CURSODIRIGIDO
NOMBASESORCD
NUMHORASPRES
Variable characters (50)
Number
NOTAS Universitarias | 37
1. Identificar entidades que posean atributos compuestos y esquematizarlos.
2. En un problema informático cualquiera, identificar las entidades, sus atributos y
los identificadores candidatos de las entidades.
3. Identificar tres ejemplos de atributos calculados en diferentes entidades.
4. Investigas como se grafica la generalización “completa” y “mutualmente exclusiva”
en la herramienta Power Designer.
5. Crear a partir de un ejemplo dado por el profesor, un esquema de base de datos
completo en una herramienta CASE. Ejemplo: biblioteca, entidad bancaria,
hospital, etc.
NOTAS Universitarias | 38
NOTAS Universitarias | 39
3 Modelo de datos relacional
El modelo de datos relacional es el modelo de datos más utilizado en la actualidad, fue
propuesto por Codd en 1970 y supuso una revolución en las bases de datos debido a su
enfoque y la separación de los datos en sí mismos de las aplicaciones utilizadas para
gestionar dichos datos. La estructura u objeto básico de este modelo es la relación o tabla,
cuya función es la de representar las entidades del mundo del problema así como las
asociaciones o interrelaciones del modelo E/R.
Los componentes básicos del modelo son:
Dominio: Es el conjunto de posibles valores que puede tomar un atributo, debe ser
finito y nominal. Se puede definir por extensión (nombrando sus posibles valores)
o por intensión (mediante el tipo de datos), siendo este último el más utilizado.
Atributo: Es una propiedad o característica de la relación, es la misma columna de
una tabla en el modelo físico.
Un atributo se encuentra siempre en una relación (es una propiedad de una
relación), mientras que un dominio tiene existencia independiente a las relaciones del
esquema; ej.: los números enteros existen así no haya relaciones (tablas) en el esquema.
Un atributo debe tomar los valores de un dominio y de solo un dominio según su
definición y diferentes atributos pueden tomar sus valores del mismo dominio, es decir
que varios atributos pueden ser del mismo tipo.
Relación: es el conjunto de elementos llamados tuplas {tj}, donde cada tupla o
registro es una pareja conformada por el nombre del atributo “Ai” y el valor del
atributo “Vij” sobre el dominio Di donde fue definido el atributo; se expresa:
(<A1:V1j> , ... <Ai:Vnj> , ... <An:Vnj>).
El esquema de relación es la representación de la relación en términos de sus
atributos con sus respectivos dominios, se compone del nombre de la relación R
(usualmente un sustantivo en singular), de un conjunto de atributos (el numero de
atributos es cualquier entero positivo) {Ai} y de un conjunto de dominios (cada atributo
debe tener un dominio, y dos o más atributos pueden tener el mismo dominio) {Di}. Se
expresa: R (A1:D1 , A2:D2 , An:Dn) donde R es el nombre del esquema de relación, Ai es
el nombre del atributo y Di el dominio al cual pertenece cada atributo.
Una relación se representa físicamente utilizando una tabla en donde:
NOTAS Universitarias | 40
Los atributos de la relación son las columnas de la tabla.
Cada registro de la tabla es una tupla de la relación, el conjunto de todas las tuplas
conforman la relación. El número de tuplas se llama cardinalidad de la relación.
3.1 Intensión y extensión de una relación
La intensión de una relación es el mismo esquema de la relación, es decir la parte
definitoria de la relación, los metadatos o abstracción de la relación. Se puede representar
como en la Figura 33.
Figura 33. Esquema de relación.
CURSO(CODIGOCUR:NUMERICO, NOMBRECUR:CADENA, INTHORARIACUR:NUMERICO,
ESTADOCUR:CADENA)
La extensión de una relación es el conjunto de tuplas (registros) que componen la relación,
todas las tuplas deben ser iguales en términos de estructura (no de valores) para satisfacer
la estructura de la relación, estas tuplas se almacenan en la base de datos y suelen llamarse
simplemente relación. La Figura 34 muestra un ejemplo de relación que satisface el
esquema de relación de la Figura 33.
CODIGOCUR NOMBRECUR INTHORARIACUR ESTADOCUR
2245 Programación 4 AC
2215 Lógica 6 AC
2219 Base de Datos 4 IN
Figura 34. Relación.
Un esquema relacional es el conjunto de esquemas de relación que describen el
minimundo del problema del cual se diseña la base de datos. Cuando se crea un diagrama
relacional de base de datos, se está creando un esquema relacional que satisfaga la
estructura informática del mundo del problema.
CURSO
CODIGOCUR
NOMBRECUR
INTHORARIACUR
ESTADOCUR
<pi> Number
Variable characters (50)
Number
Variable characters (2)
<M>
CPCURSO
...
<pi>
NOTAS Universitarias | 41
3.2 Restricciones del modelo relacional
Las siguientes son las restricciones inherentes (las que son propias del modelo) del
modelo relacional:
No pueden existir dos tuplas (registros) idénticos en una relación.
EL orden en que se encuentran las tuplas en la relación no es importante. Esto no
implica que a la hora de realizar una consulta el orden no sea importante o no se
pueda mostrar el resultado de forma ordenada.
El orden en que se encuentran los atributos en la relación no es importante, sin
embargo y por razones ajenas al modelo, se recomienda esquematizar los atributos
“más relevantes” al inicio de la relación.
Cada atributo de la relación solo puede tomar un solo valor en un momento
determinado del dominio al cual está asociado, es decir que por ejemplo al atributo
GÉNERO solo puede ser M ó F, pero no los dos al tiempo. Esto se conoce en teoría
de la normalización como la primera forma normal.
El único objeto del modelo relacional es la relación, así que toda entidad y / o
interrelación creada en el modelo E/R debe representarse a través de este objeto.
En toda entidad debe existir un atributo o conjunto de atributos que son la clave
primaria, este atributo (o atributos) no puede tomar el valor nulo (null).
3.2.1 Restricciones semánticas
Las restricciones semánticas deben reflejar las reglas del mundo real. En el modelo
relacional una restricción de integridad es de tipo evento condición acción, donde el
evento puede ser una inserción, actualización o eliminación; la condición es un predicado
que se aplica sobre el conjunto de datos sobre los cuales se dispara el evento y la acción es
la respuesta al evento y condición anteriores, siendo el rechazo la acción por defecto. Por
ejemplo si se desea insertar un ejemplar (registro) sobre una relación (tabla) cuyo valor en
la clave primaria ya se encuentre en la relación, se rechaza la inserción.
La creación de las restricciones semánticas se debe poder hacer de forma simple y
precisa así como permitir cierta flexibilidad en el manejo de la condición y la acción de la
restricción. Es labor del motor de base de datos permitir la definición de las restricciones
semánticas así como validar la consistencia de estas reglas al momento de definirlas como
al momento de aplicarlas.
3.2.2 Clasificación de las restricciones según los elementos a los que afecta
la condición
La forma más simple de clasificar las restricciones semánticas es de acuerdo con el o los
elementos que afectan la condición de la restricción.
NOTAS Universitarias | 42
Que afectan los atributos de una sola relación (clave primaria, unicidad, not null,
etc.): es definido en el esquema de relación como S1 =<A,P> donde A es el
conjunto de atributos (uno o varios) a los que se aplica la condición y P es un
predicado (expresión que retorna un valor booleano). Entre este tipo de
restricciones se encuentran:
o Restricción de Unicidad (UNIQUE): indica que un atributo (o conjunto de
atributos) no puede tener los mismos valores en dos tuplas o registros; esto
no indica que puedan no tener valor, es decir que sean nulos o NULL. En
caso de que se intente insertar o actualizar un registro que viole esta
restricción, la acción es de rechazo de la inserción o actualización.
o Restricción de nulidad (NOT NULL): indica que un atributo no puede ser
vacio; en realidad lo que limita esta restricción es que el atributo no pueda
recibir el valor NULL. En caso de que se intente insertar o actualizar un
registro que viole esta restricción, la acción es de rechazo de la inserción o
actualización.
o Restricción de llave primaria (PK): en una relación pueden existir uno o
varios atributos que identifiquen unívocamente a cada ejemplar dentro de
la relación, este o estos atributos son llamados claves candidatas y entre las
claves candidatas y por razones ajenas al modelo relacional se elije una y se
le denomina llave primaria, la cual indica que el o los atributos que
componen esta clave NO pueden tener valores iguales en dos tuplas o
registros de la relación NI ser nulos.
o Restricción de llave alterna: todas las claves candidatas que no son llaves
primarias se denominan claves o llaves alternas. La forma de implementar
las llaves alternas es utilizando la estricción de unicidad junto a la de
nulidad.
o Restricción de verificación (CHECK): indica que un atributo debe cumplir
con determinado predicado, se declara al momento de definir la relación y
en caso de realizarse una inserción o actualización y no cumplir con el
predicado, la acción es de rechazo; un ejemplo es: CHECK ESTADO = „AC‟.
Que afectan los atributos de más de una relación (integridad referencial): también
llamada clave o llave foránea; en una relación llamada Relacion1 existe uno o
varios atributos (conjunto de atributos) cuyos valores coinciden con los valores de
otro u otros atributos en la Relacion2 (Relacion1 y Relacion2 pueden ser la misma)
o ser nulos. La Relacion2 se denomina la relación referenciada y la Relacion1 la
relación que referencia. La llave foránea asegura la integridad de los datos al
validar que los valores de la Relacion1 coincidan con los de la Relacion2 o ser
nulos. Las figuras 35 y 36 muestran el esquema de relación y las relaciones de una
llave foránea.
NOTAS Universitarias | 43
Figura 35. Esquema de Relación que utiliza una llave foránea.
PROGRAMACADEMICO
CODPROGACA NOMBPROGACAD FECHCREPROGACA ESTAPROGACA
22 SISTEMAS 01/01/1986 AC
23 INSDUSTRIAL 01/01/1987 AC
25 CIVIL 01/01/1985 AC
MATERIA
CODMATE CODPROGACAD NOMMATE INTHORMATE ESTAMATE
2054 22 Lógica 4 AC
2048 23 Procesos 4 AC
2041 22 Estructuras de
Datos
6 AC
2078 Comunicación de
datos
4 IN
Figura 36. Relaciones con llavea foránea.
En el ejemplo anterior un nuevo registro cuyo código de programa CODPROGACA sea
diferente a los valores 22, 23 o 25 (que son los registros de la relación
PROGRAMACADEMICO) no podría existir en la relación MATERIA.
Definidas sobre las tuplas de una relación (cardinalidad): el número de tuplas o
registros que puede tener una relación se puede gestionar a través de una
restricción de cardinalidad; sin embargo al implementar esta restricción es
necesario el uso de disparadores o procedimientos almacenados en el motor de
base de datos. Un ejemplo de esta restricción es limitar el número de alumnos
matriculados en un curso.
FKPROGMAT
PROGRAMAACADEMICO
CODPROGACA
NOMBRPROGACA
FECHREGCALPRGACA
ESTAPROGACA
<pi> Number
Variable characters (50)
Date
Variable characters (2)
<M>
<M>
<M>
<M>
PKPROGRAMAACADEMICO
...
<pi>
MATERIA
CODMATE
CODPROGACAD
NOMMATE
INTHORMATE
ESTAMATE
<pi> Number
Number
Variable characters (50)
Number
Variable characters (2)
<M>
PKMATERIA
...
<pi>
FKPROGMAT
NOTAS Universitarias | 44
Sobre los dominios (verificación sobre los valores de un dominio): todos los
atributos de una relación deben ser definidos sobre un dominio y deben contener
valores dentro del conjunto del dominio específico.
3.3 Paso del modelo E/R al relacional
El paso de un diseño realizado utilizando el modelo entidad interrelación al modelo
relación (que es el que utiliza la gran mayoría de motores comerciales de bases de datos)
es relativamente simple si se siguen una serie de patrones y recomendaciones. A
continuación se describirán diferentes alternativas y técnicas para realizar esta
transformación.
3.3.1 Paso de una asociación muchos a muchos entre dos entidades
Cuando se posee en diagrama de base de datos dos entidades relacionadas con
cardinalidad muchos a muchos, la mejor opción es “romper” esa relación con una tercera
entidad; es usual que nuevos atributos aparezcan en la tercera entidad. Las figuras 37 y 38
muestran un ejemplo de este proceso.
Figura 37. Dos entidades relacionadas con cardinalidad muchos a muchos
Figura 38. Tres entidades con relaciones uno a muchos
relacionMuchosAMuchos
CURSO
CODICURS
NOMBCURS
INHOCURS
CREDCURS
ESTACURS
<pi> Number
Variable characters (50)
Number
Number
Variable characters (2)
<M>
<M>
<M>
<M>
PKCURSO
...
<pi>
ALUMNO
CODALUMN
NOMBALUM
GENEALUM
TELEALUM
<pi> Number
Variable characters (50)
Variable characters (1)
Variable characters (15)
<M>
<M>
<M>
<M>
PKALUMNO
...
<pi>
FKCURINSC FKALUMINC
CURSO
CODICURS
NOMBCURS
INHOCURS
CREDCURS
ESTACURS
<pi> Number
Variable characters (50)
Number
Number
Variable characters (2)
<M>
<M>
<M>
<M>
PKCURSO
...
<pi>
ALUMNO
CODALUMN
NOMBALUM
GENEALUM
TELEALUM
<pi> Number
Variable characters (50)
Variable characters (1)
Variable characters (15)
<M>
<M>
<M>
<M>
PKALUMNO
...
<pi>
INSCRIPCION
CONSINSC
FECHINSC
ESTAINSC
<pi> Number
Date
Variable characters (2)
<M>
<M>
<M>
PKINSCRIPCION
...
<pi>
NOTAS Universitarias | 45
3.3.2 Asociaciones uno a uno
Las asociaciones uno a uno entre dos entidades (o relaciones en el modelo relacional) son
muy sospechosas, sin embargo son útiles y hasta necesarias en algunos casos. La forma de
implementar estas asociaciones es creando una llave foránea entre las dos entidades y
adicionalmente sobre los atributos que tiene asociada la llave foránea de la tabla (relación)
que referencia, se implementa una restricción de unicidad y de no nulidad (esta última
según sea necesaria). La Figura 39 muestra un ejemplo de una relación uno a uno.
Figura 39. Dos entidades relacionadas por una asociación uno a uno
3.3.3 Paso de Herencia a relaciones uno a muchos
La asociación de herencia tan común en el modelo E/R (Figura 40) no existe en el modelo
relacional y aunque existen muchas técnicas para transformar esta asociación, a
continuación presentamos dos posibles alternativas las cuales se representan en las
figuras 41 y 42.
Figura 40. Asociación de herencia entre empleado con docente y servicios generales
FKCLIENTARJ
CLIENTE
CODICLIEN
NOMCLIEN
ESTACLIEN
<pi> Number
Variable characters (50)
Variable characters (2)
<M>
<M>
<M>
PKCLIENTE
...
<pi>
TARJETAPUNTOS
CODITARJ
FECHCTARJ
PUNTTARJ
<pi> Number
Date
Number
<M>
<M>
<M>
PKTARJETAPUNTOS
...
<pi>
ES UN
FKDPTOEMPLE
EMPLEADO
NUMIDENEMPL
TIPIDENEMPL
NOMBEMPL
TELEEMPL
<pi>
<pi>
Number
Variable characters (3)
Variable characters (50)
Variable characters (15)
<M>
<M>
<M>
PKEMPLEADO
...
<pi>
DOCENTE
TIPODOCTE
CARSEMDCTE
Variable characters (50)
Number
SERVICIOSGENERALES
NUMTURSEM Number
DEPARTAMENTO
CODIDPTO
NOMDPTO
<pi> Number
Variable characters (50)
<M>
<M>
PKDEPARTAMENTO
...
<pi>
NOTAS Universitarias | 46
Figura 41. Asociación entre empleado con docente y servicios generales
sin herencia – opción 1
Figura 42. Asociación entre empleado con docente y servicios generales
sin herencia – opción 2
FKDPTODOCENTE
FKDPTOSERVGEN
DEPARTAMENTO
CODIDPTO
NOMDPTO
<pi> Number
Variable characters (50)
<M>
<M>
PKDEPARTAMENTO
...
<pi>
DOCENTE
NUMIDENEMPL
TIPIDENEMPL
NOMBEMPL
TELEEMPL
TIPODOCTE
CARSEMDCTE
<pi>
<pi>
Number
Variable characters (3)
Variable characters (50)
Variable characters (15)
Variable characters (50)
Number
<M>
<M>
<M>
PKDOCENTE
...
<pi>
SERVICIOSGENERALES
NUMIDENEMPLE
TIPIDENEMPLE
NOMBEMPL
TELEEMPL
NUMTURSEM
<pi>
<pi>
Number
Variable characters (3)
Variable characters (50)
Variable characters (15)
Number
<M>
<M>
<M>
<M>
PKSERVICIOSGENERALES
...
<pi>
NOTAS Universitarias | 47
3.3.4 Asociaciones recursivas (a la misma tabla)
La relación recursiva, es decir a la misma tabla, se utiliza cuando se desea modelar una
relación entre ejemplares de la misma entidad, por ejemplo como se puede apreciar en la
Figura 43 existe una relación de tipo jefe – empleado, pero el jefe es a su vez un empleado,
así que se considera un ejemplar dentro de la tabla.
Figura 43. Asociación recursiva
3.3.5 Ejemplo de manejo de productos
Un ejemplo práctico interesante de analizar es el de empresas dedicadas a la venta de
productos, y específicamente a dos tipos muy diferentes de productos; por un lado
encontramos productos comestibles como arroz, frijol, etc. Por otro lado tenemos
productos como un vehículo o un computador. Aunque el proceso de venta es
prácticamente el mismo, la diferencia radica en el control sobre la información del
producto a vender; llevar control sobre todas y cada una de las bolsas de arroz vendidas
probablemente sea ineficiente e innecesaria. Por el contrario, llevar control sobre cada
vehículo vendido es completamente necesario. Las figuras 44 y 45 representan dos
posibles diseños para la base de datos (simplificada) del proceso de venta, el primero para
la venta de productos en volumen (como los comestibles) y el segundo para artículos como
vehículos.
FKJEFE
EMPLEADO
CODEMPL
NUMDOCEMPL
TIPODOCEMPL
NOMEMPL
GENEEMPL
<pi> Number
Number
Variable characters (2)
Variable characters (50)
Variable characters (1)
<M>
<M>
<M>
<M>
PKEMPLEADO
...
<pi>
NOTAS Universitarias | 48
Figura 44. Diagrama relacional para venta de productos sin control individual
Figura 45. Diagrama relacional para venta de productos con control individual
3.4 Ejercicios
1. Crear un ejemplo de los datos (tablas en una hoja de cálculo) para cada uno de los
pasos del numeral 3.3.
2. Diseñar una base de datos relacional para el problema informático de una
biblioteca. En clase se plantea un dominio de una biblioteca ficticia y a partir de
este dominio se genera el diseño de la base de datos.
FKVENTDETVENT
FKPRODDETVENT
FKTIPPRODPROD
VENTA
CODIVENT
FECHVENT
ESTAVENT
<pi> Number
Date
Variable characters (2)
<M>
<M>
<M>
PKVENTA
...
<pi>
DETALLEVENTA
NUMITEM
CANTDETVEN
VALORVENT
ESTADEVE
<pi> Number
Number
Number (12,2)
Variable characters (2)
<M>
<M>
<M>
<M>
PKDETALLEVENTA
...
<pi>
PRODUCTO
CODPROD
CANTPROD
VALOR
ESTAPROD
<pi> Number
Number (7)
Number (12,2)
Variable characters (2)
<M>
<M>
<M>
<M>
PKPRODUCTO
...
<pi>
TIPOPROCUTO
CODITPPROD
NOMTIPROD
ESTATIPROD
<pi> Number
Variable characters (50)
Variable characters (2)
<M>
<M>
<M>
PKTIPOPROCUTO
...
<pi>
FKVENTDETVENT
FKPRODDETVENT
FKTIPPRODPROD
VENTA
CODIVENT
FECHVENT
ESTAVENT
<pi> Number
Date
Variable characters (2)
<M>
<M>
<M>
PKVENTA
...
<pi>
DETALLEVENTA
NUMITEM
ESTADEVE
VALORVENT
<pi> Number
Variable characters (2)
Number (12,2)
<M>
<M>
<M>
PKDETALLEVENTA
...
<pi>
PRODUCTO
CODPROD
PLACA
VALOR
ESTAPROD
<pi> Number
Variable characters (7)
Number (12,2)
Variable characters (2)
<M>
<M>
<M>
<M>
PKPRODUCTO
...
<pi>
TIPOPROCUTO
CODITPPROD
NOMTIPROD
ESTATIPROD
<pi> Number
Variable characters (50)
Variable characters (2)
<M>
<M>
<M>
PKTIPOPROCUTO
...
<pi>
NOTAS Universitarias | 49
3. Diseña una base de datos relacional para el problema informático de una entidad
bancaria. En clase se plantea un dominio de una entidad bancaria ficticia y a
partir de este dominio se genera el diseño de la base de datos.
4. Diseña una base de datos relacional para el problema informático de una cadena
de supermercados. En clase se plantea un dominio de una entidad cadena de
supermercados ficticia y a partir de este dominio se genera el diseño de la base de
datos.
5. Diseña una base de datos relacional para el problema informático de una video
tienda. En clase se plantea un dominio de una video tienda ficticia y a partir de
este dominio se genera el diseño de la base de datos.
NOTAS Universitarias | 50
NOTAS Universitarias | 51
4 Lenguaje de consulta estructurado SQL
Existen cinco tipos de instrucciones SQL, que son:
DDL (Data Definition language) o CREATE
o ALTER
o RENAME
o TRUNCATE
o DROP
DML (Data Manipulation Language) o INSERT
o UPDATE
o DELETE
DCL (Data Control Language) o GRANT
o REVOKE
Transaction Control o COMMIT
o SAVEPOINT
o ROLLBACK
Data Retrieval o SELECT
Antes de empezar a trabajar con las instrucciones SQL es necesario conocer otros
conceptos que serán utilizados de forma constante en este documento:
Operadores:
Los operadores aritméticos son:
o Multiplicación “*”
o División “/”
o Adición “+”
o Substracción ” -”
Los operadores Lógicos son: o AND
o OR
o NOT
Los operadores Relacionales son:
o Igual que “=”
o Diferente que “<>”
o Mayor que “>”
o Menor que “<”
NOTAS Universitarias | 52
o Mayor o igual que “>=”
o Menor o igual que “<=”
Tipos de Datos en Oracle
Los tipos de datos comúnmente utilizados en este documento son:
VARCHAR2(n), tipo de dato tipo cadena de caracteres con una longitud
máxima de 4000 bytes especificada por el parámetro n.
NUMBER(p,s), tipo de dato numérico, donde p es la precisión (rango 1 a
38)y s la escala (rango -84 a 124).
DATE, tipo de dato fecha, permite almacenar valores desde enero 1 de 4712
AC hasta diciembre 31 de 9999 DC.
BLOB, tipo de dato “Binary Large Object” para el almacenamiento de
archivos en la base de datos, el tamaño máximo es de 4 GB.
4.1 Instrucciones DDL
Las instrucciones DDL (Data Definition Language) son utilizadas para crear, modificar o
eliminar los objetos de la base de datos.
4.1.1 Instrucción CREATE
La instrucción CREATE puede ser muy compleja o relativamente simple dependiendo de su
uso; a continuación veremos varios ejemplos del uso de esta instrucción:
CREATE TABLE nombreDeLaTabla(
identificadorColumna1 tipoDeDato,
identificadorColumna2 tipoDeDato,
identificadorColumnan tipoDeDato);
La forma básica de la instrucción CREATE incluye el nombre de la tabla y la creación de
una o más columnas. En el siguiente ejemplo podemos apreciar la creación de una tabla
con cuatro columnas:
CREATE TABLE ESTUDIANTE(
CEDULA NUMBER,
NOMBRE VARCHAR2(100),
FECHANACIMIENTO DATE,
ESTADO VARCHAR2(2));
La primera columna llamada CEDULA es de tipo NUMBER. La segunda columna se
denomina NOMBRE y es de tipo VARCHAR2 con una tamaño de 100 caracteres. La tercera
columna es llamada FECHANACIMIENTO y es de tipo DATE lo que significa que puede
almacenar una fecha que incluye las horas, minutos y segundos; por último se declara la
columna ESTADO de tipo VARCHAR2 con una longitud de dos caracteres. Es importante
NOTAS Universitarias | 53
resaltar cómo el tipo de datos NUMBER puede ser utilizado si ninguna especificación de su
precisión y escala. El motor asigna un valor por defecto a estos parámetros. Sin embargo,
si se desea tener control sobre estos parámetros es necesario especificarlos; en el caso de
tipo VARCHAR2 es necesario especificar su longitud máxima; el tipo DATE por defecto
permite almacenar una fecha compuesta del día, mes, año, minutos, segundos y
milisegundos y no necesita de ningún parámetro adicional.
RESTRICCIONES (CONSTRAINTS)
Existen cinco restricciones (constraints) principales en SQL, ellas son:
Llave Primaria (Primary Key): La llave primaria es una restricción que afecta a una
o varias columnas e implica que los valores de la o las columnas no pueden ser
nulos ni tener valores repetidos.
Llave Foránea (Foreign Key): La llave foránea es una restricción entre dos tablas A
y B (la tabla B puede ser la misma A. Este concepto será explicado con detalle más
adelante), en donde una o más columnas de la tabla B referencian al mismo
número de columnas de la tabla A y los valores de la o las columnas de la tabla que
referencia (B) deben coincidir con los valores de la o las columnas de la tabla que
es referenciada (A).
Restricción de No Nulidad (Not Null): La restricción de NO nulidad indica que los
valores de una columna no pueden ser nulos.
Unicidad (Unique): Indica que la columna o columnas “Unique” deben poseer
valores únicos aunque pueden contener valores nulos.
Validación booleana (Check): Es una restricción aplicable al momento de insertar o
actualizar registros en la tabla y dependiendo del resultado de la expresión (el
resultado es booleano es decir verdadero o falso) se puede efectuar la actualización
o inserción según sea el caso.
En el siguiente ejemplo podemos observar la creación de una tabla con los mismo
atributos que el ejemplo anterior y con la creación de la llave primaria para el atributo
CEDULA de dos formas posibles.
CREATE TABLE ESTUDIANTE(
CEDULA NUMBER,
NOMBRE VARCHAR2(100),
FECHANACIMIENTO DATE,
ESTADO VARCHAR2(2),
CONSTRAINT PKESTUDIANTE PRIMARY
KEY (CEDULA)
);
CREATE TABLE ESTUDIANTE(
CEDULA NUMBER PRIMARY KEY,
NOMBRE VARCHAR2(100),
FECHANACIMIENTO DATE,
ESTADO VARCHAR2(2)
);
NOTAS Universitarias | 54
El Primer ejemplo muestra la creación de la tabla utilizando la forma simple de asignar la
restricción de llave primaria al atributo CEDULA. La segunda muestra la forma “larga” de
hacerlo; como veremos en los siguientes apartados, es conveniente utilizar la segunda
forma. Existe la posibilidad de crear una llave primaria compuesta de dos o más atributos,
como se puede observar en el siguiente ejemplo:
En el ejemplo anterior se puede observar cómo en la tabla ESTUDIANTE (utilizando
cualquiera de los dos métodos), se declara una llave primaria (solo puede existir una
sola llave primaria por tabla), aunque esta llave primaria este compuesta por las
columnas NUMDOC Y TIPODOC. La forma general de crear una restricción tipo llave primaria
dentro de la declaración de la tabla es:
CONSTRAINT NombreLlavePrimaria PRIMARY KEY (columna(s))
En el siguiente ejemplo podemos observar como en la declaración de la tabla se
adicionan dos nuevos tipos de restricciones, el “Unique” y el “Not Null”:
CREATE TABLE ESTUDIANTE(
NUMDOC NUMBER,
TIPODOC VARCHAR2(2),
CODIGO NUMBER NOT NULL,
NOMBRE VARCHAR2(100) NOT NULL,
FECHANACIMIENTO DATE NOT NULL,
CELULAR VARCHAR2(20),
ESTADO VARCHAR2(2) NOT NULL,
CONSTRAINT PKESTUDIANTE PRIMARY KEY (NUMDOC,TIPODIC),
CONSTRAINT ESTUCODIUNIQUE UNIQUE(CODIGO)
);
Como se puede observar todas las columnas de la tabla a excepción de la columna
CELULAR son ahora “Not Null” lo cual indica que no pueden tener valores nulos; se podría
CREATE TABLE ESTUDIANTE(
NUMDOC NUMBER,
TIPODOC VARCHAR2(2),
NOMBRE VARCHAR2(100),
FECHANACIMIENTO DATE,
ESTADO VARCHAR2(2),
CONSTRAINT PKESTUDIANTE PRIMARY
KEY (NUMDOC,TIPODIC)
);
CREATE TABLE ESTUDIANTE(
NUMDOC NUMBER PRIMARY KEY,
TIPODOC VARCHAR2(2) PRIMARY KEY,
NOMBRE VARCHAR2(100),
FECHANACIMIENTO DATE,
ESTADO VARCHAR2(2)
);
NOTAS Universitarias | 55
considerar que las columnas NUMDOC y TIPODOC pueden recibir valores nulos (su
característica por defecto es permitir valores nulos), sin embargo al ser llave primaria,
automáticamente se añade la restricción de “Not Null” a estas columnas. La restricción
“Unique” afecta a la columna CODIGO impidiendo que en esta columna existan valores
duplicados.
La forma simple de crear restricciones “Not Null” a una columna en una tabla es
simplemente agregando la frase “NOT NULL” después del tipo de datos de la columna.
La forma general de crear una restricción tipo “Unique” dentro de la declaración de
la tabla es:
CONSTRAINT NombreRestriccionUnique UNIQUE (columna(s))
Las llaves foráneas se crean de una forma similar al resto de restricciones. Sin
embargo, es fundamental tener claro donde se crea. La llave foránea se crea en la tabla que
referencia y NO en la tabla referenciada; la Figura 46 muestra a la izquierda la tabla que es
referenciada y a la derecha la tabla que referencia, como se puede observar la terminación
en tres líneas llega a la tabla que referencia.
Figura 46. Tabla que referenciada y tabla que referencia.
FKPROGACAALUM
ALUMNO
CODIGOALUM
NOMBREALUM
DIRECCIONALUM
GENEROALUM
ESTADOALUM
<pi> Number
Variable characters (50)
Variable characters (50)
Variable characters (1)
Variable characters (2)
<M>
<M>
<M>
<M>
CPALUMNO
...
<pi>
PROGRAMAACADEMICO
CODPROGACA
NOMBRPROGACA
FECHREGCALPRGACA
ESTAPROGACA
<pi> Number
Variable characters (50)
Date
Variable characters (2)
<M>
<M>
<M>
<M>
PKPROGRAMAACADEMICO...
<pi>
CREATE TABLE ALUMNO(
CODIGOALUM NUMBER,
NOMBREALUM VARCHAR2 (50) NOT NULL,
DIRECCIONALUM VARCHAR2 (50),
GENEROALUM VARCHAR2 (1) NOT NULL,
ESTADOALUM VARCHAR2 (2) NOT NULL,
CODPROGACA NUMBER NOT NULL,
CONSTRAINT CPALUMNO PRIMARY KEY (CODIGOALUM),
CONSTRAINT FKPROGACAALUM FOREIGN KEY (CODPROGACA) REFERENCES
PROGRAMAACADEMICO(CODPROGACA)
);
CREATE TABLE PROGRAMAACADEMICO(
CODPROGACA NUMBER,
NOMBPROGACA VARCHAR2(50) NOT NULL,
FECHREGCALPRGACA DATE NOT NULL,
ESTAPROGACA VARCHAR2(2) NOT NULL,
CONSTRAINT PKPROGRAMAACADEMICO PRIMARY KEY (CODPROGACA)
);
NOTAS Universitarias | 56
En el ejemplo anterior se puede observar la codificación del diagrama de la Figura
43; es importante resaltar nuevamente como la llave foránea se crea en la tabla que
referencia a través de la instrucción:
CONSTRAINT nombrellaveForanea FOREIGN KEY (atributoAsociado) REFERENCES
TablaReferenciada(atributoReferenciado)
Otro objeto de la base de datos que se puede crear utilizando la instrucción
CREATE es un índice (estructura que hace más eficiente la localización de los datos en las
tablas) y la instrucción general de construcción es:
CREATE INDEX nombreDelIndice ON nombreDelaTabla (atributo(s) de la tabla)
El siguiente ejemplo muestra cómo crear un índice llamado indiceapellido sobre el
atributo apellido de la tabla empleado:
CREATE INDEX indiceapellido ON EMPLEADO(APELLIDO);
Muchas veces se utiliza un atributo auto numerado en una tabla, es decir un
atributo que toma un valor automáticamente; en el caso del motor de base de datos
Oracle, la forma de implementar ésto es atreves de una secuencia. Una secuencia es un
objeto de la base de datos que posee un valor numérico y cada vez que realizamos una
inserción en una tabla y utilizamos esta secuencia, se incrementa o decrementa (según sea
el caso) automáticamente. La forma de crear una secuencia es la siguiente:
CREATE SEQUENCE nombreDeLaSecuencia START WITH valorInicial;
En el siguiente ejemplo se crea una secuencia llamada secEmpleado que inicia su
valor en 1000:
CREATE SEQUENCE secEmpleado START WITH 1000;
4.1.2 Instrucción ALTER
La instrucción ALTER es utilizada cuando se desea realizar una modificación estructural de
una tabla de la base de datos, como adicionar un atributo, modificar el tamaño o tipo de
un atributo existente o eliminar un atributo. Para adicionar un atributo la instrucción
genérica del ALTER es:
ALTER TABLE nombreDeLaTabla
ADD (nombreAtributo tipoDeDato);
NOTAS Universitarias | 57
En el siguiente ejemplo se adiciona un atributo llamado telCelular de tipo varchar2
a la tabla EMPLEADO:
ALTER TABLE EMPLEADO
ADD (telCelular varchar2(12));
Para modificar un atributo existente dentro de una tabla se utiliza la instrucción:
ALTER TABLE nombreDeLaTabla
MODIFY (nombreAtributo tipoDeDato);
El nombreAtributo es un atributo ya existente y el tipoDeDato es el nuevo tipo de
dato del atributo o el mismo con diferente longitud; las siguientes reglas deben tenerse en
cuenta al momento de realizar la modificación:
Solo se puede decrementar el tamaño de un atributo si la tabla no tiene valores en
ese atributo.
Solo se puede cambiar el tipo de dato del atributo si el atributo no tiene valores en
la tabla.
Solo se puede asignar la restricción NOT NULL al atributo si éste no posee valores
NULOS.
Para eliminar un atributo de la tabla se utiliza la instrucción:
ALTER TABLE nombreDeLaTabla
DROP COLUMN nombreAtributo;
El siguiente ejemplo elimina el atributo llamado telCelular de la tabla EMPLEADO:
ALTER TABLE EMPLEADO
DROP COLUMN telCelular;
4.1.3 Instrucción RENAME
La instrucción RENAME renombra una tabla a un nuevo nombre, la instrucción es:
RENAME nombreActual TO nuevoNombre;
En el siguiente ejemplo se renombra la tabla ESTUDIANTE por ALUMNO.
RENAME ESTUDIANTE TO ALUMNO;
NOTAS Universitarias | 58
4.1.4 Instrucción TRUNCATE
La instrucción TRUNCATE se utiliza cuando se desea eliminar todos los registros de una
tabla sin eliminar la tabla en sí, es mucho más eficiente que la instrucción DELETE (ver más
adelante) y no genera ROLLBACK. La instrucción genérica es:
TRUNCATE TABLE nombreDeLaTable;
4.1.5 Instrucción DROP
La instrucción DROP es utilizada para eliminar objetos de la base de datos como las tablas,
la siguiente instrucción y el ejemplo a continuación demuestran el uso de la instrucción
DROP.
DROP TABLE nombreDeLaTabla;
DROP TABLE nombreDeLaTabla CASCADE CONSTRINTS;
DROP TABLE EMPLEADO;
DROP TABLE EMPLEADO CASCADE CONSTRINTS;
La clausula CASCADE CONSTRINTS se utiliza cuando hay llaves foráneas relacionadas con
la tabla y se deben borrar.
4.2 Instrucciones DML
Las instrucciones DML (Data Manipulation Language) se encargan de manipular los datos
que se encuentran en las tablas de la Base de Datos.; las tres instrucciones clave son el
INSERT, UPDATE y el DELETE.
4.2.1 Instrucción INSERT
La instrucción INSERT es utilizada para insertar nuevos registros en las tablas, tiene dos
posibles versiones de acuerdo a la forma de utilización, las cuales son:
INSERT INTO nombreDeLaTabla VALUES(valor1, valor2, valor_n);
INSERT INTO nombreDeLaTabla(atributo1, atributo2, atributon) VALUES(valor1,
valor2, valor_n);
La diferencia entre las dos versiones radica en que en la segunda especificamos el
orden de los atributos, mientras que en la primera se asume el orden de los atributos que
en este momento posee la tabla. En los siguientes ejemplos se muestra el uso de la
instrucción INSERT en la tabla CURSO, la cual tiene cuatro atributos, el primero de tipo
NOTAS Universitarias | 59
numérico, el segundo de tipo cadena de caracteres, el siguiente de tupo fecha y el último
de tipo cadena pero que puede ser NULO.
INSERT INTO CURSO VALUES (1102, „CALCULO I‟, „01/01/2011‟, NULL);
INSERT INTO CURSO (NOMBCUR, CODCUR, ESTACUR, FECHCUR) VALUES („CALCULO I‟, 1102,
NULL, „01/01/2011‟);
El tipo fecha se puede ingresar como una cadena de caracteres, ya que el motor
realiza la transformación al tipo de dato adecuado siempre y cuando el formato de la fecha
coincida con el formato establecido en el motor de la base de datos.
4.2.2 Instrucción UPDATE
La instrucción UPDATE es utilizada con el fin de actualizar uno o varios datos existentes en
una tabla. La forma general de utilizar la instrucción es:
UPDATE nombreDeLaTabla
SET atributoX = valorX
WHERE atributoY = valorY;
Donde atributoX es el atributo de la tabla al que queremos cambiar su valor por el
valorX y atributoY es el atributo sobre el cual se evaluara la condición para cambiar el
valor en ese registro siempre y cuando sea igual al valorY. El siguiente ejemplo ilustra el
uso de la instrucción UPDATE para actualizar el estado del curso a „AC‟ siempre y cuando el
código del curso sea 1102.
UPDATE CURSO
SET ESTACUR = ‘AC’
WHERE CODICUR = 1102;
La clausula WHERE puede ser más compleja que la comparación entre un atributo y
un valor, pueden ser expresiones booleanas que incluyan operadores lógicos y
relacionales.
4.2.3 Instrucción DELETE
La instrucción DELETE se utiliza para eliminar registros de una tabla, posee dos versiones
tanto para eliminar todos los registros de la tabla como para eliminar solo alguno(s).
DELETE FROM nombreDeLaTabla;
DELETE FROM nombreDeLaTabla
WHERE condición;
NOTAS Universitarias | 60
En los siguientes ejemplos se eliminan todos los registros (primer ejemplo) de la tabla
y solo los que cumplan con la condición de tener estado „AC‟ (segundo ejemplo).
DELETE FROM CURSO;
DELETE FROM CURSO
WHERE ESTACUR = ‘AC’;
4.3 Instrucciones DCL
Las instrucciones DCL (Data Control Language) son utilizadas para dar privilegios a los
usuarios de la base de datos, es decir dar permisos como poder insertar, actualizar, etc
sobre los datos.
4.3.1 Instrucción GRANT
La instrucción GRANT otorga privilegios a los usuarios, la estructura general de la
instrucción es:
GRANT nombreProvilegio TO nombreUsuario;
Donde nombreProvilegio es el nombre del privilegio que se quiere otorgar y
nombreUsuario es el usuario al cual se le quiere otorgar el privilegio. Es válido en lugar de
otorgar un privilegio, otorgar un rol (conjunto de privilegios); en el siguiente ejemplo se
otorga el rol de DBA (Data Base Administrator) al usuario ESTUDIANTE.
GRANT DBA TO ESTUDIANTE;
4.3.2 Instrucción REVOKE
La instrucción REVOKE a diferencia de GRANT, remueve privilegios de un usuario; la
estructura general de la instrucción es:
REVOKE nombreProvilegio FROM nombreUsuario;
El siguiente ejemplo revoca los privilegios (rol en este caso) de DBA del usuario
ESTUDIANTE.
REVOKE DBA FROM ESTUDIANTE;
Para otorgar y revocar privilegios se debe ser un usuario de la base de datos con el
privilegio de otorgar / revocar privilegios, es muy común que sea el administrador de la
base de datos quien se encargue de esta tarea.
NOTAS Universitarias | 61
4.4 Instrucciones de Control de Transacciones
Las instrucciones de control de transacciones permiten confirmar una transacción (o
conjunto de transacciones) en la base de datos como un INSERT, UPDATE ó DELETE.
Cuando varios usuarios de forma simultánea acceden a la base de datos, el motor
gestiona una parte de la memoria para las transacciones que realiza cada usuario, esta
memoria es temporal mientras dura la sesión del usuario y permite mantener separadas
las transacciones de diferentes usuarios; sin embargo cuando un usuario desee confirmar
o deshacer las transacciones realizadas tiene que utilizar un comando especifico.
4.4.1 Instrucción COMMIT
La instrucción COMMIT permite confirmar el conjunto de transacciones realizadas por un
usuario desde la última confirmación; la forma de utilizarlo es simplemente digitando el
comando en la consola de la base de datos.
COMMIT;
Cuando se realiza una instrucción DDL se hace implícitamente un COMMIT.
4.4.2 Instrucción SAVEPOINT
La instrucción SAVEPOINT permite crear un “punto de salvado” entre transacciones, es
común utilizarlo cuando queremos realizar diferentes transacciones por lotes sin
mezclarlas ni confirmar por cada lote o al terminar. La instrucción general es:
SAVEPOINT nombreDelSavePoint;
En el siguiente ejemplo se realizan 5 transacciones y dos SAVEPOINT.
INSERT INTO EMPLEADO VALUES(1,‟CARLOS‟,‟AC‟);
INSERT INTO EMPLEADO VALUES(2,‟ANDRES‟,‟AC‟);
SAVEPOINT SAV1;
INSERT INTO EMPLEADO VALUES(3,‟ANGELA‟,‟AC‟);
INSERT INTO EMPLEADO VALUES(4,‟PILAR‟,‟AC‟);
SAVEPOINT SAV2; INSERT INTO EMPLEADO VALUES(5,LUIS,‟AC‟);
Esta instrucción es usada comúnmente en conjunto a la instrucción ROLLBACK la
cual se especifica a continuación.
4.4.3 Instrucción ROLLBACK
La instrucción ROLLBACK es utilizada para “deshacer” las transacciones realizadas hasta el
último punto de confirmación (COMMIT); esta instrucción tiene dos posibles versiones, en
la primera simplemente se utiliza ROLLBACK hasta la última confirmación, en la segunda se
NOTAS Universitarias | 62
deshacen las transacciones hasta el punto de salvado que se desee. Las instrucciones
genéricas de ROLLBACK son las siguientes:
ROLLBACK;
ROLLBACK nombreDelSavePoint;
Si se realiza un ROLLBACK hasta un SAVEPOINT, éste debe haberse creado con
anterioridad. Al realizarse un ROLLBACK, todos los SAVEPOINT creados son eliminados
automáticamente.
4.5 Instrucciones de recuperación de datos
La instrucción de recuperación de datos SELECT permite mostrar al usuario los datos
almacenados en las tablas de la base de datos.
4.5.1 Instrucción SELECT
La instrucción SELECT se compone de varias partes, dos obligatorias y las demás
opcionales. La instrucción general de consulta simple es:
SELECT columna1, columna2, columnaN
FROM nombreDelaTabla;
Donde columna1, columna2, etc. Son los nombres de las columnas que queremos
mostrar y el nombreDeLaTabla es la tabla de donde se encuentran los datos que queremos
mostrar. Por ejemplo si queremos mostrar las columnas CODICUR y NOMBCUR de la tabla
CURSO, podemos utilizar la siguiente instrucción:
SELECT CODICUR, NOMBCUR
FROM CURSO;
Esta consulta mostraría todos los registros de la tabla CURSO, específicamente en
las columnas CODICUR, NOMBCUR; si se desea limitar el número de registros, se debe
utilizar la clausula WHERE. En el siguiente ejemplo se muestra como realizar la misma
consulta del ejemplo anterior, pero limitando el numero de registros solo a los cursos que
tengan estado ‟AC‟.
SELECT CODICUR, NOMBCUR
FROM CURSO
WHERE ESTACUR = ‘AC’;
La expresión asociada a la clausula WHERE debe arrojar un resultado booleano y
en esta expresión se pueden utilizar los operadores aritméticos, lógicos y relacionales que
NOTAS Universitarias | 63
se consideren útiles para la condición. En general la estructura de la instrucción SELECT
con condición es:
SELECT columna1, columna2, columnaN
FROM nombreDelaTabla
WHERE expresionDeCondicion;
4.6 Proceso de respaldo y recuperación
Para realizar el proceso de importación de una base de datos ejemplo en el motor Oracle,
como la base de datos DEMO, es necesario seguir los siguientes pasos: Debe existir un
usuario a donde importar como "seminario" en este caso.
1. Abrir una ventana de comandos y dirigirse al directorio donde fue instalado
Oracle, específicamente a la carpeta BIN y el programa IMP.exe ej:
C:\Oracle\DataBase\product\11.1.0\db_2\BIN
2. Digitar en la ventana de comandos:
IMP system/oracle FROMUSER=DEMO TOUSER=SEMINARIO
FILE='G:\backup\Semestre A de 2010\Seminarios\BASE DE DATOS
DEMO\backcal.dmp'
Donde system/Oracle es la pareja nombre de usuario / contraseña que posee
privilegios de importación.
FROMUSER= DEMO, es el usuario de donde se realizo el backup.
TOUSER=CURSO, es el usuario donde quedara restablecido el backup.
FILE = „…‟ es la ruta donde se encuentra el archivo con el backup.
Para realizar la exportación, es decir el respaldo de la base de datos, se realizan los
pasos anteriores, pero en lugar de utilizar el comando IMP, se utiliza el comando EXP.
4.7 Ejercicios
1. Investigar sobre diferentes opciones adicionales a las instrucciones SQL de este
capítulo.
2. Codificar la base de datos basada en el diseño creado en el capitulo anterior.
3. Codificar la base de datos del punto anterior en por lo menos tres motores
diferentes de base de datos.
4. Realizar 5 consultas simples a la base de datos DEMO.
5. Investigar y realizar 5 consultas de tipo join a la base de datos DEMO.
6. Utilizar el comando EXP para exportar una base de datos.
NOTAS Universitarias | 64
Bibliografía
De Miguel, Adoración; Piattini, Mario y Marcos, Esperanza. Diseño de Bases de Datos Relacionales.
España. Alfaomega. 2000. 549 p.
Connolly, Thomas y Begg, Carolyn. Sistemas de bases de datos. 4 ed. España. Pearson. 2005. 1320
p.
Silberschatz, Abraham; Korth, Henry y Sudarshan. Fundamentos de bases de datos. 5 ed. España.
McGraw-Hill. 2006. 953 p.
Elmasri, Ramez y Navathe, Shamkant. Sistemas de bases de datos : Conceptos gundamentales. 2
ed. Estados Unidos de America. Addison Wesley. 1997. 887 p.
Urman, Scott. Oracle 8 : Programación PL/SQL. España. Osborne. 1999. 778 p.
Cibergrafía
http://es.wikipedia.org/wiki/Base_de_datos (Definicion de base de datos, consultado: 2011)
http://www.alegsa.com.ar/Dic/sgbase de datos.php (Sistema gestor de base de datos, consultado:
2011)
http://www3.uji.es/~mmarques/f47/apun/node83.html (Modelo Entidad / Interrelación,
consultado: 2011)
http://www.monografias.com/trabajos24/herramientas-case/herramientas-case.shtml
(Herramientas CASE para bases de datos, consultado: 2011)
www.uazuay.edu.ec/analisis/El%20modelo%20relacional.pdf (EL modelo relacional, consultado:
2011)
http://ora.u440.com/ddl/ (Instrucciones DDL, consultado: 2011)
http://ora.u440.com/dml/ (Instrucciones DML, consultado: 2011)
http://psoug.org/reference/dcl.html (Instrucciones DCL, consultado: 2011)
http://ist.marshall.edu/ist480adbp/plsql_trnctl.html (Instrucciones Transaction Control,
consultado: 2011)
http://psoug.org/reference/select.html (Instrucciones Data Retrieval, consultado: 2011)