introducción a la base de datos

13
CAPITULO I. INTRODUCCIÓN Hoy en día existen diferentes formas de manejar la información a continuación se hará un comparativo sobre las formas que conocen hasta el momento y la Base de Datos. Además conoceremos porqué utilizar bases de datos, su concepto y las características que debe tener para ser una base de datos. 1.1. FORMAS DE MANEJO DE DATOS Enfoque tradicional versus Base de datos Hasta hoy, todo tipo de manejo de información se viene realizando a través de archivos tradicionales, hagamos una comparación de esta con la base de datos. Archivos Tradicionales Base De Datos Las aplicaciones son propietarias de sus archivos. Un archivo puede llegar a ser usado por diversas aplicaciones. Programas dependientes de la estructura y contenido de los archivos. Modificaciones de las estructuras de almacenamiento físico no involucran modificaciones en los programas de aplicación. La programación de las aplicaciones es facilitada dado que ella es realizada sobre vistas determinadas y que ella no está involucrada por las estructuras de almacenamiento físico ni por los problemas de acceso. Dificultad para compartir datos. Alto nivel de redundancia. Reduce la redundancia debido a que los datos pueden ser compartidos mediante vistas diferentes que pueden ser extraídos de la misma estructura de almacenamiento. Evita inconsistencias. Genera sistemas rígidos (inflexibles). Facilita el control de estándares. Falta de control sobre los datos. Mayor seguridad gracias a que la ejecución de operaciones ilícitas tales como la actualización o eliminación de datos que no pertenecen a una vista es fácilmente prohibida. Reduce los efectos producidos por cambios. Alto costo de Mantenimiento. Reduce costos de mantenimiento de programas. Por qué utilizar B.D.? 1

Upload: rafael-neftali-lizcano-reyes

Post on 28-Mar-2016

216 views

Category:

Documents


0 download

DESCRIPTION

Conceptos Básicos relacionados con BD

TRANSCRIPT

CAPITULO I. INTRODUCCIÓN

Hoy en día existen diferentes formas de manejar la información a continuación se hará un comparativo sobre las formas que conocen hasta el momento y la Base de Datos.

Además conoceremos porqué utilizar bases de datos, su concepto y las características que debe tener para ser una base de datos.

1.1. FORMAS DE MANEJO DE DATOS

Enfoque tradicional versus Base de datosHasta hoy, todo tipo de manejo de información se viene realizando a través de archivos tradicionales, hagamos una comparación de esta con la base de datos.

Archivos Tradicionales Base De Datos Las aplicaciones son

propietarias de sus archivos. Un archivo puede llegar a ser usado por diversas aplicaciones.

Programas dependientes de la estructura y contenido de los archivos.

Modificaciones de las estructuras de almacenamiento físico no involucran modificaciones en los programas de aplicación.

La programación de las aplicaciones es facilitada dado que ella es realizada sobre vistas determinadas y que ella no está involucrada por las estructuras de almacenamiento físico ni por los problemas de acceso.

Dificultad para compartir datos.

Alto nivel de redundancia.

Reduce la redundancia debido a que los datos pueden ser compartidos mediante vistas diferentes que pueden ser extraídos de la misma estructura de almacenamiento.

Evita inconsistencias. Genera sistemas rígidos

(inflexibles). Facilita el control de estándares.

Falta de control sobre los datos.

Mayor seguridad gracias a que la ejecución de operaciones ilícitas tales como la actualización o eliminación de datos que no pertenecen a una vista es fácilmente prohibida.

Reduce los efectos producidos por cambios. Alto costo de Mantenimiento. Reduce costos de mantenimiento de programas.

Por qué utilizar B.D.?

Las personas encuentran una serie de razones para decidir la necesidad de transformar un sistema orientado a archivos en un sistema apoyado en una base de datos. Estas razones pueden ser:

1. Relaciones complejas en el modelo de información.2. Alta volatilidad en los requerimientos de las aplicaciones y, como consecuencia, una excesiva carga

de re-programación.3. Necesidad de integración de nuevas aplicaciones junto con las ya existentes.

Motivaciones de orden tecnológico

La informática provee en la actualidad un sin número de herramientas, entre las que podemos incluir a los Sistemas de Gestión de Base de datos (SGBD = Data Base Management System) llamados también hoy en día “Motor de Base de Datos”. Estas herramientas vienen desarrollándose en una diversidad de formas (técnicas) que están asociadas directamente al aumento de capacidad del hardware (velocidad de procesamiento y almacenamiento) y la baja de precio de estos; y que tienen como objetivo la mejora de la productividad y calidad en el desarrollo y uso del software de la aplicación.

1

Motivaciones de orden organizacional

El estudio de la organización de la empresa es de vital importancia en B.D., en donde se debe determinar el funcionamiento de la misma y clasificar los diversos procesos en los tres niveles de la empresa (estratégico, táctico y operacional). Es decir, que la ejecución de un planteamiento estratégico de información pasa necesariamente por el uso de técnicas y herramientas asociadas a B.D.

Motivaciones de orden económico

Si bien es cierto, el esfuerzo inicial en B.D. puede ser costoso, éste es con el tiempo, de gran rentabilidad por las ventajas intrínsecas que redundarán en beneficio de la empresa; claro está que una mala aplicación de la misma, puede traer consecuencias imprevisibles y altos costos.

1.2. CONCEPTOS DE BASE DE DATOS

"Base de Datos es la representación de la realidad (entiéndase como organización) en forma de datos; los que están entrelazados de la manera más coherente posible, almacenados con una redundancia calculada y estructurados de tal manera que facilite su explotación, y que se pueda satisfacer las necesidades de información de los diferentes usuarios".

Una base de datos es un conjunto de información útil, confiable y organizada que al ser utilizada por sistemas aplicativos (programas de computador) se transforma en herramientas fundamentales en la toma de decisiones de una organización.

EJEMPLO DE UNA BASE DE DATOS

1.3. CARACTERÍSTICAS DE LAS BASES DE DATOS

Entre las principales características de las BD podemos tener la independencia de datos, menor redundancia, integridad, privacidad y migración de datos, entre otras.

Las principales características de Base de Datos son:

1. Conjunto (colección) de datos.2. Datos interrelacionados y estructurados.3. Redundancia controlada. 4. Independencia de datos y de procesos.5. Soporta múltiples usuarios y múltiples aplicaciones.

2

6. La actualización y recuperación de datos debe asegurar Integridad, Seguridad y Confidencialidad de los datos.

Conceptos Asociados a Base de Datos

Cuando nos referimos a Base de Datos, estamos haciendo referencia a un conjunto de conceptos que manejamos cotidianamente y que están fuertemente ligados al concepto mismo de Base de Datos. Así tenemos que:

- Base de Datos involucra un conocimiento profundo y detallado de la realidad referida a la organización.

- La Base de Datos debe ser la representación más fidedigna de la organización.

- Los datos que representan la organización deberán ser utilizados de manera coordinada e integral que facilite la "difusión" de los mismos.

- El proceso de difusión de los datos obliga a definir y establecer objetivos que protejan la organización. En consecuencia, existen cuatro conceptos involucrados; estos son: 1) Coherencia, asociado a la validez de los datos.2) Integridad, sobre el total de la información a representar. 3) Seguridad, como garantía de los datos en su representación. 4) Confidencialidad, otorgando acceso de acuerdo a los niveles de la organización.

Independencia de datos

Es la inmunidad de los programas a cambios de la estructura de almacenamiento, lo que permite que los programas que actualmente se están trabajando continúen ejecutándose correctamente después de que la estructura de almacenamiento de datos ha sufrido algún ajuste.

Redundancia

Se define haciendo que los datos queden almacenados, en lo posible, una sola vez y que sean compartidos por dos o más aplicaciones.

Integridad

Es la veracidad de que la base de datos contiene sólo datos reales y necesarios.

Privacidad

Es el legítimo derecho de los individuos y las organizaciones a determinar por sí mismos, cuándo, cómo y en qué medida, alguna información sobre ellos va a se transmitida a otros.

Flexibilidad

Es la capacidad de dar una respuesta rápida con diferentes criterios de búsqueda de información.

Entonación (“Tuning”)

Es el proceso de ajustar o afinar una base de datos para mejorar su rendimiento.

Migración de datos

Es el proceso de transportar los datos de un ambiente o plataforma a otra, acomodándolos a su nivel de uso.

3

1.4. VENTAJAS DE LAS BASES DE DATOS

Según C.J. DATE en "An Introduction to Database Systems" 3th. edition de 1982, dice :

a) La redundancia puede ser reducida.No es posible asegurar que toda la redundancia sea eliminada; pero es posible que por diversas razones se requiera mantener múltiples copias de la misma data.

b) La inconsistencia puede ser evitada.Es claro que si cada factor es representado por una entrada simple (es decir, si la redundancia es eliminada) no pueden ocurrir inconsistencias.Alternativamente, si la redundancia no es eliminada pero es controlada, entonces el sistema podrá garantizar que la base de datos no va a ser nunca inconsistente a la vista del usuario, asegurando que cualquier cambio debe realizarse automáticamente en todas las entradas posibles. Este proceso es conocido como "actualización simultánea" (propagating updates).

c) La data puede ser compartida.d) Los estándares pueden ser reformados.Con un control central de la base de datos, el Administrador de Base de Datos (DBA=DataBase Administrator) puede asegurar que todos los estándares aplicables serán seguidos en la representación de la data.La estandarización de los formatos de data almacenados es particularmente deseable como una ayuda para el intercambio de data (data interchange) o migración entre sistemas.

e) Las restricciones de seguridad pueden ser aplicables.Teniendo completa jurisdicción sobre la data operativa, el DBA:- Puede asegurar que los accesos a la base de datos serán a través de los propios canales (accesos / caminos que se definan).- Puede definir chequeos de autorización para el acceso a la data.

f) La integridad puede ser mantenida.El problema de integridad es el problema de asegurar que la data en la base de datos es exacta y precisa.La redundancia puede ser eliminada, pero la base de datos puede contener data incorrecta.

g) Los requerimientos en conflicto pueden ser balanceados.Conociendo la totalidad de los requerimientos de la empresa, el DBA puede estructurar el sistema de base de datos para proveer un servicio total que sea "el mejor para la empresa".

Uso flexible. Los datos pueden usarse o accesarse por diferentes caminos.Facilidad de cambios. La base de datos puede crecer y cambiar sin interferir con las formas establecidas de usar los datos.Economía. La minimización de los altos costos de hacer cambios a los programas, y por menor costo de almacenamiento de información, debido a que la cantidad de datos duplicados es mínima.Consistencia de datos. Al minimizar la redundancia, el sistema evita tener múltiples versiones de la misma información.Independencia de datos. Al lograr expandir la estructura de datos sin rescribir los programas.Privacidad. El sistema permite el bloqueo de accesos no autorizados.

4

1.5. COMPONENTES DE LA BASE DE DATOS

Entre los componentes de una BD tenemos al Sistema de Gestión de BD o SGBD (DBMS en inglés), el Administrador de BD (DBA), el desarrollador y el diccionario de datos.

Veámoslo gráficamente, a través de sus componentes más importantes:

1.6. SISTEMA DE GESTIÓN DE BASE DE DATOS (DATABASE MANAGEMENT SYSTEM)

El SGBD es el componente de software más importante de todo el sistema, maneja todas las funciones generales, controla la transmisión de la información desde el nivel externo hasta el nivel interno.

Conceptos de un DBMS (SGBD)

Tomemos algunas definiciones tales como:

" ...sistema desarrollado que hace posible acceder a datos integrados que atraviesan los límites operacionales, funcionales u organizacionales de una empresa. " (S. Atre, 1980)

" ...conjunto de soportes lógicos que permiten describir, memorizar, manipular, tratar y asegurar los conjuntos de datos constituyentes de la base de datos en un entorno de múltiples usuarios simultáneos." (Flory, 1982)

" ...conjunto de programas, procedimientos, lenguajes, etc. que suministra a los usuarios los medios necesarios para describir, recuperar y manipular los datos integrados en la base, asegurando su Confidencialidad y seguridad." (De Miguel, 1985)

" ... es la interfaz entre las transacciones y la base de datos."

Es el conjunto de programas que controlan la transmisión de la información desde el nivel externo, el acceso de los usuarios, hasta el nivel interno.

5

Es el componente de software más importante de todo el sistema, maneja todas las funciones generales, tales como distanciar a los usuarios de la base de datos de detalles de administración de base de datos. Software que permite la interfase con la base de datos localizada en varios lugares de la red de comunicación.

Componentes del SGBD

Características

Maneja y participa en los procesos de ejecución del sublenguaje de datos, en la transmisión y recuperación de la información, almacenándola en el área de trabajo que pertenece al usuario específico.

Traduce desde el sublenguaje, cuales datos están contenidos en el submodelo, para conocer perfectamente que grupos de datos debe trabajar y su modo de almacenamiento físico.

Efectúa la traducción de la base de datos físicamente almacenada para acceder los datos y luego ponerlos a disposición del usuario.

Utiliza instrucciones o rutinas para definir submodelo de datos y modelo de datos, cuando son implantados por primera vez.

Controla el diccionario de datos, que es un directorio que contiene todas las definiciones detalladas de la estructura de datos.

Objetivos y Funciones de un SGBD

Sus principales objetivos son los siguientes:

Independencia lógica y física de los datos: se refiere a la capacidad de modificar una definición de esquema en un nivel de la arquitectura sin que esta modificación afecte al nivel inmediatamente superior. Para ello un registro externo en un esquema externo no tiene por qué ser igual a su registro correspondiente en el esquema conceptual.

6

Redundancia mínima: se trata de usar la base de datos como repositorio común de datos para distintas aplicaciones.

Acceso concurrente por parte de múltiples usuarios: control de concurrencia mediante técnicas de bloqueo o cerrado de datos accedidos.

Distribución espacial de los datos: la independencia lógica y física facilita la posibilidad de sistemas de bases de datos distribuidas. Los datos pueden encontrarse en otra habitación, otro edificio e incluso otro país. El usuario no tiene por qué preocuparse de la localización espacial de los datos a los que accede.

Integridad de los datos: se refiere a las medidas de seguridad que impiden que se introduzcan datos erróneos. Esto puede suceder tanto por motivos físicos (defectos de hardware, actualización incompleta debido a causas externas), como de operación (introducción de datos incoherentes).

Consultas complejas optimizadas: la optimización de consultas permite la rápida ejecución de las mismas.

Seguridad de acceso y auditoría: se refiere al derecho de acceso a los datos contenidos en la base de datos por parte de personas y organismos. El sistema de auditoría mantiene el control de acceso a la base de datos, con el objeto de saber qué o quién realizó una determinada modificación y en qué momento.

Respaldo y recuperación: se refiere a la capacidad de un sistema de base de datos de recuperar su estado en un momento previo a la pérdida de datos.

Acceso a través de lenguajes de programación estándar: se refiere a la posibilidad ya mencionada de acceder a los datos de una base de datos mediante lenguajes de programación ajenos al sistema de base de datos propiamente dicho.

Funciones

- Definición de datos- Privacidad y seguridad- Modificación y/o recuperación de datos- Backup (respaldo) y/o restore (recuperación)- Mantenimiento- Consulta- Reportes

El gestor de base de datos es responsable de las siguientes tareas:

Interacción con el gestor de archivos. Los datos sin procesar se almacenan en el disco usando el sistema de archivos que normalmente es proporcionado por un sistema operativo convencional. El gestor de base de datos traduce las distintas sentencias DML a comandos del sistema de archivos de bajo nivel. Así, el gestor de base de datos es responsable del verdadero almacenamiento, recuperación y actualización de los datos en la base de datos.

Implantación de la integridad. Los valores de los datos que se almacenan en la base de datos deben satisfacer ciertos tipos de restricciones de consistencia. Por EJEMPLO., el número de horas que un empleado puede trabajar en una semana no puede exceder un límite específico (digamos 80 horas). El administrador de la base de datos debe especificar explícitamente estas restricciones. El gestor de la base de datos entonces puede determinar si las actualizaciones a la base de datos dan como resultado la violación de la restricción; si así es, se debe tomar la acción apropiada.

Implantación de seguridad. No todos los usuarios de la base de datos necesitan tener acceso a todo su contenido. Es trabajo del gestor de la base de datos hacer que se cumplan estos requisitos de seguridad.

7

Copia de seguridad y recuperación. Un sistema informático, como cualquier otro dispositivo mecánico o eléctrico, está sujeto a fallos. Las causas de los fallos incluyen rotura de disco, problemas del suministro de energía y errores en el software. En cada uno de estos casos se pierde la información referente a la base de datos. Es responsabilidad del gestor de la base de datos detectar tales fallos y restaurar la base de datos al estado que existía antes de que ocurrir el fallo. Esto se lleva a cabo normalmente a través de la iniciación de varios procedimientos de copias de seguridad y recuperación.

Control de concurrencia. Cuando varios usuarios actualizan la base de datos concurrentemente, es posible que no se conserve la consistencia de los datos. Controlar la interacción entre los usuarios concurrentes es otra responsabilidad del gestor de la base de datos.

1.7. DBA (ADMINISTRADOR DE BD)

El DBA es el responsable de controlar, mantener y aplicar procesos o programas de utilidad.

Concepto

Es la persona o grupo de personas responsables de controlar, mantener y aplicar procesos o programas de utilidad que forma parte del manejador de base de datos (SGBD).

Una de las razones principales para tener sistemas de gestión de bases de datos es tener el control central de los datos y de los programas que acceden a esos datos. La persona que tiene dicho control central sobre el sistema se llama administrador de la base de datos (database administrator, DBA).

Características

Definición del esquema. Es la escritura de una serie de definiciones que el compilador del lenguaje de definición de datos traduce a un conjunto de tablas que se almacenan en forma permanente en el diccionario de datos.

Definición de la estructura de almacenamiento y del método de acceso. Escribiendo la definición de la estructura de almacenamiento, utilizando el lenguaje de definición de datos, que luego son traducidas por el compilador del lenguaje de almacenamiento y definición de datos.

Concesión de autorización para el acceso de datos. Determinan las partes de la base de datos a las que accederán los diferentes usuarios mediante la asignación de las permisiones correspondientes.

Procedimientos de validación. Son los procedimientos lógicos para validar la entrada, el acceso, la manipulación y el archivo de los datos.

Estrategia de respaldo y recuperación. Es la estrategia para la recuperación adecuada para reparar los datos y procesos necesarios de una forma rápida, de costo mínimo y de menor repercusión en el sistema.

Funciones

Definición de esquema. El esquema original de la base de datos se crea escribiendo un conjunto de definiciones que son traducidas por el compilador de DDL a un conjunto de tablas que son almacenadas permanentemente en el diccionario de datos.

Definición de la estructura de almacenamiento y del método de acceso. Estructuras de almacenamiento y métodos de acceso adecuados se crean escribiendo un conjunto de definiciones que son traducida por el compilador del lenguaje de almacenamiento y definición de datos.

Modificación del esquema y de organización física. Las modificaciones, tanto al esquema de la base de datos como a la descripción de la organización física de almacenamiento, aunque relativamente poco comunes, se logran escribiendo un conjunto de definiciones que son usadas bien

8

por el compilador de DDL o bien por el compilador del lenguaje de almacenamiento y definición de datos para generar modificaciones a las tablas internas apropiadas del sistema (por EJEMPLO., el diccionario de datos).

Concesión de autorización para el acceso a los datos. La concesión de diferentes tipos de autorización permite al administrador de la base de datos regular qué partes de la base de datos van a poder ser accedidas por varios usuarios.

Especificación de las restricciones de integridad. Las restricciones de integridad se mantienen en una estructura especial del sistema que consulta el gestor de la base de datos cada vez que tiene lugar una actualización en el sistema.

1.8. EL DESARROLLADOR Y EL DICCIONARIO DE DATOS

El desarrollador implementa las transacciones e interfaces, un diccionario de datos contiene datos acerca de los datos.

El Desarrollador

El desarrollador de aplicaciones (programador) implementa las transacciones e interfaces.

El Diccionario de Datos

Un diccionario de datos contiene datos acerca de los datos. Constituye lo que puede considerarse una meta-base, es decir, una base que describe a las otras bases.

El diccionario de datos contiene:

Las descripciones externa, conceptual e interna de la base de datos.

Las descripciones de los campos, registros y referencias cruzadas entre los registros de varios archivos.

Códigos de autorización y seguridad de los datos, al igual que la definición de alias o apodos.

Los esquemas externos que son empleados por cada programa, quiénes son sus usuarios y las autorizaciones que posee.

Funciones

Brindar la relación del personal de la empresa o de los usuarios que tienen acceso a dichos datos.

Ser fuente de información para los analistas de sistemas y diseñadores para conocer las descripciones y definiciones de los campos, archivos, etc... que ya existen en la base de datos.

EJERCICIOS PROPUESTOS.

1. Según los conceptos anteriores defina con sus palabras que es una Base de Datos.2. De cinco (5) EJEMPLO.s de base de datos, de la vida diaria.3. Defina las cinco (5) características más importantes de las bases de

datos.4. Enumere diferencias entre los componentes de la base de datos.5. Busque conceptos adicionales sobre los componentes de una base de

datos.

6. Mapa Conceptual sobre la información presentada

9