bases de datos avanzadas - universidad …...facultad de estadística e informática bases de datos...

45
Facultad de Estadística e Informática BASES DE DATOS AVANZADAS

Upload: others

Post on 17-Jun-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Facultad de Estadística e Informática

BASES DE DATOS AVANZADAS

Facultad de Estadística e Informática

Clase 6

▪Tema 2. Bases de Datos Distribuidas (BDD)❖Procesamiento en sitios múltiples y datos en sitios múltiples.

❖Características de las BDD (Ventajas, Desventajas)

❖Características de Transparencia en los Sistemas Manejadores de Bases de Datos Distribuidos (SMBDD)

Facultad de Estadística e Informática

Bases de Datos Distribuidas

BibliografíaBell, David (1992). Distributed database systems. Wokingham, Eng. : Addison-Wesley.

Connolly, Thomas M. (2005). Sistemas de bases de datos: un enfoque práctico para diseño, implementacion y gestión. (4ta ed.). Madrid : Pearson Educación Limited.

Date, C. J. (2001). Introducción a los sistemas de bases de datos. (7ma ed.). México: Pearson Educación: Addison Wesley.

Marqués, M. (2001). Apuntes de ficheros y bases de datos. Universitat Jaume I, Campus de Riu Sec. España. consultado el 13 de noviembre de 2007, en: http://www3.uji.es/~mmarques/f47/apun/apun.html Si no encuentras el documento, pulsa aquí.

Rob, Peter (2004). Sistemas de bases de datos: diseño, implementación y administración. (5ta ed.). México, D.F.: Thomson.

Facultad de Estadística e Informática

Bases de Datos Distribuidas

DefiniciónUna Base de Datos Distribuida o por sus siglas en inglés DDB(Distributed Database), la podemos entender como una base de datos tradicional, dividida en diferentes partes físicamente dispersas y que se acceden de forma lógica, tal como se accede a una base de datos centralizada por medio de un Sistema de Administración de Bases de Datos.

Facultad de Estadística e Informática

Bases de Datos Distribuidas

DefiniciónUn sistema de administración de bases de datos distribuida o por sus siglas en inglés DDBMS (Distributed Database ManagmentSystem), rige el almacenamiento y procesamiento de datos lógicamente relacionados a través de sistemas de computadoras interconectadas en las cuáles, tanto las funciones de datos como de procesamiento, se distribuyen entre varios sitios (Rob, Peter 2004).

Facultad de Estadística e Informática

Bases de Datos Distribuidas

Clasificación de los Sistemas Manejadores de Bases de Datos Distribuidas (SMBDD). ❖Escenario Procesamiento en un solo sitio y datos en un solo sitio.❖Escenario Procesamiento en sitios múltiples y datos en un solo sitio.❖Escenario Procesamiento en sitios múltiples y datos en sitios múltiples.

Facultad de Estadística e Informática

Bases de Datos Distribuidas

Escenario procesamiento en sitios múltiples y datos en sitios múltiples. ❖Describe un Sistema de administración de base de datos (SMBDD) totalmente distribuida con soporte para múltiples procesadores de datos y de transacciones en diversos sitios.❖Homogéneas y Heterogéneas

Facultad de Estadística e Informática

Bases de Datos Distribuidas

Procesamiento en sitios múltiples y datos en sitios múltiples. ❖SMBDD Homogéneas

Facultad de Estadística e Informática

Bases de Datos Distribuidas

Procesamiento en sitios múltiples y datos en sitios múltiples. ❖SMBDD Heterogéneas

Facultad de Estadística e Informática

Bases de Datos DistribuidasProcesamiento en sitios múltiples y datos en sitios múltiples. Ningún sistema de administración de base de datos distribuida (DDBMS) soporta en su totalidad Homogéneo / Heterogéneo, por ejemplo:

❖El acceso remoto es sólo lectura y no soporta privilegios de escritura.

❖Se restringe el número de tablas remotas que pueden ser accedidas en una sola transacción.

❖Se restringe el número de bases de datos distintas que pueden ser accedidas.

❖Se restringe el modelo de base de datos que puede ser accedido. Por lo tanto, se puede permitir el acceso a bases de datos relacionales, pero no a bases de red o jerárquicas.

Facultad de Estadística e Informática

Bases de Datos DistribuidasVentajas de los sistemas de administración de base de datos distribuida (DDBMS).1. Los datos se localizan cerca del sitio de "mayor demanda". 2. Acceso más rápido a los datos. 3. Procesamiento más rápido de los datos4. Facilita el crecimiento5. Comunicaciones mejoradas6. Costos de operación reducidos7. Interface de usuario fácil de usar. 8. Menos peligro de falla en un solo punto9. Independencia del procesador

Facultad de Estadística e Informática

Bases de Datos DistribuidasLos 12 objetivos de las bases de datos distribuidas (Date, 2001):1. Independencia del sitio local. 2. Independencia del sitio central. 3. Independencia de fallas. 4. Transparencia de ubicación. 5. Transparencia de fragmentación. 6. Transparencia de replicación. 7. Procesamiento de consulta distribuida. 8. Procesamiento de transacciones distribuidas. 9. Independencia del hardware. 10. Independencia del sistema operativo. 11. Independencia de la red. 12. Independencia de la base de datos.

Facultad de Estadística e Informática

Bases de Datos Distribuidas

Problemas que se presentan en las bases de datos distribuidasi. El rendimiento que es una ventaja podría verse contradicho, por la

naturaleza de la carga de trabajo

ii. La confiabilidad de los sistemas distribuidos, esta entre dicha, puesto que, en este tipo de base de datos existen muchos factores a tomar en cuenta como: La confiabilidad de los ordenadores, de la red, etc.

iii. La mayor complejidad, juega en contra de este tipo de sistemas, pues muchas veces se traduce en altos gastos de construcción y mantenimiento.

Facultad de Estadística e Informática

Bases de Datos DistribuidasProblemas que se presentan en las bases de datos distribuidasiv. Falta de seguridad de los datos. El procesamiento de base de datos

distribuida es difícil de controlar, pues estos procesos muchas veces se llevan a cabo en las áreas de trabajo de los usuarios, e incluso el acceso físico no es controlado.

v. Coste de desarrollo del software

vi. Mayor probabilidad de errores

vii. Mayor sobrecarga de procesamiento

viii. Hay una menor seguridad en cuanto al control de acceso a los datos: control de réplicas y errores que puedan producirse en la red.

Facultad de Estadística e Informática

Bases de Datos Distribuidas

Problemas que se presentan en las bases de datos distribuidas

ix. Mayor complejidad en el diseño e implementación del sistema. Además si la replicación de datos no se hace de forma adecuada, las ventajas se pueden transformar en desventajas.

x. Excesivos costes en el intento de conseguir la transparencia mencionada anteriormente.

xi. Falta de estándares y de experiencia, una vez más en estos modelos avanzados de BD.

Facultad de Estadística e Informática

Bases de Datos Distribuidas

Niveles de transparencia de una base de datos distribuida

La transparencia se puede entender como la separación de la semántica de alto nivel de un sistema de los aspectos de bajo nivel relacionados a la implementación del mismo.

Las características de transparencia del sistema de administración de bases de datos distribuida(DDBMS) tienen la propiedad común de permitir que el usuario sienta que es el único que está utilizando la base de datos

Facultad de Estadística e Informática

Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida❖Transparencia de distribución.❖Transparencia de transacción.❖Transparencia de replicación.❖Transparencia de falla.❖Transparencia de desempeño.❖Transparencia de heterogeneidad.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Facultad de Estadística e Informática

Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida❖Transparencia de distribución.❖Transparencia de transacción.❖Transparencia de replicación.❖Transparencia de falla.❖Transparencia de desempeño.❖Transparencia de heterogeneidad.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖La transparencia de distribución permite manejar una base de datos físicamente dispersa como si fuera centralizada. ❖Se reconocen tres niveles de transparencia de distribución (Rob, 2004):❖La transparencia de fragmentación.❖La transparencia de ubicación.❖La transparencia de ubicación local.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

SI LA INSTRUCCIÓN SQL REQUIERE:

NOMBRE DEL

FRAGMENTO

NOMBRE DE LA

UBICACIÓN

LUEGO EL DDBMS

SOPORTA

NIVEL

DETRANSPARENCIA DE

DISTRIBUCIÓN

Sí Sí Ubicación local Bajo

Sí NoTransparencia de

ubicación Medio

No NoTransparencia de

fragmentación Alto

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Ejemplo:Tabla EMPLEADO que contiene los atributos:

EMP_NOMBRE, EMP_NAC, EMP_DIR, EMP_DEP y EMP_SALARIO.

Los datos EMPLEADO están distribuidos en tres lugares: Veracruz, Monterrey y DF.

La tabla está dividida por ubicación, es decir, todos los datos de los empleados de Veracruz están guardados en el fragmento E1, los datos de los empleados de Monterrey en el fragmento E2 y los de DF en el fragmento E3.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Listar todos los empleados con fecha de nacimiento anterior al 1 de enero de 1980.

➢Supongamos que la tabla EMPLEADO está fragmentada y que cada fragmento es único (la condición de fragmento único indica que todas las filas son únicas, sin poner atención en qué fragmento esté localizado).

➢Ninguna parte de la base de datos está replicada en algún otro sitio de la red.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Según el nivel de soporte de la transparencia de distribución, pueden examinarse tres casos de consulta:

CASO 1: LA BASE DE DATOS SOPORTA TRANSPARENCIA DEFRAGMENTACIÓN:

SELECT * FROM EMPLEADOWHERE EMP_NAC < '01-ENE-1940';

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

CASO 2: LA BASE DE DATOS SOPORTA TRANSPARENCIA DE UBICACIÓN

SELECT * FROM E1WHERE EMP_NAC < '01-ENE-1940';UNIONSELECT * FROM E2WHERE EMP_NAC < '01-ENE-1940';UNIONSELECT * FROM E3WHERE EMP_NAC < '01-ENE-1940';

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

CASO 3: LA BASE DE DATOS SOPORTA TRANSPARENCIA DE UBICACIÓN LOCAL

SELECT * FROM E1 NODE VERACRUZWHERE EMP_NAC < '01-ENE-1940';

UNIONSELECT * FROM E2 NODE MONTERREYWHERE EMP_NAC < '01-ENE-1940';

UNIONSELECT * FROM E3 NODE DFWHERE EMP_NAC < '01-ENE-1940';

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

La transparencia de distribución es soportada por un diccionario de datos distribuidos (DDD, Data Distributed Dictionary por sus siglas en inglés)

Catálogo de datos distribuidos (DDC, Data Distributed Catalog por sus siglas en inglés).

El DDC contiene la descripción de toda la base de datos tal como la ve su administrador.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

La descripción de la base de datos, es conocida como esquema global distribuido.

El DDC es en sí mismo distribuido, y está replicado en los nodos de red. Por consiguiente, el DDC debe mantener consistencia mediante la actualización en todos los sitios.

Facultad de Estadística e Informática

Bases de Datos DistribuidasNiveles de transparencia de una base de datos distribuida❖Transparencia de distribución.❖Transparencia de transacción.❖Transparencia de replicación.❖Transparencia de falla.❖Transparencia de desempeño.❖Transparencia de heterogeneidad.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

La transparencia de transacción permite que una transacción actualice datos en varios sitios de la red. La transparencia de transacción garantiza que la transacción se realizará o completada en su totalidad o abortada, con lo cual se mantiene la integridad de la base de datos.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Formato de una transacción:

BEGIN WORK

Select bla bla bla

Update bla bla bla

Delete bla bla bla

COMMIT WORK

Inicio de la transacción

Solicitudes

Fin de la transacción

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖Transacción No Distribuida

❖Transacción Distribuida. Actualiza y solicita datos de varios sitios remotos en una red.

❖Transacción Remota. Está compuesta de varias solicitudes remotas y puede acceder datos en sólo un sitio.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖Solicitud remota:

❖Permite acceder datos que serán procesados por un sólo procesador de base de datos remoto.

❖La sentencia o solicitud SQL puede hacer referencia a datos en un solo sitio remoto.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖Solicitud remota:

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖Transacción remota: La transacción actualiza las tablas CLIENTE y FACTURA.Ambas tablas están en el sitio B.La transacción puede hacer referencia solamente a un procesador de datos remoto.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖Transacción remota: Cada sentencia o solicitud SQL puede hacer referencia solamente a un procesador de datos remoto (el mismo) a la vez, y toda la transacción puede hacer referencia a y ser ejecutada sólo en un procesador de datos remoto.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖Transacción distribuida permite que una transacción haga referencia a varios sitios de procesamiento de datos diferentes (locales y remotos).

❖Cada solicitud puede hacer referencia a sólo un sitio de procesamiento de datos remotos.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖La transacción distribuida como un todo puede hacer referencia a varios sitios de procesamiento de datos, porque cada solicitud puede hacer referencia a un sitio diferente.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

¿Qué pasa si la tabla PRODUCTO está dividida en dos fragmentos, PROD1 y PROD2, localizados en los sitios B y C, respectivamente?

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

❖Una solicitud distribuida permite hacer referencia a datos de varios sitios de procesamiento de datos remotos.

❖Proporciona capacidades de procesamiento de base de datos totalmente distribuida:❖Dividir una tabla en varios fragmentos.

❖Hacer referencia a uno o más de esos fragmentos solamente con una solicitud. Se tiene transparencia de fragmentación.

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Solicitud

distribuida

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

¿Y si la tabla CLIENTE está dividida en dos fragmentos, C1 y C2, localizados en los sitios B y C?

¿Si queremos los clientes cuyos saldos sean de más de $250?

Facultad de Estadística e Informática

Bases de Datos Distribuidas. Niveles de transparencia de una base de datos distribuida

Solicitud

distribuida