bases de datos distribuidos

Upload: ittgcultura

Post on 10-Jul-2015

581 views

Category:

Documents


0 download

TRANSCRIPT

Arquitecturas de los sistemas de base de datos:

BASE DE DATOS Heterogneas

La arquitectura de un sistema de bases de datos est influida en gran medida por el sistema informtico subyacente en el que se ejecuta, en concreto por aspectos de la arquitectura de la computadora como:

La conexin en red El paralelismo La distribucin

Arquitecturas de los sistemas de base de datos:

BASE DE DATOS Heterogneas

La distribucin: permite que estos datos residan donde han sido generados o donde son ms necesarios, pero continuar siendo accesibles desde otros lugares o departamentos diferentes. El hecho de guardar varias copias de la base de datos en diferentes sitios permite que puedan continuar las operaciones sobre la base de datos aunque algn sitio se vea afectado por algn desastre natural como una inundacin, un incendio o un terremoto.

Arquitecturas de los sistemas de base de datos:

BASE DE DATOS Heterogneas

Se han desarrollado los sistemas distribuidos de bases de datos para manejar datos distribuidos geogrfica o administrativamente a lo largo de mltiples sistemas de bases de datos.

Base de datos distribuida:

BASE DE DATOS Heterogneas

Es aquella que se almacena en ms de un lugar fsico y cada uno de stos es manejado por un DBMS capaz de funcionar independientemente de los otros. Algunos de ellos son completamente distribuidos, otros tienen un alto grado de centralizacin.

Base de datos distribuida:

BASE DE DATOS Heterogneas

Estos sistemas no comparten ni memoria, ni disco y las computadoras utilizadas por los mismos pueden variar en tamao y funcin, abarcando desde estaciones de trabajo hasta los grandes sistemas.

Base de datos distribuida:

BASE DE DATOS Heterogneas

Beneficios e inconvenientes: Reducen la vulnerabilidad de un lugar nico central y voluminoso. Permiten el incremento en la potencia de los sistemas al adquirir mini computadoras que son ms pequea y baratas. Incrementan el servicio y la posibilidad de respuesta de los usuarios locales.

Base de datos distribuida:

Beneficios e inconvenientes:

BASE DE DATOS Heterogneas

Los sistemas distribuidos, sin embargo, dependen de la alta calidad de las lneas de telecomunicaciones , las cuales a su vez son vulnerables. Adems, las bases de datos locales pueden algunas veces alejarse de las normas y las definiciones de los datos centrales lo cual hace surgir problemas de seguridad al distribuir ampliamente el acceso a datos de alta sensibilidad.

Base de datos distribuida:

BASE DE DATOS Heterogneas

razones para construir sistemas distribuidos

Datos compartidos. La principal ventaja de construir un sistema distribuido de bases de datos es poder disponer de un entorno donde los usuarios puedan acceder desde una nica ubicacin a los datos que residen en otras ubicaciones.

Autonoma. La principal ventaja de compartir datos por medio de distribucin de datos es que cada ubicacin es capaz de mantener un grado de control sobre los datos que se almacenan localmente.

Base de datos distribuida:

BASE DE DATOS Heterogneas

razones para construir sistemas distribuidos

Disponibilidad. Si un sitio de un sistema distribuido falla, los sitios restantes pueden seguir trabajando. En particular, si los elementos de datos estn replicados en varios sitios, una transaccin que necesite un elemento de datos en particular puede encontrado en varios sitios. De este modo el fallo de un sitio no implica necesariamente la cada del sistema.

Base de datos distribuida:

BASE DE DATOS Heterogneas

razones para construir sistemas distribuidos

El sistema puede detectar el fallo de un sitio y es posible que sea necesario aplicar apropiadas para la recuperacin del fallo. El sistema no debe seguir utilizando los ser sitio que fall. Finalmente, cuando el sitio que fall se recupera o se repara, debe haber mas disponibles para integrado sin problemas de nuevo en el sistema.

Base de datos distribuida:

BASE DE DATOS Heterogneas

razones para construir sistemas distribuidos

La disponibilidad es crucial para los sistemas de bases de datos que se utilizan en aplicaciones de tiempo real. Que por ejemplo, una lnea area pierda el acceso a los datos puede provocar la prdida de potenciales compradores de billetes en favor de la competencia.

Base de datos distribuida:

BASE DE DATOS Heterogneas

razones para construir sistemas distribuidos Agilizacin del procesamiento de consultas: Si una consulta comprende datos de varias localidades, puede ser posible dividir la consulta en varias subconsultas que se ejecuten en paralelo en distintas localidades. Sin embargo, en un sistema distribuido no se comparte la memoria principal, as que no todas las estrategias de interseccin para procesadores paralelos se pueden aplicar en estos sistemas. En los casos en que hay repeticin de los datos, el sistema puede pasar la consulta a las localidades ms ligeras de carga.

Base de datos distribuida:

Desventajas de la distribucin de los datos:

BASE DE DATOS Heterogneas

La desventaja principal de los sistemas distribuidos es la mayor complejidad que se requiere para garantizar una coordinacin adecuada entre las localidades. El aumento de la complejidad se refleja en: Costo del desarrollo de software: es ms difcil estructurar un sistema de bases de datos distribuidos y por tanto su costo es mayor

Base de datos distribuida:

BASE DE DATOS Heterogneas

Mayor posibilidad de errores: puesto que los sitios del sistema distribuido operan en paralelo, es ms difcil garantizar que los algoritmos sean correctos. Mayor tiempo extra de procesamiento: el intercambio de mensajes y los clculos adicionales son una forma de tiempo extra que no existe en los sistemas centralizados.

Clasificacin de las Bases de datos distribuidas:

BASE DE DATOS Heterogneas

o Homogneas.

o Heterogneas.

Base de datos distribuida:

BASE DE DATOS Heterogneas

o HOMOGNEA En los sistemas de bases de datos distribuidas homogneas todos los sitios emplean idntico software de gestin de bases de datos, son conscientes de la existencia de los dems sitios y acuerdan cooperar en el procesamiento de las solicitudes de los usuarios.

Base de datos distribuida:

BASE DE DATOS Heterogneas

o HOMOGNEA

En estos sistemas, los sitios locales renuncian a una parte de su autonoma en cuanto a su derecho a modificar los esquemas o el software de gestin de bases de datos. Ese software tambin debe cooperar con los dems sitios en el intercambio de la informacin sobre las transacciones para hacer posible su procesamiento entre varios sitios.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Las BDs Heterogneas o Multibase de Datos son aquellas donde Sitios diferentes utilizan diferentes DBMSs, siendo cada uno esencialmente autnomo. Es posible que algunos sitios no sean conscientes de la existencia de los dems y quizs proporcionen facilidades limitadas para la cooperacin en el procesamiento de transacciones.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

En las bases de datos distribuidas heterogneas puede que los diferentes sitios utilicen esquemas y software de gestin de sistemas de bases de datos diferentes. Puede que algunos sitios no tengan informacin de la existencia del resto y que slo proporcionen facilidades limitadas para la cooperacin en el procesamiento de las transacciones.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

La heterogeneidad se debe a que los datos de cada BD son de diferentes tipos o formatos. El enfoque heterogneo es ms complejo que el enfoque homogneo y favorece el enfoque ascendente. Es una tecnologa reciente y an existen pocas en el mercado.

Hoy en da existe la tendencia a crear software que permita tener acceso a diversas bases de datos autnomas preexistentes almacenadas en SGBD heterogneos.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

La Heterogeneidad de las BD es inevitable cuando diferentes tipos de BD coexisten en una organizacin que trata de compartir datos entre stas. Investigadores han enfocado sus esfuerzos en la exploracin de un esquema global que trate de resolver los problemas de la Heterogeneidad, la definicin de Protocolos nter operables y la integracin de las BD.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Qu es la Interoperabilidad entre las BD? Es el acceso a varias BD con SMBD similares o diferentes.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Las Bases de Datos Distribuidas Heterogneas se componen de un conjunto de localidades, cada una de las cuales mantiene un SBD local, stas pueden procesar transacciones locales (aquellas que se realizan sobre esa localidad). Ejemplo:

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

El tratamiento de la informacin ubicada en bases de datos distribuidas heterogneas exige una capa de software adicional por encima de los sistemas de bases de datos ya existentes. Esta capa de software se denomina sistema de bases de datos mltiples. Puede que los sistemas locales de bases de datos empleen modelos lgicos y lenguajes de definicin y de tratamiento de datos diferentes, y que difieran en sus mecanismos de control de concurrencia y de administracin de las transacciones.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Los sistemas de bases de datos mltiples crean la ilusin de la integracin lgica de las bases de datos sin necesidad de su integracin fsica. La integracin completa de sistemas heterogneos en una misma base de datos distribuida homognea suele resultar difcil o imposible:

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Dificultades tcnicas. La inversin en los programas de aplicaciones basados en los sistemas de bases de datos ya existentes puede ser enorme, y el coste de transformar esas aplicaciones puede resultar prohibitivo.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

. Dificultades organizativas. Aunque la integracin resulte tcnicamente posible, puede que no lo sea polticamente, porque los sistemas de bases de datos ya existentes pertenezcan a diferentes empresas u organizaciones. En ese caso es importante que el sistema de bases de datos mltiples permita que los sistemas de bases de datos locales conserven un elevado grado de autonoma para la base de datos local y para las transacciones que se ejecuten con esos datos.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Vista unificada de los datos

Cada sistema local de administracin de bases de datos puede utilizar un modelo de datos diferente. Por ejemplo: puede que algunos empleen el modelo relacional, mientras que otros pueden emplear modelos de datos ms antiguos, como el de red o el jerrquico.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Vista unificada de los datos

Dado que se supone que los sistemas con bases de datos mltiples ofrecen la ilusin de un solo sistema de bases de datos integrado, hay que utilizar un modelo de datos comn. Una opcin adoptada can frecuencia es el modelo relacional, can SQL como lenguaje comn de consulta.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Otra dificultad es proporcionar un esquema conceptual comn. Cada sistema local ofrece su propio esquema conceptual. El sistema de bases de datos mltiples debe integrar esos esquemas independientes en uno comn. La integracin de los esquemas es una tarea complicada, sobre todo por la heterogeneidad semntica.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Qu es Heterogeneidad Sintctica? Es la Heterogeneidad que se produce por la autonoma de los componentes de la BD y por las diferencias en sus diseos. Qu Heterogeneidad Semntica? Es la que se da por las diferentes concepciones que se tienen de los elementos por parte de las diferentes BD.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Procesamiento de las consultas: El procesamiento de las consultas en las bases de datos heterogneas puede resultar complicados, los problemas son: Dada una consulta en un esquema global, puede que haya que traducir la consulta a en los esquemas locales de cada uno de los sitios en que hay que ejecutar la consulta. Hay que volver a traducir los resultados de las consultas al esquema global.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

Procesamiento de las consultas: La tarea se simplifica escribiendo envolturas para cada origen de datos, que o vista de los datos locales en el esquema global. Las envolturas tambin traducen las consultas del esquema global a consultas del esquema local y vuelven a traducir los resultados al esquema global.

Base de datos distribuida HETEROGNEA:

BASE DE DATOS Heterogneas

La optimizacin global de consultas en bases de datos heterogneas resulta difcil que el sistema de ejecucin de consultas no conozca los costes de los planes de consulta alternativos en los diferentes sitios. La solucin habitual es confiar slo en a optimizacin a nivel local y utilizar nicamente la heurstica a nivel global.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Los sistemas de bases de datos federadas o bases de datos heterogneas son sistemas computacionales que hacen disponible la informacin desde diversas fuentes, y donde esas fuentes de informacin pueden ser heterogneas, distribuidas y autnomas.

Bases de datos FEDERADAS o bases de datos heterogneas

BASE DE DATOS Heterogneas

Un sistema de bases de datos federadas es una coleccin de sistemas de bases de datos cooperativos y autnomos [Bhavani99]. En un sistema federado los usuarios tienen acceso a los datos, de los distintos sistemas, a travs de una interfaz comn sin embargo, no existe un esquema global que describa a todos los datos de las distintas bases de datos, en su lugar hay varios esquemas unificados, cada uno describiendo porciones de bases de datos y archivos para el uso de cierta clase de usuarios [Larson90].

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

El SGBDF no contiene datos, solo accede a los datos almacenados en la BD componente. Una BDF no es una BD nica distribuida. Pueden usar diferentes esquemas de software. La diferencia en software es un problema mayor al momento de la transaccin de procesamiento. Las federaciones se forman y desaparecen. No hay un esquema conceptual nico. Se dice que las SBD se federan para dar lugar a las SGBF.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Forma en que operan. Los componentes de un SBDF (Sistema de base de datos federadas) pueden efectuar operaciones locales o bien ejecutar consultas sobre los datos de la federacin y pueden tambin ser usadas por otros componentes de la federacin. La autonoma o la integracin de los componentes la controla el administrador del sistema global en colaboracin con los administradores de las bases de datos componente. Este nivel de integracin se da de acuerdo a las necesidades propias de cada componente.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Es posible tambin la agrupacin en una federacin o la desincorporacin de la misma, y de igual forma es posible que entren o salgan componentes. Para poder lograr esto se establecen diferentes esquemas en el nivel federal. Se debe remarcar que una base de datos federada no es una base de datos nica distribuida, mas bien son soluciones para acceder informacin depositada en diferentes bases de datos.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

1. Integracin manual, todo queda a cargo de unas pocas personas. Implica muchos cambios. 2. Integracin de datos. Se crea una nueva base de datos. 3. Acceso integrado. DBMF (Data base manager federated) o SGBDF (Sistema gestor de bases datos federadas) o SMBDF(Sistema manejador de bases de datos federadas).

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

La forma en que cooperan se basa fundamentalmente en dos esquemas: El esquema de exportacin: Denota las partes de la base de datos que va a compartir o que va a poner a disposicin de los dems miembros de la federacin. As tambin es un subconjunto de un esquema componente ya que no todos los datos debern de ser disponibles para la federacin. El esquema de importacin: Son vistas de la base de datos que proporcionan lo que desea el esquema de exportacin.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Arquitectura propuesta por (Sheth y Larson) Esquema local: Es el esquema conceptual de un sistema de bases de datos componente de la federacin. Esquema componente: Este resulta al transformar un esquema local a un modelo cannico o comn de datos del sistema manejador de bases de datos federadas.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Arquitectura propuesta por (Sheth y Larson)

Esquema federado: Pueden existir varios esquemas federados en el sistema, dependiendo de cada tipo de usuarios dentro de la federacin. Las clases de usuarios son los que tienen funciones similares, ejemplo ventas, justicia, compras, bibliotecas, etc.. Al esquema federado tambin se le conoce como empresarial o tambin de importacin

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Niveles de un SGBDF:

a) Nivel Componente: son las Bases de Datos preexistentes. b) Nivel Federado: conjunto de BD que interoperan.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Clasificacin:

Se pueden clasificar en: a) Dbilmente Acoplados: Los usuarios deben tratar explcitamente con las BD, es decir, cuando la responsabilidad de crear y mantener la Federacin recae sobre el usuario y no hay control por parte del sistema Federado y sus administradores.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

b) Fuertemente Acoplados: la Federacin y sus administradores controlan el acceso y mantienen el sistema, es decir, el administrador tiene la responsabilidad de crear y mantener la Federacin y el control de acceso de los sistemas de Bases de Datos Componentes. Se pueden clasificar, a su vez, en: 1. Federacin sencilla: permite crear y manejar un slo esquema federado. 2. Federacin Mltiple: permite la creacin y el manejo de varios esquemas federados.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

ARQUITECTURA.

En el caso de las bases de datos federadas debemos identificar dos partes: 1. La parte de software 2. La parte de arquitectura de esquema. La segunda est encargada de resolver las heterogeneidades sintcticas y semnticas de los distintos componentes de la base de datos.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Para poder resolver esto se debe de contar con capas, aqu se conocen como capas de esquemas. Un sistema federado debe cumplir 3 aspectos. Autonoma. Heterogeneidad. Sistema distribuido.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Arquitectura de 3 niveles (ANSI/SPARC) Fsico (esquema interno). Lgico (Esquema conceptual) Externo (Esquema externo) Esta arquitectura es muy usada en el diseo de bases de datos relacionales mas no as en diseo de bases de datos orientadas a objetos. Existen muchas otras arquitecturas para el manejo de las bases de datos federadas, un ejemplo puede ser la arquitectura de 8 niveles o por ejemplo la de esquemas de data warehouse.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Problemtica para la implementacin de Bases de Datos Federadas.

Uno de los principales problemas es la incompatibilidad entre los sistemas de consulta entre los diferentes fabricantes, aunque existen estndares para el SQL como el SQL 92, normalmente los fabricantes construyen dialectos, o finalmente una instruccin no es la misma es un manejador que en otro, o simplemente tipos de datos.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Problemtica para la implementacin de Bases de Datos Federadas.

Otro problema es la codificacin por ejemplo unos usan ASCII otros ASCII extendido o el EBCDIC. As mismo un aspecto importante, son los cdigos de error generados por los distintos fabricantes, que normalmente no son compatibles.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Problemas en transacciones.

Control de concurrencia. El SMBDF no conoce las transacciones a nivel de componentes y los SMBD componentes no siempre pueden distinguir entre transacciones propias y externas. Heterogeneidad. Cada SMBD mantiene su autonoma. La autonoma total es incompatible con la atomicidad.

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Soluciones comerciales

Existen varias opciones y varias instituciones y compaas que trabajan para dar la solucin a estos problemas de interoperabilidad, mas sin embargo muy pocos trabajan para la administracin global, algunas de las compaas que trabajan en soluciones son augsoft, Oracle, Sybase, y ha usado distintas opciones por ejemplo ODBC(open Data Base Connectivity) y JDBC el conector de Java,

Bases de datos federadas o bases de datos heterogneas

BASE DE DATOS Heterogneas

Soluciones comerciales

en general los grandes manejadores de bases de datos contienen alguna herramienta para poder hacer esto lo malo es que tienen un producto para conectarse con otros manejadores, pero cada uno se vende aparte adems de que los costos son exorbitantes.

Resumen

BASE DE DATOS Heterogneas

Las BDs Heterogneas o Multibases de Datos: Son aquellas donde Sitios diferentes utilizan diferentes DBMSs, siendo cada uno esencialmente autnomo. Bases de Datos Distribuidas Heterogneas: Se compone de un conjunto de localidades, cada una de las cuales mantiene un SBD local, stas pueden procesar transacciones locales (aquellas que se realizan sobre esa localidad).

Resumen

BASE DE DATOS Heterogneas

Un sistema de BDD tiene las siguientes caractersticas: 1. Cada sitio es un sistema de base de datos en s mismo. 2. Los sitios han convenido en trabajar juntos (si es necesario) con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red tal como si todos estuvieran almacenados en el sitio propio del usuario.

Resumen

BASE DE DATOS Heterogneas

La llamada base de datos distribuida es en realidad una especie de objeto virtual, cuyas partes componentes se almacenan fsicamente en varias bases de datos reales distintas ubicadas en diferentes sitios. De hecho, es la unin lgica de esas bases de datos.

Resumen

BASE DE DATOS Heterogneas

Las BDDH son una realidad en muchas organizaciones para bien o para mal. La mayora de enfoques buscan agregar y coordinar el acceso. Los DHDBMS estn surgiendo para atender estas necesidades.