base de datos distribuidos

25
Sistema de Gestión de Base de Datos. 1 Presentado por: LLiulli Lopez Jackeline Loa Ferrel Arelís Menacho Alvarez Vani Judith Peña Soto Jean Carlos Docente : Ing. Marleny Peralta Ascue Base de Datos Distribuido UNIVERSIDAD NACIONAL MICAELA BASTIDAS DE APURIMAC C.P. INGENIERIA INFORMATICA Y SISTEMAS Abancay 2014

Upload: jean-carlos-pena-soto

Post on 21-Jul-2015

115 views

Category:

Internet


1 download

TRANSCRIPT

Page 1: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 1

Presentado por:

LLiulli Lopez Jackeline

Loa Ferrel Arelís

Menacho Alvarez Vani Judith

Peña Soto Jean Carlos

Docente :

Ing. Marleny Peralta Ascue

Base de Datos Distribuido

UNIVERSIDAD NACIONAL MICAELA BASTIDAS DE APURIMAC

C.P. INGENIERIA INFORMATICA Y SISTEMAS

Abancay

2014

Page 2: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 2

TABLA DE CONTENIDO

1. Sistema de Cómputo Distribuido. ...................................................................................... 5

1.1. Una base de datos distribuida (BDD) ........................................................................... 6

1.2. Un sistema de bases de datos distribuidos (SBDD) ....................................................... 6

1.3. Un sistema de manejo de bases de datos distribuidas (SMBDD) .................................. 6

1.4. Un sistema de base de datos distribuida (SBDD) .......................................................... 6

2. Base de Datos Distribuida. ................................................................................................ 7

3. Definición de una Base de Datos Distribuido: .................................................................. 8

5. Características. ................................................................................................................. 10

6. Construcción de una base de datos distribuidos. ............................................................. 11

8. Ventajas de las bases de datos distribuidas ..................................................................... 13

9. Desventajas de las bases de datos distribuidas ................................................................ 15

10. Modelo de una arquitectura distribuida ............................................................................ 15

11. Diseño de la base de datos distribuidos ........................................................................ 16

11.1 Almacenamiento distribuido de datos ......................................................................... 16

11.2. Ventajas de la fragmentación: .................................................................................... 20

12. Transparencia de la red ..................................................................................................... 20

13. Transparencia de localización ........................................................................................... 21

14. Modelo de transacciones distribuidas ............................................................................... 21

Page 3: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 3

15. Aplicación ....................................................................................................................... 23

16. Conclusión. ....................................................................................................................... 24

17. Anexos. ............................................................................................................................. 25

Page 4: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 4

TABLA DE ILUSTRACIONES

Figura 1. (Logo de Base de Datos

Distribuido.)……………………………………………..Error! Bookmark not defined.

Figura 2 (Logo Base de Datos Distribuido)………………………………………………..9.

Figura 3 (Logo Base Distribuida Particionada)……………………………………………12

Figura 4 (Logo Base de Datos Multiplicada y Distribuida)……………………………….12

Figura 5 (Logo Base de Datos Combinando)……………………………………………..13

Figura 6 distribuido geográficamente.)……………………………………………………16

Figura 7 (Modelo de una Arquitectura Distribuida)………………………………………18

Figura 8 (Logo Fragmentación Horizontal)…………………………………………………19

Figura 9 (Logo Fragmentación Vertical)………………………………………………….20

Figura 10 (Logo Fragmentación Mixta)……………………………………………………21

Page 5: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 5

BASE DE DATOS DISTRIBUIDAS.

Los sistemas de información empezaron a utilizar las bases de datos distribuidas

aproximadamente a mediados de la década de los 70’s, pero no fue sino hasta 1980.

Originalmente se había pensado en almacenar la información de manera centralizada utilizando

un conjunto de herramientas que facilitarán este BASES DE DATOS DISTRIBUIDAS .Pero con

el paso del tiempo esto produjo ciertos inconvenientes que no eran posibles solucionar.

Estos problemas impulsaron la creación de ALMACENAMIENTO DISTRIBUIDO, los cuales

hoy en día proveen características indispensables en el manejo de información; es decir, la

combinación de las redes de comunicación y las bases de datos.

En el mundo actual, diversos tipos de personas, en varios lugares a nivel mundial, querrán

compartir un gran base de datos, estas empresas que tienen la finalidad de garantizar el

compartimiento de los archivos de los usuarios optan por dividir esta base de datos en unas más

pequeñas denominados fragmentos, los cuales se pueden colocar en distintas ubicaciones.

Entonces llamamos base de datos distribuidas a los fragmentos que se encuentran almacenados en

lugares distintos. Estos sitios constan con una computadora y una DBMS (Sistema de gestión de

base de datos), para administrar la base local situada conectándose entre sí aquellos fragmentos

de una base distribuida por medio de una red de comunicación.

Page 6: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 6

1. Sistema de Cómputo Distribuido.

Es un conjunto de elementos de procesamiento autónomos (no necesariamente homogéneos) se

interconectan por una red de comunicaciones y cooperan entre ellos para realizar sus tareas

asignadas.

1.1. Una base de datos distribuida (BDD)

Es un conjunto de múltiples bases de datos lógicamente relacionados las cuales se

encuentran distribuidas entre diferentes sitios interconectados por una red de

comunicaciones.

1.2. Un sistema de bases de datos distribuidos (SBDD)

Es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema

de comunicaciones , de tal forma que ,un usuario en cualquier sitio puede accesar los

datos en cualquier parte de la red exactamente como si los datos estuvieran

almacenados en su sitio propio .

1.3. Un sistema de manejo de bases de datos distribuidas (SMBDD)

Es aquel que se encarga del manejo de la BDD y proporciona un mecanismo de acceso

que hace que la distribución sea trasparente a los usuarios. El término transparente

significa que la aplicación trabajaría, desde un punto de vista lógico, como si un solo

SMBD ejecutado en una sola máquina, administra esos datos.

1.4. Un sistema de base de datos distribuida (SBDD)

Es entonces el resultado de la integración de una base de datos distribuida con un

sistema para su manejo.

En un sistema de base de datos distribuida, los datos se almacenan en varios

computadores (llamados sitios o nodos). Los computadores de un sistema distribuido se

comunican entre sí a través de diversos medios de comunicación.

Page 7: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 7

Un Sistema de Base de Datos Distribuida (DDBS)=DDB +DDBMS.

2. Base de Datos Distribuida.

Una BD Distribuida es aquella donde los datos están repartidos entre más de una máquina y un

SGBD que lo gestiona haciendo que la distribución sea transparente al usuario, el actúa ve toda la

base de datos.

También es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se

encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones, los

cuales tienen la capacidad de procesamiento autónomo lo cual indica que puede realizar

operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un

sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de

comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en

cualquier parte de la red exactamente como si los datos estuvieran. Un sistema distribuido de

bases de datos se almacena en varias computadoras.

El soporte de las bases de datos distribuidas es que sola una aplicación sea capaz de operar de

manera transparente sobre todos los datos dispersos en una variedad de bases de datos diferentes,

administradas por diferentes SGBDs ejecutadas desde diferentes maquinas, manejadas por

diferentes sistemas operativos.

Page 8: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 8

Figura 1. (Logo de Base de Datos Distribuido.)

Una BDD es en realidad un tipo de BD virtual cuyas partes componentes están almacenadas en

varias BD “reales” distintas que se encuentran en varios sitios distintos (de hecho, es la unión

lógica de esas BD reales).

3. Definición de una Base de Datos Distribuido:

En otras palabras, cada sitio local tiene

Sus propias BD “reales”

Sus propios usuarios locales

Su propio DBMS local

Software de administración de transacciones (incluyendo su propio

software local para bloqueo, registro en bitácora, recuperación, etc.)

Así como su propio administrador de comunicación de datos local.

Page 9: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 9

La base de datos distribuidos son fragmentos que se encuentran almacenados en lugares

distintos. Estos sitios constan con una computadora y una DBMS (Sistema de gestión de base de

datos), para administrar la base local situada conectándose entre sí aquellos fragmentos de una

base distribuida por medio de una red de comunicación.

Figura 2 (Logo Base de Datos Distribuido)

Al momento de surgir una petición de consulta de cualquier sitio, el administrador general de la

base de datos, analiza esta petición y determina qué tipo de base de datos distribuidos.

(fragmentos) se puede necesitar. Las bases de datos locales pueden conectarse físicamente de

diversas formas:

Red totalmente conectada

Red prácticamente conectada

Red con estructura de árbol

Red de estrella

Red de anillo

Page 10: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 10

Las principales diferencias entre estos tipos de configuraciones podemos tener lo siguiente:

Costo de la instalación: El costo de conectar físicamente las localidades del

sistema

Costo de la comunicación: El costo del tiempo y el dinero que interviene en

enviar un mensaje desde una localidad a otra.

Fiabilidad: La frecuencia con que falla una línea de comunicación o una

localidad.

Disponibilidad: La posibilidad de acceder a la información a pesar que podrían

existir los fallos en algunas localidades o líneas de comunicación.

5. Características.

Autonomía Local: Los sitios distribuido deben ser autónomos, es decir que todas las

operaciones en un sitio dado se controlan en ese sitio.

No dependencia de un sitio central: No debe de haber dependencia de un sitio

central para obtener un servicio.

Operación Continua: Nunca debería apagarse para que se pueda realizar alguna

función, como añadir un nuevo sitio.

Independencia con respecto a la localización: No debe de ser necesario que los

usuarios sepan dónde están almacenados físicamente los datos, sino que más el

usuario lo debe de ver como si solo existiera un sitio local

Independencia con respecto a la fragmentación: La fragmentación es deseable por

razones de desempeño, los datos, pueden almacenarse en la localidad donde se

Page 11: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 11

utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean

sólo locales y se reduzca el tráfico en la red.

Independencia de réplica: Si una relación dada (es decir, un fragmento dado de una

relación) se puede presentar en el nivel físico mediante varias copias almacenadas o

réplicas, en muchos sitios distintos.

Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de

usuario en instrucciones para manipulación de datos, y así reducir el tráfico en la red

implica que el proceso mismo de optimización de consultas debe ser distribuido.

Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de

recuperación y el control de concurrencia, cada uno de los cuales requiere un

tratamiento más amplio en el ambiente distribuido.

Independencia con respecto al equipo

Independencia con respecto al Sistema Operativo

Independencia con respecto a la red

Es que se puede leer o escribir datos localizados en diferentes nodos de

la red

Todos los usuarios accedan a la BDD a través de un esquema global en

forma transparente al usuario.

El mismo SMBD es usado por cada localidad.

6. Construcción de una base de datos distribuidos.

Page 12: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 12

Base distribuida particionada: Una base de datos global se divide en tres partes (A, B,

C), donde cada una de las bases se almacena en lugares diferentes.

Figura 3 (Logo Base Distribuida Particionada)

Base de datos multiplicada y distribuida: Las bases de datos se duplican en cada sitio,

con el objetivo de reducir costos de comunicación y aumentar el desempeño del sistema,

eliminando la necesidad de la transmisión de datos en las diferentes ubicaciones.

Figura 4 (Logo Base de Datos Multiplicada y Distribuida)

Page 13: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 13

Distribución de la base de datos combinando replicas y particiones: en la actualidad

este tipo de distribución se emplea con mayor frecuencia. El archivo se divide basándose

en el patrón que usa, es decir los datos se guardan en los lugares donde puede ser

accesado con más frecuencia, pero si requiere un dato en más de un sitio, este fragmento

puede estar almacenado en cada uno de estos sitios.

Figura 5 (Logo Base de Datos Combinando)

8. Ventajas de las bases de datos distribuidas

La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la

información de una forma fiable y eficaz

Compartimiento de Datos: Los usuarios pueden acceder a los datos de todas las

distribuciones como si fuera centralizada.

Page 14: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 14

Autonomía Local: Cada Distribución puede conservar cierto grado de control sobre

los datos que maneja localmente. Cada Distribución actúa como administrador de las

responsabilidades asignada.

Disponibilidad: Si el sistema falla en una distribución los restantes pueden seguir

funcionando, y si hay una duplicación de los datos en varias distribuciones se puede

acceder a alguno de estos y puede seguir funcionado. El cierre de una distribución o

nodo no afecta al funcionamiento de los demás

Eficiencia de procesamiento :(los datos se mantienen cerca del punto en donde se

usan más frecuentemente).

Mayor accesibilidad (es posible acceder a una cuenta remota y viceversa, por medio

de la red de comunicaciones).Probablemente el mayor beneficio de los sistemas

distribuidos es que permiten que la estructura de la BD refleje la estructura de la

empresa.

Figura 6 (Logo Base de Datos Distribuido)

Planta A Almacén

Planta C

Planta B

Page 15: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 15

9. Desventajas de las bases de datos distribuidas

Coste de desarrollo del software. La complejidad añadida que es necesaria para

mantener la coordinación entre nodos hace que el desarrollo de software sea más

costoso.

Mayor probabilidad de errores. Como los nodos que constituyen el sistema

funcionan en paralelo, es más difícil asegurar el funcionamiento correcto de los

algoritmos, así como de los procedimientos de recuperación de fallos del sistema.

Mayor sobrecarga de procesamiento. El intercambio de mensajes y ejecución de

algoritmos para el mantenimiento de la coordinación entre nodos supone una

sobrecarga que no se da en los sistemas centralizados.La mayor desventaja es el

hecho de que los sistemas distribuidos son complejos (al menos desde el punto de

vista técnico).

10. Modelo de una arquitectura distribuida

Figura 6 (Modelo de una Arquitectura Distribuida)

Page 16: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 16

11. Diseño de la base de datos distribuidos

Transparencia y autonomía

Es importante que el sistema reduzca al mínimo la necesidad de que el usuario se dé

cuenta de cómo está almacenada una relación. El sistema puede ocultar los detalles de la

información en la red. Esto se denomina transparencia de la red. La transparencia de la

red se relaciona con la autonomía local. La transparencia de la red es el método por el

cual los usuarios del sistema pueden ignorar los detalles del diseño distribuido. La

autonomía local es el método por el cual el diseñador o administrador de una localidad

pueden ser independientes del resto del sistema distribuido.

Nombre de los datos.

Repetición de los datos.

Fragmentación de los datos.

Localización de las bases locales y sus copias.

11.1 Almacenamiento distribuido de datos

Replica: El sistema consiste en varias copias iguales, donde cada copia se guarda en una

base diferente, lo que significa la réplica de los datos.

o Disponibilidad

o Distribución de la base de datos combinando replicas y particiones

o Actualización de los datos duplicados

Page 17: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 17

Fragmentación de datos: si una base se encuentra fragmentada, esta base se dividirá en

numerosos fragmentos. Los fragmentos contienen suficiente información para permitir la

reconstrucción de la base original.

o Fragmentación horizontal: divide la base asignando a cada división a uno o

varios fragmentos.

Figura 7 (Logo Fragmentación Horizontal)

o Fragmentación vertical: Divide la base de un modo especial, igual que una

descomposición, implica el concepto de varios subconjuntos. Todos los esquemas

resultantes contienen una clave candidato común (o superclase) .Se añade un

atributo especial que actúa como clave candidata.

Ambos tipos de fragmentación se pueden mezclar.

Page 18: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 18

Ejemplo:

type cuenta =record

nombre: char(22);

maquina: char(8);

login: char(8);

end

Figura 8 (Logo Fragmentación Vertical)

o Fragmentación mixta: la base se divide por medio de una serie de relaciones de

fragmentos, donde cada fragmento tiene como resultado los procedimientos de las

fragmentaciones horizontales y mixtas.

Page 19: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 19

Figura 9 (Logo Fragmentación Mixta)

Replica y fragmentación de datos: La réplica y fragmentación de datos se puede aplicar

de manera continua, es decir de una pequeña división que anteriormente se ha

fragmentado también se puede hacer una réplica y estos fragmentos también se pueden

volver a fragmentar.

Page 20: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 20

11.2. Ventajas de la fragmentación:

Horizontal

– permite el procesamiento paralelo de una relación

– permite que una tabla global pueda estar donde se utiliza más frecuentemente

Vertical

– permite que una tabla pueda ser distribuida en función del uso de sus atributos.

– permite descomposiciones adicionales que se pueden conseguir con normalización.

– el atributo especial facilita la mezcla de fragmentos verticales

– permite el procesamiento paralelo de una relación

12. Transparencia de la red

Los datos se pueden guardar de muchas maneras en el sistema de bases distribuidas, pero

también es de suma importancia que este sistema disminuya cualquier información que los

usuarios necesitan saber cómo se guarda el dato en la base. Entonces el sistema pude

ocultar este tipo de detalle de la distribución de los datos en la red a esto se lo llama

transparencia de red:

Denominación de los elementos de datos: Todos los elementos de los datos, las

divisiones, y las copias de las bases, deben tener nombres únicos, pero en este tipo

de sistemas hay que asegurarse de que dos procedimientos no utilicen el mismo

nombre para distintos elementos de datos. Cada copia y cada fragmento de un

elemento deben tener también un nombre único, es muy importante diferenciar

cuales copias y fragmentos de las bases del mismo elemento.

Page 21: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 21

Transparencia y actualizaciones: Es muy importante asegurar que todas las

copias de un elemento o una base y que todas sus fragmentaciones se actualicen

constantemente, pero también puede que exista muchos problemas si hay

constantemente acceso a alguna base en específica, lo que da lugar a que se

actualice una base antes que otra.

13. Transparencia de localización

Si el sistema es transparente en cuanto a la repetición y fragmentación de las bases donde se

ocultará al usuario gran parte del esquema de la base de datos distribuida. Sin embargo, el

componente de los nombres que identifican a la base obliga al usuario a darse cuenta del hecho

de que el sistema está distribuido.

14. Modelo de transacciones distribuidas

El acceso a los diferentes elementos de las bases en los sistemas de bases distribuidas se puede

realizar mediante transacciones donde se debe conservar las propiedades ACID (conjunto de

características que se necesitan para que una serie de instrucciones puedan ser consideradas como

transacciones) Hay que tener en cuenta dos tipos de transacciones.

14.1 Transacciones locales

Tienen total acceso y actualización de datos en una sola de las bases locales

14.2 Transacciones globales

Tienen total acceso y actualización en varias bases de datos en varias bases de datos

locales

Page 22: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 22

14.3 Arquitectura del sistema:

Cada procedimiento tiene su propio gestor de transacciones locales, cuya función es

asegurar las propiedades ACID, los diferentes gestores de transacciones ayudan para

la ejecución de las transacciones globales, por lo tanto cada procedimiento del

sistema contiene en si dos subsistemas:

Gestor de transacciones: gestiona la ejecución de las transacciones que tienen el

total acceso a los datos guardados en la base local, pero tomando en cuenta que

las transacciones de este tipo solo pueden ser locales.

El coordinador de transacciones: coordina la ejecución de las diferentes

transacciones tanto locales como globales.

14.4 Modos de fallos del sistema.

Los sistemas de bases de datos distribuidos pueden tener los mismos fallos que los

sistemas de base de datos centralizados, por ejemplo: errores de software, hardware,

fallos graves del disco, pero existen otros fallos muy importantes en este tipo de

sistema.

Fallos de un procedimiento

Perdida de mensajes: es muy usual en este tipo de sistemas distribuidos,

utilizan protocolos de control de la transmisión, como TCP/IP.

Fallos de un enlace de comunicaciones

División de la red

Page 23: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 23

15. Aplicación

Aplicaciones Manufactura(multiplantas)

Comando y control militar.

Microsoft SQL Server 2008

SIGs corporativos Aerolíneas

Cadenas hoteleras

Page 24: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 24

16. Conclusión.

Las bases de datos distribuidas son cada vez más usadas por las empresas y suponen una ventaja

competitiva frente a los sistemas centralizados, siempre y cuando la empresa en cuestión tenga necesidad

de usar una base de datos de este tipo. Lo más habitual es disponer de varias sedes y tener que manejar

información común, para lo cual las bases de datos distribuidas son especialmente útiles.

Page 25: Base de datos distribuidos

Sistema de Gestión de Base de Datos. 25

17. Anexos.

http://unefazuliasistemas.files.wordpress.com/2011/04/fundamentos-de-bases-de-datos-silberschatz-

korth-sudarshan.pdf

http://conten.pearson.es/ib/NPcd/IB_BooksVis?cod_primaria=1000187&codigo_libro=2155

http://www.intercambiosvirtuales.org/libros-manuales/fundamentos-de-bases-de-datos-abraham