tema bbdd

Upload: ximena-andrea-amado-m

Post on 10-Jan-2016

215 views

Category:

Documents


0 download

DESCRIPTION

acerca de las bases de datos usadas con la selección de personal para estudiantes , administradores e ingenieros que se interesan por el tema en calidad

TRANSCRIPT

  • 1Archivos y Bases de Datos

    TEMA 7

    lvarez, S., Bravo, S.,Departamento de Informtica y automtica

    Universidad de Salamanca

    lvarez, S., Bravo, S. Universidad de Salamanca -2-

    Introduccin

    n Anteriormente a la explosin de la informtica, el almacenamiento de los archivos consista generalmente en el mantenimiento de una coleccin de fichas con datos.

    n stas fichas se colocaban en armarios o ficheros, y cuando era preciso consultar la informacin de alguna se deba hacer de forma manual, buscando la ficha.

    n Desde la llegada de la informtica, este proceso se ha automatizado, ganando en rapidez, calidad y fiabilidad.

    n La utilizacin de las computadoras en la administracin de las empresas ha supuesto una revolucin respecto al almacenamiento y gestin de sus datos, dando lugar al uso de los denominados archivos informticos y bases de datos.

  • 2 lvarez, S., Bravo, S. Universidad de Salamanca -3-

    Archivos

    n Un archivo o fichero es coleccin de informacin (datos relacionados entre s), almacenada como una unidad en la computadora.

    n Los archivos son el conjunto organizado de informaciones del mismo tipo, que pueden utilizarse en un mismo tratamiento, como soporte mate rial de estas informaciones

    n Archivos y registros Los archivos como coleccin de datos sirven para la E/S a la

    computadora y son manejados con programas. Un registro lgico (registro), es cada uno de las componentes del

    archivo, conteniendo el conjunto de informaciones que se acceden y se tratan de manera unitaria

    Cada registro est constituido por uno o ms elementos denominados campos, que pueden ser de diferentes tipos y que a su vez pueden estar compuestos por subcampos.

    Los bloques son la cantidad de informacin que se transfiere fsicamente en cada operacin de acceso (R o W) sobre el exterior. Un bloque puede tener uno o ms registros (registros bloqueados) Un registro ocupe ms de un bloque (registros expandidos).

    lvarez, S., Bravo, S. Universidad de Salamanca -4-

    Caractersticas de los Archivos

    n Las principales caractersticas que diferencian esta estructura de datos de las restantes son las siguientes: Residencia en soportes de informacin externos, tambin

    denominados memoria secundaria o auxiliar, como son las cintas ydiscos.

    Independencia respecto de los programas, lo que significa que la vida del archivo no est limitada por la vida del programa que lo cre, y tambin que en diferentes momentos pueden utilizar el mismo archivo diferentes programas.

    Permanencia de las informaciones almacenadas, es decir, toda la informacin almacenada en la memoria central desaparece cuando se termina la ejecucin del programa que la maneja, pero para hacer desaparecer un archivo ser necesario realizar explcitamente una operacin de borrado.

    Gran capacidad de almacenamiento: tericamente esta capacidad es ilimitada. Por el contrario, las estructuras de datos que residen en la memoria central tienen limitado su tamao por la capacidad de sta.

  • 3 lvarez, S., Bravo, S. Universidad de Salamanca -5-

    Organizacin de archivos

    n Existen tres tipos de organizacin de archivos:

    Organizacin secuencial: Es aquella en la cual los registros ocupan posiciones consecutivas

    de memoria, y slo se puede acceder a ellos de uno en uno a partir del primero.

    En un archivo secuencial no se pueden hacer operaciones de escritura cuando se est leyendo, ni operaciones de lectura cuando se est escribiendo.

    Para actualizarlos es preciso crear nuevos archivos donde se copien registros que vayan a permanecer, modificados o no, junto con los nuevos.

    lvarez, S., Bravo, S. Universidad de Salamanca -6-

    Organizacin de archivos

    Organizacin directa o aleatoria:

    Los datos se colocan y se acceden de forma aleatoria mediante suposicin, es decir, indicando el lugar relativo que ocupan dentro del conjunto de posiciones posibles.

    En esta organizacin se pueden leer y escribir registros, en cualquier orden y en cualquier lugar. Presenta el inconveniente de que es tarea del programador establecer la relacin entre la posicin que ocupa un registro y su contenido. Adems puede desaprovecharse parte del espacio destinado al archivo, ya que pueden quedar huecos libres entre unos registros y otros. Su principal ventaja es la rapidez de acceso a un registro cualquiera, puesto que no es preciso pasar por los registros anteriores.

  • 4 lvarez, S., Bravo, S. Universidad de Salamanca -7-

    Organizacin de archivos

    Organizacin secuencial indexada:

    Un archivo con esta organizacin consta de tres reas: rea de ndices, rea primaria y rea de excedentes.

    lvarez, S., Bravo, S. Universidad de Salamanca -8-

    Modos de acceso

    n Se denomina modo de acceso a la forma en que el dispositivo que maneja el soporte al que accedemos se posiciona en un determinado lugar del mismo para realizar una operacin de lectura o escritura de un registro.

    n Es determinado por el programador de la aplicacin en funcin del soporte utilizado y del tipo de organizacin.

    n Hay dos modos bsicos: Acceso secuencial a un registro supone acceder inicialmente al primer registro

    del archivo y despus, consecutivamente, a todos los sucesivos hasta llegar al registro deseado. Se puede utilizar con cualquier soporte y organizacin.

    Acceso directo solamente se puede dar en los soportes direccionales, como los discos magnticos, y consiste en el posicionamiento sobre cualquier registro sin necesidad de haber accedido antes a los anteriores.

  • 5 lvarez, S., Bravo, S. Universidad de Salamanca -9-

    Operaciones sobre archivos

    n Creacin Consiste en la escritura o grabacin en un soporte determinado de todos los

    registros que van a formar el archivo. Los datos pueden ser introducidos desde un teclado, pueden proceder de otro archivo o ser obtenidos como resultado de algn proceso.

    n Copia Es una de las operaciones ms usadas y consiste en crear un nuevo archivo

    como duplicacin de otro existente. La copia puede realizarse en el mismo o en diferente soporte de informacin. Un caso particular de esta operacin es la impresin de un archivo

    n Consulta Se realiza para obtener el contenido de uno o varios registros. En muchos casos

    ir precedida de una bsqueda de los mismos. n Clasificacin u ordenacin

    Es la operacin consistente en reubicar los registros de tal forma que queden ordenados con respecto a los valores de un campo que denominamos clave de ordenacin. En un archivo clasificado sern mucho ms rpidas las consultas que se realicen por medio del campo que rige la ordenacin. Por ejemplo, ser muy til clasificar alfabticamente el archivo de alumnos por el campo nombre, ya que la mayora de las consultas se harn utilizando este campo.

    n Concatenacin Dados dos archivos con registros de igual estructura, se trata de obtener uno

    solo en que figuren todos los registros del primero y a continuac in todos los del segundo. Esta operacin se puede generalizar para ms de dos archivos.

    lvarez, S., Bravo, S. Universidad de Salamanca -10-

    Operaciones sobre archivos

    n Interseccin Dados dos archivos de igual estructura, se trata de obtener otro en que figuren

    los registros comunes a ambos.n Fusin o mezcla

    A partir de dos archivos de igual estructura clasificados por un mismo campo, se obtiene como resultado un archivo que contiene los registros de ambos y que mantiene la ordenacin.

    n Particin Consiste en descomponer un archivo en dos, atendiendo a alguna caracterstica

    de su registro.n Actualizacin

    Es la operacin de modificar un archivo de situacin por medio de un archivo de movimientos, conteniendo altas, bajas y modificaciones que hay que realizar sobre el archivo maestro para ponerlo al da.

    n Reorganizacin Operacin consistente en reubicar los registros de un archivo que ha sufrido

    actualizaciones, de tal manera que se ocupen de los posibles huecos libres intermedios resultantes de bajas de registros para optimizar la ocupacin de la memoria, liberando la que no estaba aprovechada.

    n Borrado Eliminacin total del archivo, cuando ya no se necesite, dejando libre el espacio

    de la memoria que ocupaba en el soporte utilizado.

  • 6 lvarez, S., Bravo, S. Universidad de Salamanca -11-

    Bases de datos: introduccin

    n La gestin de archivos fsicos, por lo general, es insuficiente gestionar la informacin de una entidad

    ocupan demasiado espacio fsico

    su bsqueda es lenta

    su actualizacin y optimizacin es complicada

    los archivos pueden estar dispersos por los distintos departamentos (esto puede ocasionar repeticiones o carencias de archivos)

    los mtodos para controlar la seguridad son muy complejos

    n Las bases de datos informticas pretenden solucionar todos estos problemas

    lvarez, S., Bravo, S. Universidad de Salamanca -12-

    Bases de datos

    n Una base de datos es un conjunto integrado de datos interrelacionados, junto con una serie de aplicaciones para su manejo, accesibles simultneamente por diferentes usuarios y programas.

    n Las caractersticas que ha de presentar una base de datos son las siguientes: Control centralizado de los datos Integridad de los datos Minimizacin de las repeticiones Independencia de los datos y las aplicaciones

    Acceso concurrente a los datos Coste mnimo de almacenamiento y mantenimiento Versatilidad para la representacin de relaciones. Establecimiento de medidas de seguridad. Facilidad para el cambio, actualizacin y optimizacin

  • 7 lvarez, S., Bravo, S. Universidad de Salamanca -13-

    Estructura y arquitectura de una base de datos

    n Una BBDD almacena informacin de objetos de datos: entidades, relaciones, ndices, consultas, formularios, reportes, etc.

    n Cada entidad tiene una serie de atributos (campos) y un contenido determinado.

    n Para facilitar acceso rpido a los registros de cada entidad se puede crear una determinada clave asociada a archivos de ndice

    n Los programas que permiten gestionar las bases de datos se denominan SGBD (Sistemas de Gestin de Base de Datos).

    n Un SGBD es que puede trabajar con diferentes bases de datos, por ejemplo: Almacn, Biblioteca, Agenda, etc.

    n No confundir el concepto de BBDD (entidades u objetos de informacin) con el SGBD (programa que maneja la base de datos, tambin denominado gestor motor de base de datos).

    n Ejemplos: Oracle , Ms access.

    lvarez, S., Bravo, S. Universidad de Salamanca -14-

    Tipos de bases de datos

    n Base de datos jerrquica

    Una base de datos de tipo jerrquico utiliza jerarquas o rboles para la representacin lgica de los datos. Los archivos son organizados en jerarquas, y normalmente cada uno de ellos se corresponde con una de las entidades de la base de datos. Los rboles jerrquicos se representan de forma invertida, con la raz hacia arriba y las hojas hacia abajo.

  • 8 lvarez, S., Bravo, S. Universidad de Salamanca -15-

    Tipos de bases de datos

    n Base de datos de red

    Fue el resultado de estandarizacin del comit CODASYL.

    El modelo de red intenta superar las deficiencias del enfoque jerrquico, permitiendo el tipo de relaciones de muchos a muchos, mediante la estructura de red o grafo.

    Una estructura de datos en red, o estructura plex, es muy similar a una estructura jerrquica, de hecho no es ms que un superconjunto de sta. Al igual que en la estructura jerrquica, cada nodo puede tener varios hijos, pero a diferencia de sta, tambin puede tener varios padres.

    lvarez, S., Bravo, S. Universidad de Salamanca -16-

    Tipos de bases de datos

    n Base de datos relacional

    Las bases de datos relacionales son las ms conocidas y utilizadas, tanto por su sencillo manejo, como por estar al alcance de todo tipo de usuarios, al estar muy difundidas.

    En una base de datos relacional, el objetivo es que el usuario vea las bases de datos como una estructura lgica de relaciones (tablas), simple y uniforme. Una relacin o tabla se compone de:

  • 9 lvarez, S., Bravo, S. Universidad de Salamanca -17-

    Tipos de bases de datos

    Los sistemas relacionales ofrecen muchos tipos de procesos de datos, como: simplicidad y generalidad, facilidad de uso para elusuario final, perodos cortos de aprendizaje y consultas de informacin especificadas de una forma muy sencilla.

    Las BBDD relacionales estn constituidas por una o ms tablas que contienen la informacin ordenada de una forma organizada.

    Las tablas son un medio de representar la informacin de una forma ms compacta y es posible acceder a la informacin contenida en dos o ms tablas.

    Cumplen las siguientes leyes bsicas: Generalmente, contendrn varias tablas.

    Una tabla s lo contiene un nmero fijo de campos.

    El nombre de los campos de una tabla es distinto.

    Cada registro de la tabla es nico.

    El orden de los registros y de los campos no est determinados.

    Para cada campo existe un conjunto de valores posible

    lvarez, S., Bravo, S. Universidad de Salamanca -18-

    Tipos de bases de datos

    En las tablas, las filas representan registros (conjuntos de datos acerca de elementos separados) y las columnas representan campos (atributos particulares de un registro).

    Al realizar las bsquedas, una base de datos relacional hace coincidir la informacin de un campo de una tabla con informacin en el campo correspondiente de otra tabla y con ello produce una tercera tabla que combina los datos solicitados de ambas tablas.

  • 10

    lvarez, S., Bravo, S. Universidad de Salamanca -19-

    Tipos de bases de datos

    En estas BBDD las operaciones permitidas son bsicamente las de actualizacin, es decir, insercin, borrado y modificacin de las mismas, y tambin la consulta.

    La base de todas operaciones reside en el lgebra relacional. Para todo ello se emplean lenguajes relacionales como el SQL, y el tratamiento de las bases debe cumplir unas reglas de integridad.

    Estas reglas de integridad consisten en evitar que el modelo represente plausiblemente a la realidad, evitando incoherencias.

    Tambin recogen la unicidad de la clave primaria, su entidad, la integridad del dominio y la integridad referencial

    Las ventajas de una base de datos relacional son: Compatibilidad y estandarizacin.

    Fiabilidad.

    Garanta de independencia de los datos.

    Existencia de numerosos sistemas comerciales entre los que escoger y consiguiente apoyo tcnico.

    Conectividad garantizada con los lenguajes de programacin estndar

    lvarez, S., Bravo, S. Universidad de Salamanca -20-

    Tipos de bases de datos

    Desventajas o limitaciones (que conlleva la adopcin un modelo de datos con una veintena de aos): Imposibilidad de representar conocimiento en forma de reglas. Inexistencia de mecanismos de herencia de propiedades (y por

    supuesto demtodos). Falta de poder expresivo (por ejemplo, para representar

    jerarquas).

    Dificultad para gestionar datos no atmicos (por ejemplo, los valores estructurados de una estructura de rasgos).

    Incompatibilidad entre los tipos de estructuras de datos que se transfieren o inadaptacin de impedancia (impedance mismatch).

    Una BBDD supone una plataforma estable y compatible, con limitaciones en sus capacidades y poder expresivo.

    En esta situacin se piensa que un cuidado diseo (modelado conceptual) puede vencer muchas de estas desventajas y aprovechar al mximo todas las ventajas mencionadas.

  • 11

    lvarez, S., Bravo, S. Universidad de Salamanca -21-

    Tipos de bases de datos

    El modelo Entidad-Relacin (E-R) es un modelo de representacin que se utiliza para la representacin de las bases de datos relacionales. Fue propuesto por Chen entre los aos 1976-1977.

    El modelo E-R describe los datos como entidades, relaciones (vnculos) y atributos y permite representar el esquema conceptual de una base de datos de forma grfica mediante los diagramas E-R.

    lvarez, S., Bravo, S. Universidad de Salamanca -22-

    Ventajas y desventajas del uso de las bases de datos

    n La utilizacin de BBDD como plataforma para el desarrollo de los sistemas de aplicacin en las organizaciones se ha incrementado debido a las siguientes ventajas entre otras: Permiten una globalizacin de la informacin: cada usuario recurre y utiliza

    la informacin como un recurso corporativo que carece de dueo espec fico. Eliminacin de informacin inconsistente: si existen dos o ms archivos con la

    misma informacin, los cambios que se hagan a stos debern hacerse a todas las copias del archivo de facturas.

    Las bases de datos permiten compartir todo tipo de informacin contenida en ellas a cualquier usuario que la solicite.

    Permite mantener la integridad en la informacin: la integridad de la informacin es una de sus cualidades altamente deseable y tiene por objetivo que s lo se almacena la informacin correcta.

    Independencia de datos: el concepto de independencia de datos es quizs el que ms ha ayudado a la rpida proliferacin del desarrollo de sistemas de bases de datos. La independencia de datos implica un divorcio entre programas y datos.

    Se evita la redundancia de la informacin, manteniendo ntegras las bases de datos y bien definidas las tablas.

    La ltima ventaja, y quiz una de las ms importantes: mantienen varios niveles de control y seguridad

  • 12

    lvarez, S., Bravo, S. Universidad de Salamanca -23-

    Ventajas y desventajas del uso de las bases de datos

    n La utilizacin de BBDD tiene las siguientes desventajas:

    Al perder o daarse la base de datos se hacen irrecuperables las tablas, informes, consultas, etc., que en ella existen.

    Al tener una base de datos con demasiada informacin su acceso se har ms lento y pudiendo influir adems su uso simultneo por varios usuarios.

    lvarez, S., Bravo, S. Universidad de Salamanca -24-

    Seguridad en las bases de datos

    n La seguridad de los datos integrados en una base de datos es un concepto que se relaciona directamente con el propio concepto debase de datos. Recordando que una base de datos es un conjunto de datos integrados, adecuado a varios usuarios y a diferentes usos. Es por ello, que el uso de dichos datos plantea problemas de seguridad que el administrador de la base de datos tiene que tratar de solventar.

    n La proteccin de dichos datos deber llevarse a cabo tanto contra fallos fsicos como contra fallos humanos. Dichos fallos alteran o destruyen la informacin, los datos contenidos, por lo que la base de datos perdera su funcionalidad.

    n Normalmente el SGBD facilita mecanismos para prevenir los fallos (subsistema de control), para detectarlos una vez que han sucedido (subsistema de deteccin) y para corregir dichos fallos una vez que han sido detectados (subsistema de recuperacin).

  • 13

    lvarez, S., Bravo, S. Universidad de Salamanca -25-

    Seguridad en las bases de datos

    n La seguridad en las bases de datos est basada en tres pilares fundamentales: Accesibilidad: se busca que la informacin este en todo momento a

    disposicin del usuario. Confidencialidad: se trata de no desvelar los datos a usuarios no

    autorizados, incluye la proteccin de los datos personales que se incluyen en la base de datos.

    Integridad: se busca que los datos permanezcan tal y como han sido introducidos por el administrador o los usuarios con derecho a modificacin, sin ser falseados.

    n Las amenazas afectan normalmente a los tres aspectos, por lo que las medidas que se tomen, lgicamente, debern incluir todos ellos.

    n Para la toma de dichas medidas tambin debemos considerar el hardware, el tipo de sistema operativo, la seguridad fsica de acceso a los equipos, controles organizativos y legales, etc.