almacenamiento y estructura de archivos

30
Almacenamiento y estructura de archivos Ing. Fabián Ruano

Upload: maxime

Post on 15-Feb-2016

40 views

Category:

Documents


0 download

DESCRIPTION

Almacenamiento y estructura de archivos. Ing. Fabián Ruano. Visión general. Caché: rapida y costosa Memoria principal: RAM, temporal. No es lo suficientemente grande para almacenar BDs - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Almacenamiento y estructura de archivos

Almacenamiento y estructura de

archivosIng. Fabián Ruano

Page 2: Almacenamiento y estructura de archivos

Caché: rapida y costosa Memoria principal: RAM, temporal. No es lo

suficientemente grande para almacenar BDs Memoria flash: Memoria de solo lectura

programable y borrable electricamente. Para escribir se debe formatear todo el banco de memoria. Igual de rapida que RAM.

Discos magnéticos: Principal medio de almacenamiento. Acceso a datos desde la memoria principal y guardado igual.

Visión general

Page 3: Almacenamiento y estructura de archivos

Almacenamiento óptico: Compact Disc, Digital Versatile Disc, Blu-Ray Disc, UMD, HD DVD, Blu-Ray 3d

Almacenamiento en cinta: menos costo, mayor lentitud de acceso por ser secuencial. Almacenamiento de copias de seguridad

Almacenamiento en linea: cloud-computing Solid State Drive, Secure Digital,

MultiMediaCard, Memory Stick, CompactFlash, Microdrive, SmartMedia, xD-Picture Card

Visión general

Page 4: Almacenamiento y estructura de archivos

Dependiendo de la velocidad se clasifican en Almacenamiento primario Almacenamiento secundario Almacenamiento terciarioDependiendo de persistencia de la

información:- Volátil- No Volátil

Visión general

Page 5: Almacenamiento y estructura de archivos

Capacidades? Características físicas

Discos Magnéticos

Page 6: Almacenamiento y estructura de archivos

Controlador del disco: interfaz entre sistema informático y HW de unidad de disco. Toma ordenes de alto nivel y realiza acciones físicas.

Comprobación de suma: valor guardado en escritura por sector en lectura se recalcula y se compara con lo almacenado, si despues de n intentos no coincide se declara error de lectura.

Reasignación de sectores: cuando se daña sector se mueve información a sectores para este fin.

Discos Magnéticos

Page 7: Almacenamiento y estructura de archivos

DD conectado a controlador Varios DD en diferentes locaciones conectados

a un único controlador Red de área de almacenamiento (Storage Area

Network, SAN): gran numero de discos mediante red de alta velocidad a varios servidores

Disposición redundante de discos independientes RAID (Redundante Array of Independent Disks): proporciona vista lógica de DD de gran tamaño y muy fiable.

Disposición de discos

Page 8: Almacenamiento y estructura de archivos

Tiempo de acceso: tiempo desde formulación de solicitud de E/S hasta inicio de transferencia de datos: búsqueda + latencia.

Tiempo de búsqueda: tiempo de ubicación del brazo. Tiempo medio de búsqueda: media de tiempo con solicitudes aleatorias uniformemente distribuidas.

Tiempo de latencia rotacional: tiempo de espera a que un sector aparezca bajo el brazo. Tiempo de latencia medio: [tiempo rotación completa] / 2

Medidas de rendimiento

Page 9: Almacenamiento y estructura de archivos

Velocidad de transferencia: velocidad a la que se puede recuperar o guardar datos en disco.

Tiempo medio entre fallos: fiabilidad del disco. Cantidad de tiempo que, en media, se puede esperar que el sistema funcione de manera continua sin tener algún fallo

Medidas de rendimiento

Page 10: Almacenamiento y estructura de archivos

Requerimientos: gran número de discos en sistema, paralelismo y fiabilidad de almacenamiento

Objetivo: abordar problemas de rendimiento y fiabilidad.

Fiabilidad Redundancia Rendimiento Paralelismo

RAID

Page 11: Almacenamiento y estructura de archivos

Nivel 0: información en fragmentos pero sin redundancia

Nivel 1: espejos de cada fragmento. Simple pero costoso. Cuando rendimiento de lectura es mucho mas importante que capacidad. Conjunto RAID 1 solo puede ser tan grande como el mas pequeño de los discos.

Niveles de RAID

Page 12: Almacenamiento y estructura de archivos

Nivel 2: división por bits. Varios discos dedicados a paridad

Niveles de RAID

Page 13: Almacenamiento y estructura de archivos

Nivel 3: división por bytes. Problemas de lectura. Disco dedicado a paridad.

Niveles de RAID

Page 14: Almacenamiento y estructura de archivos

Nivel 4: división por bloques. Disco dedicado a paridad

Niveles de RAID

Page 15: Almacenamiento y estructura de archivos

Nivel 5: paridad distribuida

Niveles de RAID

Page 16: Almacenamiento y estructura de archivos

Nivel 6: adiciona paridad a RAID 5

Niveles de RAID

Page 17: Almacenamiento y estructura de archivos

Costo económico extra Requisitos de rendimiento de E/S Rendimiento cuando falla disco Rendimiento durante la reconstrucción de

datos

Elección de RAID

Page 18: Almacenamiento y estructura de archivos

Objetivo: minimizar transferencias de bloques entre el disco y la memoria

Solución: Maximizar número de bloques en memoria para evitar procesos entre memoria principal y secundaria. Memoria intermedia (buffer) es destinada para ello.

Gestor de memoria intermedia: responsable de asignación del espacio del buffer.

Acceso al almacenamiento

Page 19: Almacenamiento y estructura de archivos

Gestor de memoria intermedia

Page 20: Almacenamiento y estructura de archivos

Estrategia de sustitución: Que hacer cuando no queda espacio en buffer? Algoritmo común: Menos recientemente utilizado.

Bloques clavados: limitar escritura de bloque en disco.

Salida forzada de bloques: sobre-escribir bloque del disco aunque no se necesite espacio en buffer.

Gestor memoria intermedia

Page 21: Almacenamiento y estructura de archivos

No todos los bloques son de igual longitud Enfoque sencillo:

◦ espacios iguales◦ acceso secuencial◦ problema de espacios libres en borrado◦ problemas cuando bloques no son de tamaño

adecuado◦ Adicionar estructura para index de espacios◦ Registros en lista enlazada

Almacenamiento y estructura de archivos – longitud fija

Page 22: Almacenamiento y estructura de archivos

Aparecen cuando:◦ Necesario almacenar varios tipos de registros en

un solo archivo◦ Longitudes variables en uno o varios campos◦ Tipos de registros con campos repetidos

Representación en cadenas de bytes◦ Símbolo de finalización de registro o tamaño de

registro al inicio del mismo

Almacenamiento y estructura de archivos – longitud variable

Page 23: Almacenamiento y estructura de archivos

◦ Inconvenientes cadena de bytes- Problemas para volver a usar el espacio liberado tras

el borrado de un registro- Expansión de tamaño de registros guardados es casi

imposible en algunos casos Estructura de páginas con ranuras

◦ Hay cabecera al inicio del bloque que indica- Numero de elementos en el registro- El espacio vacio del bloque- Un array de entradas que indica la dirección y el

tamaño de cada registro

Almacenamiento y estructuras de archivos – longitud variable

Page 24: Almacenamiento y estructura de archivos

◦ Bloques de pocos Kb de tamaño◦ Reubicación tras borrado de un registro

Representación de longitud Fija◦ Espacio Reservado

- Teniendo el tamaño máximo de cada registro se toman bloques de dicho tamaño y lo sobrante de cada bloque se rellena con caracteres especiales

- Útil cuando los registros tienen usualmente un tamaño cercano al maximo

Almacenamiento y estructuras de archivos – longitud variable

Page 25: Almacenamiento y estructura de archivos

◦ Representación con listas- cada registro se representa con lista de registros de

longitud fija enlazados mediante punteros- Desperdicia espacio excepto en el primer bloque- Soluciones para perdida de espacio: usar bloque

ancla y bloque de desbordamiento

Almacenamiento y estructuras de archivos – longitud variable

Page 26: Almacenamiento y estructura de archivos

Organización de Archivos En montículo◦ No hay organización de los registros ◦ Generalmente un archivo por relación

Organización de Archivos Secuenciales◦ Organización dependiente de una clave de

búsqueda, no necesariamente PK o superclave.◦ Vinculación de registros mediante punteros◦ Costo de ordenamiento es alto cuando se inserta

o borran registros, hay que mover grandes cantidades de información

Organización de registros en archivos

Page 27: Almacenamiento y estructura de archivos

Organización Asociativa (hash) de archivos◦ Relación x Archivo y tuplas en bloques de tamaño

fijo- Ideal para BD pequeñas- Aprovecha sistema de archivos del S.O.

◦ Relación x Archivo y tuplas en diseños mas complejos

◦ Único archivo para base de datos completa◦ Almacenan registros relacionados de dos o mas

relaciones en un solo bloque. Mejor consultas.

Organización de registros en archivos

Page 28: Almacenamiento y estructura de archivos

Usualmente◦ Nombres de relaciones◦ Nombres de atributos de cada relación◦ Dominios y longitudes de atributos◦ Nombres de vistas y definicion de las mismas◦ Restricciones de integridad

Algunos sistemas◦ Nombres de usuarios◦ Informacion de cuentas de usurios◦ Informacion para autenticacion

Diccionario de datos

Page 29: Almacenamiento y estructura de archivos

Informacion estadistica◦ No tuplas x relacion◦ Metodo de almacenamiento x relacion

Organización de almacenamiento◦ Tipo de organización◦ Ubicación de las relaciones

Informacion de indices◦ Nombre de indice◦ Nombre de relacion ◦ Atributos implicados◦ Tipo de indice formado

Diccionario de datos

Page 30: Almacenamiento y estructura de archivos

http://es.wikipedia.org/wiki/RAID Silberschatz, Korth, Sudarshan.

Fundamentos de bases de datos 4ta edicion. CAPITULO 11

Referencias