presentación grupo 5

82
UNIVERSIDAD DEL QUINDIO FACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES CIENCIA DE LA INFORMACIÓN Y LA DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA ANÁLISIS Y DISEÑO DE SISTEMAS DE INFORMACIÓN II DISEÑO DE ARCHIVO CASTRO PINO JORGE OLMEDO DIAZ NAVARRO NINY JHOANNA FERRO DE GODOY CONCEPCIÓN GARCIA RAMÍREZ SILGAR ENRIQUE ORTIZ TORRES DIANA DEL PILAR PEÑUELA MORA JEIMY MIYERLANDY RODRIGUEZ PINEDA MARY JAQUELINE ROJAS GAMBA WEIMAR LARRY Tutor JORGE MARIO ZULUAGA CAMPUZANO Mayo 2010

Upload: jorge

Post on 14-Apr-2017

224 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Presentación grupo 5

UNIVERSIDAD DEL QUINDIOFACULTAD DE CIENCIAS HUMANAS Y BELLAS ARTES

CIENCIA DE LA INFORMACIÓN Y LA DOCUMENTACIÓN, BIBLIOTECOLOGÍA Y ARCHIVÍSTICA

ANÁLISIS Y DISEÑO DE SISTEMAS DE INFORMACIÓN II

DISEÑO DE ARCHIVO

CASTRO PINO JORGE OLMEDODIAZ NAVARRO NINY JHOANNA

FERRO DE GODOY CONCEPCIÓNGARCIA RAMÍREZ SILGAR ENRIQUEORTIZ TORRES DIANA DEL PILAR

PEÑUELA MORA JEIMY MIYERLANDYRODRIGUEZ PINEDA MARY JAQUELINE

ROJAS GAMBA WEIMAR LARRY

Tutor

JORGE MARIO ZULUAGA CAMPUZANO

Mayo 2010

Page 2: Presentación grupo 5

INTRODUCCION

Los Sistemas de Información en las empresas están orientados hacia el uso de archivos y bases de datos. Los datos se acumulan en archivos que son procesados o mantenidos por el Sistema

El Analista de Sistemas es el responsable de Diseñar Archivos, determinar su contenido y elegir un método para organizar los datos. En esta exposición revisaremos los

Conceptos de archivos y los interesesQue surgen al procesar archivos en

Los sistemas de información.

Page 3: Presentación grupo 5

OBJETIVOS DE DISEÑO

•Diseñar archivos de computadora utilizando estructuras de•Almacenamiento adecuadas.

•Elegir estructuras de archivo y métodos de acceso respaldo•Y recuperación.

•Desarrollar diagramas de estructura de datos para el diseño de archivos y registros.

•Diseñar procedimientos de respaldo para protegerse contra la pérdida de datos.

Page 4: Presentación grupo 5

TERMINOLOGIA BÁSICA DE ARCHIVOS¿Qué es DATO?

Los DATOS son realidades concretas en su estado primario como por ejemplo el nombre de un empleado, los números de

parte de un inventario.

Los DATOS son los elementos individuales de los archivos, también conocidos como campos. (un cheque de banco está

formado por datos, ejemplo: número de cheque, fecha, monto numérico, firma, etc.)

Cada dato se identifica por su nombre y tiene un valor específico asociado a él. Por ejemplo, el número 1125 es un

valor de un dato asignado al dato llamado número de cheque.

DISEÑO DE ARCHIVOS

Page 5: Presentación grupo 5

TERMINOLOGÍA BÁSICA DE ARCHIVOS¿Qué es REGISTRO?

Un REGISTRO es el conjunto completo de datos relacionados pertenecientes a

una entrada, tal como un cheque bancario.

Cuando el número y tamaño de los datos de un registro son constantes

para cada registro, éste se denomina de longitud fija. La ventaja de este tipo de registros es que siempre tienen el

mismo tamaño.Los registros de longitud variable son menos comunes en la

mayoría de las aplicaciones de las empresas que los diseños de longitud fija, debido a que estos últimos son más fáciles de

manejar y cubren las necesidades de la mayoría de las aplicaciones. El tamaño del registro puede variar debido a que los datos varían en longitud (número diferente de bytes) o debido a

que el número de datos en un registro cambie de un caso a otro.

Page 6: Presentación grupo 5

Para distinguir un registro de otro, los analistas de sistemas eligen uno de los datos del registro cuyo valor sea único en

todos los registros del archivo y lo utilizan con fines de identificación. Este campo, llamado llave del registro, atributo

o simplemente llave, ya forma parte del registro y no es un dato adicional que existe sólo para propósitos de

identificación.

Por ejemplo son llaves de registros el número de parte de un inventario, el número de estudiante en un registro de

inscripciones de una universidad o el número de serie de un producto manufacturado.

Page 7: Presentación grupo 5

• lklll

• Una ENTIDAD es cualquier persona, lugar, cosa o evento de

interés para la organización y acerca del cual se capturan,

almacenan o procesan datos.

TERMINOLOGIA BÁSICA DE ARCHIVOSEntidad

Los pacientes y exámenes son entidades de interés en los hospitales, mientras que las entidades de un banco incluyen los clientes y los

cheques.

Page 8: Presentación grupo 5

DDDD

TERMINOLOGIA BÁSICA DE ARCHIVOSARCHIVO

DDDDUn ARCHIVO es una colección de registros

relacionados. Se incluye cada registro en un archivo ya que pertenece a la misma entidad.

El tamaño del archivo se determina por el número de registros que hay en él. Si un archivo tiene 6

registros y cada registro es de longitud fija y utiliza 200 caracteres de almacenamiento, entonces el

archivo utilizará 6 por 200 caracteres de almacenamiento.

Page 9: Presentación grupo 5

Es una colección integrada de datos almacenados en distintos tipos de registros, de forma que sean accesibles para múltiples aplicaciones.

Las bases de datos no eliminan la necesidad del archivos en un sistema de información. Los

distintos tipos de archivos siguen siendo necesarios para capturar detalles de los

eventos y actividades de la empresa.

TERMINOLOGIA BÁSICA DE ARCHIVOSBASES DE DATOS

Page 10: Presentación grupo 5

DIAGRAMA DE ESTRUCTURAS DE DATOS

Son Herramientas básicas que muestran los requerimientos lógicos de la estructura de datos.

Sus principales objetivos son: -          Verificar los requerimientos de información -          Escribir los datos asociados con las entidades; -          Mostrar la relación entre entidades -          Comunicar los requerimientos de datos de un diseñador de archivo o administrados de la base de datos.

Notación:Una notación común se usa al preparar los diagramas de estructuras de datos.

Las entidades se representan mediante rectángulos, con el nombre de la entidad en la parte de arriba y una lista de atributos.

Page 11: Presentación grupo 5

DIAGRAMA DE ESTRUCTURAS DE DATOS

Uso en el diseño de archivo

Los diagramas de datos requieren que el analista haga preguntas importantes acerca de la entidad a describir: Cuáles son los campos que identificaran la entidad? Por qué medio se accesará la información? Que otros datos describirán los atributos de la entidad? 

Page 12: Presentación grupo 5

TIPOS DE ARCHIVOS

Las empresas y las organizaciones ya, sean computarizadas o no, utilizan ampliamente los archivos maestros, de transacciones, tablas y reportes para reunir y mantener muchos tipos de registros

Un archivo es una colección de registros relacionados entre si, en el sentido de que todos ellos pertenecen a la misma entidad lo cual proporcionan información para la operación, diseño, administración y toma de decisiones en una organización.

Page 13: Presentación grupo 5

Los que se usan para almacenar datos por un periodo indefinido. Ejemplo: Archivos maestros y de tabla.

Los que se usan para almacenar datos temporalmente, para un propósito especifico.

Pueden ser archivos de transacción, archivos de trabajo o archivos de reporte.

TIPOS DE ARCHIVOS

Page 14: Presentación grupo 5

El archivo maestro contiene todos los registros de una determinada base de datos, cada uno de las cuales consiste en un conjunto de campos de longitud variable. Cada registro se identifica con un número único, asignado automáticamente por CDS/ISIS al ser creado; este número se denomina: Número del archivo maestro o MFN (iniciales de Master File Number).

ARCHIVO MAESTRO

Un archivo maestro es un conjunto de registro acerca de un aspecto importante de las actividades de una organización. Puede contener datos que describan el estado actual de los eventos específicos o indicaciones de la empresa.

Page 15: Presentación grupo 5

ARCHIVO MAESTRO

Los archivos maestros se mantienen actualizados por medio del uso de los archivos de transacciones.

Los archivos maestros son útiles sólo mientras se mantengan exactos y actualizados.

Page 16: Presentación grupo 5

ARCHIVO MAESTRO

FORMATO DEL REGISTRO DEL ARCHIVO MAESTRO

Los registros del archivo maestro son registros de longitud variable, cada uno de ellos está formado por tres secciones: la primera es el rótulo del registro, de longitud fija; la segunda, es un directorio o índice del contenido del registro; y la tercera contiene los campos de información de longitud variable.

Page 17: Presentación grupo 5

ARCHIVO MAESTRO

FORMATO DE ROTULO DEL REGISTRO

El rótulo del registro está formado por los 7 enteros.

FORMATO DEL DIRECTORIO

El directorio es una tabla que indica el contenido del registro. Hay una entrada o bloque de datos en el directorio para cada campo presente en el registro.

Page 18: Presentación grupo 5

ARCHIVO MAESTRO

Page 19: Presentación grupo 5

ARCHIVO MAESTRO El archivo maestro, mantiene la totalidad de registros en una versión actualizada.

Por ejemplo, un archivo usado para el pago de la nomina.

Archivos maestros. Contienen registros para un grupo de entidades. Estos archivos son propensos a tener registros grandes que contienen toda la información sobre una entidad de datos. Cada registro normalmente contiene una clave primaria y varias claves secundarias.

Los archivos maestros son permanentes y duran mientras exista el sistema

Page 20: Presentación grupo 5

ARCHIVO TRANSACCIONES

Un archivo de transacciones es un archivo temporal que persigue básicamente dos propósitos; uno es el de acumular datos de eventos en el momento que ocurran, y el segundo propósito es el de actualizar los archivos maestros para reflejar los resultados de las transacciones actuales.

Page 21: Presentación grupo 5

ARCHIVO TRANSACCIONES

En otras palabras, guardan información sobre los eventos que afectan a la organización y sobre los cuales se calculan datos; como es en el caso de los archivos de VENTAS, ORDENES DE PRODUCCIÓN o PAGO DE SALARIOS.

Otros ejemplos de archivos de transacciones son los archivos de: REGISTROS CONTABLES, COSTOS, FACTURAS, PAGOS A RECIBIR, PROCESOS DE EXPORTACIÓN, CONSULTA DE CLIENTES, PEDIDOS DE CLIENTES Y PEDIDOS A PROVEEDORES

Page 22: Presentación grupo 5

ARCHIVO TRANSACCIONESCada archivo de transacciones contiene únicamente los registros que pertenecen a las entidades particulares que son el tema del archivo.

Los archivos de transacciones y maestros se leen como transacción de entrada por el programa de actualización esto da como resultado un archivo maestro revisado que refleja los resultados del procesamiento.

Page 23: Presentación grupo 5

ARCHIVO TRANSACCIONES

Los archivos de transacciones son temporales en algún momento ya no son necesarios y se borran o destruyen, dependiendo del método utilizado para almacenar los datos.

Los archivos de transacciones se utilizan para actualizar los archivos maestros .

Los archivos de transacciones pueden retenerse por meses, a veces incluso por años, después de haber sido creados dependiendo las necesidades legales y de la organización.

Page 24: Presentación grupo 5

ARCHIVO TRANSACCIONES

Page 25: Presentación grupo 5

ARCHIVO DE TABLAS

Archivos de tabla retiene datos usados para calcular más datos o medidas de desempeño.

Los archivos de tablas contienen datos de referencia utilizados en el procesamiento de transacciones, actualización de los archivos maestros o producción de salida.

Page 26: Presentación grupo 5

ARCHIVO DE TABLAS

A menudo, los analistas especifican el uso de los archivos de tablas para almacenar los datos que de otra forma se incluirán en los archivos maestros o en los programas de computadores.

Los archivos de tablas conservan el espacio de almacenamiento y facilitan el mantenimiento del programa guardando en un archivo, datos que de otro modo, se incluirían e los programas o registros del archivo maestro.

Page 27: Presentación grupo 5

ARCHIVO DE REPORTES

Los archivos de reportes son archivos temporales que se utilizan cuando el tiempo de impresión no está disponible para todos los reportes producidos.

Cuando se necesita imprimir un informe y no hay ninguna impresora disponible, se usa un archivo de reporte. Enviar la salida a un archivo en lugar de a una impresora se denomina apooling. Después cuando el dispositivo está listo, el documento se puede imprimir.

Page 28: Presentación grupo 5

ARCHIVO DE REPORTESLa unidad central de proceso de una computadora frecuentemente produce datos para salida a una velocidad más rápida de lo que las impresoras puedan retener

Para prevenir tal uso ineficiente del CPU (Unidad Central de Procesamiento), el componente más poderoso de la mayoría de los sistemas de cómputo, muchos sistemas están diseñados para utilizar el procesamiento sobrepuesto y los archivos de reportes.

Page 29: Presentación grupo 5

ARCHIVO DE REPORTES

Los archivos de reporte son muy útiles, debido a que los usuarios pueden llevar los archivos a otros sistemas de computadora y hacer la salida en dispositivos especiales, tales como graficadores, impresoras láser, unidades de microficha y hasta maquinas de composición tipográfica computarizadas.

Page 30: Presentación grupo 5

OTROS ARCHIVOS

Al igual que los usos especiales de los tipos de archivos analizados anteriormente, otros archivos también juegan un papel en los sistemas de información por ej. un archivo de respaldo es una copia de un archivo maestro, de transacciones o de tablas hecho para garantizar que se dispone de un duplicado si alfo le ocurre al original.

Page 31: Presentación grupo 5

OTROS ARCHIVOS

También se hacen copias de los archivo para el almacenamiento de datos a largo plazo; estas copias usualmente se almacenan lejos del centro de computo para prevenirse de que en forma inadvertida se pueda acceder o recuperar para su uso garantizando así su preservación.

Page 32: Presentación grupo 5

ÑÑ

METODOS DE ORGANIZACIÓN DE ARCHIVOS

ORGANIZACIÓN SECUENCIAL

Los registros son archivos, utilizando su organización se determina su almacenamiento, localización, y recuperación de registros.

Las tres formas comunes de almacenamiento son:

•Organización Secuencial

•Organización de acceso directo

•Organización de archivo Indexado.

Page 33: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

ORGANIZACIÓN SECUENCIAL (2)

Forma simple de almacenar y recuperar registros en un archivo. En éste tipo de archivos se almacenan los registros uno tras otro sin tener en cuenta su valor real de datos, es decir que se hace por posición, según el orden como es guardado. Lo que no permite ningún análisis.

En los archivos secuenciales para leer el décimo archivo hay que leer desde el primero, no se puede ir directamente al décimo.Es un buen archivo para organizar cuando es necesario acceder cada registro para un tipo de aplicación.Pero cuando el archivo o la base de datos es muy grande se convierte en desventaja por su forma de búsqueda.

Page 34: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Lectura de Archivos Secuenciales Para leer un archivo secuencial, el Sistema siempre comienza al principio del archivo y lee un registro a la vez hasta llegar al registro deseado. No se puede ir directamente al décimo registro en un archivo secuencial sin partir del principio. La verdad es que el Sistema no sabe que es el décimo registro. Según la naturaleza del sistema a diseñar, esta característica puede ser una ventaja o desventaja.El ejemplo del cheque, se puede utilizar para ejemplificar los archivos secuenciales. Usted usa cheques en una secuencia, uno a la vez. Usa el primer cheque de la chequera en primer lu7gar, el segundo a continuación y el tercero después de eso. En cierto sentido, la chequera es un archivo secuencial en el cual los cheques están en orden con base en el número de cheque (La clave del registro)

Page 35: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOSBúsqueda de Registros

Al Sistema no le interesa los valores de los datos almacenados, en los campos dentro de un registro. De hecho, los archivos secuenciales no utilizan llaves de registro físico.

Los registros se accesan por su orden de aparición en el archivo (Por esta razón los analistas se refieren a los archivos secuenciales como “archivos sin llave”).

¿Cómo recupera entonces el Sistema un registro específico?Por ejemplo ¿Cómo se localiza y recupera el cheque 1258?. Llamaremos al número 1258 del cheque la “llave de búsqueda” (Para el valor del dato a buscar mediante la llave del registro).

Page 36: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Búsqueda de Registros El programa controla todos los pasos de procesamiento siguientes. El primer registro es leído y su número de cheque comparado con la llave de búsqueda: 1240 contra 1258. Puesto que el número de cheque y la llave de búsqueda no coinciden se repite el proceso.El número de cheque para el siguiente registro es 1248 y tampoco coincide con la llave de búsqueda. El proceso de lectura y comparación de registros continúa hasta que el número de cheque y la llave de búsqueda coincidan.Si el archivo no contiene un cheque con el número 1258, el proceso de lectura y comparación continúa hasta alcanzar el final del archivo.El anterior método es la única forma para procesar un archivo secuencial.

Page 37: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Búsqueda de Registros¿Se podría escribir el programa para comparar el número de cheque del primer registro y la llave de búsqueda para calcular dónde se encuentra el cheque? La respuesta es no, ya que aunque el archivo no está en el orden secuencial ascendente, no aparecen todos los números de cheque; algunos cheques faltan. Al restar el último número de cheque (1258) del primero (1249) es 1269. (Aún cuando el archivo estuviera en orden ascendente, el sistema no lo sabría).

Page 38: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Evaluación de archivos secuenciales Nos preguntamos: ¿Acaso la organización secuencial es una forma que ofrece ventajas para ordenar y procesar archivos?La respuesta depende de cómo se utilice el archivo.El método es simple y fácil de comprender. Sólo se almacenan o leen registros uno después del otro para procesar el archivo, se comienza desde el principio y se lee un registro después del otro. Supóngase que es necesario accesar cada registro en el archivo para una aplicación particular. En este caso, un archivo secuencial es un buen método de organización si, en promedio, alrededor de la mitad de los registros en el archivo se van a utilizar, la organización secuencial sigue siendo aceptable, ya que al menos uno de dos registros recuperados serà utilizado y el tiempo necesario para examinar un registro adyacente es breve.

Page 39: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Evaluación de archivos secuenciales Por otro lado, si el requerimiento es hallar un registro particular en un archivo muy grande, la organización secuencial del archivo se convierte en desventaja. El programa debe comenzar al principio del archivo y leer cada registro hasta encontrar al correcto, una tarea que consume mucho tiempo a menos de que el registro deseado sea uno de los primeros en el archivo.

Page 40: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Organización de Acceso Directo Es un método que muestra al sistema donde se almacena un registro antes de poder accesar y no requiere que el sistema comience en el primer registro.Éstos se caracterizan por que son archivos con llave, asocian un registro con un valor llave específico y un lugar particular de almacenamiento.

Todos los registros se almacenan mediante las llaves en las direcciones en vez de por posición, si el programa conoce la llave del registro, puede determinar la dirección de localización de un registro y recuperarlo en forma independiente de los demás registros del archivo.

Page 41: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Direccionamiento Directo

Si seguimos con el ejemplo del cheque, el acceso directo de los registros se demuestra utilizando un área de almacenamiento que tiene un espacio reservado para cada número de cheque del 1240 al 1300.El Sistema utiliza el número de cheque como una “llave de registro físico”. El cheque número 1248 se almacena en la dirección 1248, lugar reservado para el cheque con ese número.

Page 42: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Direccionamiento Directo

Para recuperar el cheque del almacenamiento en un sistema de cómputo se instruye al programa para que utilice el número 1258 como la llave de búsqueda.

Se sabe que la llave sirve como la dirección y así, va directamente al lugar asignado para el registro con la llave de 1248 y recupera el registro. La característica atractiva de la organización directa es que los registros se recuperan mucho más rápidamente que cuando la búsqueda se hace desde el inicio del archivo

Page 43: Presentación grupo 5

Requerimientos para el Direccionamiento Directo

El uso de la llave del registro como la dirección de almacenamiento se llama “Direccionamiento Directo”. Cuando éste método se puede utilizar, es simple y rápido. Sin embargo, es frecuente que los requerimientos de este método permiten desventajas para su uso. El direccionamiento debe tener un conjunto de datos con las siguientes características:

1.El conjunto de llaves (es decir, el rango de valores asignados a las llaves) tiene un orden denso y ascendente con pocos valores no utilizados (los valores no utilizados significan espacio de almacenamiento desperdiciado).

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 44: Presentación grupo 5

Requerimientos para el Direccionamiento Directo

Por lo tanto, se desean pocos espacios abiertos entre los valores de las llaves.2. Las llaves de los registros corresponden con los números de las direcciones de almacenamiento; existe una dirección de almacenamiento en el archivo para cada valor real o posible de la llave y no hay valores duplicados de la llave.

En una lista densa de llaves, para cada valor-llave existe un espacio de almacenamiento con una dirección que es equivalente a la llave. Los valores llave están también en una secuencia cerrada. Lo anterior es importante en el Diseño del Archivo, ya que, cuando se asigna el espacio de almacenamiento al archivo se comienza en el valor más bajo de la llave y se extiende al valor más alto de la misma.

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 45: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Direccionamiento por Hashing (Quiere decir Transformación de llaves o aleatorización)

Es un acceso directo por un método de acceso alternativo de hashing, proceso por el cual se obtiene una dirección de almacenamiento a partir de un campo de llave . Se diseña un algoritmo (Un procedimiento aritmético) para transformar un valor de la llave en otro valor que sirva como una dirección de almacenamiento. (Los valores de los datos en el propio registro no cambian)

Page 46: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Tipos de algoritmos de hashing En el número de algoritmos que los analistas pueden Desarrollar virtualmente, no existe límite. Por ejemplo, al almacenar registros de información sobre el personal de una empresa, es frecuente que los analistas elijan el número del Seguro Social (o algún otro número de identificación personal) para utilizarlo como llave del registro. Ya que el número del Seguro Social no cumple con los criterios anteriores para las llaves de direccionamiento directo, el diseño debe especificar un procedimiento de hashing que convierta el número del Seguro Social en un valor correspondiente a una dirección de almacenamiento.

Page 47: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Requerimientos para los algoritmos de hashing

Los algoritmos de hashing deben tener las siguientes características

•Posibilidad de repetición: La capacidad de almacenar un registro mediante un algoritmo y recuperación, utilizando el mismo algoritmo, es un requerimiento importante.

• Distribución uniforme: Si se va almacenar un archivo en un espacio que permite el almacenamiento de 10.000 registros, éstos deben distribuirse de manera uniforme en todo el espacio asignado en vez de acumularse todos juntos.

Page 48: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Requerimientos para los Algoritmos de Hashing (2)

•Minimizar sinónimos: No existe un algoritmo de hashing perfecto, aunque algunos son mejores que otros cuando se trata de minimizar sinónimos. En la práctica, los sinónimos aparecen cuando el procedimiento de dispersión se aplica a llaves distintas y produce la misma dirección en el almacenamiento.

•Cuando el sistema debe recuperar un registro, el algoritmo de hasging se lleva a cabo y se determina la dirección de almacenamiento. Entonces se verifica el registro del área de almacenamiento. Si no es el correcto (Lo cual significa que apareció antes un sinónimo), el sistema automáticamente va al área de OVERFLOW ( DESBORDAMIENTO) y recupera el registro para su procesamiento.

Page 49: Presentación grupo 5

METODOS DE ORGANIZACIÓN DE ARCHIVOS

ORGANIZACIÓN INDEXADA El método de organización indexada es aquel que tiene asociado un índice para mejorar la operación de búsqueda, organizar de manera efectiva los registros para facilitar y agilizar el acceso.Para hallar un registro cuando se conoce la dirección de almacenamiento estructura de hashing) es necesario examinar los registros, pero es más fácil la búsqueda si se asocia con un índice, esta búsqueda se realiza recorriendo una sucesión de tablas.

QUE ES UN ÍNDICE?

Es un recurso para encontrar información. El índice contiene una lista de temas (llaves) y números de páginas donde se encuentran ubicados esos temas (campos de referencia).

Page 50: Presentación grupo 5

ORGANIZACIÓN INDEXADA

CARACTERÍSTICAS DE UN INDICE:Un índice es un archivo independiente del archivo maestro.Cada registro en el índice contiene dos datos: una llave de registro y una dirección de almacenamiento.La localización de un registro se hace buscando en la tabla de índices el valor del campo clave y obtenemos la posición en que está grabado el registro dentro del fichero.

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 51: Presentación grupo 5

.

ORGANIZACIÓN INDEXADANO SECUENCIAL

El archivo de datos se almacena mediante indexación. Ver figura: El índice de la izquierda contiene las llaves de los registros en el archivo maestro (AB, AC, AD, BC, BD, etc.) y el lugar de almacenamiento en el mismo. Así, el índice muestra las direcciones 1021 para AB, 1022 para AC, etc. En la figura el archivo maestro no tiene ningún orden específico. Este método de organización del archivo se llama Organización Indexada no secuencial. Existe un registro en el índice por cada registro en el archivo maestro.

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 52: Presentación grupo 5

ORGANIZACIÓN INDEXADA NO SECUENCIAL

Page 53: Presentación grupo 5

.

ORGANIZACIÓN INDEXADA SECUENCIAL

Un archivo organizado secuencialmente es un conjunto de registros lógicamente relacionados cuya secuencia de acceso está determinada por su ordenamiento. Los registros deben ser grabados consecutivamente cuando el archivo es creado, y deben ser leídos consecutivamente cuando el archivo es usado posteriormente como entrada.

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 54: Presentación grupo 5

.

ORGANIZACIÓN INDEXADA SECUENCIALCARACTERISTICAS

El tipo de sus registros contiene un campo clave identificador. •Los registros se almacenan en bloques con capacidad específica, pueden almacenar hasta 3150 datos.•Los registros se encuentran en orden secuencial dentro de los bloques en el archivo maestro, están situados en un soporte direccionable por el orden de los valores indicados por la clave. • Existe un índice con cada una de las posiciones direccionales que almacena la dirección de la posición y el valor de la clave, es decir, en el índice encontramos la clave del último registro y la dirección de acceso al primer registro bloque

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 55: Presentación grupo 5

¿ Búsqueda de Registros

¿CÓMO SE LOCALIZA EL REGISTRO CUANDO EL ARCHIVO SE ALMACENA UTILIZANDO EL MÉTODO DE UNA ORGANIZACIÓN INDEXADA SECUENCIAL?

1. Si el archivo está organizado según el método de acceso indexado secuencial (ISAM ) no es necesario tener una entrada de índices para cada registro.

2. Se necesita el mayor o el menor valor de todos los registros en un bloque.

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 56: Presentación grupo 5

¿ Búsqueda de Registros

3. El programa primero da acceso al índice y le indica al sistema que inicie la lectura de registros y va comparando las llaves en el registro del índice que tenga el valor dado (el mayor o menor) hasta que esta concuerde y pueda leer el registro y empezar el proceso necesario.

4. Es decir sin el uso del índice el sistema buscaría en los registros de todos los bloques antes de hallar el deseado y seria más lenta la búsqueda.

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 57: Presentación grupo 5

MANTENIMIENTO DE UN ARCHIVO ISAM1. Para insertar registros a los archivos indexados secuenciales

el sistema los añade al archivo maestro, serán insertados en los bloques que comiencen con la dirección del valor dado conservando la naturaleza secuencial de cada bloque

2. Para modificar se utilizan los mismos procedimientos de búsqueda se modifica el registro y se reemplaza en su ubicación original.

3. Cuando se borra un registro este deja de ser accesible al programa , este espacio no queda disponible para almacenar otro registro.

METODOS DE ORGANIZACIÓN DE ARCHIVOS

Page 58: Presentación grupo 5

ESTRUCTURAS DE ALMACENAMIENTO

Los métodos para desarrollar un Sistema de Información evolucionan cada día, más rápidamente y se tiene la oportunidad de utilizar las nuevas herramientas que nos ofrece la Tecnología.

La parte central de las actividades de los Desarrolladores de Sistemas de Información esta la forma en que se almacenaron los datos en el Sistema para su futura recuperación.Existen dos formas:

•Secuencialmente (Con un registro detrás del otro) o

•Aleatoriamente: en lugares específicos de almacenamiento.

•Estos métodos son características arquitectónicas fundamentales de los dispositivos de Almacenamiento.

Page 59: Presentación grupo 5

ESTRUCTURAS DE ALMACENAMIENTO

CINTA MAGNÉTICAEs uno de los medios más conocidos y menos caros de almacenar datos en Sistemas de todos los tamaños.

Almacenamiento de datos en cinta magnética:Los datos se almacenan a lo largo de la superficie de la cinta en una densidad específica, medida en bytes por pulgada (BPI).Un byte almacena un carácter.

La densidad de registro de un sistema se mide por el número de BPI~. La densidad standard en los sistemas de red principal es 1.600 y 6.250 BPI.

Page 60: Presentación grupo 5

CARACTERISTICAS DEL ARCHIVO

•Número de registro en el archivo:15.000• Tamaño de cada registro:175 bytes

FORMATO SIN BLOQUESEspacio de almacenamiento de un registro

Espacio entre los bloques +( Tamaño de registro

Densidad de registro)

Espacio total de almacenamiento del archivo:Número de registros en el archivo por el espacio usado para cada registro.

Espacio entre los bloques

Espacio entre los bloques

Espacio entre los bloques

Espacio entre los bloques

0.3”0.3”

0.3”0.3”

0.028”

0.028”

Registro de datos

FORMATO CON BLOQUESFactor de BloqueoEspacio de almacenamiento de un bloque:

Espacio entre los bloques + |Factor de bloqueo ( Tamaño de registro

Densidad de registro) |

Número de bloquesTamaño del archivoFactor de bloqueo

Espacio total de almacenamiento de bloques:Número de bloques por el espacio utilizado para cada bloque

Espacio entre los bloques

Registro lógico de datos

0.3 pulg. + |30 ( 1756250 )|= 1.14 pulg.

1500030

= 500 bloques

500 x 1.14 pulg.= 570 pulg.

CARACTERISTICAS DE ALMACENAMIENTO

•Densidad de registro 6250 BPI• Tamaño del espacio entre los bloques: 0.3 pulg.

0.3 pulg. + 1756250

Pulg.=0.328 pulg por registro

15.000 x 0.328 pulg.= 4.920 pulg.

Page 61: Presentación grupo 5

Creación de BloquesLos analistas de sistemas, reducen el número de los espacios necesarios entre los bloques mediante la creación de bloques, en la figura anterior observamos que se necesita más espacio para los espacios entre los bloques que para los datos.

Cada registro físico, ya sea que contenga un byte de datos o una cantidad mucho mayor, es precedido y seguido por un espacio entre los bloques, los usuarios trabajan con lo que, en un sentido de sistemas, son registros lógicos (tales como registros médicos, de ventas, facturas o cheques bancarios).

La creación de bloques ocurre cuando el sistema almacena varios registros lógicos dentro de un único registro físico. El número de registros en el bloque se llama factor de bloqueo.

ESTRUCTURAS DE ALMACENAMIENTO

Page 62: Presentación grupo 5

Determinación del EspacioLos analistas deben calcular la cantidad de espacio necesario para almacenar los registros, al determinar los requerimientos de almacenamiento durante el diseño de sistemas.

En la figura anterior muestra los cálculos cuando se utiliza un archivo formado por 15.000 registros, cada uno con una longitud de 175 bytes. En este ejemplo, se necesitan 4.920 pulgadas, o alrededor del 17% del carrete de 2.400 pies (28.800 pulgadas) de cinta para almacenar todo el archivo.

ESTRUCTURAS DE ALMACENAMIENTO

Page 63: Presentación grupo 5

Determinación del tiempo de lectura Además de ser capaces de determinar el factor de bloqueo y las necesidades de espacio, es frecuente que los analistas también deseen saber cuántos segundos, minutos u horas se necesitan para procesar el archivo.

El tiempo que lleva leer un archivo de datos (sin incluir el tiempo de procesamiento en el CPU) está gobernado por el tamaño de los registros lógicos y físicos, el tamaño de los espacios entre los bloques, la densidad de registro y la razón de transferencia de la unidad de cinta (la velocidad a la que se pueden transmitir los datos del almcenamiento secundario, en este caso la cinta magnética, a la memoria, o viceversa).

ESTRUCTURAS DE ALMACENAMIENTO

Page 64: Presentación grupo 5

La forma más eficiente para procesar los archivos maestros y de transacciones analizados anteriormente, es teniendo a ambos en la misma secuencia. De esta forma, sólo se necesitan leer los registros una sola vez. Las especificaciones de diseño deben establecer que el archivo de transacciones esté ordenado de la misma forma que el archivo maestro antes de llevar a cabo cualquier otro procesamiento.

El resultado de un proceso de ordenamiento, utilizando un programa de ordenamiento, es un archivo de transacciones ordenado y listo para el procesamiento posterior.

PROCESAMIENTO DE UN ARCHIVO SECUENCIAL

Page 65: Presentación grupo 5

Actualización de un archivo Para actualizar un archivo maestro, las tres transacciones posibles son añadir nuevos registros existentes o cambiar el contenido de los registros existentes del archivo maestro. La actualización de un archivo maestro crea uno nuevo que contiene los resultados de las actividades de actualización. Se observa que el archivo maestro anterior no se destruiye, adicional no es posible añadir o borrar registros en un archivo maestro secuencial sin producir una nueva copia de él en un carrete de cinta distinto.El contenido del archivo de transacciones controla realmente el proceso de actualización, eligiendo los registros del archivo maestro por actualizar y aquellos que permanecen sin alterar. La secuencia original del archivo maestro anterior se preserva en el nuevo.

PROCESAMIENTO DE UN ARCHIVO SECUENCIAL

Page 66: Presentación grupo 5

Manejo de errores Durante el procesamiento del archivo, se hacen continuamente

verificaciones de error. Pueden ocurrir los siguientes tipos de error si los datos de entrada no se validan en forma adecuada o si se incluyen transacciones erróneas en el archivo de transacciones, así:

1. Intento de añadir registros a un archivo maestro cuando el registro ya se ha almacenado en el archivo y no se permiten llaves duplicadas.

2. Intento de borrar registros que no están almacenados en el archivo.

3. Intento de cambiar el contenido de los registros que no están almacenados en el archivo (la llave de búsqueda no coincide con ninguna llave en el archivo).

PROCESAMIENTO DE UN ARCHIVO SECUENCIAL

Page 67: Presentación grupo 5

DISCO MAGNÉTICO

Se observará las características de los discos magnéticos para ver cómo almacenan los datos y por qué es posible el acceso directo a los registros con los discos pero no con las cintas magnéticas. El formato de los discos permite un almacenamiento ordenado de los datos.

Page 68: Presentación grupo 5

Características y Diseño del Disco MagnéticoLos datos se escriben o se leen de los discos magnéticos (o diskettes) sólo cuando están girando dentro del drive (unidad de disco). La rotación del disco varía de aproximadamente 200 a varias miles de resoluciones por minuto, dependiendo del drive que se utilice.

Las cabezas de lectura y escritura detectan en forma electrónica los datos almacenados en la superficie del disco. Normalmente, las cabezas de lectura y escritura son parte del drive. Sin embargo, en los sistemas Winchester, las cabezas vienen selladas en el mismo paquete del disco para mantenerlas alejadas del polvo, así como para mejorar la velocidad de acceso.

DISCO MAGNÉTICO

Page 69: Presentación grupo 5

Características y Diseño del Disco MagnéticoLos datos se almacenan en la superficie del disco en una o más pistas, círculos concéntricos con una capacidad fija de almacenamiento medido en bytes por pista. Los diskettes pequeños tienen menos de 34 pistas por superficie, mientras que los grandes tienen varios cientos de pistas por superficie.Las cabezas de lectura y escritura en un disco están instaladas en un brazo de acceso y todas las cabezas se mueven juntas.

Las cabezas en cada superficie pueden accesar una sola pista en esa superficie. Por lo tanto, si existen 20 superficies en un paquete de disco, el sistema puede escribir o leer de cualquiera de las 20 pistas cuando el brazo de acceso se posiciona. Las pistas identificadas con el mismo número forman lo que se conoce como cilindro.

DISCO MAGNÉTICO

Page 70: Presentación grupo 5

DIRECCIONAMIENTO PISTA/CILINDRO

La forma de direccionamiento de uso más común en las computadoras grandes utiliza el concepto de direccionamiento pista/cilindro

Punto índiceLa distribución general de una pista bajo el concepto pista/cilindro, la cual se muestra en la siguiente figura:

Page 71: Presentación grupo 5

DIRECCIONAMIENTO PISTA/CILINDRO

Se explica así: consiste de un punto índice, la dirección inicial, registro descriptor de la pista y los registros de datos. El punto índice señala el comienzo de una pista, considerado como un enorme lugar de almacenamiento. Todas las pistas del disco están sincronizadas con el punto índice.

Cuando los discos se inicializan o preparan para su uso, un programa de utilería especial identifica el formato del disco escribiendo pistas en el disco en forma magnética. (Las pistas no son visibles, no existen surcos o marcas físicas en la superficie).

Page 72: Presentación grupo 5

DIRECCIONAMIENTO PISTA/CILINDRO

Dirección inicial Durante la inicialización, el sistema escribe la dirección inicial en la pista. (Si por alguna razón el sistema no puede escribir una dirección inicial, el disco no se puede utilizar). La dirección inicial consta de cuatro datos:

1.Byte bandera: indica si la pista es una pista primaria o alternativa.

2. Número de cilindro

3.Número de cabeza de lectura y escritura: Identifican juntos una pista específica en el disco, característica esencial para los métodos de direccionamiento directo o por hashing que ya se han analizado.

4. Byte para control de errores: Los bytes de verificación son para la detección de errores.

Page 73: Presentación grupo 5

Registro Descriptor de la pistaEl registro en la pista es el registro descriptor de la misma, el cual describe cómo se organizan los datos de la parte restante de la pista. Se incluyen nueve datos. El byte de bandera, número de cilindro y número de cabeza de lectura y escritura, se repiten en el registro descriptor de la pista de forma que, en caso de que surja la necesidad, se puedan mover los datos de la pista de una pista primaria a una alternativa. Esto proporciona al sistema toda la información que necesita para utilizar los datos que siguen.

El número de registro es el número secuencial del registro en la pista. El primer registro en la pista, número 0, es el registro descriptor de la misma. Su posición es la razón de que a veces se le llame registro cero.

DIRECCIONAMIENTO PISTA/CILINDRO

Page 74: Presentación grupo 5

Registro Descriptor de la pistaEl método de direccionamiento por sector de los discos magnéticos divide cada pista en un número específico de bloques de longitud fija, llamados sectores. Este método se utiliza en caso todos los sistemas de disco flexible, así como en los sistemas grandes de disco duro, aunque en los últimos no es tan común como el método de direccionamiento de pista abierta. Para poder localizar un registro, el programa debe instruir al sistema para cargarlo del cilindro, superficie y sector apropiado.

Cada sector en una pista tiene una capacidad de almacenamiento fija. Los sectores (y pistas) más internos contienen el mismo número de bytes de datos que los sectores de las pistas externas. Las capacidades comunes de los sectores son 128 bytes por sector (densidad simple), 256 bytes por sector (doble densidad) y 512 bytes por sector (densidad cuádruple)

DIRECCIONAMIENTO PISTA/CILINDRO

Page 75: Presentación grupo 5

Capacidad de almacenamiento en disco El almacenamiento en disco está regido por la capacidad de cada pista del disco. La capacidad de la pista se puede establecer con el número de bytes que puede contener una pista, en el caso del direccionamiento pista/cilindro, o el número de sectores por pista, junto con una capacidad del sector, en el caso de direccionamiento pista/sector.

En el direccionamiento pista/cilindro, el número de registros físicos que se pueden colocar en una pista depende de si hay llaves en el registro y del tamaño de los registros, así como de la capacidad de la pista. El analista determina el tamaño de todos los registros, excepto del registro descriptor de la pista y la dirección inicial.

DIRECCIONAMIENTO PISTA/CILINDRO

Page 76: Presentación grupo 5

Capacidad de almacenamiento en disco

Al dar tamaño a un archivo, es importante tomar en cuenta el crecimiento esperado del archivo. El analista debe determinar la tasa de crecimiento promedio para una organización durante la investigación del sistema y asignar suficiente espacio de almacenamiento con el fin de manejar el crecimiento para varios meses o años, dependiendo de la naturaleza de la aplicación.

DIRECCIONAMIENTO PISTA/CILINDRO

Page 77: Presentación grupo 5

Determinación del tiempo de lectura El tiempo que se tarda recuperar el registro de un disco es una de las tantas funciones de las características operativas del drive. Después de que el programa instruye al sistema para que lea un registro, existe un retraso en la inicialización para la lectura, debido a la rotación del disco. El retraso se llama tiempo latente o retraso rotacional. Un tiempo latente común es de aproximadamente 0.01 segundos.

El tiempo de búsqueda, un segundo componente del tiempo de lectura y escritura asociado con la operación del disco, es el tiempo que se tarda la unidad de disco en posicionar las cabezas de lectura y escritura en el cilindro adecuado. El tiempo de acceso es el tiempo requerido para localizar el registro adecuado, pero no para leerlo o escribirlo.

DIRECCIONAMIENTO PISTA/CILINDRO

Page 78: Presentación grupo 5

Determinación del tiempo de lectura

El otro componente del procesamiento del disco es la tasa de datos, que es la tasa a la cual se leen los datos.

La información necesaria para estimar el tiempo de lectura y escritura de los discos se da en los manuales del sistema proporcionados por el fabricante del sistema de disco.

DIRECCIONAMIENTO PISTA/CILINDRO

Page 79: Presentación grupo 5

t

RESPALDO Y RECUPERACION DE ARCHIVOS

Los sistemas de información no son inmunes a la perdida accidental de datos.

Existen varias causas por las que es factible que se pierdan los datos. Tanto en dispositivos de

almacenamiento, debido a alguna mala manipulación o deterioro por el uso; así también, pueden existir fallas en el procesamiento de los mismos, producto de errores en la ejecución por parte del usuario, así como causas inesperadas

como lo son daño en el software, fallas súbitas en la energía eléctrica, o bien desastres naturales

(incendios, inundaciones, etc.)

Page 80: Presentación grupo 5

t

RESPALDO Y RECUPERACION DE ARCHIVOS

Métodos de respaldoVaciado de un archivo Vaciado de un archivo

maestro. maestro.

Es duplicar un archivo para crear un archivo de él.

Ocupa el doble de espacio en el disco de almacenamiento.

Copias imágenes de Copias imágenes de registro.registro.

Almacena versiones modificadas, las cuales

pueden ser consultadas en cualquier momento. Ideal para empresas con gran

cantidad de datos.

Depende del analista, evaluar las necesidades de la entidad para

ejecutar el mejor método de respaldo de datos.

Page 81: Presentación grupo 5

CONCLUSIONES

sDurante el desarrollo del tema Diseño de

Archivos, fue muy importante la consulta de varios textos, para entender en forma precisa y correcta de organizar con base en archivos que

acumulan y almacenan datos para su procesamiento.

Los archivos contienen registros relacionados con datos, los cuales describen entidades de importancia para el éxito de la organización

Page 82: Presentación grupo 5

http://www.cgoogle.com/ definiciones/imágenes

http://es.wikipedia.org/wiki/Analista_de_sistemas

Senn, James A. Análisis y diseño de sistemas de información . 2 ed. México: McGraw-Hill, 2000.

BIBLIOGRAFÍA