fbd
DESCRIPTION
Fundamentos de Base de DatosTRANSCRIPT
BASE DE DATOS I
Fundamentos Básicos de base de datos
y de la importancia de las mismas en las
organizaciones
DEFINICIONES
Dato:
“Símbolos que representan hechos, condiciones, situaciones o valores”
“Un dato es la unidad o cantidad mínima de información no
elaborada, sin sentido en sí misma, pero que convenientemente tratada se puede utilizar en la realización de cálculos o toma de decisiones….”
“Los Datos son representaciones abstractas de hechos (Eventos,
ocurrencias o transacciones) u objetos (Personas, lugares, etc.)”.
Tipos de Datos: Numéricos. (Cifras)
Alfabéticos. (Letras, palabras)
Multimedia. (Música, voz, imágenes, video)
Físicos. (Valores tomados directamente del entorno)
DEFINICIONES
Información: • Es el resultado de transformar o procesar datos.
• La transformación de los datos en información se lleva a cabo mediante operaciones aritméticas (sumar, restar, multiplicar, dividir, etc.) y/o lógicas (ordenar, comparar, etc.)
• La información es significativa para el usuario
• Información es el significado que se le da a los datos
Procesamiento
de Datos
Procesamiento Información Datos
Datos Almacenados
DEFINICIONES
Sistema de Información:
Es un conjunto de componentes interrelacionados que permiten capturar, almacenar, procesar y distribuir la información para apoyar la toma de decisiones y el control de las operaciones en una organización
La Información mediante un procesamiento:
• Tiene un valor significativo para quien la utiliza
• Expresa conocimiento sobre los hechos u objetos que la originan
• Reduce su grado de incertidumbre.
Datos Información
Contexto
Orden
Relación
DEFINICIONES
0,1
1000 0001=A
Pedro Pérez
Pedro Pérez, 25 años, soltero,
depto. Ventas, etc.
Tabla de ventas, Tabla de productos, Tabla de
Clientes, Tabla de pedidos, etc.
Los bits se configuran en octetos para formar
Caracteres (bytes) se agrupan bajo un contexto para formar
Elementos de datos (campos) que se agrupan y relacionan de
manera lógica para formar
Archivos que se reorganizan y se integran de manera
lógica para obtener una
Base de Datos
Registros que contienen los elementos de datos relacionados
y se expresan en
Pedro Pérez, 25 años, soltero, depto.
Ventas,..., Jesús Chacon, 45 años,casado,
Dpto. contabilidad,..,etc
Jerarquía en la Organización de Datos
El almacenamiento de los datos en las organizaciones
es de vital importancia en su eficiencia total.
Antes de la era informática los datos eran
almacenados usando archivos manuales.
Archivo Manual
Desventajas:
• Este tipo de forma de guardar datos es propenso a errores, los archivos contenidos por el mismo pueden ser fácilmente dañados, perdidos o desorganizados.
• Es muy difícil compartir datos en este tipo de sistema.
• Existe redundancia de datos y problemas de seguridad
• Procesos muy lentos.
Sistemas Orientados a Archivos
¿La Solución?
Digitalizar los datos
(Sistema de Archivos)
Beneficios:
• Reducción del espacio de almacenamiento necesario.
• Incremento en la seguridad de los datos.
• Facilidad en el Acceso a los datos.
• Menos consumo de tiempo en su mantenimiento.
• Las Inconsistencias puede ser mas fácilmente evitadas y no debería existir duplicidad de los datos.
Sistemas Orientados a Archivos
Sistemas de procesamiento de datos:
Sistemas automatizados que reemplazaron al sistema
manual y llevaban a cabo esto imitando los
procedimientos manuales existentes. Ejemplo: Cuentas
por pagar, Cuentas por cobrar, Nomina, entre otros.
Organización de los registros:
Organización secuencial de archivo: Los registros
almacenados deben ser recuperados en la misma
secuencia física en la que se almacenaron
• Método utilizado en las cintas magnéticas
• Procesamiento por lotes (todos los registros se
procesaban al mismo tiempo)
Sistemas Orientados a Archivos
Organización Directa o Aleatoria de Archivo: Los registros almacenados pueden ser accedidos en cualquier secuencia,
independientemente del orden físico real con que fueron almacenados en el medio de almacenamiento. Para esta organización se utiliza el Disco Magnético. Los registros individuales pueden ser accedidos mediante los siguientes métodos:
• Método de Acceso Secuencial Indexado (ISAM): Método de acceso de archivos, para accesar directamente registros
organizados secuencialmente mediante el uso de un índice o campo clave. • Método de Acceso Directo a Archivo: Este método se usa la organización directa de archivo y se produce un
acceso a los registros mediante una transformación matemática (Algoritmo de Transformación) de los campos clave en las direcciones especificas de los registros.
Sistemas Orientados a Archivos
• Redundancia de datos: La misma ocurre cuando hay duplicación de
los datos en lugares diferentes. Lo que provoca un desperdicio de
espacio de almacenamiento y a su vez genera otro problema la
inconsistencia.
• Inconsistencia: Ocurre debido a que los datos se encuentran
guardados en mas de un lugar a la vez (redundancia). Pueden existir
diversas copias de los mismos datos pueden no coincidir. • Dependencia de la Aplicación: Los archivos solo pueden ser
accedidos por las aplicaciones que conozcan la estructura de datos
exacta del archivo. Estos efectos pueden ser mas fácilmente
observados cuando una estructura de un archivo necesita ser
cambiada.
• Elevada Necesidad de Mantenimiento: El trabajo de los
desarrolladores involucra en mas de un 50% de su tiempo el
mantenimiento de los sistemas para adecuarlos a cualquier
modificación llevada a cabo en la estructura de los archivos y el
manejo de su integridad.
• Elevados tiempos de respuesta,
• Datos no restaurados ante un fallo
• Dificultades en el manejo de la integridad de los datos.
• Inconvenientes en el acceso concurrente de los datos.
• Dificultades en el manejo de la seguridad de los datos.
D
e
s
v
e
n
t
a
j
a
s
Resumiendo Obtenemos:
Los datos eran almacenados de
manera manual en un principio
Luego fueron digitalizados e
inicialmente se uso el sistema de
archivos para almacenarlos
Pero estos sistemas poseían
muchos de los errores del
sistema manual y algunos
nuevos:
• Inconsistencia de los Datos.
• Redundancia de los Datos.
• Dependencia de los Datos.
• Elevado uso del tiempo de los
programadores en
mantenimiento.
Una solución a los problemas presentados por
los sistemas de almacenamientos manuales y de
archivos es usar una base de datos para guardar
y organizar los datos.
Razones para escoger una Base de Datos para reemplazar a
un sistema de archivos:
1. Independencia de los Datos.
2. Estandarización de los Datos.
3. Aumento en la productividad de los desarrolladores.
4. Integración de los sistemas.
5. Centralización de la seguridad.
6. Control de la privacidad.
¿Qué es una Base de Datos?
Una base de datos es un mecanismo que es usado para guardar
información o datos de manera organizada, de fácil acceso,
recuperación, modificación y eliminación.
• Una base de datos se dice que es una colección de datos organizada para dar servicio eficiente a muchas aplicaciones al centralizar los datos y minimizar aquellos que son redundantes. • Es una colección de datos relacionados con un objetivo específico Representa un aspecto del mundo real (Elmasri,1.998). • Es un lugar donde se almacenan datos computarizados (Date,1.995) • Es una colección de datos lógicamente coherente, con significado Inherente (Elmasri,1.998).
Una base de datos es una colección organizada de datos relacionados.
Organizado: Hace referencia a la manera en que los datos deben ser
almacenados. Solamente si se organizan los datos, el usuario podrá
localizarlos y recuperarlos eficientemente.
Colección: hace referencia a un grupo de datos y no tan sólo a uno en
particular. Son generalmente datos que pertenecen a diversos tipos de datos.
Algunos de los elementos de dataos pueden ser números enteros, otros
números reales, incluso otros pueden ser tipos de datos estructurados, tal
como los tipos de datos fecha.
Inter-relacionado: la interrelación entre los datos permite que una colección
de datos proporcione información razonable y coherente. La información y los
datos significan dos cosas distintas. Cuando los datos tienen sentido para un
negocio se convierten en información. Datos procesados son información.
Ejemplo:
Ventas ------------------------ Ventas regionales consideradas por trimestre
Un Ambiente de Base de Datos consiste de 4 componentes:
1
2
3
4
Datos
Usuarios
Hardware
Software
1 Datos: En las bases de datos existen 2 cosas que las
diferencian de los sistemas tradicionales de
almacenamiento de datos.
1. Los datos se encuentra integrados: Esto significa que en
lugar de que las aplicaciones tengan su propio sistema
de archivos para almacenar sus datos, ahora las mismas
usan un sistema unificado de archivos. Esto
prácticamente elimina la redundancia de datos.
2. Los datos son compartidos: Esto significa que ahora
diversas aplicaciones pueden compartir datos y
accederlos al mismo tiempo de manera concurrente.
Esto trae como principal ventaja que los sistemas pueden ser
mejor integrados ahora
DEFINICIONES
2 Usuarios: Son otro componente de los ambientes de
bases de datos, pueden ser catalogados en 3 clases:
1. Usuarios Finales: Interactúan con la base de datos
usando para ello los programas de aplicación.
2. Administradores de Base de Datos: DBA por sus siglas
en ingles, son los encargados de coordinar las
actividades de todos los usuarios de la base de datos y
poseen en ultima instancia el control sobre la base de
datos. Su función es muy importante, ya que los mismos
deben tener conocimiento no solo de la base de datos en
si, sino también de los requerimientos de información de
la organización.
3. Desarrolladores de aplicaciones: Desarrollan los
programas para las aplicaciones que procesan los datos
guardados en la base de datos.
DEFINICIONES
3 Hardware: Una base de datos puede ser ejecutadas en
computadores convencionales así como en mainframes,
minis, etc. Aunque generalmente son usados servidores
dedicados para el manejo de la base de datos.
La distribución del hardware puede determinar diversos
tipos de ambientes de bases de datos, varios son posibles
pero los tres ambientes mas comunes de configuración de
una base de datos son:
• Mainframe.
• Cliente / Servidor.
• Computación por Internet.
DEFINICIONES
Mainframe: Es el mas tradicional de los ambientes
para las bases de datos (antiguas),
consiste principalmente de un
poderoso mainframe que puede
manejar múltiples conexiones de
usuario, múltiples terminales se
encuentran unidos mediante la red al
mainframe, permitiendo al usuario
comunicarse con el mismo. Los
terminales no piensan por si mismos,
ellos se basan en el poder
computacional del servidor.
Base de Datos
DEFINICIONES
Cliente / Servidor: Involucra un servidor principal, llamado el
servidor, y una o mas computadores
personales que se encuentran unidos por
la red al servidor. La base de datos reside
en el servidor, cada usuario que requiera
acceso a la Base de Datos en el servidor
debe tener su propio PC. Las
aplicaciones se encuentran en el PC y no
el servidor, la información es trasmitida a
través de la red usando open database
conectivity (ODBC) o cualquier otro
protocolo especifico del vendedor.
Servidor de
Base de Datos
Debido a que los PCs “piensan”, los mismos pueden correr sus propias
aplicaciones y los usuarios pueden ser mas productivos. Por ejemplo, un
usuario puede conectarse a la base de datos en el servidor y mientras tanto de
manera simultanea trabajar en un documento de texto y leer su correo
electrónico.
DEFINICIONES
Computación por Internet: Es muy similar al ambiente cliente /
servidor, se encuentran involucrados en el
mismo: un servidor, la red y uno o mas
PCs. Este ambiente es único debido a que
se basa en Internet, lo cual no restringe los
usuarios a la Intranet Corporativa. Se
diferencia del ambiente cliente / servidor en
que las aplicaciones solo son instaladas y
configuradas en el servidor web.
Navegador Web
PC
Base de Datos
Internet
DEFINICIONES
4 Software: Es el componente final del ambiente de las
bases de datos, el mismo puede ser dividido en 2
categorías:
1. Sistema de Gestión de Bases de Datos SGBD o Data
Base Manager System DBMS: Es el software encargado
de manejar la base de datos.
2. Software de Aplicación: Son programas escritos por los
desarrolladores de aplicaciones para los usuarios finales,
los mismos usan el DBMS para la manipulación de los
datos (recuperación, creación, actualización o borrado)
DEFINICIONES
DBMS
Es un conjunto de programas que ayudan al manejo de una base de datos realizando operaciones de recuperación de datos, agregar, modificar y eliminar información de la base de datos.
DEFINICIONES
•Un DBMS se puede entender como algo que
provee al programador y al usuario las
funcionalidades para crear una base de
datos, agregar elementos a la base de datos,
modificar su contenido, eliminar registros y
ordenar los registros de la manera deseada.
• El DBMS proporciona al usuario comandos
para ayudarlo a realizar estas tareas, no
teniendo que realizar programación de bajo
nivel.
• El DBMS efectivamente actúa como una
capa entre los datos guardados físicamente
sobre los dispositivos de almacenamiento y
los usuarios finales de los programas.
• Todos los accesos a los datos son
realizados a través de este software
Usuarios
Finales
DBMS o SGBD
Capa Física
Un objetivo importante de un sistema de Base de Datos es proporcionar a los usuarios una visión abstracta de los datos y facilitar el manejo de los mismos en forma eficiente. Es decir; que el sistema esconde ciertos detalles de cómo se almacenan y mantienen los datos mediante estructuras complejas. Esta complejidad se esconde mediante diferentes niveles de abstracción.
Nivel Conceptual
Vista 2 Vista 1 Vista 3
Nivel Físico
Un modelo de datos es la estructura subyacente de una base de datos.
Es una colección de herramientas conceptuales para describir los datos, sus relaciones, asociaciones, reglas y restricciones.
Los diferentes modelos de datos existentes se dividen en tres grupos:
Modelos lógicos basados en objetos.
Modelos lógicos basados en registros.
Modelo físico de datos.
Los modelos lógicos basados en objetos se usan para describir datos en los niveles conceptual y de visión. Se caracterizan por el hecho de proporcionar organización y estructuras flexibles y permitir especificar restricciones de datos explícitamente. Los mas conocidos son:
Modelo Entidad – Relación y el
Modelo Orientado a Objeto
Modelos de Datos
Los modelos lógicos basados en registros se utiliza para describir datos en los niveles conceptual y físico. Se usa para especificar la estructura lógica global de la base de datos y para proporcionar una descripción a nivel mas alto de la implementación.
Son llamados así porque la BD es estructurada en torno a registros de formato fijo, con varios campos o atributos, Los campos o atributos pueden ser de diferentes tipos de datos y cada campo es usualmente de una longitud fija
Los tres modelos mas ampliamente aceptados son:
Modelos relacionales,
De red
Jerárquicos.
Los modelos físicos de datos se usan para describir datos en el nivel mas bajo.