Download - Historia basesdatos
HISTORIA
DE LAS
BASES DE DATOS
Complementos de Formación Disciplinar en Informática
Autor: Manuel Fernández Bedmar
Historia de las Bases de Datos
Introducción
Orígenes
Década 1950
Década de 1960
Década de 1970
Década de 1980
Década 1990
SIGLO XXI
Introducción
Primera aproximación de conceptos:
BASES DE DATOSConjunto de información relacionada que seencuentra agrupada o estructurada.
PILAR BASICO
INFORMATICADisciplina que estudia el tratamiento
automático de la información utilizandodispositivos electrónicos y sistemascomputacionales.
SISTEMAS DE GESTION DE BASES DE DATOS
Software especifico dedicado a servir de interfaz entre la
base de datos, el usuario y las aplicaciones.
Una agrupación de programas que sirven para
definir, construir y manipular una base de datos.
Permitien almacenar y acceder a los datos de forma rápida y
estructurada.
Conceptos:
BASES DE DATOS Conjunto de datos almacenados en
memoria externa o discos. Permiten el acceso directo a datos. Un conjunto de programas que manipulen
ese conjunto de datos.
Simposio California 1963
Se escuchó por primera vez el término base de datos.
ORÍGENES
Antigüedad donde ya existían bibliotecas y toda clase de registros.
Utilizaban para recoger información sobre las cosechas y censos.
Búsqueda lenta y poco eficaz.
Trabajo manual, sin ayuda de máquinas.
En 1884 Herman Hollerith creó la máquina automática de
tarjetas perforadas.
Primer ingeniero estadístico de la historia.
Cencsos manuales.
Diseña una maquina tabuladora o censadora, basada en
tarjetas perforadas.
Este invento disparo el desarrollo de la tecnología, la industria de los computadores.
Se abren nuevas perspectivas y posibilidades hacia el futuro.
Uso de las bases de datos se desarrollaría a partir de las necesidades de almacenar grandes
cantidades de información o datos.
Herman Hollerit en 1884 creó la máquina perforadora.
Antes censo de Estados Unidos tardaba 7 años
Después se dieron resultados en 2 años y medio.
Obtener datos importantes como número de nacimientos,
población infantil y número de familias.
Usa sistemas mecánicos para procesar la información de
las tarjetas y para tabular los resultados.
A diferencia con la máquina de Babbage, que
utilizaba unas tarjetas similares, estas se centraban en
dar instrucciones a la máquina.
DECADA DE 1950
Nacen las cintas magnéticas, para automatizar la información y
hacer respaldos.
La cinta magnética fue el medio usado para la primera grabación
de un ordenador en 1951 en el Eckert-Mauchly UNIVAC I (el
primer ordenador personal).
Esto sirvió para suplir las necesidades de información de las
nuevas industrias.
Ejemplos: automatizar la información de las nóminas, el
aumento de salario.
Simulando un sistema de Backup, que consiste en hacer una
copia de seguridad o copia de respaldo, para guardar en un
medio extraíble la información importante. La nueva cinta a la
que se transfiere la información pasa a ser una cinta maestra.
Mecanismo que empezó a automatizar la información .
Desventaja de que estas cintas solo se podían leer secuencial y
ordenadamente.
Un sistema de ficheros está formado por un conjunto de ficheros de datos y los
programas de aplicación que permiten a los usuarios finales trabajar sobre los
mismos.
Un sistema de ficheros sigue un modelo descentralizado.
Estructura física de los ficheros de datos como la de sus registros, están definidas
dentro de los programas de aplicación.
Cuando en una empresa se trabaja con un sistema de ficheros, los departamentos no
comparten información ni aplicaciones, por lo que los datos comunes deben estar
duplicados en cada uno de ellos. Esto puede originar inconsistencias en los datos.
Datos se separan en distintos ficheros, es más complicado acceder a ellos, ya que el
programador de aplicaciones debe sincronizar el procesamiento de los distintos
ficheros implicados para garantizar que se extraen los datos correctos.
Estructura física de los datos se encuentra especificada en los programas de
aplicación, cualquier cambio en dicha estructura es difícil de realizar. Falta de
independencia de datos lógica-física.
Sistemas de ficheros PREDECESORES Bases de datos
DECADA DE 1960
DISCOS, adelanto muy efectivo: Consultar la información directamente, ahorrar tiempo(en milisegundos
era recuperable la información) y sin saber la ubicación exacta de
los datos.
A diferencia de las cintas magnéticas, ya no era necesaria la
secuencialidad, y este tipo de soporte empieza a ser ambiguo.
Las computadoras bajan los precios para su adquisición por
compañías privadas.
• Sistemas de bases de datos tienen sus raíces en el proyecto estadounidense de mandar al hombre a la luna en los años sesenta, el proyecto Apolo.• No había ningún sistema que permitiera gestionar la inmensa cantidad de información •Empresa encargada del proyecto, NAA (North American Aviation), desarrolló una aplicación denominada GUAM (General Update Access Method) basada en el concepto de que varias piezas pequeñas se unen para formar una pieza más grande, y así sucesivamente hasta que el producto final está ensamblado. •Esta estructura, que tiene la forma de un árbol, es lo que se denomina una estructura jerárquica.
A mediados de los sesenta, IBM se unió a NAA
para desarrollar GUAM en lo que después fue IMS
(Information Management System).
Alianza de IBM y American Airlines para
desarrollar SABRE, un sistema operativo que
manejaba las reservas de vuelos e informaciones
sobre los pasajeros.
General Electric desarrolló IDS (Integrated Data
Store). Este trabajo fue dirigido por uno de los pioneros en los sistemas de bases de datos, Charles Bachmann.
IDS era un nuevo tipo de sistema de bases de datos conocido como sistema de red.
El sistema de red se desarrolló para satisfacer la necesidad de representar relaciones más complejas entre datos que las que se podían modelar con los sistemas jerárquicos y, en parte, para imponer un estándar de bases de datos.
Grupo CODASYL (Conference on Data Systems Languages) era un
consorcio formado por representantes del gobierno de EEUU y
representantes del mundo de la industria informática empresarial, fundaron
un grupo denominado DBTG (Data Base Task Group).
Meta: promover un análisis, diseño e implementación de sistemas de
datos más efectivos y el manejo de los datos .
Mediante la regularización de un lenguaje de programación estándar
como COBOL que pudiera ser utilizado en multitud de ordenadores.
PRINCIPAL CARACTERISTICA: es que trabajan con los modelos de datos de bajo
nivel, o modelos físicos, que describen cómo se almacenan los datos en el ordenador: el
formato de los registros, la estructura de los ficheros
(desordenados, ordenados, agrupados) y los métodos de acceso utilizados (índices, tablas
de dispersión). En definitiva el esquema de la base de datos.
DESVENTAJAS: Es necesario escribir complejos programas de aplicación para
responder a cualquier tipo de consulta de datos, por simple que ésta sea.
La independencia de datos es mínima. No tienen un fundamento teórico.
.
PRIMERA GENERACION
Sistemas de Gestion de Bases de datos de Red y Jerárquicas.
DECADA DE 1970
Edgar Frank Codd, científico informático ingles conocido por sus
aportaciones a la teoría de bases de datos relacionales, basadas en el álgebra y el cálculo relacional.
Publicó una serie de reglas para definir el MODELO RELACIONAL
para grandes bancos de datos compartidos.
Presentó inconvenientes de sistemas previos: jerárquico y red.
System R, de IBM, desarrolló un primer SGBD relacional, con
una implementación de sus estructuras de datos y operaciones.
Y Lawrence J. Ellison, desarrolló el Relational Software System, o lo
que es lo mismo, lo que actualmente se conoce como Oracle
Corporation, con el mismo nombre que dicha compañía.
El desarrollo de un lenguaje de consultas estructurado denominado
SQL, que se ha convertido en el lenguaje estándar de los sistemas
relacionales.
Debilidades: limitada capacidad al modelar los datos.
En 1976, Peter Chen presentó el modelo entidad-relación, que es
la técnica más utilizada en el diseño de bases de datos.
En 1979, Codd intentó subsanar algunas de las deficiencias de su
modelo relacional con una versión extendida denominada RM/T.
Cierto nivel de abstracción de datos, al ocultar las características sobre el almacenamiento físico
que la mayoría de usuarios no necesita conocer. Los modelos de datos de alto nivel, o modelos
conceptuales, disponen de conceptos muy cercanos a como los usuarios perciben los datos.
Un conjunto de tablas con referencias lógicas entre ellas, mientras que en los jerárquicos y de
red, los datos se describen como conjuntos de registros con referencias físicas entre ellos
(punteros).
Datos estructurados a nivel lógico como tablas formadas por filas y columnas, aunque a nivel
físico pueden tener una estructura completamente distinta.
Sencillez de su estructura lógica. Pero hay un fundamento teórico.
Utilizan conceptos como entidades, atributos y relaciones.
Minimizar las redundancias de datos, dividiéndolos en distintos grupos no duplicados.
Incrementar la consistencia de datos, si se cambia el nombre de un cliente cambiará en todos
los reportes.
SEGUNDA GENERACION
Sistemas de Gestion de Bases de datos RELACIONALES.
DECADA DE 1980
Auge de la comercialización de los sistemas relacionales.
SQL comenzó a ser el estándar de la industria.
Competir con las bases jerárquicas y de red.
Nivel de programación era sencillo .
SGBD relacional implementa el lenguaje
SQL, todas las acciones con tres grupos de
sentencias sencillas:
• Sentencias de definición de datos: crear tablas,
alterar su definición y eliminarlas.
• Sentencias de manejo de datos: insertar datos en
las tablas, consultarlos, modificarlos y borrarlos.
• Sentencias de control: administradores de la base
de datos crear usuarios y privilegios.
ORACLE se consolidó como uno de los
sistemas de bases de datos más
completos que existían en el mundo, y su
dominio era casi total en el mercado de
servidores empresariales.
COMPETENCIA
Aparecen a finales de esta década una oferta de otros sistemas
administradores de bases de Datos Relacionales con licencia libre que
tratan de hacer la competencia a los dos grandes colosos del mercado:
PostgreSQL
MySQL
Firebird
Importantes desarrollos de sistemas de gestión de base de datos
durante esta década como:
DB2 (Data Base Software) y SLQ/DS de IBM.
QBE (Query-By-Example) de IBM Research
Ingres, SGBD basado en cálculo relacional. Utilizaba el lenguaje
Quel que era el favorito de las universidades.
Los lenguajes de manejo de datos no procedurales son fáciles de aprender y de usar y se extendieron durante toda la esta década.
DECADA DE 1990
Modelo concepturalModelo lógico
BD relacional, red y jerárquica BD Orientada a Objetos
Orientados a registros Orientada a Objetos
TERCERA GENERACION
Sistemas de Gestion de Bases de datos Orientadas a Objetos.
Desarrollo de modelos similiar al de progrmamas con lenguajes
orientados a objetos.
Una implementación interna de un objeto y una especificación
externa separada. Nivel de abstracción superior.
Soporta el modelado y creación de datos como objetos definidos
por el usuario.
Dar soporte a herencia de propiedades y métodos para las
subclases.
Encapsulamiento, que agrupa en una única entidad los atributos y los
métodos de un objeto, ocultando los detalles de su implementación.
Buscando establecer un STANDAR
Modificación de la primera publicación hecha por ANSI del lenguaje SQL y se empezó a agregar nuevas expresiones regulares, consultas recursivas, triggers y algunas características orientadas a objetos. Reinterpreta el modelo relacional bajo una visión orientada a objetos.
Buscando estándar para SGBDOO. Se presentan varios manifiestos y en el tercer manifiesto (Darwen y Date).Propone un lenguaje D con algunas ventajas de la OO como son los tipos de datos definidos por el usuario y la herencia, y mantener fundamento teórico del modelo relacional. BD OBJETO-RELACIONAL.
“Base de Datos Relacional”
de un gato
“Base de Datos Orientada a
Objetos” de un gato
Se desarrollaron herramientas como Excel y Access del
paquete de Microsoft Office que marcan el inicio de las bases de
datos orientadas a objetos.
Las cuales han tenido bastante éxito a la hora de gestionar
datos complejos en los campos donde las bases de datos
relacionales no han podido desarrollarse de forma eficiente.
El boom del nacimiento del World Wide Webfacilitará la consulta a bases de datos.
Las bases de datos distribuidas posibilitan el
procesamiento de datos pertenecientes a distintas bases de
datos conectadas entre sí.
El emplazamiento lógico de cada una de las bases de
datos se denomina nodo, conteniendo cada uno su sistema
de gestión de bases de datos, junto con las utilidades y
facilidades propias del soporte distribuido.
Los nodos, por lo general, están ubicados en
emplazamientos físicos distantes geográficamente.
Se encuentran conectados por una red de comunicación
de datos.
SIGLO XXI
La Web una nueva interfaz de acceso a Bases de datos.
SGBD proporcionan almacenamiento y acceso a datos a través
de XML.
La Web puede también ser considerada como una inmensa
base de datos.
XML (eXtensible Markup Language) es un lenguaje orientado a
identificar estructuras de datos en un documento.
Sistema para definir, validar y compartir formatos de
documentos en la web.
XML permite definir estructuras de datos susceptibles de ser
procesadas por una gran variedad de aplicaciones y realizar
intercambio electrónico de datos de modo eficiente.
Permitir a las aplicaciones integrar el uso de XQuery (lenguaje
de consulta XML) para acceso concurrente a datos ordinarios
SQL y documentos XML.
Tres grandes compañías dominan el mercado de las bases de
datos son IBM, Microsoft y Oracle.
Google, en el campo de internet, es la compañía que genera
inmensa cantidad de información.
.NET es la plataforma de Microsoft orientada a la creación de
software para Internet. Posibilita el desarrollo y ejecución de
software en la forma de servicios que puedan ser tanto publicados
como accedidos a través de Internet.
El objetivo de este proyecto es permitir que todo el código
hecho en Visual Studio sean también orientado a objetos para
facilitar y estandarizar el acceso a dichos objetos
Visual Studio es un entorno de desarrollo integrado para
sistemas operativos Windows.Soporta lenguajes de programación
como Visual C++, Visual#, Visual J#, ASP.NET y Visual Basic.NET.
Objetivo es permitir crear aplicaciones, sitios y aplicaciones
web, así como servicios web a cualquier entorno que soporte la
plataforma .Net. Para intercomunicarse entre estaciones de
trabajo, páginas web y dispositivos móviles.
Db4objects: versión comercial de db4o.Objectivity/DB: Maneja BDs localizadas, centralizadas o distribuidas.ObjectStore: SGBDOO “Puro” con solidez y alta performance paraaplicaciones de empresa. Versant Object Database: SGBDOO “Puro” que maneja objetos complejosmodelados en java y C.ObjectDB: Es una Base de Datos java pura.GemStone: Es un SGBDOO “Puro. Los objetos no son aplanados o serializados, sino que se almacenan como un todo.
Matisse 8: Una base de datos .NET. Es una BD Post-Relational que ofrece “lo mejor de dos mundos”. Tiene la capacidad de mapear objetos desde .NET directamente a la base de datos, soporta lenguaje query estandar (SQL-99) y la escalabilidad de los productos relacionales. …Airbus usa Matisse en el diseño de componentes de aviación.
Otros productos y prototipos son: ORION, OpenOODB , IRIS, ONTOS de Ontologic, O2 ,etc.
Respecto a las relacionales: Oracle, IBM DB2, Informix, PostgreSQL, etc.)Todas están cubriendo, en mayor o menor grado, aspectos de SGBD OR.
MULTIPLES PRODUCTOS COMERCIALES EN SGBD
MULTIPLES TIPOS DE BASES DE DATOS
SGBD Activas para aplicaciones que
requieren una respuesta puntual ante situaciones
críticas. En control del tráfico aéreo o control de
plantas industriales.
SGBD Seguras plantean problemas
vinculados a la seguridad como la compartición y
acceso a los datos, protección contra
fallos, protección contra accesos no
permitidos, etc. El SGBD cuenta con
mecanismos para prevenir, detectar y corregir
fallos. Integridad, confidencialidad, privacidad…
SGBD Múltiples permiten realizar
operaciones que implican a varios sistemas de
bases de datos, cada uno de los cuales puede
ser centralizado o distriuido.
SGBD Temporales intentan, en primer
lugar, definir un modelo de datos que capture la
semántica del tiempo en el mundo real, y, en
segundo lugar, realizar una implementación
eficiente de tal modelo.
SGBD Multimedia. Los recientes avances en el almacenamiento de
distintos tipos de información, televisión interactiva, sistemas de información
geográficos, enciclopedias electrónicas, aplicaciones musicales, etc.
FUNCIONALIDAD/INTELIGENCIA
BD Activas
BD Temporales
BD Deductivas
BD Seguras
BD OO
BD OR
…
RENDIMIENTO
BD
BD DistribuidasBD Multibases
BD FederadasBD Web
BD Móviles
…
BD Paralelas
BD en Memoria Principal
BD Grid
BD en Tiempo Real
… DISTRIBUCIÓN/
INTEGRACIÓN
Evolución de la tecnología de BD: Dimensiones