carlos lobo valerio alexander jiménez palacios sql server 2008 integration services

Click here to load reader

Upload: candelaria-somera

Post on 22-Jan-2016

217 views

Category:

Documents


2 download

TRANSCRIPT

SQL Server 2008 Integration Services

Carlos Lobo ValerioAlexander Jimnez PalaciosSQL Server 2008 Integration Services1Qu es?Es una plataforma para la creacin de soluciones empresariales de transformaciones de datos e integracin de datos.Sirve para resolver complejos problemas empresariales mediante la copia o descarga de archivos, la actualizacin de almacenamientos de datos, la limpieza y minera de datos.2Caractersticas Permite crear soluciones de integracin de datos de alto rendimiento, incluidas la extraccin, la transformacin y la carga (ETL) de datos para almacenes de datos.Integration Services reemplaza a Data Transformation Services (DTS).Se pueden usar para crear soluciones sin escribir una sola lnea de cdigo.

3Diagrama

4PaquetesUn paquete es el objeto que implementa la funcionalidad de Integration Services para extraer, transformar y cargar datosUn paquete se crea utilizando el Diseador SSIS en BI Development StudioUn paquete bsico incluye los elementos: flujo de control y flujo de datos51. Elementos de flujo de controlProporcionan estructura y controlan el orden en el que se ejecutan los elementosLos principales elementos de flujo de control son las tareas, los contenedores y restricciones de precedencia

6a) ContenedoresProporcionan estructura en paquetes y servicios a las tareas en el flujo de controlPermiten repetir flujos de control en paquetes y agrupan tareas y contenedores en unidades de trabajo significativasLos contenedores pueden incluir otros contenedores, adems de tareas7a) Contenedores (fines)Repetir tareas para cada elemento de una coleccin, como archivos de una carpetaRepetir las tareas hasta que una expresin especificada se evale como falseAgrupar tareas y contenedores que deben completarse correctamente o no completarse como una unidad (todas o ninguna)8a) Contenedores (tipos)

9b) TareasLas tareas son elementos de flujo de control que definen las unidades de trabajo que se realizan en un flujo de control de paquetes.Un paquete consta de una o ms tareasTambin se puede escribir tareas personalizadas mediante un lenguaje de programacin .NET, como C#.10Tarea Flujo de datosLa tarea Flujo de datos encapsula el motor de flujo de datos que mueve datos entre orgenes y destinos, y permite al usuario transformar, limpiar y modificar datos a medida que se mueven

11Tarea Sistema de archivosLa tarea Sistema de archivos realiza operaciones en archivos y directorios del sistema de archivos. Por ejemplo, un paquete puede utilizar la tarea Sistema de archivos para crear, mover o eliminar directorios y archivos12Tarea Servicio webLa tarea Servicio web ejecuta un mtodo de servicio webEscribir en una variable los valores devueltos por un mtodo de servicio webEscribir en un archivo los valores devueltos por un mtodo de servicio web13Tarea XMLLa tarea XML se usa para trabajar con datos XML.Un paquete puede recuperar documentos XML, aplicar operaciones a los documentos mediante las hojas de estilos (XSLT) y expresiones XPath, mezclar varios documentos, o bien validar, comparar y guardar los documentos actualizados en archivos y variables.14Tarea Ejecutar paquetePermite que los paquetes ejecuten otros paquetes como parte de un flujo de trabajoDescomponer un flujo de trabajo de paquetes complejoReutilizar partes de paquetesAgrupar unidades de trabajoControlar la seguridad de los paquetes15Tarea Enviar correoLa tarea Enviar correo enva un mensaje de correo electrnico. Un paquete puede utilizar la tarea Enviar correo para enviar mensajes si las tareas del paquete de flujo de trabajo finalizan correctamente o si se producen errores16Tareas de SQL ServerTarea Insercin masiva: proporciona una forma muy eficaz de copiar grandes cantidades de datos a una tabla o vista de SQL Server.Tarea Ejecutar SQL: ejecuta instrucciones SQL o procedimientos almacenados de un paqueteTarea Transferir bases de datos: transfiere una base de datos de SQL Server entre dos instancias de SQL Server.17Tarea Ejecutar DDL de Analysis ServicesEjecuta instrucciones del lenguaje de definicin de datos (DDL) que pueden crear, quitar o modificar modelos de minera y objetos multidimensionales, como cubos y dimensiones18Tarea Procesamiento de Analysis ServicesProcesa objetos de Analysis Services como cubos, dimensiones y modelos de minera de datosSlo se puede procesar objetos de anlisis creados mediante las herramientas de SQL Server19Tarea Consulta de minera de datosEjecuta consultas de prediccin basadas en modelos de minera de datos integrados en Analysis Services.La consulta de prediccin crea una prediccin para datos nuevos a partir de modelos de minera de datos.20Tareas de mantenimientoTarea Copia de seguridad de la base de datosTarea Ejecutar instruccin T-SQLTarea Reducir base de datos21c) Restricciones de precedenciaLas restricciones de precedencia vinculan ejecutables, contenedores y tareas de paquetes en un flujo de control, y especifican condiciones que determinan si se ejecutan los ejecutables.Un ejecutable puede ser un contenedor de bucles For, de bucles Foreach o de secuencia, o bien una tarea o un controlador de eventos22c) Restricciones de precedencia

232. Elementos de flujo de datosProporcionan el origen, transformaciones y destinos de los datos.

24a) OrgenesSon los componentes de flujo de datos que hacen que datos de distintos tipos de orgenes de datos estn disponibles para un flujo de datos.Origen de ADO .NETOrigen de ExcelOrigen de archivo planoOrigen de OLE DBOrigen XML25b) TransformacionesSon los componentes en el flujo de datos de un paquete que agregan, mezclan, distribuyen y modifican datosLas transformaciones tambin pueden realizar operaciones de bsqueda y generar conjuntos de datos de ejemplo26Transformaciones de inteligencia empresarialBsqueda aproximada: realiza tareas de limpieza de datos como normalizar datos, corregir datos y proporcionar valores que faltan.Consulta de minera de datos: realiza consultas de prediccin en modelos de minera de datos27Transformaciones de filaCopiar columna: crea columnas nuevas copiando columnas de entrada y agregando las columnas nuevas a la salida de la transformacin.Conversin de datos: convierte los datos de una columna de entrada a otro tipo de datos diferente y despus los copia a una nueva columna de salida.28Transformaciones de conjunto de filasAgregado: realiza agregaciones como average, sum y countOrdenar: ordena los datosMuestreo de porcentaje: crea una muestra aleatoria a partir de un porcentajeMuestreo de fila: crea una muestra aleatoria a partir de una cantidad29Transformaciones de divisin y combinacinDivisin condicional: puede dirigir filas de datos a salidas diferentes en funcin del contenido de los datos (CASE)Unin de todo: combina varias entradas en una salida.Mezclar: combina dos conjuntos de datos ordenados en un solo conjunto de datosBsqueda: realiza bsquedas mediante la combinacin de datos de columnas de entrada con columnas de un conjunto de datos de referencia30c) DestinosLos destinos son los componentes de flujo de datos que cargan los datos en un flujo de datos en diferentes tipos de orgenes de datos o crean un conjunto de datos almacenados en memoria. Los destinos tienen una entrada y una salida de error.Los destinos deben tener una entrada.31c) DestinosADO NET: carga datos en una serie de bases de datos compatibles con ADO.NET que usan una tabla o vista de base de datosEntrenamiento del modelo de minera de datos: entrena los modelos de minera de datos pasando los datos que recibe el destino por los algoritmos de modelos de minera de datosDataReader: expone los datos en un flujo de datos mediante la interfaz ADO.NET DataReader32c) DestinosExcel: carga datos en hojas de clculo o intervalos en libros de Microsoft ExcelArchivo plano escribe datos en un archivo de textoOLE DB: carga datos en una serie de bases de datos compatibles con OLE DBSQL Server: se conecta a una base de datos local de SQL Server y realiza una carga masiva de datos en tablas y vistas de SQL Server33Usos tpicosMezclar datos de almacenes de datos heterogneosInformacin almacenada en sistemas de almacenamiento de datos antiguos.Datos almacenados en archivos planos, hojas de Excel, documentos XML.Diferentes bases de datos relacionales: SQL Server, Oracle, MySQL, DB2,etc. 34Usos tpicosLlenar almacenamientos de datos y puestos de datos.Suelen actualizarse frecuentemente y normalmente las cargas de datos son muy grandes.Carga masiva de datos directamente desde un archivo plano a tablas y vistas de SQL Server35Usos tpicosLimpiar y normalizar datosLos datos proceden de varias sucursales de una organizacin y en cada una de las sucursales se usan convenciones y estndares distintos.Los datos pueden ser alquilados o comprados.Los datos son especficos de la configuracin regional.Remplazo de los valores de las columnas por valores de una tabla de referencia mediante una bsqueda exacta o aproximada36Usos tpicosGenerar inteligencia de negocioResumir, convertir y distribuir los datos en funcin de valores de datos.Rechazar datos en funcin de una evaluacin de valores de columna.Combinar datos de varios orgenes de datos.Evaluar datos y aplicar conversiones de datos.Dividir un conjunto de datos en mltiples conjuntos de datos en funcin de valores de datos.37Usos tpicosAutomatizar funciones administrativas y la carga de datosAutomatizar las funciones administrativas como la copia de seguridad y la restauracin de bases de datos.Copia de objetos de SQL Server y la carga de datos.38Arquitectura

39