caso práctico etl pentaho my sql

9
CASO PRÁCTICO Para nuestro caso práctico en este trabajo de investigación, utilizaremos Pentaho Data Integrator para realizar el proceso ETL como fuente un archivo plano y como destino una base de datos (que simule un Data Warehouse) en MySQL. Como vemos nuestra base de datos esta vacia (No contiene Tablas) Para iniciar necesitamos crear una base de datos ya sea en SQL SERVER y MySQL u otro. A. EXTRACION 1. Iniciamos P D I (Pentaho Data Integrator) y creamos una nueva transformación (Tranformacion1)

Upload: my-home

Post on 23-Jan-2018

211 views

Category:

Education


2 download

TRANSCRIPT

Page 1: Caso práctico etl pentaho my sql

CASO PRÁCTICO

Para nuestro caso práctico en este trabajo de investigación, utilizaremos Pentaho Data

Integrator para realizar el proceso ETL como fuente un archivo plano y como destino una base

de datos (que simule un Data Warehouse) en MySQL.

Como vemos nuestra base de datos esta vacia (No contiene Tablas)

Para iniciar necesitamos crear una base de datos ya sea en SQL SERVER y MySQL u otro.

A. EXTRACION

1. Iniciamos P D I (Pentaho Data Integrator) y creamos una nueva transformación

(Tranformacion1)

Page 2: Caso práctico etl pentaho my sql

2. Creamos una nueva conexión en Conexiones a Base de Datos

Ingresamos los datos de nuestro servidor de MySQL (nombre de la maquina, usurio y

contraseña, base de datos a la cual conectarse y probamos la conexión.

En caso de no conectar por algún error probar los conectores de DBMs.

3. En la pestaña de DISEÑO vamos a escribir Excel (Para seleccionar archivo fuente Excel

Y procedemos a editar para seleccionas qué libros (tablas) vamos a transformar y

cargar.

Page 3: Caso práctico etl pentaho my sql

4. Para nuestro caso escogeremos un arcivo Excel (Sucursales.xlsx) y procedemos a

añadir (en a pestaña de Ficheros)

En la pestaña de Hojas seleccionas las hojas que será nuestras tablas en este caso (TSUCURSAL)

Page 4: Caso práctico etl pentaho my sql

En la pestaña de Contenido debe estar los check box de la siguiente manera

Y en la pestaña Campos seleccionamos en obtener campos y tendremos:

Pre visualizamos el archivo (las primeras 1000) filas

Page 5: Caso práctico etl pentaho my sql

Y sabremos que si funciona el cargado.

B. TRANSFORMACION

5. Para la transformación usamos un componente que se llama Seleccionar valor que

permite configurar los tipos de valores de los campos así como los nombres de los

mismos campos, con la opción de omitir campos que no se necesitaran.

Y configuramos ende a al que necesitamos para cumplir los requerimientos establecidos.

Renombraos los campos

Eliminamos campos que no deseamos (esto funcionaria para eliminar campos que no infieren

en nada de nuestra solución BI)

Page 6: Caso práctico etl pentaho my sql

Configuramos el cambio que haremos en la estructura de los datos de nuestro origen:

Nota: en estas opciones debemos cargar los campos que deseamos y eliminamos con

(DEL/SUP) los que no interesan.

Page 7: Caso práctico etl pentaho my sql

C. CARGA o LOAD

6. Para la carga seleccionamos el objeto de Salida Tabla

Procedemos a editar esta sección creando la tabla T_SUCURSAL y con la conexión que

realizamos al inicio.

Obtendremos los nombres de los campos ya cambiados en el proceso de

Transformación

Page 8: Caso práctico etl pentaho my sql

Escogemos SQL para ver si se realiza la creación de la tabla.

Y ejecutamos

Notamos que solo hay 9 campos de los 10 pues como el primer campo es secuencial no se

cambiara de tipo de dato.

7. Ahora su ejecutamos nuestro proceso ETL

Page 9: Caso práctico etl pentaho my sql

8. Verificamos que todo ejecute correctamente y los resultados los veremos en MySQL