manuela xxxx

42
Factorit y Compañía Limitada Servicios Integrales de Informática IBM WebSphere DataStage

Upload: 00110101001

Post on 20-Dec-2015

60 views

Category:

Documents


6 download

DESCRIPTION

askjdnkasjdn kasjdn kasjdn kasjdn

TRANSCRIPT

Page 1: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

IBM WebSphere DataStage

Page 2: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Introducción 

En el siguiente documento se procederá a mostrar la funcionalidad de los Stages de una manera que sea fácil de entender y su rápida aplicación, A continuación se dará una breve explicación de lo que es Data Stages a grandes rasgos

Datastage es una herramienta que permite crear rápidamente procesos ETL. Se basa básicamente en una arquitectura Cliente-Servidor (en sus versiones más nuevas puede ser hasta una arquitectura de 4 capaz). Puede acceder a distintos orígenes de datos y lo hace ideal para realizar las tareas de carga de datos a un Data Warehouse o Data Mart, aunque también se puede utilizar en cualquier proyecto que requiera mover datos desde un origen a un destino. Las tareas (o Jobs) son compilados y se crean ejecutables que luego pueden ser ejecutados mediante la misma herramienta o por línea de comandos.

En la actualidad existen varias versiones de la herramienta pero la más popular es la Enterprise Edition que posee los dos motores de tareas que posee la herramienta (server engine y parallel engine)

2

Page 3: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Ejercicio DataStage

Extracción

Paso 1: Lo primero que tenemos que hacer es dirigirnos a la paleta de herramientas (“Palette”), vamos a la opción “File” y de ese repositorio sacamos un (”Sequential File”) y lo arrastramos al diseñador esto servirá para obtener los datos de origen.

Paso 2: Lo segundo que debemos hacer es dirigirnos nuevamente a la paleta de herramientas (“Palette”), vamos a la opción “Processing” y luego de esa opción extraemos un tranformer y lo arrastramos al diseñador. La característica de un Transformer puede tener una sola entrada y cualquier número de salidas. También puede tener un enlace que lleva rechazar cualquier fila que no han sido escritos en cualquiera de las salidas de enlaces por razón de un error de escritura o expresión fracaso evaluación (“tener en cuenta que hay que unir los procesos”)

Paso 3: Lo tercero que tenemos que hacer es dirigirnos nuevamente a la paleta de herramientas (“Palette”), vamos a la opción ”File” y de ese repositorio sacamos un “Data Set” y lo arrastramos al diseñador, La función del Data Set es básicamente de recibir los datos ya filtrados del tranformer especificado la ruta donde se quiera guardar.

A continuación se mostrara en la siguiente ilustración como estaría todo el esquema unido en el DataStage.

Tener en cuenta que hay que cambiar los nombres de los link y de los procesos dependiendo a que proceso corresponda.

3

Page 4: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Configuración de los procesos (“Extracción”)

a) Sequential File: Una vez ya realizado todo el esquema de unión nos dirigimos a las propiedades del Sequential File, donde tenemos que ingresar en el (“textbox File”) la ruta de los datos de origen como se especifica en la siguiente ilustración.

4

Page 5: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

b) Format: A continuación nos dirigimos a la opción Format donde tendremos que ir a la carpeta “Field Defaults” vamos a la opción Delimiter donde tenemos que especificar qué tipo de delimitador tiene nuestros datos en este caso tiene un “|” que se está usado para separar los datos, luego de eso vamos a la opción Quote donde tendremos que seleccionar si nuestros datos son (“Doublé, single o none”) en este este caso se está utilizando none.

5

Page 6: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

c) Columns: Una vez realizado las configuraciones en Format vamos a la opción Columns donde tendremos que ingresar las columnas de las base datos o archivo plano con sus respectivos valores (“tipo de dato, largo y si null”). una vez ingresado todos los datos correctamente presionan OK.

6

Page 7: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Configuración de los procesos (“Tranformer”)

a) Tranformer: A continuación ingresamos a las propiedades del tranformer donde tendremos las tablas de origen del Sequential file donde tendremos que hacer las siguiente configuración como lo muestra las siente ilustración (“b”).

7

Page 8: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

b) Tranformer traspaso de datos: Como vimos en lo anterior ahora tenemos que traspasar los datos de origen de la tabla izquierda a la tercera tabla del lado derecho. De esta maneara habremos dado pase al siguiente proceso.

8

Page 9: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Configuración de los procesos (“Data Set y creación de parámetros”)

a) Data Set: A continuación Tendremos que dirigirnos a la barra de menú donde tendremos que dirigirnos a Job parameter e ingresaremos los parámetros que vamos a utilizar.

Una vez presionado en la opción se desplegara la siguiente interfaz donde tendremos que dirigirnos a la pestaña parameter como se muestra en siguiente ilustración, en esta opción tendremos que agregar los parámetros de la siguiente manera pero no obstante ustedes tendrán que agregar el nombre dependiendo como corresponda.

9

Page 10: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Una vez realizado los parametros nos dirigimos a las propiedades del data set donde indicaremos la ruta pero con el parametro que ingresamos nos vamos al text box file y la última parte del nombre especificamos el parametro correspondiente como se muestra en el siguiente ilustración, al ingresar el parametro tienes que ingresarlo anteponiendo los siguientes signos al principio y final “# #”.

10

Page 11: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Ejercicio DataStage

Transformación

Paso 1: Lo primero que tenemos que hacer es extraer el proceso final de la extracción “Data Set” copiamos y luego nos dirigimos a la carpeta transformación donde pegamos el proceso.

Paso 2: Lo segundo que debemos hacer es dirigirnos a la paleta de herramientas (“Palette”), y extraemos el proceso Join hay cuatro tipos de combinaciones que se le puede dar al proceso Join como por ejemplo

Left Outer Join Right Outer Join Inner Join Full Outer Join

Paso 3: Lo tercero que tenemos que hacer es dirigirnos a la paleta de herramientas (“Palette”), y extraemos el proceso Remove Duplicates y lo arrastramos al diseñador

Paso 4: Lo cuarto que debemos es dirigirnos nuevamente a la paleta de herramientas (“Palette”), vamos a la opción “Processing” y luego de esa opción extraemos un tranformer y lo arrastramos al diseñador

Paso 5: Lo quinto que tenemos que hacer es dirigirnos nuevamente a la paleta de herramientas (“Palette”), vamos a la opción “File” y de ese repositorio sacamos un “Data Set” y lo arrastramos al diseñador

Paso 6: Lo sexto que tenemos que hacer es dirigirnos al nuevamente a la paleta de herramientas (“Palette”), vamos a la opción “File” y de ese repositorio sacamos un “(”Sequential File”) y lo arrastramos al diseñador”

11

Page 12: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Configuración (“Transformación”)

Sequential File (Transformación): Una vez realizado el esquema nos dirigimos al Sequential que pegamos e ingresamos a las propiedades y veremos como se muestra en la siguiente ilustración donde tendremos que poner la ruta del Sequential de la extracción como mostraremos en la siguiente ilustración Data Set 2

12

Page 13: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Data Set 2:

A continuación nos dirigiremos al text box “File” donde indicamos la ruta de la extracción así de esta manera estaremos llamando los datos finales de la extracción.

13

Page 14: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Sequential File: Posteriormente una vez ya realizado la configuración del Data Set nos dirigimos al Sequential File y abrimos las propiedades y ponemos la ruta en el text box File de los datos de que queremos que se hagan el cruce en Join. (“Tener en cuenta que hay que revisar las columnas”)

14

Page 15: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Join: A continuación nos dirigimos a las propiedades del Join donde tendremos que buscar las keys para hacer el cruce de los datos y luego filtrarlos a un tranformer o un data set dependiendo lo que se necesite, en este caso solo está capturando una sola “key” como se muestra en la siguiente ilustración pero no siempre es una sola key en la siguiente ilustración, mostraremos como agregar más keys

15

Page 16: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Join (“Agregar keys”): Como mencionado en lo anterior mostraremos como agregar más keys al Join, nos dirigimos a la carpeta “Join Keys” presionamos en ella y luego vamos a la parte de abajo del lado derecho y presionamos en la opción “Key” y nos estará agregando automáticamente una nueva key pero no obstante tendremos que agregar la key correspondiente como lo hicimos anteriormente.

16

Page 17: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Join (“Mapping”): Luego de haber agregado las key(s) nos dirigimos a la pestaña “Output” y “Mapping” donde le aparecerá solo la tabal “Columns” llena donde ustedes tendrán que seleccionar toda la tabla y arrastrarla a la tabla del lado derecho.

17

Page 18: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Join (“Columns”): En la pestaña “Columns” solo tendremos que verificar si los datos son correctos pero por lo general una ver traspasado los datos del Mapping estas se agregan automáticamente.

18

Page 19: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Archivo de rechazo: A continuación veremos cómo hacer un archivo de rechazo cómo podemos ver en la siguiente ilustración para ello tendremos que dirigirnos a la paleta de herramientas y en la opción Processing extraemos un Remove Duplicates lo cual esta opción nos removerá los duplicados y en el Transformer ingresaremos la condición de rechazo y luego de eso agregamos un Sequential file para recepcionar los datos rechazados.

19

Page 20: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Remove Duplicates: Como ya visto en el Join este proceso tiene el mismo mecanismo, hay que extraer la key luego dirigirse a Output y hacer el Mapping y verificar las Columnas.

20

Page 21: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Remove Duplicates (Mapping): Como mencionado en lo anterior nos dirigimos al Mapping donde tendremos que seleccionar la tabla del lado izquierdo y arrastrarlo a la tabla del lado derecho para traspasar los datos y luego de eso verificar las columnas

21

Page 22: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Tranformer (Transformación): A continuación nos dirigimos al Transformer donde abrimos en las propiedades en la cual se nos desplegara la siguiente interfaz y en ella tendremos que realizar los mismos pasos que se realizó en el tranformer anterior de la extracción donde seleccionaremos todos los datos de la tabla izquierda y luego procederemos arrastrarlo a la tercera tabla del lado derecho hacemos el mismo procedimiento para la cuarta tabla del lado derecho. Luego de eso tenemos que hacer un paso que es vital para realizar el archivo de rechazo ya que en ella ingresaremos la condición para que nos filtre los datos como se puede apreciar en la siguiente ilustración por lo general en este tipo de condiciones se utiliza la sentencia IF dado que es una manera más óptima de realizarlo, en este caso se está haciendo una rechazo a los RUT con la letra “K” por lo que se está ingresando la siguiente sentencia (“If Trim (DSLink9.Item ,'k' ,"A") = DSLink9.Item Then 1 Else 0”) ya que de esta maneara se realiza el rechazo. .

22

Page 23: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Sequential file (“rechazo”): Una vez ya echo la condición en el tranformer nos dirigimos a las propiedades del Sequential file en la cual ingresaremos en el text box file la ruta donde queremos que se guarde los datos de rechazo.

23

Page 24: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Data Set: Una vez realizado el Transformer nos dirigimos al Data set en donde este será vuestro paso final para terminar la transformación, una vez más abrimos en las propiedades en donde se nos mostrara la siguiente interfaz en la cual tendremos que especificar en el “Text box file” la ruta en donde queremos que se guarde.

24

Page 25: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Ejercicio DataStage

Carga

Paso 1: Lo primero que tenemos que hacer es dirigirnos al archivo final de la transformación y copiarlo para luego posteriormente pegarlo en el Job de carga.

Paso 2: Lo segundo que tenemos que hacer es dirigirnos a la paleta de herramientas en la opción Processing y sacamos un tranformer y lo arrastramos al diseñador.

Paso 3: Lo tercero que tenemos que hacer es ir nuevamente a la paleta de herramientas en la opción file y sacamos un Sequential file y lo arrastramos al diseñador

A continuación se mostrara como debe estar armado el esquema en el Data Stage

25

Page 26: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Configuración (“Carga”)

Data Set (Final transformación): Como mencionado en lo anterior tenemos que copiar el data set final de la transformación para luego pegarlo en el Job de carga una vez echo eso vamos a las propiedades del data set donde tendremos que pegar la ruta del data set de la transformación como se muestra en la siguiente ilustración. (“tener en cuenta que si no copias bien la ruta los datos no se traspasaran con éxito”).

26

Page 27: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Tranformer (“Carga”): Una vez realizado el proceso anterior nos dirigimos al tranformer donde abrimos las propiedades y hacemos los mismos pasos que llevas haciendo en todo el manual en el tranformer como se muestra en la siguiente ilustración.

27

Page 28: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Data Set (Carga): Este sería el último paso para realizar la serie de extracción, transformación y carga. Lo que tenemos que hacer es dirigirnos a las propiedades del data set y especificar la ruta donde va ser destinado los datos y de esta manera usted habrá completado la serie de los Jobs.

28

Page 29: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Ejercicio Data Stage

Secuencial

Pasó 1: Lo primero que tenemos que hacer dirigirnos a la paleta de herramientas y en la opción Sequence extraemos el Sequence “UserVariables Activity” y los arrastramos al diseñador.

Paso 2: Lo segundo que tenemos que hacer es ir nuevamente a la paleta de herramientas y en la opción Sequence extraemos el Sequence “Job Activity” y los arrastramos al diseñador y repetimos los mismos pasos para los demás Job ya que se tendrá que agregar un Job Activity por cada Job que se haya creado.

Paso 3: Lo tercero que tenemos que hacer es ir otra vez a la paleta de herramientas e ir a la opción Sequence y extraer Notification Activity y arrastrarlo al diseñador.

Paso4: Lo cuarto que tenemos que hacer es ir a la paleta de herramientas e ir a la opción Sequence y extraer Terminator Activity (“tener en cuenta que se debe agregar por cada Job Activity que se haya agregado al diseñador”)

Paso5: Lo quinto que tenemos que hacer es sacar del mismo repositorio el Sequence Exception Handler y arrástralo al diseñador.

Paso 6: Lo sexto que tenemos que hacer es ir al mismo repositorio y extraer el Sequence UserVariables Activity y arrástralo al diseñador.

Paso 7: Lo sexto que tenemos que hacer es ir al mismo repositorio y extraer el Sequence de Notification Activity.

A continuación se mostrara cómo debería estar armado el Sequence ene le Data Stage como se muestra en la siguiente ilustración.

29

Page 30: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

30

Page 31: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Configuración (“Secuencial”)

UserVariables Activity

User Variables:

31

Page 32: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

General:

32

Page 33: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Trigger:

33

Page 34: Manuela xxxx

Factorit y Compañía LimitadaServicios Integrales de Informática

Job Activity:

A continuacion nos dirigimos al Job Activity donde tendremos que extraer el Job de extracion en (Job name como se muestra en el rectangulo café) tendran que presinar en el boton del lado derecho y hay se les desplegara una interfaz en cual tendran que buscar el job de extracion tener en cuenta que tienen Seleccionar el job que corresponda a la secuencia.

A continuacion nos dirigimos a Execution donde tendremos que seleccionar en el combobox Reset if requierd, the run.

Luego de eso nos dirimos a Inset Parameter en donde tendremos presinar e ingresar los parametros correspondientes si en un caso no estuvieran se tendra agegar en el menu parameter para posteriormente agregarlos al Insert Parameter.

34