descubriendo los datos - bodegas de datos

25

Upload: julian-castiblanco

Post on 21-Jan-2018

111 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Bodegas de DatosJulián Castiblanco P

Líder de la comunidad ITPROS-DC

https://www.facebook.com/ITProsDChttp://www.meetup.com/ITPROS-DC/

Julián Castiblanco P.

http://www.azurecloud.com.co/

http://julycastiblanco.blogspot.com.co/

co.linkedin.com/juliancastiblancop

@jcastiblancop

[email protected]

Database Consultant- Synergy TPC

MVP Data Platform

Miembro de PASS ITPros-DC Chapter

http://conta.cc/29wAQXe

Agenda

• Algo de teoría Básica

• Qué son los paquetes ETLs

• Nuevas tendencias

Recomendados del día

Inmon

Kimball

http://www.kimballgroup.com/

Diferencias en diseño

Bodegas de datosSistemas transaccionales

ER Diagram

Llaves Sustitutas Vs Llaves de Negocio

CustomerKey CustomerAltKey FirstName LastName

1 1002 Amy Alberts

2 1005 Neil Black

Llave Suplente Llave de Negocio Atributos Adicionales de la dimensión

Atributos y Jerarquías

CustKey CustAltKey Name Country State City Phone Gender

1 1002 Amy Alberts Canada BC Vancouver 555 123 F

2 1005 Neil Black USA CA Irvine 555 321 M

3 1006 Ye Xu USA NY New York 555 222 M

Jerarquías FiltrosDetallesDetalles

Dimensiones Lentamente CambiantesCustKey CustAltKey Name Phone

1 1002 Amy Alberts 555 123

CustKey CustAltKey Name City Current Start End

1 1002 Amy Alberts Vancouver Yes 1/1/2000

CustKey CustAltKey Name Phone

1 1002 Amy Alberts 555 222Tipo 1

CustKey CustAltKey Name City Current Start End

1 1002 Amy Alberts Vancouver No 1/1/2000 1/1/2012

4 1002 Amy Alberts Toronto Yes 1/1/2012

Tipo 2

CustKey CustAltKey Name Cars

1 1002 Amy Alberts 0

CustKey CustAltKey Name Prior Cars Current Cars

1 1002 Amy Alberts 0 1

Tipo 3

Dimensión de Tiempo

•Granularidad

•Rangos

•Múltiples Calendarios

• Incluir una fecha por

defecto

DateKey DateAltKey MonthDay Day MonthNo Month Year

00000000 01-01-1753 NULL NULL NULL NULL NULL

20130101 01-01-2013 1 Tue 01 Jan 2013

20130102 01-02-2013 2 Wed 01 Jan 2013

20130103 01-03-2013 3 Thu 01 Jan 2013

20130104 01-04-2013 4 Fri 01 Jan 2013

Dimensiones Auto-Referenciadas

EmployeeK

ey

EmployeeAltK

ey

EmployeeNa

me

ManagerKe

y

1 1000 Manuel NULL

2 1001 Julio 1

3 1002 Cesar 1

4 1003 Dora 2

Manuel

Julio

Dora

Cesar

Dimensiones Chatarra

Agrupa características o

dimensiones relacionadas y

pequeñas en una sola

dimensión para simplificar

el modelo Estrella y

mejorar los tiempos de

respuesta de la bodega de

datos.

JunkKey OutOfStockFlag FreeShippingFlag CreditOrDebit

1 1 1 Credit

2 1 1 Debit

3 1 0 Credit

4 1 0 Debit

5 0 1 Credit

6 0 1 Debit

7 0 0 Credit

8 0 0 Debit

Columnas de la tabla de hechos

OrderDateKey ProductKey CustomerKey OrderNo Qty SalesAmount

20120101 25 120 1000 1 350.99

20120101 99 120 1000 2 6.98

20120101 25 178 1001 2 701.98

Llaves de las dimensionesDimensionesDegeneradas Medidas

Tipos de Tablas de Hechos• Tabla de hechos a nivel de transacción

• Foto de Periodo Por Fecha

• Foto De Periodo Acumulado

OrderDateKey ProductKey CustomerKey OrderNo Qty Cost SalesAmount

20120101 25 120 1000 1 125.00 350.99

20120101 99 120 1000 2 2.50 6.98

20120101 25 178 1001 2 250.00 701.98

DateKey ProductKey OpeningStock UnitsIn UnitsOut ClosingStock

20120101 25 25 1 3 23

20120101 99 120 0 2 118

OrderNo OrderDateKey ShipDateKey DeliveryDateKey

1000 20120101 20120102 20120105

1001 20120101 20120102 00000000

1002 20120102 00000000 00000000

Que viene Ahora

AUTOSERVICIO DE BI

Fuentes no Normalizadas

Cruces de informaciones no

homogéneas

Tiempos mínimos para la ejecución

de proyectos

Azure SQL Data Warehouse

https://azure.microsoft.com/en-us/documentation/articles/sql-data-warehouse-overview-what-is/

Azure SQL Data Warehouse

Azure SQL Data Warehouse

Azure Data Lake

https://azure.microsoft.com/en-us/solutions/data-lake/

Hadoop

PREGUNTAS / COMENTARIOS / SUGERENCIAS

JULIAN CASTIBLANCO [email protected]

@jcastiblancop

www.azurecloud.com.co

http://julycastiblanco.blogspot.com.co/

https://www.facebook.com/ITProsDChttp://www.meetup.com/ITPROS-DC/