Download - Descubriendo los Datos - Bodegas de datos
Bodegas de DatosJulián Castiblanco P
Líder de la comunidad ITPROS-DC
https://www.facebook.com/ITProsDChttp://www.meetup.com/ITPROS-DC/
Julián Castiblanco P.
http://www.azurecloud.com.co/
http://julycastiblanco.blogspot.com.co/
co.linkedin.com/juliancastiblancop
@jcastiblancop
Database Consultant- Synergy TPC
MVP Data Platform
Miembro de PASS ITPros-DC Chapter
Llaves Sustitutas Vs Llaves de Negocio
CustomerKey CustomerAltKey FirstName LastName
1 1002 Amy Alberts
2 1005 Neil Black
Llave Suplente Llave de Negocio Atributos Adicionales de la dimensión
Atributos y Jerarquías
CustKey CustAltKey Name Country State City Phone Gender
1 1002 Amy Alberts Canada BC Vancouver 555 123 F
2 1005 Neil Black USA CA Irvine 555 321 M
3 1006 Ye Xu USA NY New York 555 222 M
Jerarquías FiltrosDetallesDetalles
Dimensiones Lentamente CambiantesCustKey CustAltKey Name Phone
1 1002 Amy Alberts 555 123
CustKey CustAltKey Name City Current Start End
1 1002 Amy Alberts Vancouver Yes 1/1/2000
CustKey CustAltKey Name Phone
1 1002 Amy Alberts 555 222Tipo 1
CustKey CustAltKey Name City Current Start End
1 1002 Amy Alberts Vancouver No 1/1/2000 1/1/2012
4 1002 Amy Alberts Toronto Yes 1/1/2012
Tipo 2
CustKey CustAltKey Name Cars
1 1002 Amy Alberts 0
CustKey CustAltKey Name Prior Cars Current Cars
1 1002 Amy Alberts 0 1
Tipo 3
Dimensión de Tiempo
•Granularidad
•Rangos
•Múltiples Calendarios
• Incluir una fecha por
defecto
DateKey DateAltKey MonthDay Day MonthNo Month Year
00000000 01-01-1753 NULL NULL NULL NULL NULL
20130101 01-01-2013 1 Tue 01 Jan 2013
20130102 01-02-2013 2 Wed 01 Jan 2013
20130103 01-03-2013 3 Thu 01 Jan 2013
20130104 01-04-2013 4 Fri 01 Jan 2013
Dimensiones Auto-Referenciadas
EmployeeK
ey
EmployeeAltK
ey
EmployeeNa
me
ManagerKe
y
1 1000 Manuel NULL
2 1001 Julio 1
3 1002 Cesar 1
4 1003 Dora 2
Manuel
Julio
Dora
Cesar
Dimensiones Chatarra
Agrupa características o
dimensiones relacionadas y
pequeñas en una sola
dimensión para simplificar
el modelo Estrella y
mejorar los tiempos de
respuesta de la bodega de
datos.
JunkKey OutOfStockFlag FreeShippingFlag CreditOrDebit
1 1 1 Credit
2 1 1 Debit
3 1 0 Credit
4 1 0 Debit
5 0 1 Credit
6 0 1 Debit
7 0 0 Credit
8 0 0 Debit
Columnas de la tabla de hechos
OrderDateKey ProductKey CustomerKey OrderNo Qty SalesAmount
20120101 25 120 1000 1 350.99
20120101 99 120 1000 2 6.98
20120101 25 178 1001 2 701.98
Llaves de las dimensionesDimensionesDegeneradas Medidas
Tipos de Tablas de Hechos• Tabla de hechos a nivel de transacción
• Foto de Periodo Por Fecha
• Foto De Periodo Acumulado
OrderDateKey ProductKey CustomerKey OrderNo Qty Cost SalesAmount
20120101 25 120 1000 1 125.00 350.99
20120101 99 120 1000 2 2.50 6.98
20120101 25 178 1001 2 250.00 701.98
DateKey ProductKey OpeningStock UnitsIn UnitsOut ClosingStock
20120101 25 25 1 3 23
20120101 99 120 0 2 118
OrderNo OrderDateKey ShipDateKey DeliveryDateKey
1000 20120101 20120102 20120105
1001 20120101 20120102 00000000
1002 20120102 00000000 00000000
Que viene Ahora
AUTOSERVICIO DE BI
Fuentes no Normalizadas
Cruces de informaciones no
homogéneas
Tiempos mínimos para la ejecución
de proyectos
Azure SQL Data Warehouse
https://azure.microsoft.com/en-us/documentation/articles/sql-data-warehouse-overview-what-is/
Azure Data Lake
https://azure.microsoft.com/en-us/solutions/data-lake/
PREGUNTAS / COMENTARIOS / SUGERENCIAS
JULIAN CASTIBLANCO [email protected]
@jcastiblancop
www.azurecloud.com.co
http://julycastiblanco.blogspot.com.co/
https://www.facebook.com/ITProsDChttp://www.meetup.com/ITPROS-DC/