Download - Minería de datos
Minería de Datos – 11 y12 de Junio de 2014
Leonel Morales Díazl e o n e l @ i n g e n i e r i a s i m p l e . c o ml m o ra l e s d @ u r l . e d u . gt@ l i t o m d
http://goo.gl/zozuBr
Por favor llenar encuesta:
Big Data
Big DataVe
locid
ad
Datos
por
segu
ndo
Rede
s: co
nduc
tore
s de d
atos
Volumen
MB -> GB -> TB
VariedadEstructurados
No estructuradosNúmeros, texto, fotos
Big DataVe
locid
ad
Datos
por
segu
ndo
Rede
s: co
nduc
tore
s de d
atos
Volumen
MB -> GB -> TB
VariedadEstructurados
No estructuradosNúmeros, texto, fotos
Valor¿Qué problemas puede resolver?
¿Qué nuevo conocimiento
provee?
Big DataVe
locid
ad
Datos
por
segu
ndo
Rede
s: co
nduc
tore
s de d
atos
Volumen
MB -> GB -> TB
VariedadEstructurados
No estructuradosNúmeros, texto, fotos
Valor¿Qué problemas puede resolver?
¿Qué nuevo conocimiento
provee?
Para obtener valor:CapturarlaLimpiarlaConocerlaAnalizarlaModelarla
Captura de Datos
N = Todos los datos
Captura de Datos
N = 1 dato
Conocer los Datos
Análisis Exploratoriode Datos
Modelar los Datos
Un modelo simplees mejor que ningún modelo
Minería de Datos
Saber delTema
Experiencia
Estudios
Familiaridad
Especialización
Minería de Datos
Usar
Estadísticas
Saber delTema
Experiencia
Estudios
Familiaridad
Especialización
Graficar
Calcular
Interpretar
Muestrear
Probabilidades
Minería de Datos
Usar
Estadísticas
Saber delTema
Experiencia
Estudios
Familiaridad
Especialización
Graficar
Calcular
Interpretar
Muestrear
Probabilidades
Investigación tradicional
Minería de Datos
Prog
ram
arHac
kear
Usar
Estadísticas
Saber delTema
Experiencia
Estudios
Familiaridad
Especialización
Graficar
Calcular
Interpretar
Muestrear
Probabilidades
Bajar Datos
Almacenarlos
Mezclarlos
Limpiarlos
Minería de Datos
Prog
ram
arHac
kear
Usar
Estadísticas
Saber delTema
Experiencia
Estudios
Familiaridad
Especialización
Graficar
Calcular
Interpretar
Muestrear
Probabilidades
Bajar Datos
Almacenarlos
Mezclarlos
Limpiarlos
Machine learningAprendizaje
automatizado
Minería de Datos
Prog
ram
arHac
kear
Usar
Estadísticas
Saber delTema
Experiencia
Estudios
Familiaridad
Especialización
Graficar
Calcular
Interpretar
Muestrear
Probabilidades
Bajar Datos
Almacenarlos
Mezclarlos
Limpiarlos
¡Peligro!
Minería de Datos
Prog
ram
arHac
kear
Usar
Estadísticas
Saber delTema
Experiencia
Estudios
Familiaridad
Especialización
Graficar
Calcular
Interpretar
Muestrear
Probabilidades
Bajar Datos
Almacenarlos
Mezclarlos
Limpiarlos Mineríade Datos
Proceso de Minería de Datos
Recolección de datos “crudos”
Procesa-miento de
datos
Datos limpios
Mundoreal
Proceso de Minería de Datos
Recolección de datos “crudos”
Procesa-miento de
datos
Datos limpios
Análisis exploratorio
de datosMundo
real
Proceso de Minería de Datos
Recolección de datos “crudos”
Procesa-miento de
datos
Datos limpios
Análisis exploratorio
de datosMundo
real
Identifica-ción
automática de patrones
Modelos estadísticos
ClasificarPredecirDescribir
Proceso de Minería de Datos
Recolección de datos “crudos”
Procesa-miento de
datos
Datos limpios
Análisis exploratorio
de datos
Sistema basado en
datos
Mundoreal
Identifica-ción
automática de patrones
Modelos estadísticos
ClasificarPredecirDescribir
Proceso de Minería de Datos
Recolección de datos “crudos”
Procesa-miento de
datos
Datos limpios
Análisis exploratorio
de datos
ComunicarVisualizarReportar
Sistema basado en
datos
Mundoreal
Identifica-ción
automática de patrones
Modelos estadísticos
ClasificarPredecirDescribir
Proceso de Minería de Datos
Recolección de datos “crudos”
Procesa-miento de
datos
Datos limpios
Análisis exploratorio
de datos
Identifica-ción
automática de patrones
Modelos estadísticos
ClasificarPredecirDescribir
ComunicarVisualizarReportar
Sistema basado en
datos
Decisiones
Mundoreal
Temas del Taller
• 1: Búsqueda de datos• 2: Descarga automática de datos• 3: Construcción de bases de datos• 4: Análisis exploratorio de datos• 5: Modelación