Transcript
Page 1: ANÁLISIS EXPLORATORIO DE DATOS

ANÁLISIS EXPLORATORIO DE DATOS

MAYRA ALEJANDRA BAHAMÓN MONTEROJAVIER EDUARDO IBARRA GUTIÉRREZ

DIEGO ANDRÉS VILLEGAS BARRIOS

Page 2: ANÁLISIS EXPLORATORIO DE DATOS

¿QUÉ ES EL ANÁLISIS EXPLORATORIO?

Es el conjunto de herramientas estadísticas que permite visualizar el análisis definitivo de los datos de estudio. Donde evalúa la calidad y la consistencia de los datos, resume los datos mediante los gráficos, ayuda a determinar las distribuciones, detecta datos atípicos, comprueba supuestos de Normalidad, linealidad, Homocedasticidad y entre otras.

Page 3: ANÁLISIS EXPLORATORIO DE DATOS

EL ANALISIS EXPLORATORIO PUEDE

SER:

UNIVARIANTE

BIVARIANTE

MULTIVARIANTE

Hace referencia al valor de un solo indicador.

Relaciona dos o más variables , de manera que se pueda estudiar una variable en función de la otra. (Clasificación cruzada, análisis de varianza y regresiones simples).

Aborda todos los indicadores disponible para un fenómeno determinado

Page 4: ANÁLISIS EXPLORATORIO DE DATOS

El Análisis Univariante se puede analizar a través de los gráficos de:

Histograma.Diagrama de Tallo y hojas.Tallo y hojas. Diagrama de Cajas (Boxplot).

ANÁLISIS EXPLORATORIO UNIVARIADO

Page 5: ANÁLISIS EXPLORATORIO DE DATOS

Representa la variabilidad debida a causas aleatorias.

Se puede apreciar sí hay Simetría o no.

Se pueden observar si hay datos atípicos.

Ej: En la gráfica se puede observar que hay discrepancia en los datos, encontramos un número menor de intervalo y uno de mayor intervalo. Lo cual no presenta simetría, es decir que la variable “Calidad del producto” presenta valores atípicos.

GRÁFICO DE HISTOGRAMA Y CURVA NORMAL

Page 6: ANÁLISIS EXPLORATORIO DE DATOS

Nivel de Demanda Stem-and-Leaf Plot  Frequency Stem & Leaf  ,00 2 . 3,00 2 . 589 7,00 3 . 1222234 17,00 3 . 55666667888899999 16,00 4 . 0001111223333344 22,00 4 .

5566666777777889999999 16,00 5 . 0001133333444444 11,00 5 . 55556788899 7,00 6 . 0000023 1,00 6 . 5  Stem width: 100 Each leaf: 1 case(s)

Es un semigráfico que presenta información de las variables cuantitativas. Es una combinación entre el histograma de barras y la tabla de frecuencias.

Ej: En el diagrama se observa que la distribución de los datos de la variable “Nivel de Demanda” presenta simetría y Normalidad. Presenta un valor mínimo de 2 y un valor máximo de 6,5.

DIAGRAMA DE TALLO Y HOJAS

Page 7: ANÁLISIS EXPLORATORIO DE DATOS

Permite analizar, resumir y comparar simultáneamente varios conjuntos de datos.

Permite examinar la posible presencia de normalidad, simetría y valores atípicos.

Ej: En el diagrama se observa que hay un valor máximo de 8 y un valor mínimo de 2,5. También se aprecia que la distribución es asimétrica, ya que la media tiende ser menor que la mediana, es decir se aproxima al percentil 25.

DIAGRAMA DE CAJA Y BIGOTES (BOXPLOT)

Page 8: ANÁLISIS EXPLORATORIO DE DATOS

ANÁLISIS EXPLORATORIO BIVARIADO

El análisis bivariado exresa el grado de relación entre dos variables y las diferencias entre grupos de variables. Se pueden analizar a través de los gráficos de cajas y bigotes. Son un complemento del análisis de varianza y del análisis de correlación.

Page 9: ANÁLISIS EXPLORATORIO DE DATOS

COMPROBACIÓN DE LOS SUPUESTOS DEL ANÁLISIS MULTIVARIANTE

•Se comprueba mediante el método gráfico, para apreciar que la media y la volatilidad son cercanas a los valores establecidos.

•Para contratar la normalidad se utiliza la prueba de: Chi cuadrado, prueba Shapiro & Wilk y prueba Kolmogorov Sminov.

NORMALIDAD

•Se comprueba mediante el método gráfico, y se analiza los residuos respecto las variables endógenas y exógenas que permita determinar cuál es la variable con mayor heteroscedasticidad.

HETEROSCEDASTICIDAD

•El supuesto de que las variables sean independientes, se analizan mediante las correlaciones. Esto permite determinar si hay multicolinealidad. Sus soluciones son: Ampliar la muestra , realizar transformaciones entre las variables y/o sustituir o suprimir algunas de las variables.

MULTICOLI-NEALIDAD

•Se evalúa mediante el análisis gráfico, si hay una estructura aleatoria de libre de tendencia. El supuesto de que el error es una variable aleatoria con esperanza nula y matriz de covarianza constante es una hiotesis de autocorrelación

AUTOCORRE-LACIÓN

•Los gráficos que no son lineales , es decir hay dispersión de las variables y residuos con secuencias no aleatorios. Detecta la falta de Linealidad.

LINEALIDAD

Page 10: ANÁLISIS EXPLORATORIO DE DATOS

GRÁFICOS DEL ANÁLISIS EXPLORATORIO MULTIVARIADO

Dentro de las gráficas del Análisis Exploratorio encontramos la Matrices de Dispersión que representa las relaciones entre las variables .


Top Related