estadística descriptiva · •diagrama de pastel o pie (circular) •diagrama de tallo y hoja...

Post on 07-May-2020

17 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Estadística Descriptiva

Concepto de Estadística

• Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas.

• Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.

Divisiones de la Estadística

Por su Objetivo

• Estadística Descriptiva• Gráfica

• Numérica

• Muestreo

• Estadística Inferencial

Por las variables de Interés

• Estadística Univariada

• Estadística Bivariada

• Estadística Multivariada

Estadística DescriptivaObjetivo

Es la estadística que tiene como objetivo la presentación de los datos de manera que se presentan al usuario de

manera sintética y ordenada a fin de que se pueda extraer la mejor información posible

Estadística DescriptivaTipos

• Gráfica• Presenta los datos de manera gráfica, ordenados en esquemas didácticos

orientados a la captación visual de los mismos

• Numérica• Presenta los datos en forma numérica buscando medidas que puedan dar

información sobre las variables de interés.

Estadística Descriptiva Gráfica

Principales formas de presentación de datos

• Diagrama de Barras

• Diagrama de Pastel o Pie (Circular)

• Diagrama de Tallo y Hoja

• Histograma de Frecuencia

• Diagrama de “Caja – Bigotes”

Clasificación

• Por el objetivo de las medida• Medidas de tendencia central

• Medidas de dispersión

• Por la agrupación de los datos• Estadística para datos individuales

• Estadística para datos agrupados

¿Para qué ordenar y clasificar las variables de interés de una población?Una vez obtenida la muestra de una población es importante,

empezar a entender algunas características de la población por lo que se sugiere realizar descripciones numéricas y gráficas de los

datos recolectados

¿Por qué se trabaja con muestras?

1 Consume menos tiempo

2 Cuesta menos

3 Es menos difícil de analizar

4 Se tiene más control para obtener datos de buena calidad

5 Puede dar mayor información

7 En ocasiones es imposible obtener la información de toda la población o proceso

Aplicaciones de la Estadística

La Estadística es una herramienta potencial para lograr interpretaciones adecuadas y e esta manara no tomar decisiones equivocadas.

1 Saber el nivel de satisfacción de mis clientes,

2 Saber cuáles son las regiones potenciales para la venta de un producto

3 Pronosticar el precio de alguna materia prima

4 Saber cuáles son los productos o los servicios con más demanda

5 Para estimar el tiempo promedio que dura el producto que fabrico

Aplicaciones de la Estadística

6 Pronosticar la inflación del siguiente mes

7 Para estimar el número promedio y la desviación estándar del número de reclamaciones al mes y el tipo de seguro

8 Para estimar el promedio y desviación estándar de la cantidad reclamada en un tipo de seguros

9 Para analizar el tiempo ente reclamo y reclamo en un tipo de seguro

Las mujeres viven en promedio más años que los hombres, en 1930, la esperanza de vida para las personas de sexo femenino era de 35 años y para el masculino de 33.

Al 2010 este indicador fue de 77 años para mujeres y 71 para los hombres, en 2016, se ubicó en casi 78 años para las mujeres y en casi 73 años para los hombres.

Esperanza de vida en México

Como se puede observar en lagráfica, a nivel nacional NuevoLeón, Baja California Sur y laCiudad de México presentan lamayor esperanza de vida conun poco más de 76 años; encaso contrario se encuentranChiapas, Guerrero y Oaxacacon 73 años.

Esperanza de vida por entidad

federativa

Medidas de Tendencia Central

Las medidas de tendencia central concentran toda la informacióndel conjunto en una sola medida que se considera un númerorepresentativo.

Media

Moda

Mediana

Media Aritmética

Media Geométrica

• La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G.

• Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual.

Media geométrica

El director ejecutivo de la empresa White-Knuckle Airlines desea determinar la tasa de crecimiento promedio en los ingresos con base en las cifras dadas en la tabla. Si la tasa de crecimiento promedio es menor que el promedio industrial del 10%, se asumirá una nueva campaña publicitaria.

Primero vamos a determinar elporcentaje que los ingresos decada año representan respecto losobtenidos del año anterior. Sea MGla media geométrica buscada:

• Ahora encontremos el promedio.Sea X el promedio buscado:

Media geométrica

• Ya que se presentaron 4 cambios durante el periodo:

MG X

Ya que el monto obtenido en MG supera los $78,000 qué tenía,

la tasa de crecimiento de la media geométrica es más preciso.

Debido a que la tasa de crecimiento supera el promedio de la industria del 10%, la nueva campaña publicitaria no se llevará a cabo.

Media geométrica

Media armónica:

• La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H

Media armónica

• Si las velocidades de rendimiento son v1 = 60, v2 = 70 y v3 = 80. Encuentre el rendimiento promedio de la producción:

Mediana

• La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra.

• Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua.

• Cálculo de la mediana en el caso discreto:

• Tendremos en cuenta el tamaño de la muestra.

• Si N es Impar, hay un término central, el término que será el valor de la

mediana.

• Si N es Par, hay dos términos centrales, la mediana será la media de

esos dos valores

Mediana

• Se quisiera conocer cuál es el promedio de hijos, que tiene un grupo de trabajadores. Supongamos que el resultado de una encuesta ha sido el siguiente:

• 3 8 5 4 2 6 5 4 1 2 2 4 3 1

• Primero hay que organizar de menor a mayor los números obtenidos:

• 1 1 2 2 2 3 3 4 4 4 5 5 6 8

• Identificados los valores centrales, se procederá entonces a sumarlos y dividirlos entre dos:

4 + 4 = 8 8 ÷ 2 = 4

en promedio ese grupo específico tiene 4 hijos por persona. Mientras de la Media nos arrojaría el resultado de 3.6 (sumando todas las cifras y dividiendo entre el total de intervalos) cifra que resulta bastante cercana al promedio, pero que la Mediana calcula mejor.

MODA:

• La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo.

• Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.

Datos Agrupados

Cuando el número de datos que constituyen la base de datos son muy numerosos y vienen de una variable continua. Los datos se “agrupan”, es decir los datos son presentados en pequeños paquetes que abarcan todos los datos contenidos entre dos valores determinados de la variable.

Calculo del número de intervalos

Existen varias reglas automáticas para determinar el

número de intervalos a usar en la construcción de una

tabla. Los programas estadísticos de uso habitual, las

usan a menudo en su configuración estándar, aunque

también permiten que el usuario decida por su cuenta

las características de los intervalos que desea usar.

Una de las reglas más conocidas fue propuesta por

Herbert Sturges y calcula el número k de intervalos

mediante la expresión

k = 1 + log2(n) = 1 + 3.322 * log(n)

En donde n es el número total de datos

Características del Intervalo

• Li = límite inferior del intervalo: es el valor más pequeño del intervalo, por lo general es un límite “abierto”

• Las = límite superior: es el máximo valor del intervalo por lo general es un límite “cerrado”

• Mc = marca de clase: es el valor intermedio del intervalo, por lo general se considera que todos los valores del intervalo toman este valor para fines prácticos.

Tamaño de la muestra NLlamamos tamaño muestra al número de observaciones

realizadas, es decir, al número total de datos.

Frecuencia Absoluta ni

Llamamos frecuencia absoluta de un valor xi de la variable estadística X al número de veces que aparece repetido dicho valor en el conjunto de las observaciones realizadas.

Frecuencia Absoluta Acumulada Ni

Llamamos frecuencia absoluta acumulada en el valor xi a la suma de las frecuencias absolutas de los valores inferiores o iguales a él.Evidentemente, los valores xi han de estar ordenados de forma creciente, como ya se ha indicado, y la frecuencia absoluta acumulada del último valor será igual a N.

Frecuencia Relativa fi

Llamamos frecuencia relativa de un valor xi de la variable estadística X al cociente entre la frecuencia absoluta y el número de observaciones realizadas.

;

Frecuencia Relativa Acumulada Fi

Llamamos frecuencia relativa acumulada en el punto xi al cociente entre la frecuencia absoluta acumulada y el número de observaciones realizadas.

;

Moda

• Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:

*Cuando todos los intervalos tienen la misma amplitud.

Intervalos fi

[60, 63) 55

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

100

• En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.

• *Cuando los intervalos tienen amplitudes distintas.

Moda

Medidas de dispersión

El objetivo es medir el grado de variabilidad de los datos. Las medidas de dispersión que se estudian son Rango, Desviación media Varianza y Desviación estándar

1 Rango es la diferencia entre el dato mayor y el dato menor

2 Desviación Media Es el promedio de las distancias hacia la media muestral

3 Varianza Muestral Es casi el promedio del cuadrado de las desviaciones de cada observación a su media

4 La Desviación Estándar Muestral es la raíz cuadrada de la varianza

KurtosisDetermina el grado de concentración que presentan los valores en la región central de la distribución. Por medio de este podremos saber si existe una gran concentración de valores

Sesgo El coeficiente de Sesgo determina el grado de asimetría.

Gráficos de distribución

• Para datos cuantitativos, uno de los principales objetivos, es tener una idea visual del comportamiento de la variable en estudio, la distribución de sus posibles valores o categorías.

• Tipos de gráficos de distribución

• Diagrama de Tallo y Hojas

• Histograma

• Polígono de Frecuencias

Desviación Estándar

• Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di .

• No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.

Diagrama de Tallo y Hojas

Muestra el patrón de variabilidad mostrado por los diferentes valores o grupos de una variable. S representan

frecuencias de cada valor o de cada grupo de variable

Histograma

Es una representación gráfica de las frecuencias relativas (porcentajes) de los diferentes valores que

toman los grupos, intervalos o clases de una

variable de interés

Se calculan por intervalos llamados “clases”

Pasos para construir un Histograma

1 Se ordenan los datos d menos a mayor

2 Se calcula el rango, de los datos

3 Se calcula l numero de clases

4 Se calcula el numero el ancho de cada clase (Rango / k)

5 se construye los intervalos, con el ancho determinado con intervalos cerrado abierto y el ultimo cerrado cerrado

6 se calculo las frecuencias para cada intervalo

7 Se calcula las frecuencias relativas (FI/n)

8 Se calcula la frecuencia relativa acumulada

9 Se calcula para cada clase la marca de clase

Polígonos de frecuencia

La gráfica de polígonos de frecuencia es una

suavización del histograma, se

construye sobre el histograma realizado. Sobre el histograma se añade dos clases del mismo ancho una al

principio y otra al final

Después para cada clase, la distancia de la marca de clase, en la parte superior del rectángulo, se marca

la frecuencia relativa , estas marcas se unen

por medio de segmentos de línea

Varianza y desviación estándar

• Calcular la varianza y la desviación estándar de los siguientes datos: 2, 4, 6 y 8 sabiendo que corresponden a una población.

• Solución:Nos indican que estos datos forman una población, por lo tanto, usaremos las fórmulas de varianza y desviación estándar para la población, teniendo en cuenta que tenemos 4 datos, es decir, N = 4.

• Empezamos calculando la media poblacional:

• Ahora calculamos la varianza poblacional:

Ahora calculamos la desviación estándar, teniendo en cuenta que es la raíz cuadrada de la varianza.

Varianza y desviación estándar

Percentiles

El percentil es una medida de posición usada ene estadística, que indica una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual

se encuentra un porcentaje dado de observación en un grupo.

Percentiles

Cuartiles

• Medida de localización que divide la población o muestra en cuatro partes iguales.

• Q1= Valor de la variable que deja a la izquierda el 25% de la distribución.

• Q2= Valor de la variable que deja a la izquierda el 50% de la distribución = mediana.

• Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.

• Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos, depende del tipo de variable.

• Caso I: Variable cuantitativa discreta:

• En este caso tendremos que observar el tamaño de la muestra: N y para calcular Q1 o Q3 procederemos como si tuviésemos que calcular la mediana de la correspondiente mitad de la muestra.

• Caso II: Variable cuantitativa continua:

• En este caso el cálculo es más simple:, sea la distribución que sigue:

• [Li-2 -- Li-1) ni-1

• [Li-1 -- Li) ni Ni

• Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente:

Cuartil

y

Cuartiles

• Para los siguientes datos: 7, 9, 16, 36, 39, 45, 45, 46, 48, 51. Encontrar los respectivos cuartiles y el rango intercuartil:

Q1 = 14.25

Q2 (mediana) = 42

Q3 = 46.50

Rango Intercuartil = 14.25 a 46.50 o 32.25

Referencias

• Webster, Allen L. (2000). Estadística aplicada a los negocios y la economía. Editorial McGraw-Hill. Colombia.

top related