distribucion estadistica

27
Medidas de tendencia central: Media, Mediana, Moda Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba. el propósito de las medidas de tendencia central es: Mostrar en qué lugar se ubica la persona promedio o típica del grupo. Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico. Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos. Las medidas de tendencia central más comunes son: La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior. La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md. La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo. De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las características de la media, esta es afectada por los valores extremos). La media es considerada como la mejor medida de tendencia central, por las siguientes razones: Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media. Es la medida de tendencia central más conocida y utilizada. Las medias de dos o más distribuciones pueden ser fácilmente promediadas mientras que las medianas y las modas de las distribuciones no se promedian.

Upload: bryan-vera

Post on 13-Dec-2015

42 views

Category:

Documents


3 download

DESCRIPTION

trabajo de estadistica universitaria

TRANSCRIPT

Page 1: DISTRIBUCION ESTADISTICA

Medidas de tendencia central: Media, Mediana, Moda

Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.

el propósito de las medidas de tendencia central es:

Mostrar en qué lugar se ubica la persona promedio o típica del grupo.

Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.

Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.

Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.

Las medidas de tendencia central más comunes son:

La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior.

La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md.

La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.

De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las características de la media, esta es afectada por los valores extremos).

La media es considerada como la mejor medida de tendencia central, por las siguientes razones:

Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media.

Es la medida de tendencia central más conocida y utilizada.  

Las medias de dos o más distribuciones pueden ser fácilmente promediadas mientras que las medianas y las modas de las distribuciones no se promedian.

La media se utiliza en procesos y técnicas estadísticas más complejas mientras que la mediana y la moda en muy pocos casos.

Cómo calcular, la media, la moda y la mediana

Media aritmética  o promedio

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.

Page 2: DISTRIBUCION ESTADISTICA

Ejemplo 1:

En matemáticas, un alumno tiene las siguientes notas:  4, 7, 7, 2, 5, 3

n = 6 (número total de datos)

La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio.

Ejemplo 2:

Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra.

Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta

5 10 5          .       10  =   50

6 15 6          .        15 =   90

7 20 7          .        20 =  140

8 12 8          .        12 =    96

9 6 9            .          6 = 54

Frecuencia total = 63 430

 

Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).

Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más.

Ejemplo 1:

Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.

                  5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3

La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Ejemplo 2:

Page 3: DISTRIBUCION ESTADISTICA

               20, 12, 14, 23, 78, 56, 96

En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.

Mediana (Med)

Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al número del caso que representa la mediana de la distribución.

Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.

Según el número de valores que se tengan se pueden presentar dos casos:

Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.

Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:

Se tienen los siguientes datos:  5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:  1, 2, 4,  5, 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

POSICIÓN

Las medidas de posic ión  div iden un conjunto de datos en grupos con el mismo número de indiv iduos.Para calcular las  medidas de posic ión es necesar io que los  datos estén ordenados de  menor a mayor. Las  medidas de posic ión  son:

Cuartiles

Los cuarti les  son los  tres valores  de la var iable que dividen  a un conjunto  de datos ordenados  en cuatro partes iguales .

Q1, Q2 y Q3 determinan los valores correspondientes al  25%, al 50% y al 75% de los datos .

Q2 coincide con la mediana .

Page 4: DISTRIBUCION ESTADISTICA

Cálculo de los cuartiles

1 Ordenamos   los  datos  de  menor a mayor .

2 Buscamos el lugar que ocupa cada cuarti l  mediante la expresión.

Número impar de datos

2, 5, 3, 6, 7, 4, 9

Número par de datos

2, 5, 3, 4, 6, 7, 1, 9

Cálculo de los cuarti les para datos agrupados

En primer lugar buscamos la clase  donde se encuentra , en la tabla de las frecuencias acumuladas .

Page 5: DISTRIBUCION ESTADISTICA

L i  es el l ímite inferior de la clase donde se encuentra la mediana.

N es la suma de las frecuencias absolutas.

F i - 1 es la frecuencia acumulada  anterior a la clase mediana.

a i  es la amplitud de la clase.

Ejercicio de cuartiles

Calcular los cuartiles  de la distribución de la tabla:

f i F i

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Cálculo del primer cuartil

Page 6: DISTRIBUCION ESTADISTICA

Cálculo del segundo cuartil

Cálculo del tercer cuartil

Deciles Los deciles  son los nueve valores  que dividen   la serie de datos  en diez partes iguales . Los deciles  dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana .

Cálculo de los deciles

En primer lugar buscamos la clase donde se encuentra  , en la tabla

de las frecuencias acumuladas.

L i  es el l ímite inferior de la clase donde se encuentra la mediana.

Page 7: DISTRIBUCION ESTADISTICA

N es la suma de las frecuencias absolutas.

F i - 1 es la frecuencia acumulada  anterior a la clase mediana.

a i  es la amplitud de la clase.

Ejercicio de deciles Calcular los deciles  de la distribución de la tabla:

f i F i

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Cálculo del primer decil

Cálculo del segundo decil

Page 8: DISTRIBUCION ESTADISTICA

Cálculo del tercer decil

Cálculo del cuarto decil

Cálculo del quinto decil

Cálculo del sexto decil

Cálculo del séptimo decil

Cálculo del octavo decil

Cálculo del noveno decil

Page 9: DISTRIBUCION ESTADISTICA

Percentiles

Los percentiles  son los 99 valores  que dividen   la serie

de datos en 100 partes iguales .

Los percentiles  dan los valores correspondientes al 1%, al 2%... y al

99% de los datos.

P50  coincide con la mediana .

Cálculo de los percentiles

En primer lugar buscamos la clase donde se encuentra

, en la tabla de las frecuencias acumuladas.

L i  es el l ímite inferior de la clase donde se encuentra la mediana.

N es la suma de las frecuencias absolutas.

F i - 1 es la frecuencia acumulada  anterior a la clase mediana.

a i  es la amplitud de la clase.

Page 10: DISTRIBUCION ESTADISTICA

Ejercicio de percenti les

Calcular el percentil 35 y 60  de la distribución de la tabla:

f i F i

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Percentil 35

Percentil 60

Page 11: DISTRIBUCION ESTADISTICA

Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son:

Rango o recorrido El  rango es la diferencia entre el  mayor y el  menor de losdatos de una distribución estadística.

Desviación media La desviación respecto a la media  es la diferencia entre cada valor de la variable estadística y la  media aritmética.

D i  = x -  x

La desviación media  es la media aritmética  de

los valores absolutos de las desviaciones respecto a la

media .

La desviación media  se representa por  

Page 12: DISTRIBUCION ESTADISTICA

Ejemplo

Calcular la  desviación media  de la

distr ibución:

9, 3, 8, 8, 9, 8, 9, 18

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

Page 13: DISTRIBUCION ESTADISTICA

Desviación media para datos

AGRUPADOS Si los datos vienen agrupados en

una  tabla de frecuencias , la expresión de la  desviación

media  es:

Ejemplo

Calcular la  desviación media  de la distr ibución:

xi fi xi · fi |x - x| |x - x| · fi

[10, 15) 12.5 3 37.5 9.286 27.858

[15, 20) 17.5 5 87.5 4.286 21.43

Page 14: DISTRIBUCION ESTADISTICA

[20, 25) 22.5 7 157.5 0.714 4.998

[25, 30) 27.5 4 110 5.714 22.856

[30, 35) 32.5 2 65 10.174 21.428

21 457.5 98.57

Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media  de una distribución estadística.

La varianza se representa por   .

Varianza para datos agrupados

Para

simpl i f icar el  cálculo de la varianza  vamos o ut i l izar las

s iguientes expresiones que son equivalentes a las anter iores.

Page 15: DISTRIBUCION ESTADISTICA

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza  de la distr ibución:

9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza  de la distr ibución de la tabla:

xi fi xi · fi

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

Page 16: DISTRIBUCION ESTADISTICA

[60,70) 65 4 260

[70, 80) 75 2 150

42 1 820

PROPIEDADES DE LA VARIANZA

1 La varianza  será siempre un valor posit ivo o cero , en el caso

de que las puntuaciones sean iguales.

2 Si a todos los  valores  de la var iable se

les suma  un número   la  varianza no varía .

3 Si todos los  valores  de la var iable se  multipl ican  por

un número   la  varianza  queda multipl icada por el  cuadrado  de

dicho número . 4 Si tenemos var ias distr ibuciones con la

misma media  y conocemos sus respect ivas  varianzas  se puede

calcular la  varianza total .

Si todas las muestras t ienen el mismo tamaño:

Si las muestras t ienen dist into tamaño:

Page 17: DISTRIBUCION ESTADISTICA

Observaciones sobre la varianza 1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas. 2 En los casos que no se pueda hal lar la media   tampoco será posible hallar la  varianza. 3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

Desviación típica La desviación t ípica  es la raíz cuadrada de la varianza . Es decir , la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La  desviación t ípica  se representa por  σ.

Desviación típica para datos agrupados

Para simpl i f icar el cálculo vamos o ut i l izar las s iguientes

expresiones que son equivalentes a las anter iores.

Desviación típica para datos agrupados

Page 18: DISTRIBUCION ESTADISTICA

Ejercicios de desviación típica

Calcular la  desviación t ípica  de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviación t ípica  de la distr ibución de la tabla:

Page 19: DISTRIBUCION ESTADISTICA

xi fi xi · fi xi2 · fi

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

Page 20: DISTRIBUCION ESTADISTICA

Propiedades de la desviación típica

1 La desviación t ípica  será siempre un valor posit ivo o cero , en

el caso de que las puntuaciones sean iguales.

2 Si a todos los  valores  de la var iable se

les suma  un número   la  desviación t ípica no varía .

3 Si todos los  valores  de la var iable se  multipl ican  por

un número   la  desviación t ípica  queda multipl icada  por

dicho número .

4 Si tenemos var ias distr ibuciones con la misma  media  y

conocemos sus respect ivas  desviaciones t ípicas se puede

calcular la  desviación t ípica total .

Si todas las muestras t ienen el mismo tamaño:

Si las muestras t ienen dist into tamaño:

Page 21: DISTRIBUCION ESTADISTICA

Observaciones sobre la desviación típica

1 La desviación t ípica , a l igual que la media y la var ianza, es un

índice muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media   tampoco será

posible hal lar la  desviación t ípica .

3 Cuanta más pequeña sea la  desviación t ípica  mayor será

la concentración de datos  a l rededor de la media .

ASIMETRIA Y CURTOSIS

forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y la Curtosis.

1. ASIMETRÍAEsta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define deforma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

Figura 5-1

Page 22: DISTRIBUCION ESTADISTICA

El Coeficiente de asimetría, se representa mediante la ecuación matemática,

Ecuación 5-9

Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuación se interpretan:(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.(g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.

2. CURTOSISEsta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Figura 5-2

Para calcular el coeficiente de Curtosis se utiliza la ecuación:

Ecuacion 5-10

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula se interpretan:(g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil  encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.).(g2 > 0) la distribución es Leptocúrtica(g2 < 0) la distribución es Platicúrtica

Page 23: DISTRIBUCION ESTADISTICA

Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente.La principal ventaja de la distribución normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estándar de la media aritmética (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviación y después le restamos a la media dos desviaciones, el 95% de los casos se encontraría dentro del rango que compongan estos valores.

Figura 5-3

Desde luego, los conceptos vistos hasta aquí, son sólo una pequeña introducción a las principales medidasde Estadística Descriptiva; es de gran importancia que los lectores profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en el desconocimiento de los conceptos estadísticos.Las definiciones plasmadas en este capítulo han sido extraídas de los libros Estadística paraadministradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadística y Muestreo escrito por Ciro Martínez editorial Ecoe editores (Octava edición). No necesariamente tienes que guiarte por estos libros ya que en las librerías encontraras una gran variedad de textos que pueden ser de bastante utilidad en la introducción a esta ciencia.

Page 24: DISTRIBUCION ESTADISTICA