estadística descriptiva. medidas de posicion

24
MEDIDAS DE POSICIÓN www.clasesuniversitarias.com Departamento Métodos Cuantitativos Universidad Pablo de Olavide Profesor: Juan Antonio González Díaz

Upload: juan-gonzalez-diaz

Post on 17-Feb-2017

92 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Estadística Descriptiva. Medidas de posicion

MEDIDAS DE POSICIÓN

www.clasesuniversitarias.com

Departamento Métodos CuantitativosUniversidad Pablo de Olavide

Profesor: Juan Antonio González Díaz

Page 2: Estadística Descriptiva. Medidas de posicion

Medidas de Posición, Dispersión y Forma

www.clasesuniversitarias.com

Cuando disponemos de una distribución de frecuencias asociada a cierta variable estadística, ésta puede resumirse por unas medidas que dan una idea general de cómo es la distribución sin tener que tratar todos los datos con frecuencias absolutas o relativas. Dichas medidas se pueden dividir en:

Medidas de posición; estas medidas dan una idea de en qué valores se distribuye la variable estadística: medias aritmética, geométrica y armónica, mediana, moda y cuantiles.

Medidas de dispersión; estas medidas tratan de medir el grado de esparcimiento de la variable estadística en torno a una medida de posición, indicándonos lo representativa que es ésta. A mayor dispersión, menor representatividad de la medida de posición y viceversa. Veremos como ejemplos, entre otros, la varianza, el recorrido y el coeficiente de variación de Pearson.

Medidas de forma; se distinguen principalmente dos medidas que estudian la simetría de una distribución (coeficiente de asimetría de Fisher) y el grado de semejanza de la misma a la distribución campaniforme de Gauss o también llamada normal (coeficiente de curtosis de Fisher).

MEDIDAS DE POSICIÓN

Page 3: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Estudiaremos las Medidas de Posición, también llamadas Medidas de Centralización, ya que estamos estudiando los valores centrales de la variable estadística, distinguiendo:

Variables Estadísticas de Datos Simples

MODA ABSOLUTA (Mo): El dato o datos con mayor frecuencia absoluta, es decir, el dato que aparece más veces en la variable estadística. En caso de existir más de una Moda Absoluta, se puede decir que la variable es bimodal, trimodal o multimodal.Resulta también interesante definir moda relativa como aquel valor de la variable (o valores) cuya frecuencia absoluta no es superada por los valores contiguos.

MEDIDAS DE POSICIÓN

Variables Estadísticas de Datos Agrupados en Intervalos

MEDIANA (Me): Dada una distribución de frecuencias con los valores ordenados de forma creciente, llamamos Mediana y la representamos por Me al valor de la variable que deja a su izquierda y a su derecha exactamente el 50% del número de frecuencias absolutas. Se obtiene con facilidad a partir de la Tabla Estadística, analizando las Frecuencias Absolutas Acumulados, buscando el valor N/2, es decir, la mitad de la población.

Page 4: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Moda Absoluta y Mediana para Variables Estadísticas de Datos Simples (Ejemplo 1)

MEDIDAS DE POSICIÓN

Dada la siguiente Variable Estadística: 1 , 2 , 2 , 3 , 3 , 3 , 3 , 4 , 5

12345

12411

13789

xi ni iN

N=9

Mo=3 La Moda es 3, ya que se trata del valor con mayor frecuencia absoluta.

Me=3 Para calcular la Mediana, hay que calcular el valor central de la variable estadística, para lo cuál obtenemos el valor:

5,429

2

N

En la Tabla Estadística buscamos el primer valor cuya Frecuencia Absoluta Acumulada supere el valor 4,5.

Si, como en este caso, no aparece una Frecuencia Absoluta Acumulada que coincida con el valor 4,5, la Mediana será el primer valor cuya Frecuencia Absoluta Acumulada supere el valor 4,5. En este caso, será 3, ya que su Frecuencia Absoluta Acumulada supera 4,5, siendo en este caso, 7

Page 5: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Moda Absoluta y Mediana para Variables Estadísticas de Datos Simples (Ejemplo 2)

MEDIDAS DE POSICIÓN

Dada la siguiente Variable Estadística: 1 , 2 , 2 , 3 , 3 , 4

xi ni iN

N=6

Mo=2 y 3 Se trata de una Variable Estadística bimodal, ya que hay dos valores con una Frecuencia Absoluta mayor

Me=2,5 Partimos igualmente del valor 326

2

N

Y buscamos en la Tabla Estadística el valor 3. En este caso sí aparece el valor 3 en las Frecuencias Absolutas Acumuladas, por lo que el proceso para el cálculo de la mediana, varía.

En este caso, tomamos el valor xi, cuya Frecuencia Absoluta Acumulada coincide con 3 y el valor siguiente, x i+1, cuya Frecuencia Absoluta Acumulada supera el valor 3, y calculamos la media de ambos valores.

1234

1221

1356

5,2232

21

ii xxMe

Page 6: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)

MEDIDAS DE POSICIÓN

Dada la siguiente Tabla Estadística, calculemos la MODA:

N=30

Mo=[1,6;1,7) En este caso es un Intervalo modal, ya que este intervalo presenta la mayor Frecuencia Absoluta.

Pero tenemos que asignar un valor numérico a este intervalo modal, para que la Moda sea un número. Vamos a ver dos formas de hacerlo:

La primera, muy sencilla, es asignar al Intervalo el valor numérico correspondiente a su Marca de Clase, es decir, el valor medio de los extremos. En este caso, 1,65.

Intervalo

[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)

41871

4222930

ni iN

Mo=1,65

La segunda, más elaborada, nos obliga a ampliar la información de la Tabla Estadística, incorporando los conceptos:- densidad de frecuencia de los intervalos anterior y posterior al intervalo modal (hi-1 y hi+1)- Límite Inferior del Intervalo Modal, (Li-1) - su amplitud, (ci)

Page 7: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)

MEDIDAS DE POSICIÓN

Ampliamos la Tabla Estadística con los valores mencionados anteriormente:

N=30

Intervalo

[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)

41871

4222930

niiNic ih

0,10,10,10,1

0,41,80,70,1

iii

iio c

hhh

LM

11

11

Si, como en este caso, los intervalos de amplitud son constantes, la moda absoluta se puede calcular utilizando frecuencias absolutas en vez de densidades de frecuencia.

6878,11,0429

296,111

11

i

ii

iio c

NNNLM

Page 8: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)

MEDIDAS DE POSICIÓN

Dada la siguiente Tabla Estadística, calculemos la MEDIANA:

N=30

Me=[1,6;1,7)

Pero tenemos que asignar un valor numérico a este intervalo mediano, para que la Mediana sea un número. Vamos a ver dos formas de hacerlo:

La primera, muy sencilla, es asignar al Intervalo el valor numérico correspondiente a su Marca de Clase, es decir, el valor medio de los extremos. En este caso, 1,65.

Intervalo

[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)

41871

4222930

ni iN

La segunda, más elaborada, nos obliga a ampliar la información de la Tabla Estadística, incorporando los conceptos:- Límite Inferior del Intervalo Modal, (Li-1) - su amplitud, (ci)

Partimos igualmente del valor 15230

2

N

Page 9: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)

MEDIDAS DE POSICIÓN

Ampliamos la Tabla Estadística con los valores mencionados anteriormente:

N=30

Intervalo

[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)

41871

4222930

niiNic

0,10,10,10,1 6611,11,0

184156,12 1

1

ii

i

ie cn

NN

LM

ii

iie c

nNNLM

1

12/

Si no quieres aprenderte esta fórmula de memoria, se puede razonar esta manera de calcular la Mediana de una forma más sencilla, sin recurrir a complejas fórmulas….

Page 10: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)

MEDIDAS DE POSICIÓN

N=30

Me=[1,6;1,7)

Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [1,6;1,7) comienza con una frecuencia acumulada 4 y termina con una frecuencia acumulada 22

Intervalo

[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)

41871

4222930

ni iN Partimos igualmente del valor 15

230

2

N

1,6 1,7

Frecuencia acumulada 4

Frecuencia acumulada 22

Frecuencia acumulada 15

x

Dos triángulos equivalentes (Teorema de Tales):

)6,17,1()422(

)6,1()415(

x )1,0()18(

)6,1()11(

x

Me = x = 1,6611

Como ves, el resultado coincide y no hemos tenido que memorizar ninguna fórmula…

Page 11: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 2)

MEDIDAS DE POSICIÓN

Dada la siguiente Tabla Estadística, calculemos la MEDIANA:

N=30

En este caso, existe un valor para el que la Frecuencia Absoluta Acumulada coincide con 15, por lo que el Intervalo mediano se correspondería con la media de los intervalos [1,6;1,7) y [1,7;1,8) ¿Cómo puedo hacer esto?

La primera, muy sencilla, es asignar a cada intervalo, el valor numérico correspondiente a su Marca de Clase, es decir, el valor medio de los extremos, para calcular la semisuma, o media, de ambos valores numéricos.

Intervalo

[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)

ni iN Partimos del valor 15

230

2

N69

132

6152830

Dos Formas:

Marca de clase del intervalo [1,6;1,7) = 1,65

Marca de clase del intervalo [1,7;1,8) = 1,75 70,1275,165,1

eM

Page 12: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 2)

MEDIDAS DE POSICIÓN

Dada la siguiente Tabla Estadística, calculemos la MEDIANA:

N=30

Intervalo

[1,5;1,6)[1,6;1,7)[1,7;1,8)[1,8;1,9)

ni iN

69

132

6152830

La segunda forma, consideramos que la evolución de las frecuencias absolutas dentro de cada uno de los intervalos es constante, por lo que el intervalo [1,6;1,7) comienza con una frecuencia acumulada de 6 y el intervalo [1,7;1,8) termina con una frecuencia acumulada 28

1,6 1,8

Frecuencia acumulada 4

Frecuencia acumulada 28

Frecuencia acumulada 15

1,7

Siguiendo esta argumentación, debemos encontrar el valor para el cuál la Frecuencia Absoluta Acumulada coincida con el valor 15. En este ejemplo, está claro que ese valor es el 1,7, por lo que:

Me = 1,7

Page 13: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

VENTAJAS:

MEDIANA1.Es la medida más representativa en los

casos de variables que solo admitan la escala ordinal.

2.Es sencilla de calcular.3.Tiene fácil interpretación.4.Es insensible a los valores extremos y solo

influyen en ella los valores centrales.

MODA5.Es la única medida de posición central que

puede calcularse en aquellas variables que solo admitan escala nominal.

6.Es sencilla de calcular.7.Tiene fácil interpretación.

INCONVENIENTES:

MEDIANA 1.No participan todos los valores de

la variable sino todas las frecuencias absolutas.

MODA2.Se centra en una sola variable y

no en todas (como la media) o en las frecuencias (mediana).

Page 14: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

MEDIA ARITMÉTICA: la suma de todos los valores de la distribución dividida por el número total de observaciones.

El concepto de media aritmética de una distribución de frecuencias se debe utilizar cuando los datos observados son de naturaleza aditiva (rentas, salarios, beneficios, primas de seguros, etc.) de tal forma que una suma representa el total de los recursos repartidos entre todos los elementos de una distribución.

r

iiinxN

x1

1

Propiedades:

1. Si a la variable estadística xi la sometemos al mismo tiempo a un cambio de origen y escala mediante una transformación lineal (yi = a+bxi) entonces resulta que xbay 2. La suma de las desviaciones de los valores o datos respecto a su media aritmética es cero: 0)(

1

r

iii nxx

3. La suma de los cuadrados de las desviaciones de los valores observados unitarios respecto a una constante arbitraria C es mínima cuando dicha constante coincide con la media aritmética.

4. Si el total de datos se estratifica en L grupos distintos, la media aritmética del total es una media aritmética de las distintas medias de los estratos ponderadas por el número de observaciones que tienen los mismos

MEDIDAS DE POSICIÓN

Page 15: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

MEDIA GEOMÉTRICA de una distribución de frecuencias y la denotaremos por G, como la raíz N-ésima del producto de los N valores observados

El concepto de media geométrica se debe utilizar cuando los valores representan la evolución de una característica con respecto al valor que tiene en un período que llamamos base (números índices, tasas de porcentajes, tipos de interés, etc.). La media geométrica es la medida de posición central más representativa cuando la variable presenta variaciones acumulativas

Propiedad: su logaritmo coincide con la media aritmética de los logaritmos de los valores de la variable.

Nr

i

niixG

1

MEDIA ARMÓNICA se define como:

Supongamos que queramos hallar el promedio de los beneficios por unidad de producción (xi) obtenidos en r empresas de un sector económico determinado. Denominaremos ni a la cantidad de beneficios obtenida por cada una de ellas, así el cociente (ni / xi) será el número de unidades producidas por cada empresa. Llamaremos a su vez, N al total de beneficios obtenidos por el sector.

r

i i

i

xnNH

1

MEDIDAS DE POSICIÓN

Page 16: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

VENTAJAS

MEDIA ARITMÉTICA1.Utiliza todos los valores de la distribución.2.Es calculable en variables cuantitativas.3.Está objetivamente definida y es única.4.Representa el centro de gravedad

MEDIA GEOMÉTRICA5.Utiliza todos los valores de la distribución.6.Está objetivamente definida y es única, si existe.7.Es más representativa que la aritmética en variables que representan evolución.8.Es menos influenciable por los valores extremos.

MEDIA ARMÓNICA9.Utiliza todos los valores de la distribución.10.Está objetivamente definida y es única, si existe.11.Sencillo cálculo.12.Es más representativa en casos de promedios en velocidades, rendimientos y productividades.

MEDIDAS DE POSICIÓN

Page 17: Estadística Descriptiva. Medidas de posicion

Medidas de Posición

www.clasesuniversitarias.com

INCONVENIENTES

MEDIA ARITMÉTICA1.Es muy sensible a valores extremos.

MEDIA GEOMÉTRICA2.No puede calcularse cuando algún valor es cero o cuando el tenemos un número par de datos negativos y el

número total de datos es impar o viceversa.3.Cálculo más complejo.

MEDIA ARMÓNICA4.No puede calcularse cuando algún valor sea cero.5.Si los valores están próximos a 0 la media armónica quedaría sobredimen-sionada.

RELACIÓN ENTRE LAS MEDIAS: xGH

MEDIDAS DE POSICIÓN

Page 18: Estadística Descriptiva. Medidas de posicion

Medidas de Posición no centrales

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

Cuando hablamos de Mediana, hablamos de la posición central respecto a la totalidad de datos ordenados. Por tanto a la hora de obtener esa posición central calculamos el cociente

2N

Sin embargo, podemos analizar posiciones no centrales de la variable estadística. Los cuantiles son aquellos valores de la variable que dividen a la distribución en un número de intervalos, que tienen un número proporcional de frecuencias absolutas. Distinguimos:

CUARTILES: Dividimos los valores en cuatro partes, distinguiendo tres tipos de cuartiles:

41NQ

42

2NQ

43

3NQ

DECILES: Dividimos los valores en diez partes, distinguiendo nueve tipos de deciles:

101ND

102

2ND

103

3ND

109

9ND

PERCENTILES: Dividimos los valores en cien partes, distinguiendo noventa y nueve tipos de percentiles:

1001NP

1002

2NP

1003

3NP

100kNPk

10099

99NP

Page 19: Estadística Descriptiva. Medidas de posicion

Ejemplo

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

75,4 85,2 79 87,3 82 84 86,2 80 78,3 81,3 76,2 83,1 82,9 80 80,6 89,8 83,9 82,4 83,9 78,4

Volvemos al ejemplo del PPT anterior: El peso de los alumnos de una clase son los siguientes:

ni iNIntervalo

N=20

[75,78)[78,81)[81,84)[84,87)[87,90]

26831

28

161920

76,579,582,585,588,5

xiMODA: En este caso es un Intervalo modal, ya que hay un intervalo presenta la mayor Frecuencia Absoluta. Mo=[81;84)

Para elegir un valor numérico representativo del intervalo modal, bien utilizamos su marca de clase, 82,5, bien utilizamos la fórmula más compleja…

ic ih iii

iio c

hhh

LM

11

11Intervalo

[75,78)[78,81)[81,84)[84,87)[87,90]

76,579,582,585,588,5

xi

33333

Como los intervalos de amplitud son constantes, utilizo las frecuencias absolutas

82336381

11

11

i

ii

iio c

NNNLM

624485760

Page 20: Estadística Descriptiva. Medidas de posicion

Ejemplo

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

ni iNIntervalo

N=20

[75,78)[78,81)[81,84)[84,87)[87,90]

26831

28

161920

76,579,582,585,588,5

xiMEDIANA: Utilizamos el valor 10

220

2

N

Me=[81,84)El intervalo mediano será el primero que tenga una Frecuencia Absoluta Acumulada superior a 10, por tanto, será:

Pero tenemos que asignar un valor numérico a este intervalo mediano, para que la Mediana sea un número, bien eligiendo su Marca de Clase, 82,5, bien aplicando la siguiente argumentación:

Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [81,84) comienza con una frecuencia acumulada 8 y termina con una frecuencia acumulada 16

81 84

Frecuencia acumulada 8

Frecuencia acumulada 16

Frecuencia acumulada 10

x

Dos triángulos equivalentes (Teorema de Tales):

)8184()816(

)81()810(

x 38

)81(3

x

Me = 81,75

Page 21: Estadística Descriptiva. Medidas de posicion

Ejemplo

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

ni iNIntervalo

N=20

[75,78)[78,81)[81,84)[84,87)[87,90]

26831

28

161920

76,579,582,585,588,5

xiCUARTIL 3: Utilizamos el valor 15

4203

43

N

Q3=[81,84)El intervalo Q3 será el primero que tenga una Frecuencia Absoluta Acumulada superior a 15, por tanto, será:

Pero tenemos que asignar un valor numérico a este Q3, para que sea un número, bien eligiendo su Marca de Clase, 82,5, bien aplicando la siguiente argumentación:

Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [81,84) comienza con una frecuencia acumulada 8 y termina con una frecuencia acumulada 16

81 84

Frecuencia acumulada 8

Frecuencia acumulada 16

Frecuencia acumulada 15

x

Dos triángulos equivalentes (Teorema de Tales):

)8184()816(

)81()815(

x 38

)81(7

x

Q3 = 83,625

Page 22: Estadística Descriptiva. Medidas de posicion

Ejemplo

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

ni iNIntervalo

N=20

[75,78)[78,81)[81,84)[84,87)[87,90]

26831

28

161920

76,579,582,585,588,5

xiDECIL 3: Utilizamos el valor 6

10203

103

N

D3=[78,81)El intervalo D3 será el primero que tenga una Frecuencia Absoluta Acumulada superior a 16, por tanto, será:

Pero tenemos que asignar un valor numérico a este D3, para que sea un número, bien eligiendo su Marca de Clase, 79,5, bien aplicando la siguiente argumentación:

Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [78,81) comienza con una frecuencia acumulada 2 y termina con una frecuencia acumulada 8

78 81

Frecuencia acumulada 2

Frecuencia acumulada 8

Frecuencia acumulada 6

x

Dos triángulos equivalentes (Teorema de Tales):

)7881()28(

)78()26(

x 36

)78(4

x

D3 = 80

Page 23: Estadística Descriptiva. Medidas de posicion

Ejemplo

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

ni iNIntervalo

N=20

[75,78)[78,81)[81,84)[84,87)[87,90]

26831

28

161920

76,579,582,585,588,5

xiPERCENTIL 96: Utilizamos el valor 2,19

1002096

10096

N

P96=[87,90]El intervalo P96 será el primero que tenga una Frecuencia Absoluta Acumulada superior a 16, por tanto, será:

Pero tenemos que asignar un valor numérico a este P96, para que sea un número, bien eligiendo su Marca de Clase, 88,5, bien aplicando la siguiente argumentación:

Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo [87,90) comienza con una frecuencia acumulada 19 y termina con una frecuencia acumulada 20

87 90

Frecuencia acumulada 19

Frecuencia acumulada 20

Frecuencia acumulada 19,2

x

Dos triángulos equivalentes (Teorema de Tales):

)8790()1920(

)87()192,19(

x 31

)87(2,0

x

P96 = 87,6

Page 24: Estadística Descriptiva. Medidas de posicion

Ejemplo

www.clasesuniversitarias.com MEDIDAS DE POSICIÓN

ni iNIntervalo

N=20

[75,78)[78,81)[81,84)[84,87)[87,90]

26831

28

161920

76,579,582,585,588,5

xiMEDIA ARITMETICA

75,8120

)1*5,883*5,858*5,826*5,792*5,76(1

N

nxx

r

iii

MEDIA GEOMÉTRICA 69,815,885,855,825,795,7620 13862

1

Nr

i

niixG

MEDIA ARMÓNICA 64,81

5,881

5,853

5,828

5,796

5,762

20

1

r

i i

i

xnNH