estadística nº 04 medidas estadisticas

34
Parámetros y estadísticos Parámetros y estadísticos Parámetro: Parámetro: Es una cantidad Es una cantidad numérica numérica calculada calculada sobre una población sobre una población La altura media de los individuos de un país La altura media de los individuos de un país La idea es resumir toda la información que hay La idea es resumir toda la información que hay en la población en unos pocos números en la población en unos pocos números (parámetros). (parámetros). Estadístico: Estadístico: Ídem (cambiar población por muestra) Ídem (cambiar población por muestra) La altura media de los que estamos en este La altura media de los que estamos en este aula. aula. Somos una muestra (¿representativa?) de la Somos una muestra (¿representativa?) de la población. población. Si un estadístico se usa para aproximar un Si un estadístico se usa para aproximar un parámetro también se le suele llamar parámetro también se le suele llamar estimador estimador. Normalmente nos interesa conocer un parámetro, pero Normalmente nos interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a *TODA* la por la dificultad que conlleva estudiar a *TODA* la población, calculamos un estimador sobre una muestra población, calculamos un estimador sobre una muestra y “confiamos” en que sean próximos. Más adelante y “confiamos” en que sean próximos. Más adelante veremos como elegir muestras para que el error sea veremos como elegir muestras para que el error sea “confiablemente” pequeño. “confiablemente” pequeño.

Upload: franco-antonio-irpanmoka-nunez

Post on 30-Jun-2015

7.783 views

Category:

Business


1 download

TRANSCRIPT

Page 1: EstadíStica Nº 04 Medidas Estadisticas

Parámetros y estadísticosParámetros y estadísticos Parámetro:Parámetro: Es una cantidad Es una cantidad numéricanumérica calculada sobre calculada sobre una población una población

– La altura media de los individuos de un paísLa altura media de los individuos de un país– La idea es resumir toda la información que hay en La idea es resumir toda la información que hay en

la población en unos pocos números (parámetros). la población en unos pocos números (parámetros).

Estadístico:Estadístico: Ídem (cambiar población por muestra) Ídem (cambiar población por muestra)– La altura media de los que estamos en este aula.La altura media de los que estamos en este aula.– Somos una muestra (¿representativa?) de la Somos una muestra (¿representativa?) de la

población.población.– Si un estadístico se usa para aproximar un Si un estadístico se usa para aproximar un

parámetro también se le suele llamar parámetro también se le suele llamar estimadorestimador..– Normalmente nos interesa conocer un parámetro, pero por Normalmente nos interesa conocer un parámetro, pero por

la dificultad que conlleva estudiar a *TODA* la población, la dificultad que conlleva estudiar a *TODA* la población, calculamos un estimador sobre una muestra y calculamos un estimador sobre una muestra y “confiamos” en que sean próximos. Más adelante “confiamos” en que sean próximos. Más adelante veremos como elegir muestras para que el error sea veremos como elegir muestras para que el error sea “confiablemente” pequeño.“confiablemente” pequeño.

Page 2: EstadíStica Nº 04 Medidas Estadisticas

Tipos de Mediciones

Page 3: EstadíStica Nº 04 Medidas Estadisticas
Page 4: EstadíStica Nº 04 Medidas Estadisticas

MEDIA O PROMEDIO

Esta es una de las medidas de tendencia central más usadas. Existen 3 tipos de medias: Media aritmética, Media geométrica, Media harmónica

La media aritmética tal como se define, se puede calcular a partir de:

a) Datos No Agrupados:La media que se obtiene a partir de “n” datos originales Xi se denomina MEDIA ARITMETICA SIMPLE.

Xn

XixM

n

i 1)(

Page 5: EstadíStica Nº 04 Medidas Estadisticas

EjemploEjemplo

En una muestra de presupuestos familiares, se ha obtenido la siguiente información respecto al numero de hijos de 21 familias

3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2 3

La variable es el numero de Hijos por familias, es decir Xi= Nº de hijos/ familia, donde los 21 valores de la variable serian X1, X2 ... X21

4421

1

i

Xi N = 21Entonces el valor de la media (Nº de los hijos) será:

095.221

44

21

21

1 i

XiX

Redondeando por se variable discreta, se tiene que el numero de hijos promedio por familia es = 2

Page 6: EstadíStica Nº 04 Medidas Estadisticas

b) DATOS AGRUPADOS EN TABLASb) DATOS AGRUPADOS EN TABLAS

Los datos se pueden presentar o agrupar en tablas sin Los datos se pueden presentar o agrupar en tablas sin intervalos y en tablas con intervalos , en ambos casos intervalos y en tablas con intervalos , en ambos casos se usa la Media Aritmética Pondera.se usa la Media Aritmética Pondera.

n

nXM(y)

m

1iii

X

Tablas sin Intervalo (Ejemplo)Tablas sin Intervalo (Ejemplo)

Nº hijosXi

Nº de familias

Fi

Xi*ni

0 1 0

1 5 5

2 7 14

3 7 21

4 1 4

TOTAL 21 44

095.22144

n

nXM(y)

m

1iii

X

Hijos por familia

Page 7: EstadíStica Nº 04 Medidas Estadisticas

TABLAS CON INTERVALOSTABLAS CON INTERVALOS

El calculo de la media es a partir del uso de la “marca El calculo de la media es a partir del uso de la “marca de clase” Yde clase” Yi i para representar el valor de cada elemento para representar el valor de cada elemento incluido en su respectivo intervalo.incluido en su respectivo intervalo.

Nº de cromosomas

Marca de

clase

Nº de herbáce

as

Nº de cromosomas ponderadas

(Y´i-1 - Y´i] Xi nI Xini

23 26 24,5 5 122,5

26 29 27,5 40 1100

29 32 30,5 27 823,5

32 35 33,5 11 368,5

35 38 36,5 3 109,5

38 41 39,5 3 118,5

41 44 42,5 1 42,5

total   90 2685

8.2990

00.2685n

nXM(y)

m

1iii

X

crom.

Page 8: EstadíStica Nº 04 Medidas Estadisticas

Observación:Observación:

Para un mismo conjunto de datos se Para un mismo conjunto de datos se obtiene valores ligeramente diferentes obtiene valores ligeramente diferentes para su media; hay que tener presente para su media; hay que tener presente que toda agrupación de intervalos siempre que toda agrupación de intervalos siempre produce sesgos, y ésta es una produce sesgos, y ésta es una característica del trabajo estadístico. Los característica del trabajo estadístico. Los estadígrafos no son valores exactos, pero estadígrafos no son valores exactos, pero si son representativos de una realidad.si son representativos de una realidad.

Page 9: EstadíStica Nº 04 Medidas Estadisticas

MEDIANA (Me)

Para un conjunto de datos ORDENADOS de mayor a menor, la mitad de los valores serán menores o iguales a la MEDIANA mientras que la mitad restante será mayor o igual a la MEDIANA

X mín X máxMe

50% 50%

La mediana divide una distribución de frecuencia en 2 mitades

Page 10: EstadíStica Nº 04 Medidas Estadisticas

El ritmo cardíaco de 9 pacientes asmáticos en estado de paro respiratorio : 167-125-120-150-150-40-136-120-150

Para datos no agrupados

40-120-120-125-136-150-150-150-167

El ritmo cardíaco de 10 pacientes asmáticos en estado de paro respiratorio : 167-150-125-120-150-150-40-136-120-150

40-120-120-125-136-150-150-150-150-167

1432

1 nn xxMe

Page 11: EstadíStica Nº 04 Medidas Estadisticas

Nº de hijos ni Ni

0 5 5

1 8

2 10

3 12

4 15

5 13

6 10

7 7

80

El número de hijos en 80 familias se distribuye de la siguiente forma:

402

80

2

N

Me = 4 hijos

PARA DATOS AGRUPADOS

Es aquel valor de la variable cuya frecuencia absoluta acumulada es inmediatamente mayor a la mitad de las observaciones

Page 12: EstadíStica Nº 04 Medidas Estadisticas

Para calcular la mediana se usa la siguiente fórmula:

ii

i

i an

NN

LMe *2 1

1

Donde:

Li-1 = Límite inferior del intervalo que contiene a la mediana

Fi-1 = Frecuencia absoluta acumulada del intervalo anterior al que contiene a la mediana

ni = Frecuencia absoluta del intervalo que contiene a la mediana

ai = Amplitud del intervalo que contiene a la mediana

PARA DATOS AGRUPADOS EN INTERVALOS

Page 13: EstadíStica Nº 04 Medidas Estadisticas

Ejemplo ...

Intervalo f

29.5 – 34.5 8

34.5 – 39.5 14

39.5 – 44.5 20

44.5 – 49.5 12

49.5 – 54.5 4

ii

i

i an

NN

LMe *2 1

1

25.415*

20

222

58

5.39

Me

F

8

22

42

54

58

Page 14: EstadíStica Nº 04 Medidas Estadisticas

MODA

Se refiere al valor de la variable que más se repite en una distribución de frecuencia, o el valor que está representado por el mayor número de observaciones

En un gráfico de barra o histograma la moda corresponde al valor en que la distribución alcanza el máximo

Page 15: EstadíStica Nº 04 Medidas Estadisticas

MODA PARA DATOS AGRUPADOS

Nº de hijos ni

0 5

1 8

2 10

3 12

4 15

5 13

6 10

7 7

80

La Moda son 4 hijos

Page 16: EstadíStica Nº 04 Medidas Estadisticas

190185180175170165160155150

10

5

0

Altura (cm)

Fre

cuen

cia

Si la distribución es un histograma existe la Intervalo (CLASE) MODAL

la MODA es la marca de clase del intervalo que contiene la mayor frecuencia

Page 17: EstadíStica Nº 04 Medidas Estadisticas

Dependiendo del número de modas que tenga la distribución de frecuencias se hablará de una distribución ...

Un Máximo = Unimodal

Dos Máximos = Bimodal

Más de 2 máximos = Multimodal

Page 18: EstadíStica Nº 04 Medidas Estadisticas

Para calcular la moda se usa la siguiente fórmula:

iii

ii a

nnn

LMd *11

11

Donde:

Li-1 = Límite inferior del intervalo que contiene a la mediana

ni = Frecuencia absoluta del intervalo que contiene a la moda

ni+1 = Frecuencia absoluta inmediata superior

ni-1 = Frecuencia absoluta inmediata inferior

ai = Amplitud del intervalo que contiene a la mediana

Page 19: EstadíStica Nº 04 Medidas Estadisticas

A

Agrupando en 6 clases

Intervalos Frecuencias

13.5 - 16.5 2

16.5 - 19.5 9

19.5 - 22.5 13

22.5 - 25.5 9

25.5 - 28.5 9

28.5 - 31.5 1

TOTAL 43

B

Agrupando en 5 clases

Intervalos Frecuencias

12.5 - 16.5 2

16.5 - 20.5 13

20.5 - 24.5 16

24.5 - 28.5 11

28.5 - 32.5 1

TOTAL 43

Clase Modal = 19.5-22.5 Clase Modal = 20.5-24.5

Moda = ? Moda = ?

En el caso de frecuencias agrupadas, la MODA varía según la forma de agrupar

Page 20: EstadíStica Nº 04 Medidas Estadisticas

DISTRIBUCIONES SIMETRICAS - DISTRIBUCIONES SIMETRICAS - ASIMETRICASASIMETRICAS

Si Md<Me<Y : Asmétrica Positiva

Page 21: EstadíStica Nº 04 Medidas Estadisticas

DISTRIBUCIONES SIMETRICAS - DISTRIBUCIONES SIMETRICAS - ASIMETRICASASIMETRICAS

Si Y<Me<Md : Asimétrica Negativa

Page 22: EstadíStica Nº 04 Medidas Estadisticas

LOS CUANTILESLOS CUANTILES

Son valores que dividen a la distribución en partes Son valores que dividen a la distribución en partes iguales, es decir, en intervalos que comprenden el iguales, es decir, en intervalos que comprenden el mismo número de observaciones. Los que más se mismo número de observaciones. Los que más se

utilizan son: los CUARTILES, DECILES Y utilizan son: los CUARTILES, DECILES Y PERCENTILES.PERCENTILES.

Los Los CUARTILES CUARTILES son 3 valores que dividen a la distribución en son 3 valores que dividen a la distribución en 4 partes iguales, cada una de las cuales contienen el 25% de 4 partes iguales, cada una de las cuales contienen el 25% de las observaciones.las observaciones.

Los Los DECILES (PERCENTILES)DECILES (PERCENTILES) son 9 (99) valores que dividen son 9 (99) valores que dividen a la distribución en 10 (100) partes iguales, cada una de las a la distribución en 10 (100) partes iguales, cada una de las cuales contiene el 10% (1%) de las observaciones.cuales contiene el 10% (1%) de las observaciones.

MEDIDAS DE POSICIÓNMEDIDAS DE POSICIÓN

Page 23: EstadíStica Nº 04 Medidas Estadisticas

LOS CUANTILESLOS CUANTILES

MEDIDAS DE POSICIÓNMEDIDAS DE POSICIÓN

Page 24: EstadíStica Nº 04 Medidas Estadisticas

100

110

120

150140130 1er cuartil1er cuartil

3er cuartil3er cuartil

MedianaMediana

Page 25: EstadíStica Nº 04 Medidas Estadisticas

MEDIDAS DE DISPERSIÓN

ABSOLUTAS

RELATIVAS

RECORRIDO (RANGO)

VARIANZA

DESVIACIÓN ESTÁNDAR

COEFICIENTE DE VARIACIÓN

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN

Page 26: EstadíStica Nº 04 Medidas Estadisticas

Recorrido (Rango)

Cuanto mayor es el recorrido mayor es la dispersión de la distribución de la variable en estudio

Page 27: EstadíStica Nº 04 Medidas Estadisticas

Varianza

Varianza para datos no agrupadosVarianza para datos no agrupados

N

xxS

n

ii

1

2

2

)(

Varianza para datos agrupadosVarianza para datos agrupados

N

nxxS

n

iii

1

2

2

)(

Page 28: EstadíStica Nº 04 Medidas Estadisticas

Desviación Estándar

Representa la variabilidad existente en un conjunto de datos, así podemos Tener dos muestras que tienen la misma media, pero que tienen diferenteDesviación Estándar

2

1

)(1

n

ii xx

nS

Page 29: EstadíStica Nº 04 Medidas Estadisticas

El Coeficiente de Variación

Nos permite la comparación entre distintas variables y poblaciones.Mide el grado de homogeneidad o heterogeneidad en una o mas poblaciones.Su principal característica es estar desprovisto de unidades.El valor se puede expresar en términos porcentuales

x

SCV

Page 30: EstadíStica Nº 04 Medidas Estadisticas

MEDIDAS DE FORMAMEDIDAS DE FORMA

Page 31: EstadíStica Nº 04 Medidas Estadisticas

Asimetría o SesgoAsimetría o Sesgo

Una distribución es simétrica si la Una distribución es simétrica si la mitad izquierda de su distribución mitad izquierda de su distribución es la imagen especular de su mitad es la imagen especular de su mitad derecha.derecha.

En las distribuciones simétricas En las distribuciones simétricas media y mediana coinciden. Si sólo media y mediana coinciden. Si sólo hay una moda también coincidehay una moda también coincide

La asimetría es positiva o negativa La asimetría es positiva o negativa en función de a qué lado se en función de a qué lado se encuentra la cola de la distribución.encuentra la cola de la distribución.

La media tiende a desplazarse La media tiende a desplazarse hacia las valores extremos (colas).hacia las valores extremos (colas).

Las discrepancias entre las Las discrepancias entre las medidas de centralización son medidas de centralización son indicación de asimetría.indicación de asimetría.

Page 32: EstadíStica Nº 04 Medidas Estadisticas

Coeficiente de asimetría Coeficiente de asimetría

Page 33: EstadíStica Nº 04 Medidas Estadisticas

Apuntamiento o curtosisApuntamiento o curtosis

Leptocúrtica

138

108

102

97

92

87

82

77

72

67

62

57

52

47

42

37

32

27

16

3

Fre

cuen

cia

400

300

200

100

0

Platicúrtica

8481787572696663605754514845

Fre

cuen

cia

160

140

120

100

80

60

40

Mesocúrtica

99

93

89

85

81

77

73

69

65

61

57

53

49

45

41

37

32

27

Fre

cuen

cia

300

200

100

0

Los gráficos que veis poseen la misma media y desviación típica, pero con diferente grado de apuntamiento.En el curso serán de especial interés las mesocúrticas y simétricas (parecidas a la normal).

La La curtosiscurtosis nos indica el grado de apuntamiento nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana. Es adimensional.distribución normal o gaussiana. Es adimensional.

PlaticúrticaPlaticúrtica: curtosis < 0: curtosis < 0

MesocúrticaMesocúrtica: curtosis = 0: curtosis = 0

LeptocúrticaLeptocúrtica: curtosis > 0: curtosis > 0

Page 34: EstadíStica Nº 04 Medidas Estadisticas

ApuntamientoApuntamiento