estadística nº 04 medidas estadisticas
TRANSCRIPT
Parámetros y estadísticosParámetros y estadísticos Parámetro:Parámetro: Es una cantidad Es una cantidad numéricanumérica calculada sobre calculada sobre una población una población
– La altura media de los individuos de un paísLa altura media de los individuos de un país– La idea es resumir toda la información que hay en La idea es resumir toda la información que hay en
la población en unos pocos números (parámetros). la población en unos pocos números (parámetros).
Estadístico:Estadístico: Ídem (cambiar población por muestra) Ídem (cambiar población por muestra)– La altura media de los que estamos en este aula.La altura media de los que estamos en este aula.– Somos una muestra (¿representativa?) de la Somos una muestra (¿representativa?) de la
población.población.– Si un estadístico se usa para aproximar un Si un estadístico se usa para aproximar un
parámetro también se le suele llamar parámetro también se le suele llamar estimadorestimador..– Normalmente nos interesa conocer un parámetro, pero por Normalmente nos interesa conocer un parámetro, pero por
la dificultad que conlleva estudiar a *TODA* la población, la dificultad que conlleva estudiar a *TODA* la población, calculamos un estimador sobre una muestra y calculamos un estimador sobre una muestra y “confiamos” en que sean próximos. Más adelante “confiamos” en que sean próximos. Más adelante veremos como elegir muestras para que el error sea veremos como elegir muestras para que el error sea “confiablemente” pequeño.“confiablemente” pequeño.
Tipos de Mediciones
MEDIA O PROMEDIO
Esta es una de las medidas de tendencia central más usadas. Existen 3 tipos de medias: Media aritmética, Media geométrica, Media harmónica
La media aritmética tal como se define, se puede calcular a partir de:
a) Datos No Agrupados:La media que se obtiene a partir de “n” datos originales Xi se denomina MEDIA ARITMETICA SIMPLE.
Xn
XixM
n
i 1)(
EjemploEjemplo
En una muestra de presupuestos familiares, se ha obtenido la siguiente información respecto al numero de hijos de 21 familias
3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2 3
La variable es el numero de Hijos por familias, es decir Xi= Nº de hijos/ familia, donde los 21 valores de la variable serian X1, X2 ... X21
4421
1
i
Xi N = 21Entonces el valor de la media (Nº de los hijos) será:
095.221
44
21
21
1 i
XiX
Redondeando por se variable discreta, se tiene que el numero de hijos promedio por familia es = 2
b) DATOS AGRUPADOS EN TABLASb) DATOS AGRUPADOS EN TABLAS
Los datos se pueden presentar o agrupar en tablas sin Los datos se pueden presentar o agrupar en tablas sin intervalos y en tablas con intervalos , en ambos casos intervalos y en tablas con intervalos , en ambos casos se usa la Media Aritmética Pondera.se usa la Media Aritmética Pondera.
n
nXM(y)
m
1iii
X
Tablas sin Intervalo (Ejemplo)Tablas sin Intervalo (Ejemplo)
Nº hijosXi
Nº de familias
Fi
Xi*ni
0 1 0
1 5 5
2 7 14
3 7 21
4 1 4
TOTAL 21 44
095.22144
n
nXM(y)
m
1iii
X
Hijos por familia
TABLAS CON INTERVALOSTABLAS CON INTERVALOS
El calculo de la media es a partir del uso de la “marca El calculo de la media es a partir del uso de la “marca de clase” Yde clase” Yi i para representar el valor de cada elemento para representar el valor de cada elemento incluido en su respectivo intervalo.incluido en su respectivo intervalo.
Nº de cromosomas
Marca de
clase
Nº de herbáce
as
Nº de cromosomas ponderadas
(Y´i-1 - Y´i] Xi nI Xini
23 26 24,5 5 122,5
26 29 27,5 40 1100
29 32 30,5 27 823,5
32 35 33,5 11 368,5
35 38 36,5 3 109,5
38 41 39,5 3 118,5
41 44 42,5 1 42,5
total 90 2685
8.2990
00.2685n
nXM(y)
m
1iii
X
crom.
Observación:Observación:
Para un mismo conjunto de datos se Para un mismo conjunto de datos se obtiene valores ligeramente diferentes obtiene valores ligeramente diferentes para su media; hay que tener presente para su media; hay que tener presente que toda agrupación de intervalos siempre que toda agrupación de intervalos siempre produce sesgos, y ésta es una produce sesgos, y ésta es una característica del trabajo estadístico. Los característica del trabajo estadístico. Los estadígrafos no son valores exactos, pero estadígrafos no son valores exactos, pero si son representativos de una realidad.si son representativos de una realidad.
MEDIANA (Me)
Para un conjunto de datos ORDENADOS de mayor a menor, la mitad de los valores serán menores o iguales a la MEDIANA mientras que la mitad restante será mayor o igual a la MEDIANA
X mín X máxMe
50% 50%
La mediana divide una distribución de frecuencia en 2 mitades
El ritmo cardíaco de 9 pacientes asmáticos en estado de paro respiratorio : 167-125-120-150-150-40-136-120-150
Para datos no agrupados
40-120-120-125-136-150-150-150-167
El ritmo cardíaco de 10 pacientes asmáticos en estado de paro respiratorio : 167-150-125-120-150-150-40-136-120-150
40-120-120-125-136-150-150-150-150-167
1432
1 nn xxMe
Nº de hijos ni Ni
0 5 5
1 8
2 10
3 12
4 15
5 13
6 10
7 7
80
El número de hijos en 80 familias se distribuye de la siguiente forma:
402
80
2
N
Me = 4 hijos
PARA DATOS AGRUPADOS
Es aquel valor de la variable cuya frecuencia absoluta acumulada es inmediatamente mayor a la mitad de las observaciones
Para calcular la mediana se usa la siguiente fórmula:
ii
i
i an
NN
LMe *2 1
1
Donde:
Li-1 = Límite inferior del intervalo que contiene a la mediana
Fi-1 = Frecuencia absoluta acumulada del intervalo anterior al que contiene a la mediana
ni = Frecuencia absoluta del intervalo que contiene a la mediana
ai = Amplitud del intervalo que contiene a la mediana
PARA DATOS AGRUPADOS EN INTERVALOS
Ejemplo ...
Intervalo f
29.5 – 34.5 8
34.5 – 39.5 14
39.5 – 44.5 20
44.5 – 49.5 12
49.5 – 54.5 4
ii
i
i an
NN
LMe *2 1
1
25.415*
20
222
58
5.39
Me
F
8
22
42
54
58
MODA
Se refiere al valor de la variable que más se repite en una distribución de frecuencia, o el valor que está representado por el mayor número de observaciones
En un gráfico de barra o histograma la moda corresponde al valor en que la distribución alcanza el máximo
MODA PARA DATOS AGRUPADOS
Nº de hijos ni
0 5
1 8
2 10
3 12
4 15
5 13
6 10
7 7
80
La Moda son 4 hijos
190185180175170165160155150
10
5
0
Altura (cm)
Fre
cuen
cia
Si la distribución es un histograma existe la Intervalo (CLASE) MODAL
la MODA es la marca de clase del intervalo que contiene la mayor frecuencia
Dependiendo del número de modas que tenga la distribución de frecuencias se hablará de una distribución ...
Un Máximo = Unimodal
Dos Máximos = Bimodal
Más de 2 máximos = Multimodal
Para calcular la moda se usa la siguiente fórmula:
iii
ii a
nnn
LMd *11
11
Donde:
Li-1 = Límite inferior del intervalo que contiene a la mediana
ni = Frecuencia absoluta del intervalo que contiene a la moda
ni+1 = Frecuencia absoluta inmediata superior
ni-1 = Frecuencia absoluta inmediata inferior
ai = Amplitud del intervalo que contiene a la mediana
A
Agrupando en 6 clases
Intervalos Frecuencias
13.5 - 16.5 2
16.5 - 19.5 9
19.5 - 22.5 13
22.5 - 25.5 9
25.5 - 28.5 9
28.5 - 31.5 1
TOTAL 43
B
Agrupando en 5 clases
Intervalos Frecuencias
12.5 - 16.5 2
16.5 - 20.5 13
20.5 - 24.5 16
24.5 - 28.5 11
28.5 - 32.5 1
TOTAL 43
Clase Modal = 19.5-22.5 Clase Modal = 20.5-24.5
Moda = ? Moda = ?
En el caso de frecuencias agrupadas, la MODA varía según la forma de agrupar
DISTRIBUCIONES SIMETRICAS - DISTRIBUCIONES SIMETRICAS - ASIMETRICASASIMETRICAS
Si Md<Me<Y : Asmétrica Positiva
DISTRIBUCIONES SIMETRICAS - DISTRIBUCIONES SIMETRICAS - ASIMETRICASASIMETRICAS
Si Y<Me<Md : Asimétrica Negativa
LOS CUANTILESLOS CUANTILES
Son valores que dividen a la distribución en partes Son valores que dividen a la distribución en partes iguales, es decir, en intervalos que comprenden el iguales, es decir, en intervalos que comprenden el mismo número de observaciones. Los que más se mismo número de observaciones. Los que más se
utilizan son: los CUARTILES, DECILES Y utilizan son: los CUARTILES, DECILES Y PERCENTILES.PERCENTILES.
Los Los CUARTILES CUARTILES son 3 valores que dividen a la distribución en son 3 valores que dividen a la distribución en 4 partes iguales, cada una de las cuales contienen el 25% de 4 partes iguales, cada una de las cuales contienen el 25% de las observaciones.las observaciones.
Los Los DECILES (PERCENTILES)DECILES (PERCENTILES) son 9 (99) valores que dividen son 9 (99) valores que dividen a la distribución en 10 (100) partes iguales, cada una de las a la distribución en 10 (100) partes iguales, cada una de las cuales contiene el 10% (1%) de las observaciones.cuales contiene el 10% (1%) de las observaciones.
MEDIDAS DE POSICIÓNMEDIDAS DE POSICIÓN
LOS CUANTILESLOS CUANTILES
MEDIDAS DE POSICIÓNMEDIDAS DE POSICIÓN
100
110
120
150140130 1er cuartil1er cuartil
3er cuartil3er cuartil
MedianaMediana
MEDIDAS DE DISPERSIÓN
ABSOLUTAS
RELATIVAS
RECORRIDO (RANGO)
VARIANZA
DESVIACIÓN ESTÁNDAR
COEFICIENTE DE VARIACIÓN
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
Recorrido (Rango)
Cuanto mayor es el recorrido mayor es la dispersión de la distribución de la variable en estudio
Varianza
Varianza para datos no agrupadosVarianza para datos no agrupados
N
xxS
n
ii
1
2
2
)(
Varianza para datos agrupadosVarianza para datos agrupados
N
nxxS
n
iii
1
2
2
)(
Desviación Estándar
Representa la variabilidad existente en un conjunto de datos, así podemos Tener dos muestras que tienen la misma media, pero que tienen diferenteDesviación Estándar
2
1
)(1
n
ii xx
nS
El Coeficiente de Variación
Nos permite la comparación entre distintas variables y poblaciones.Mide el grado de homogeneidad o heterogeneidad en una o mas poblaciones.Su principal característica es estar desprovisto de unidades.El valor se puede expresar en términos porcentuales
x
SCV
MEDIDAS DE FORMAMEDIDAS DE FORMA
Asimetría o SesgoAsimetría o Sesgo
Una distribución es simétrica si la Una distribución es simétrica si la mitad izquierda de su distribución mitad izquierda de su distribución es la imagen especular de su mitad es la imagen especular de su mitad derecha.derecha.
En las distribuciones simétricas En las distribuciones simétricas media y mediana coinciden. Si sólo media y mediana coinciden. Si sólo hay una moda también coincidehay una moda también coincide
La asimetría es positiva o negativa La asimetría es positiva o negativa en función de a qué lado se en función de a qué lado se encuentra la cola de la distribución.encuentra la cola de la distribución.
La media tiende a desplazarse La media tiende a desplazarse hacia las valores extremos (colas).hacia las valores extremos (colas).
Las discrepancias entre las Las discrepancias entre las medidas de centralización son medidas de centralización son indicación de asimetría.indicación de asimetría.
Coeficiente de asimetría Coeficiente de asimetría
Apuntamiento o curtosisApuntamiento o curtosis
Leptocúrtica
138
108
102
97
92
87
82
77
72
67
62
57
52
47
42
37
32
27
16
3
Fre
cuen
cia
400
300
200
100
0
Platicúrtica
8481787572696663605754514845
Fre
cuen
cia
160
140
120
100
80
60
40
Mesocúrtica
99
93
89
85
81
77
73
69
65
61
57
53
49
45
41
37
32
27
Fre
cuen
cia
300
200
100
0
Los gráficos que veis poseen la misma media y desviación típica, pero con diferente grado de apuntamiento.En el curso serán de especial interés las mesocúrticas y simétricas (parecidas a la normal).
La La curtosiscurtosis nos indica el grado de apuntamiento nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana. Es adimensional.distribución normal o gaussiana. Es adimensional.
PlaticúrticaPlaticúrtica: curtosis < 0: curtosis < 0
MesocúrticaMesocúrtica: curtosis = 0: curtosis = 0
LeptocúrticaLeptocúrtica: curtosis > 0: curtosis > 0
ApuntamientoApuntamiento