estadística 1
TRANSCRIPT
Estadística
Medidas de tendencia central
Dr. Carlos Cáceres Martínez CIMACO UABCS
http://cimacoestadistica.blogspot.com
2
MEDIDAS DE TENDENCIA CENTRAL
Las características globales de una población o muestra de una variable cuantitativa pueden resumirse mediante una serie de cantidades numéricas representativas llamadas parámetros o estadísticos, según sea el caso de una población o una muestra. Entre ellas, las medidas de tendencia central, como la media aritmética, la moda o la mediana, ayudan a conocer de forma aproximada el comportamiento de una distribución estadística.
Se llama medidas de tendencia central o centralización a unos valores numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores de una variable estadística.
Las tres medidas más usuales de tendencia central son:
La media Aritmética La Mediana El Modo o Moda
3
Las medidas de tendencia central son parámetros o estadísticos representativos de distribuciones de frecuencia como las que
ilustra la imagen.
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMETICA
Media Aritmética:
Se define como el “centro de gravedad” de la distribución estadística de una variable.
Sea X una variable cuantitativa donde X1, X2, ….. Xk; y f1, f2,….. fk son sus respectivos valores y frecuencias, entonces a la media aritmética de X la denotaremos por si se trata de una muestra ó µx si analizamos la población, luego:
X
n
fxfxf
n
fxX kk
k
iii
....x
22111
N
fxfxf
N
fxkk
k
iii
x
....x
22111
Distribución del Tiempo de Primeros Pasos
024681012141618
7 9 11 13 15 17
Número de Meses
Can
tid
ad
de N
iño
s
5
CALCULO DE LA MEDIA ARITMETICA
Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDNA):
Ejemplo: Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por primera vez:
meses 2,1250
610....x 22111
n
fxfxf
n
fxX kk
k
iii
Luego:
Meses (x) Niños (f) xf9 1 910 4 4011 9 9912 16 19213 11 14314 8 11215 1 15
610
Ubicación de la Media Aritmétic
a
12,2
6
CALCULO DE LA MEDIA ARITMETICA
Caso de una Distribución de Frecuencia de Datos Agrupados:
Ejemplo: Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:
cms 63,18623
5,4292 1
n
fxX
k
iii
Luego:
Altura (cms)Nº de
jugadores x xf[170, 175) 1 172,5 172,5[175, 180) 3 177,5 532,5[180, 185) 4 182,5 730[185, 190) 8 187,5 1500[190, 195) 5 192,5 962,5[195, 2.00] 2 197,5 395
23 4292,5
172,5 177,5 182,5 187,5 192,5 197,5
1
3
2
5
4
6
8
7
X
No. Ju
gad
ore
s
Estatura (cms)
7
PROPIEDADES DE LA MEDIA ARITMETICA
1 . La suma de las diferencias de la variable con respecto a la media es nula, es decir:
0)( 1
k
iii fXx
2 . La suma de los desvíos de los valores de una variable respecto a la media aritmética de estos es un mínimo, es decir:
XCfCxfXxk
iii
k
iii
)()( 1
2
1
2
3 . Si sumamos o restamos una constante a todos los valores de una variable manteniendo fijas las frecuencias entonces la media de la nueva variable así generada será igual a la media de la variable origina más o menos la constante, según sea el caso:
8
PROPIEDADES DE LA MEDIA ARITMETICA
Sean X1, X2, ….. Xk y f1, f2,….. fk los valores de la variable X y sus respectivas frecuencias y cuya media es , entonces si sumamos o restamos una constante C a cada valor de X para así generar la variable Y, es decir: Y1= X1 ± C ; Y2= X2 ± C ; ……Yk,=Xk ± C, manteniendo Y las mismas frecuencias que X entonces:
4 . Si multiplicamos o dividimos por una constante a todos los valores de una variable manteniendo fijas las frecuencias entonces la media de la nueva variable así generada será igual a la media de la variable original multiplicada o dividida por la constante, según sea el caso:
CXY
CXY
CXY
/
X
9
PROPIEDADES DE LA MEDIA ARITMETICA
5. La media aritmética es un operador lineal, es decir:
Si Y = aX + b; donde a, b son constantes entonces:
6. Dados r muestras de la misma variable cada una de tamaño n1, n2, ..., nr observaciones y siendo , , ..., las respectivas medias de cada uno de ellas; entonces la media aritmética de la unión de todas las muestras es:
r
1ii
1 nn donde ;n
nXX
r
iii
bXaY
1X 2X rX
r
r
iii
wwwnnnn
nXX r2211
rr
22
11
rr22111 X..XXn
X..n
Xn
Xn
nX..nXnX
A la expresión demarcada se le conoce como media ponderada
10
PROPIEDADES DE LA MEDIA ARITMETICA
7. Dados r muestras de la misma variable cada una de igual tamaño n observaciones y siendo , , ..., las respectivas medias de cada una de ellas; entonces la media aritmética de la unión de todas las muestras es:
r
XX
r
i
i 1
1X 2X rX
Es la media simple de las medias de las muestras
11
OBSERVACIONES SOBRE LA MEDIA ARITMETICA
1. La media se puede hallar sólo para variables cuantitativas2. La media es independiente de las amplitudes de los intervalos de
una DFDA3. La media es muy sensible a las puntuaciones extremas. P.ej. Si
tenemos una distribución con los siguientes pesos:65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralización poco
representativa de la distribución
4. La media no se puede calcular en una DFDA si hay un intervalo o clase con una amplitud indeterminada, es decir, de rango abierto
5. La media es un estadístico “suficiente” porque usa toda la información de la muestra
ValoresExtremos
La Mediapierde
Representatividad
X
12
MEDIANA
Mediana
Se define como el valor de la variable que divide la distribución en dos parte iguales del 50%, es decir, el 50% de los datos es menor o igual a él y el restante 50% el mayor o igual a él. Se denota Me
El 50%de los
primeros datos
de la distribución
son≤ Me
El restante 50%
de losdatos de
distribución son
≥ Me
Me
13
CALCULO DE LA MEDIANA
Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDNA):
Ejemplo: Caso del pediatraProcedimiento: 1. Calcular n/22. Si Fj tal que Fj= n/2 Me = Xj de
lo contrario, Me será aquel valor de X cuya frecuencia acumulada sea mayor inmediato a n/2
Meses (x) Niños (f) F
9 1 110 4 511 9 1412 16 3013 11 4114 8 4915 1 50
50
En este caso n/2 = 50/2 =25 y como no existe una frecuencia acumulada igual a 25 y la frecuencia acumulada mayor inmediata a n/2 es 30 entonces:
Me = X4 = 12 mesesVemos que efectivamente hay 25 (50%) valores ≤ a 12 y 25 (50% ≥
a 12
14
CALCULO DE LA MEDIANA
Si organizamos la serie de datos anterior denotando la posición que ocupa cada observación tenemos:X 9, 10, 10, 10, 10, 11, 11, 11, ….. 11, 12, 12,……12,12,……50Posición: 1ª, 2ª, 3ª, 4ª, 5ª, 6ª, 7ª, 8ª,……,14ª, 15ª,16ª,……25ª,26ª,..50ª
9 10 11 12 13 14 15
2
6
4
10
8
12
16
14
X
No.N
iños
Me
Meses
Procedimiento: 1. Calcular n/22. Si Fj tal que Fj= n/2 Me=
Lme, donde Lme es el limite superior de la clase correspondiente a la Fj= n/2; de lo contrario:
15
CALCULO DE LA MEDIANA
Caso de una Distribución de Frecuencia de Datos Agrupados (DFDA):
Ejemplo: Caso de la estatura de los jugadores de baloncesto
Altura (cms)Nº de
jugadores x F[170, 175) 1 172,5 1[175, 180) 3 177,5 4[180, 185) 4 182,5 8[185, 190) 8 187,5 16[190, 195) 5 192,5 21[195, 2.00] 2 197,5 23
23 meme
me
mee cf
Fn
lM
12
16
CALCULO DE LA MEDIANA
Donde:lme = limite inferior de clase que contiene a la Me
Fme-1 = Frecuencia acumulada hasta la clase inmediata anterior a la clase que contiene a la Me
fme = la frecuencia de la clase que contiene a la Me ; y
Cme = El rango de la clase que contiene a la Me
Nota: La clase o intervalo que contiene a la Me es aquella correspondiente a la frecuencia acumulada inmediata mayor a n/2
17
CALCULO DE LA MEDIANA
En el ejemplo:n/2 = 23/2 = 11,5 luego no existe frecuencia acumulada igual a n/2 por lo tanto buscamos la frecuencia acumulada inmediata superior a N/2 que resulta la F4 = 16, luego la clase que contiene a la Me es la cuarta clase entonces:
cmscf
Fn
lM meme
me
mee 1875,18758
85,111852 1
172,5 177,5 182,5 187,5 192,5 197,5
1
3
2
5
4
6
8
7
X
No. Ju
gad
ore
s
Estatura (cms)
18
CALCULO DE LA MEDIANA
meme
me
mee cf
Fn
lM
12
l1 L1 L2 ………. Lme-1 Lme ……………
F1
F2
Fme-1
Fme
::
::
n
n/2
Me
AB
C
E
D
Analizando trigonométricamente los triángulos rectángulos ABC y ADE se genera la formula de interpolación de la Mediana:
19
OBSERVACIONES ACERCA DE LA MEDIANA
1. La mediana no esta influenciada por los valores extremos ya que su determinación se apoya en los valores centrales de la variable
2. Su uso es apropiado ante distribuciones asimétricas3. No es un estadístico “suficiente” ya que no aprovecha toda la
información de la muestra
ValoresExtremos
La Mediapierde
Representatividad
XMe
20
MODO o MODA
Modo o Moda
Se define como el valor de la variable que más se repite, es decir, el valor de la variable que tenga frecuencia máxima. Se denota con Mo
Mo = Xj si y solo si fj = Max { fi, i=1, 2, 3,…..k}
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.
21
CALCULO DE LA MODA
Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDNA):
Ejemplo: Caso del pediatra
Procedimiento: 1. Determinar la frecuencia máxima, fmax, el modo será igual
al valor de la variable asociado a dicha frecuencia.
Meses (x) Niños (f) F9 1 110 4 511 9 1412 16 3013 11 4114 8 4915 1 50
50
En este caso fmax = 16 por lo tanto:Mo = 12 meses
22
CALCULO DEL MODO
Caso de una Distribución de Frecuencia de Datos No Agrupados (DFDA):
Ejemplo: Caso de los jugadores
Procedimiento: 1. Determinar la frecuencia máxima, fmax, el
modo estará ubicado en la clase correspondiente a dicha frecuencia máxima y entonces:
12
11
21
1
momo
momo
momoo
ff
ff
ClM
Donde:fmo = frecuencia de la clase que contiene al Mofmo-1= frecuencia de la clase anterior a la que
contiene al Mofmo-1= frecuencia de la clase siguiente a la que
contiene al Mo
Altura (cms)Nº de
jugadores[170, 175) 1[175, 180) 3[180, 185) 4[185, 190) 8[190, 195) 5[195, 2.00] 2
23
23
CALCULO DE LA MODA
En nuestro ejemplo:
fmo = 8; luego
358
448
8571,187534
4185
12
11
21
1
momo
momo
momoo
ff
ff
cmsClM
172,5 177,5 182,5 187,5 192,5 197,5
1
3
2
5
4
6
8
7N
o. Ju
gad
ore
s
Estatura (cms)
X = 186,63 cms
Me= 187,18 cms
Mo = 187, 86
24
OBSERVACIONES ACERCA DE LA MODA
1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalos, y relativa).
2. La moda tiene la ventaja de no ser afectada por valores extremos.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
4. En muchas series de datos no hay moda porque ningún valor aparece más de una vez.
5. En algunas series de datos hay más de una moda, en este caso uno podría preguntarse ¿cual es el valor representativo de la serie de datos?
25
RELACION EMPIRICA ENTRE MEDIA, MEDIANA Y MODO
1. En distribuciones totalmente simétricas, la media, la mediana y la moda coinciden, localizándose en un mismo valor. En cambio, en distribuciones moderadamente asimétricas, la siguiente relación se mantiene aproximadamente:Media – Moda = 3(Media – Mediana)
2. Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimétricas a derecha e izquierda respectivamente, para curvas simétricas los tres valores coinciden