Download - Teoría Medidas de Centralizacion
-
8/18/2019 Teoría Medidas de Centralizacion
1/7
MEDIDAS DE TENDENCIA CENTRAL
1. INTRODUCCIÓN
Las medidas de tendencia central son estadígrafos que se ubican al centro de un conjunto de datosordenados según su magnitud.
Los estadígrafos son valores que de manera condesada representan en un solo valor a una serie dedatos y además describen resumidamente el conjunto de observaciones.
Los estadígrafos de posición de uso más frecuente son: la media, la mediana, la moda, los deciles,cuartiles y percentiles.
2. MEDIA ARITMÉTICA
DEFINICIÓNLa media aritmética se denomina simplemente media y comúnmente se le conoce como promedio, lamedia es el estadígrafo más importante; se define y calcula dividiendo la suma de los valores de lavariables entre el número de observaciones o valores.
La media que se obtiene a partir de “n” datos originales se denomina media aritmética simple. La media obtenida a partir de los datos agrupados en tabla de frecuencia se denomina media
aritmética ponderada.
MEDIA ARITMÉTICA PARA DATOS NO TABULADOSLa media aritmética para datos no tabulados se obtiene mediante la siguiente formula:
n
x
x
n
i
i 1
___
Ejemplo 8Hallar la media de las siguientes edades: 15, 16, 18, 15, 25.
MEDIA ARITMÉTICA PARA DATOS TABULADOS (sin intervalos)La media aritmética para datos tabulados se obtiene mediante la siguiente formula:
n
x f
x
k
i
ii 1
__
Ejemplo 9Hallar el número promedio de hijos por familia.
X f
0 31 8
2 63 44 9
-
8/18/2019 Teoría Medidas de Centralizacion
2/7
MEDIA ARITMÉTICA PARA DATOS TABULADOS (con intervalos)La media aritmética para datos tabulados se obtiene mediante la siguiente formula:
n
x f
x
k
i
ii 1
__
Ejemplo 10Los ingresos quincenales de 50 personas están representados en la siguiente tabla hallar el
promedio.
INTERVALOS F
[10 23) 1
[23 36) 3
[36 49) 3
[49 62) 20
[62 75) 17
[75 88) 4
[88 101] 2
PROPIEDADES DE LA MEDIA ARITMÉTICA
La suma total de n valores es igual “ n x ___
”. La media de una constante es igual a la misma constante. La media del producto de una constante por una variable, es igual al producto de la constante
por la media de la variable. La media de la suma de dos variables, es igual a la suma de las medias de cada una de
dichas variables. Si cada uno de los “n” valores de XI es trasformado en: YI = aXi + b, siendo “a” y “b” constante,
entonces, la media de los “n” valores “y” es:
b xa y __ __
La media aritmética de datos tabulados, se calcula también utilizando las frecuencia relativas.
k
i
iih x x1
__
La media de una muestra es igual a la media ponderada de su sub. muestras donde los pesosson los tamaños respectivos.
k
i
i
k
i
ii
n
xn
x
1
1
__
__
3. LA MEDIANA
DEFINICIÓN
La mediana o valor mediano de una serie de valores observados es el número que separa a la seriede datos ordenados en formar creciente en dos partes iguales.
La mediana es una medida de posición que depende del número de datos observados y no de losvalores de estos datos.
MEDIANA PARA DATOS NO TABULADOSPara calcular la mediana para datos ordenados pero no tabulados se obtiene bajo el siguiente criterio
Cuando “n” es impar
-
8/18/2019 Teoría Medidas de Centralizacion
3/7
La posición de la mediana se calcula como: Pos
2
1nXme
Luego observando el conjunto de datos ordenados, el valor correspondiente a la Posición de laMediana obtenida, es el valor de la Mediana
Ejemplo 1
2, 4, 5, 8, 10, 11, 13. PosMediana= (7+1) /2= 4 Mediana = X(4) = 8
Cuando “n” es par
2
XXm
2/2n2/n
e
Ejemplo 21, 4, 5, 7, 13, 15, 16, 19
Pos Mediana= 9/2 = 4,5 El valor de la Mediana es el promedio entre los valores correspondientes a
la posición 4 y 5.Mediana= (X(4) + X(5)) /2= ( 7 + 13)/2 = 20/2 = 10
MEDIANA PARA DATOS TABULADOS (sin intervalo)Si los valores de una variable discreta se tabulan en una distribución de frecuencia de la forma “dato frecuencia”, entonces la mediana será aquel valor de la variable que contenga a la primera frecuenciaabsoluta acumulada que supere o sea igual a n/2.
Ejemplo 3El número de hijos por familia se encuentra en la siguiente tabla hallar la mediana.
X f F0 3 3
1 8 11
2 6 17
3 4 21
4 9 30
PosMe= 30/2 = 15Mediana= X(15) = 2
MEDIANA PARA DATOS TABULADOS (con intervalo)Si el valor de una variable aleatoria continua se tabula en una distribución de frecuencia porintervalos, la mediana se determina mediante la siguiente formula:
l i= límite inferior del grupo o clase donde se encuentra la mediana.f me= frecuencia absoluta simple del grupo o clase donde se encuentra la mediana.Fi-1 = Frecuencia absoluta acumulada anterior al grupo o clase donde se
encuentra la mediana.Ai= Amplitud de intervalo del grupo o clase donde se encuentra la mediana.N= tamaño de la poblaciónn= tamaño de la muestra
Ai f
F n
l meme
i
i )2(
1
-
8/18/2019 Teoría Medidas de Centralizacion
4/7
Ejemplo 4
Los ingresos quincenales de 50 personas están representados en la siguiente tabla hallar la mediana.
INTERVALOS f[10 23) 1
[23 36) 3
[36 49) 3
[49 62) 20
[62 75) 17
[75 88) 4
[88 101] 2
VENTAJAS DE LA MEDIANA
La suma de la diferencia de los n datos respecto a su mediana es menor o igual que la suma delas diferencias de esos datos respecto a cualquier otro valor .
La mediana, a diferencia de la media, depende del número de datos y no del valor de los datos.Por eso no está afectada de valores extremos.
La mediana puede ser calculada para distribuciones de frecuencia con intervalos de diferenteamplitud, siempre que se pueda determinar el límite inferior del intervalo de la mediana.
Para un grupo de datos existe un único valor de Mediana.
4. LA MODA
DEFINICIÓN
La moda de una serie de datos es aquel valor que se repite con mayor frecuencia . Este valor se usacuando se requiere señalar el valor más común de una serie de datos . La moda es una medida menosimportante que la mediana debido a su ambigüedad. La moda no siempre existe y si existe, nosiempre es única.
MODA PARA DATOS NO TABULADOS
Ejemplo 5Sería el valor que se repite el mayor número de veces5, 8, 8, 8, 8, 8, 8, 11, 15, 15, 15, 15, entonces La moda seria 8
MODA PARA DATOS TABULADO (sin intervalo)La moda seria aquel valor de la variable que tenga la frecuencia absoluta
Ejemplo 6El número de hijos por familia se encuentra en la siguiente tabla hallar la moda.
X f
0 31 82 63 44 9
La frecuencia absoluta de mayor valor es la correspondiente a X=4 hijos por familia. Por lo tanto, elvalor de la moda es 4.
-
8/18/2019 Teoría Medidas de Centralizacion
5/7
MODA PARA DATOS TABULADO (con intervalo)
La moda para datos tabulado en tablas de frecuencia con intervalo se encuentra mediante la siguienteformula:
21
1i
dd
d
ALmo
Donde :Li: Intervalo modal
A= amplitud del intervalo modald1= frecuencia absoluta del intervalo posterior al intervalo modald2= frecuencia absoluta del intervalo anterior al intervalo modal
NOTA: La moda puede no existir. Si existe, no siempre es la única. Cuando en un conjunto de valores o
en una distribución existe una sola moda, se trata de una distribución uní modal; si hay dos modas
será bimodal, y si presenta varias modas se llama plurimodal.
Ejemplo 7
Los ingresos quincenales de 50 personas están representados en la siguiente tabla hallar la moda .
INTERVALOS f
[10 23) 1
[23 36) 3
[36 49) 3
[49 62) 20
[62 75) 17
[75 88) 4
[88 101] 2
Intervalo Modal: [49 ; 62)
Moda= 49 + 13 [ 19/ 19 + 3] = 49 + 11.22 = 60.22
NOTA La media aritmética como estadígrafo de posición de una distribución proporciona una idea de
la posición de los valores alrededor de la media. La media es un valor promedio, por tanto no significa que todos los valores observados
resultan ser iguales. La media siempre está influenciada por los valores extremos, sean mayores o menores. La media aritmética no divide en dos partes iguales a un conjunto de datos.
Relación entre la simetría de una distribución y los valores de posición central
Para distribuciones Unimodales:
Asimétrica positiva: MO < me <
__
x
Asimétrica negativa:
__
x < me < MO
-
8/18/2019 Teoría Medidas de Centralizacion
6/7
5. CUARTILESLos cuartiles son los estadígrafos que divide a un conjunto de datos en 4 partes iguales y en total sontres cuartiles; se calculan utilizando la siguiente formula:
k = 1, 2, 3
Ejemplo 11Los ingresos quincenales de 50 personas están representados en la siguiente tabla hallar el primercuartil.
INTERVALOS f
[10 23) 1
[23 36) 3
[36 49) 3
[49 62) 20
[62 75) 17[75 88) 4
[88 101] 2
Ejemplo 12Los ingresos quincenales de 50 personas están representados en la siguiente tabla hallar el tercercuartil.
INTERVALOS f
[10 23) 1
[23 36) 3
[36 49) 3
[49 62) 20
[62 75) 17
[75 88) 4
[88 101] 2
6. DECILESEs el estadígrafo que divide a un conjunto de datos en 10 partes iguales; se calcula mediante lasiguiente formula:
Ejemplo 13Los ingresos quincenales de 50 personas están representados en la siguiente tabla hallar el decil 8
INTERVALOS f
[10 23) 1
[23 36) 3
[36 49) 3
[49 62) 20[62 75) 17
[75 88) 4
[88 101] 2
i
i
i K f
F kn
A LQ1
4
i
i
i K
f
F kn
A L D1
10
-
8/18/2019 Teoría Medidas de Centralizacion
7/7
7. PERCENTILES
Es el estadígrafo que divide a un conjunto de datos en 100 partes iguales
Ejemplo 14Los ingresos quincenales de 50 personas están representados en la siguiente tabla hallar el percentil35.
INTERVALOS f
[10 23) 1
[23 36) 3
[36 49) 3
[49 62) 20
[62 75) 17[75 88) 4
[88 101] 2
i
i
i K f
F kn
A L P
1
100