quinta sesion de aprendizaje -...
TRANSCRIPT
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
LECTURA 05 : MEDIDAS DE DISPERSIÓN Y DE FORMA
TEMA 18: MEDIDAS DE DISPERSION
1. DEFINICIONLas medidas de dispersión son aquellas que cuantifican el grado de concentración o de dispersión de los valores de la variable en torno de un valor central, generalmente la media aritmética. Las medidas de dispersión se utilizan para dos propósitos básicos:a) Para verificar la confiabilidad de los promedios y b) Para que sirva como base para el control de la variación misma.Las medidas de dispersión que se utilizan con mayor frecuencia son:• Varianza.• Desviación estándar.• Coeficiente de variación.
1.1. VarianzaEs una medida que cuantifica el grado de dispersión o de variación de los valores de una variable cuantitativa con respecto a su media aritmética. Si los valores tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los valores tienen a distribuirse lejos de la media, la varianza será grande.La varianza calculada a partir de una muestra se denota por s2 y referida a la población se denota por 2σ o V [x].La varianza se define como la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media aritmética. La varianza es una medida de dispersión con unidades de medición al cuadrado: S/.2, $2, km2, etc. La varianza siempre es positiva.
1.1.1. La varianza para datos agrupados:Se utiliza la siguiente fórmula:
• Para n ≥ 30
n
)xx(s
n
1i
2i
2∑
=−
=
_________________________________________ 1Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
• Para n < 30 [varianza de Cochran]
1n
)xx(s
n
1i
2i
2
−
−=
∑=
Ejemplo 1:Los siguientes datos corresponden a una muestra al azar de 8 clientes según su tiempo en minutos que han visitado la página de Internet Google:
Xi : 2.3, 4.5, 4.2, 3.2, 4.4, 2.1, 1.6, 4.3
Calcular e interpretar la varianza:
Solución:a) Para hallar la varianza primero debemos hallar el tiempo promedio de visia de los clientes:
utosmin3.38
6.268
xx
8
1ii
===∑
=
A continuación construiremos una tabla de trabajo para calcular la varianza:
i ix )xx( i − 2i )xx( −
1 2.3 -1.0 1.002 4.5 1.2 1.443 4.2 0.9 0.814 3.2 -0.1 0.015 4.4 1.1 1.216 2.1 -1.2 1.447 1.6 -1.7 2.898 4.3 1.0 1.00
Total 26.6 - 9.80
Donde:
80.9)xx(8
1i
2i =−∑
=
_________________________________________ 2Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=8 < 30.
82
i2 2i 1
(x x)9.80s 1.4min utos
8 1 7=
−= = =
−
∑
Interpretación: La variabilidad de los tiempos de visita de los clientes a la pagina Web Google respecto de su valor central es de 1.4 minutos2 .
1.1.2. La varianza para datos agrupados:Se utiliza la siguiente formula:
Ejemplo 2 :Los siguientes datos corresponden a 240 trabajadores de una Empresa “X” según su número de inasistencias:
N° de inasistencias
yi
N° de trabajadores
fi
3 105 307 1009 80
11 20 Total 240
Calcular e interpretar la varianza.
Solución: a) Hallando en primer lugar el número promedio de inasistencias:
_________________________________________ 3Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
m2
i i2 i 1
m2
i i2 i 1
(y y) fs ; para n 30
n
(y y) fs ; para n 30 (Varianza de Cochran)
n 1
=
=
− ×= ≥
− ×= <
−
∑
∑
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
b) A continuación construiremos una tabla de trabajo para calcular la varianza:
yi fi
3 10 -4.58 20.98 209.85 30 - 2.58 6.66 199.87 100 - 0.58 0.34 34.09 80 1.42 2.02 161.611 20 3.42 11.70 234.0
Total 240 - - 0Donde:
Reemplazando dicho valor en la formula de la varianza para n=240 > 30.
Interpetración: La variabilidad de las inasistenicas es de 4 inasistencias2 respecto de su valor central.
_________________________________________ 4Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
5
i ii 1
y f1820y 7.58 inasistencias
240 240=
×= = =
∑
i(y y)− 2i(y y)− 2
i i(y y) f− ×
25
i ii 1
(y y) f 839.2=
− × =∑
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 1
52
i i2 i 1
52
i i2 i 1
2
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs
240 240
(y y) f20.98 10 6.66 30 0.34 100 2.02 80 11.70 20s
240 240
(y y) f209.8 199.8 34 161.6 234s
240 240
(ys
=
=
=
− ×− × + − × + − × + − × + − ×= =
− ×× + × + × + × + ×= =
− ×+ + + += =
=
∑
∑
∑
52
i ii 1
52
i i2 2i 1
y) f839.2
240 240
(y y) fs 3.5 4 inasistencias .
240
=
=
− ×=
− ×= = ≅
∑
∑
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Ejemplo 3: La siguiente tabla corresponde a 280 trabajadores de una Empresa “X” según su edad en años:
Edad en en años
LI - LS
N° de trabajadoresfi
[25 - 30) 40 [30 - 35) 50 [35 - 40) 100 [40 - 45) 50 [45 - 50) 40 TOTAL 280
Calcular e interpretar la varianza.
Solución: Hallando en primer lugar el promedio:
A continuación construiremos una tabla de trabajo para calcular la varianza:
Li - Ls y fi
[25 - 30) 27.5 40 -10 100 4000 [30 - 35) 32.5 50 -5 25 1250 [35 - 40) 37.5 100 0 0 0 [40 - 45) 42.5 50 5 25 1250 [45 - 50) 47.5 40 10 100 4000
Total - 280 - - 10500
Donde:
Reemplazando dicho valor en la formula de la varianza para n=240 > 30.
_________________________________________ 5Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
5
i ii 1
y f10500y 37.5 años
280 280=
×= = =
∑
25
i ii 1
(y y) f 10500=
− × =∑
i(y y)− 2i(y y)− 2
i i(y y) f− ×
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Interpetración: La variabilidad de las edades de los trabajadores es de 37.5 años 2
respecto de su valor central.
1.2. La desviación estándar o típicaSe define como la raíz cuadrada positiva de la varianza:
Es uno de los estadígrafos de dispersión de mayor uso, la cual se expresa en unidades reales de la variable, es decir ya no están elevadas al cuadrado. La desviación estándar, al igual que la varianza, es no negativa (s ≥ 0), puesto que es la raíz positiva de la varianza. A mayor dispersión le corresponderá una mayor desviación estándar.
_________________________________________ 6Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 1
52
i i2 i 1
52
i i2 i 1
52
i i2 i 1
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs
280 280
(y y) f100 40 25 50 0 100 25 50 100 40s
280 280
(y y) f4000 1250 0 1250 4000s
280 280
(y y) fs
2
=
=
=
=
− ×− × + − × + − × + − × + − ×= =
− ×× + × + × + × + ×= =
− ×+ + + += =
− ×=
∑
∑
∑
∑
52
i i2 2i 1
1050080 280
(y y) fs 37.5 años
280=
=
− ×= =
∑
ianzas var=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Ejemplo 4:Calcular e interpretar la desviación estándar de los datos del Ejemplo 1.
Solución:
Interpretación: Los tiempos de visita de los clientes se alejan en promedio de su valor central en 1.95 puntos.
Ejemplo 5 :Calcular e interpretar la desviación del Ejemplo 2:
Solución:3.5 1.87 2 .= = ≅s inasistencias
Interpretación: Las asistencias de los trabajadores se dispersan o se alejan en promedio de su valor central en 2 inasistencias.
Ejemplo 6 :Calcular e interpretar la desviación del Ejemplo 3:
Solución:
Interpretación: Las edades de los trabajadores se dispersan o se alejan en promedio de su valor central en 6.12 años.
1.3. El coeficiente de variaciónEs una medida de dispersión relativa exenta de unidades y expresada en porcentaje, se utilizan para comparar la variación de dos distribuciones siempre que las variables se expresen en las mismas unidades de medida y sean aproximadamente del mismo tamaño promedio. Sin embargo, a veces es necesario comparar dos conjuntos de datos expresados en unidades diferentes (tales como soles y
_________________________________________ 7Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
s 1.4 1.2min utos= =
37.5 6.12 .= =s años
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
kilogramos). En estos casos las medidas de dispersión absoluta no son comparables y deben utilizarse medidas de dispersión relativa.
El coeficiente de variación de un conjunto de datos se denota por c.v. y se expresa como:
Donde:
estándar Desviación s =
aritmética Mediay =
• Si c.v. ≤ 15%, los datos son homogéneos, es decir tienen una baja variabilidad.• Si c.v. > 15%, los datos son heterogéneos, es decir tienen una alta variabilidad.
Ejemplo 7:Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 1:
Solución:
Interpretación: Las dispersiónes de los tiempos utilizados por los clientes en visitar la página Google respecto de su valor central son heterogéneos.
Ejemplo 8:Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 2:
Solución:
_________________________________________ 8Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
100ys.v.c ×=
%15%4.361003.32.1.v.c >=×=
1.87. . 100 24.67% 15%7.58
c v = × = >
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Interpretación: Las dispersiones de las inasistencias de los trabajadores respecto de su valor central son heterogéneos.
Ejemplo 9:Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 3:Solución:
Interpretación: Las dispersiones de las edades de los trabajadores respecto de su valor central son heterogéneos.
Ejemplo 10: Los siguientes datos corresponden a una muestra aleatoria de los gastos mensuales en soles de 7 estudiantes de administración:
Xi : 200, 250, 250, 400, 270, 300, 420
a) ¿Cuánto es la dispersión de los gastos mensuales respecto de su valor central?
b) ¿Son los gastos mensuales homogéneos?
Solución:a) Hallando en primer lugar el promedio:
7
ii 1
x2090x 298.57soles.
7 7== = =
∑
b) A continuación construiremos una tabla de trabajo para calcular la varianza:
i ix )xx( i − 2i )xx( −
1 200 -98.57 9716.042 250 -48.57 2359.043 250 -48.57 2359.044 400 101.43 10288.045 270 -28.57 816.246 300 1.43 2.047 420 121.43 14745.24
Total 2090 - 40270
_________________________________________ 9Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
6.12. . 100 16.32% 15%37.5
= × = >c v
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Donde:7
2i
i 1
(x x) 40285.68=
− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=7 < 30.
c) Hallando la desviación estándar :
s 6714.28 81.94 soles.= =
d) Hallando el coeficiente de variación:De acuerdo a las operaciones realizadas tenemos:
entonces:
Los gastos mensuales de los estudiantes no son homogéneos.
Ejemplo 11:Los siguientes datos corresponden a una muestra aleatoria de los ahorros mensuales en dólares de 5 clientes del Banco de Crédito del Perú:
Xi: 500, 550, 220, 340, 180
El gerente del Banco piensa hacer un aumento en la tasa de interés solo si los ahorros mensuales son regulares. ¿Qué decisión tomará el gerente del Banco.(Hallar coeficiente de variación).
_________________________________________ 10Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
72
i2 2i 1
(x x)40285.68s 6714.28 soles .
7 1 6=
−= = =
−
∑
x 298.57 soles.
s 81.94 soles.
=
=
6.12. . 100 100 16.32% 15%37.5
= × = × = >sc vx
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Solución:a) Hallando en primer lugar el ahorro mensual promedio:
5
ii 1
x1790x 358dólares.
5 5== = =
∑
b) A continuación construiremos una tabla de trabajo para calcular la varianza:
i ix )xx( i − 2i )xx( −
1 500 142 201642 550 192 368643 220 -138 190444 340 - 18 3245 180 -178 31684
Total 1790 - 108080
Donde:5
2i
i 1
(x x) 108080=
− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=5 < 30.
c) Hallando la desviación estándar :
s 27020 164.38 dólares.= =
d) Hallando el coeficiente de variación:De acuerdo a las operaciones realizadas tenemos:
x 358 dólares.
s 164.38 dólares.
=
=
_________________________________________ 11Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
52
i2 2i 1
(x x)108080s 27020 dólares .
5 1 4=
−= = =
−
∑
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
entonces:
Los ahorros mensuales de los clientes son heterogéneos; es decir no son regulares. Por lo tanto el gerente del banco no subirá la tasa de interés. El gerente no subirá la tasa de interés ya que los ahorros mensuales no son regulares.
Ejemplo 12:Los siguientes datos corresponden a una muestra aleatoria de los ahorros mensuales en dólares de dos grupos de clientes del Banco Continental :
GRUPO 1 2 3 4 5 6 1 500 550 540 530 520 5502 400 450 500 460 450 470
¿En que grupo los ahorros son más estables? (Hallar coeficiente de variación)
Solución: Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados:
● Para el Grupo 1 a) Hallando el ahorro mensual promedio para el Grupo 1:
6
ii 1
1
x3190x 531.67soles.
6 6== = =
∑
b) Hallando la varianza:i ix
i(x x )− 2i(x x )−
1 500 -31.67 1002.992 550 18.33 335.993 540 8.33 69.394 530 -1.67 2.795 520 -11.67 136.196 550 18.33 335.99
Total 3190 - 28887
_________________________________________ 12Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
164.38. . 100 45.92% 15%358
= = × = >sc vx
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Donde:6
2i
i 1
(x x) 1883.34=
− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=6 < 30.
c) Luego hallamos la desviación estándar :
1s 376.67 19.41 soles.= =
d) Finalmente hallamos el coeficiente de variación:
● Para el Grupo 2 a) Hallando el ahorro mensual promedio para el Grupo 2:
6
ii 1
2
x2730x 455soles
6 6== = =
∑
b) Hallando la varianza:i ix
i(x x )− 2i(x x )−
1 400 -55 30252 450 -5 253 500 45 20254 450 -5 255 460 5 256 470 15 225
Total 2730 - 5350Donde:
62
ii 1
(x x) 5350=
− =∑Reemplazando dicho valor en la formula de la varianza de Cochran ya que
_________________________________________ 13Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
11
1
19.41. 100 3.65% 15%531.67
= = × = <sc vx
62
i2 2i 11
(x x)1883.34s 376.67 soles .
6 1 5=
−= = =
−
∑
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
n=6 < 30.
c) Luego hallamos la desviación estándar :
2s 1070 32.71 soles.= =
d) Finalmente hallamos el coeficiente de variación:
La siguiente tabla muestra los resultados obtenidos en forma resumida:
GRUPO x s .v.c1 531.67 19.41 3.65% < 15%2 455 32.71 7.19% <15%
Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos, se observa que en el Grupo 1 los ahorros son más estables. Ejemplo 13:Los siguientes datos corresponden a dos muestras aleatorias de dos grupos de trabajdores según su sueldo mensual en soles:
GRUPO 1Sueldo mensual en soles
LI - LSN° de trabajadores
fi
[550 - 650) 40[650 - 750) 60[750 - 850) 100[850 - 950) 40 [950 - 1050) 20
Total 260
_________________________________________ 14Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
62
i2 2i 12
(x x)5350s 1070 soles .
6 1 5=
−= = =
−
∑
21
2
32.71. 100 7.19% 15%455
= = × = <sc vx
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
GRUPO 2Sueldo mensual en soles
LI - LSN° de trabajadores
fi
[750 - 850) 30[850 - 950) 50[950 - 1050) 80[1050 - 1150) 40[1150 - 1250) 10
TOTAL 210
¿Qué grupo tiene sueldos mensuales más homogéneos?Solución:Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados:
● Para el Grupo 1 a) Hallando en primer lugar el promedio:
b) A continuación construiremos una tabla de trabajo para calcular la varianza:
Li - Ls yi fi
[550 - 650) 600 40 -176.92 31300.69 1252027.6[650 - 750) 700 60 -76.92 5916.69 355001.4[750 - 850) 800 100 23.08 532.69 53269.0[850 - 950) 900 40 123.08 15148.69 605947.6
[950 - 1050) 1000 20 223.08 49764.69 995293.8 Total 260 - - 0
Donde:
Reemplazando dicho valor en la formula de la varianza para n=260 > 30.
_________________________________________ 15Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
5
i ii 1
1
y f202000y 776.92 soles
260 260=
×= = =
∑
25
i ii 1
(y y) f 3261539.4=
− × =∑
i(y y)− 2i(y y)− 2
i i(y y) f− ×
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
c) Hallando la desviación estándar:
1s 12544.48 112.00 soles.= =
d) Hallando el coeficiente de variación:
● Para el Grupo 2a) Hallando en primer lugar el promedio:
b) A continuación construiremos una tabla de trabajo para calcular la varianza:
_________________________________________ 16Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 11
52
i i2 i 11
52
i i2 i 11
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs
260 260
(y y) f31300.69 40 5916.69 60 53269.0 100 15148.69 40 49764.69 20s
260 260
(y y) f1252027.6 355s
260
=
=
=
− ×− × + − × + − × + − × + − ×= =
− ×× + × + × + × + ×= =
− ×+= =
∑
∑
∑
52
i i2 i 11
52
i i2 2i 11
001.4 53269.0 605947.6 995293.8280
(y y) f3261539.4s
260 260
(y y) fs 12544.38soles
260
=
=
+ + +
− ×= =
− ×= =
∑
∑
11
1
s 112.00c.v 100 14.42% 15%776.92y
= = × = <
5
i ii 1
2
y f205000y 976.19 soles
210 210=
×= = =
∑
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Li - Ls yi fi
[ 750 - 850) 800 30 -176.19 31042.92 931287.60 [ 850 - 950) 900 50 - 76.19 5804.92 290246.00 [ 950 - 1050) 1000 80 23.81 566.92 45353.60[1050 - 1150) 1100 40 123.81 15328.92 613156.80 [1150 - 1250) 1200 10 223.81 50090.92 500909.16
Total - 210 - - 2380953.16
Donde:
Reemplazando dicho valor en la formula de la varianza para n=210 > 30.
c) Hallando la desviación estándar:
1s 11337.87 106.48 soles.= =
_________________________________________ 17Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
25
i ii 1
(y y) f 2380953.16=
− × =∑
52
2 2 3 4 5i i2 1 1 2 2 3 3 4 4 5 5i 12
52
i i2 i 11
52
i i2 i 11
(y y) f(y y) f (y y) f (y y) f (y y) f (y y) fs
210 210
(y y) f31042.92 30 5916.69 60 566.92 80 15328.92 40 50090.92 10s
210 210
(y y) f931287.60 29024s
210
=
=
=
− ×− × + − × + − × + − × + − ×= =
− ×× + × + × + × + ×= =
− ×+= =
∑
∑
∑
52
i i2 i 11
52
i i2 2i 11
6.00 45353.60 613156.80 500909.16210
(y y) f2380953.16s
210 210
(y y) fs 11337.87soles
210
=
=
+ + +
− ×= =
− ×= =
∑
∑
i(y y)− 2i(y y)− 2
i i(y y) f− ×
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
d) Hallando el coeficiente de variación:
Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados:
GRUPO x s .v.c1 776.92 112 14.42% < 15%2 976.19 106.47 10.91% <15%
Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos, se observa que en el Grupo 2 los sueldos mensuales son más homogéneos.
TEMA 19: MEDIDAS DE FORMA
1. DEFINICIÓN:
Las medidas de forma son aquellas que permiten comprobar si una distribución de frecuencia tiene características especiales como simetría, asimetría, nivel de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
2. MEDIDAS DE ASIMETRIA:Son medidas que miden el grado de deformación horizontal de una serie de datos o de distribución de frecuencias.
Se dice que una distribución de frecuencias es simétrica, si los intervalos equidistantes del intervalo central tienen iguales frecuencias. También se dice que una distribución es simétrica si su curva de frecuencias es simétrica con respecto al centro de los datos.
Dos distribuciones pueden tener la misma media y la misma desviación estándar, pero pueden diferir en el grado de asimetría.
_________________________________________ 18Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
11
1
s 106.48c.v 100 10.91% 15%976.19y
= = × = <
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Si la distribución es simétrica, entonces la media, la mediana y la moda coinciden. En contraposición, si estos 3 promedios no coinciden la distribución es asimétrica.Entre las medidas de asimetría más usuales tenemos:
2.1. El Coeficiente de asimetría de Pearson:Se expresa como:
Si:AS = 0 La serie de datos o la distribución es simétrica. Ver fig. 1.AS > 0 La serie de datos o la distribución es asimétrica positiva
(sesgada a la derecha). Ver fig. 2.AS < 0 La serie de datos o la distribución es asimétrica negativa
(sesgada a la izquierda). Ver fig. 3.
_________________________________________ 19Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
3(x Me)Ass
−=
x Me Mdfig.2
= =
Distribución Asimétrica Positiva
Distribución Simétrica
Distribución Asimétrica Negativa
x Me Mdfig.3
< <Md Me x
fig. 1< <
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
NOTA: Si As 0, entonces se dice que la distribución es aproximadamente simétrica o ligeramente sesgada. Será tanto más sesgada cuanto más As se aleje de cero.
Ejemplo 1:Calcular e interpretar el coeficiente de asimetría de los datos del Ejemplo 1 de la lectura anterior:
Solución:Utilizando el coeficiente de asimetría de Pearson :
s)Mex(3As −=
De los datos dados se ha obtenido:
Reemplazando en la fórmula obtenemos:
Interpretación: Este valor indica que la serie de tiempos de los clientes que visitan la página Google es asimétrica negativa.
Ejemplo 2:Hallar el coeficiente de asimetría de Pearson del Ejemplo 2 de la lectura de la sesión anterior:
Solución:
_________________________________________ 20Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
12.1
)7.33.3(3As −=−=
x 3.3min utos Me 3.7 min utos s 1.2 min utos
===
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Utilizando el coeficiente de asimetría de Pearson :
De los datos dados se ha obtenido:
Reemplazando en la fórmula obtenemos:
Interpretación: La distribución de trabajadores según su número de inasistencias es asimétrica positiva.
En el siguiente gráfico podemos observar que que hay mayor concentración de datos a la derecha:
_________________________________________ 21Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
3(7.58 7)As 0.931.87
−= =
y 7.58inasistenciasMe 7inasistenciass 1.87 inasistencias
==
=
0 3 5 7 9 11
100
80
60
40
20
Nº d
e tra
baja
dore
s
N° de inasistencias
3(y Me)Ass
−=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Ejemplo 3:Hallar el coeficiente de asimetría de Pearson del Ejemplo 3 de la lectura:
Solución:Utilizando el coeficiente de asimetría de Pearson :
De los datos dados se ha obtenido:
Reemplazando en la fórmula obtenemos:
Interpretación: La distribución de trabajadores según su edad en años es simétrica.
En el gráfico se observa que en hay igual concentración de datos a la izquierda y derecha.
_________________________________________ 22Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
3(37.5 37.5)As 06.12
−= =
y 37.5 años.Me 37.5 años.s 6.12 años.
===
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
2.1. MEDIDAS DE CÚRTOSIS:La cúrtosis es el grado de apuntamiento de una distribución. La cúrtosis se analiza amparando la distribución con la forma de una curva normal o simétrica, con igual media aritmética y desviación estándar de la distribución que se estudia.
Si una distribución tiene relativamente un elevado pico o apuntamiento, se llama leptocúrtica, mientras si es achatada se denomina platicúrtica. La distribución normal constituye una distribución mesocúrtica, tal como se puede ver en las siguientes figuras:
_________________________________________ 23Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
100
8 0
60
40
20
0
y Me Md= =
Nº d
e tr
abaj
ador
es
0 25 30 35 40 45 50 37.5
Edad en años
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Leptocúrtica Mesocúrtica Platicúrtica
El estadígrafo para analizar el apuntamiento es el coeficiente de cúrtosis y se expresa como:
4
4
Mks
=
Donde:4 2 2
2
m4
i i4 i 1
s (s )
s Varianza
(y y) fM
n=
=
=
− ×=
∑
4M se llama: “cuarto momento respecto a la media”Si:
3=K , la distribución es normal o mesocúrtica.3<K , la distribución es platicúrtica.3>K , la distribución es leptocúrtica.
_________________________________________ 24Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
fig. 4 fig. 5 fig. 6
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Ejemplo 4:Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 4 de la sesión anterior:
Solución: a) Hallando en primer lugar el promedio de los datos dados:
b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los valores hallados en la última columna, tal como se muestra en la siguiente tabla:
yi fi
3 10 -4.58 440.01 4400.015 30 - 2.58 44.31 1329.307 100 - 0.58 0.11 11.009 80 1.42 4.07 325.6011 20 3.42 136.81 2736.20
Total 240 - - 36831Donde:
c) Luego hallamos los momentos de orden 4 (M4 ) :
_________________________________________ 25Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
5
i ii 1
y f1820y 7.58 inasistencias
240 240=
×= = =
∑
i(y y)− 4i(y y)− 4
i i(y y) f− ×
45
i ii 1
(y y) f 8802.11=
− × =∑
54
i i4 i 1
54
i i4 i 1
54
i i4 i 1
54
i i4 4i 1
(y y) f440.01 10 44.31 30 0.11 100 4.07 80 136.81 20M
240 240
(y y) f4400.1 1329.30 11 325.60 2736.20M
240 240
(y y) f8802.11M
240 240
(y y) fM 36.68 inasistencias
240
=
=
=
=
− ×× + × + × + × + ×= =
− ×+ + + += =
− ×= =
− ×= =
∑
∑
∑
∑
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Además:
Por lo tanto el coeficiente de cúrtosis está dado por:4
4
Mks
36.68k12.25
k 2.99 3
=
=
= <
Interpretación: La distribución de trabajadores según su número de inasistencias es
platicúrtica.
Ejemplo 5:Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 5 de la sesión anterior:
a) Hallando en primer lugar el promedio de los datos dados:
b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los valores hallados en la última columna, tal como se muestra en la siguiente tabla:
_________________________________________ 26Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
5
i ii 1
y f10500y 37.5 años
280 280=
×= = =
∑
2 2
4 4
s 3.5 inasistencias
Entonces :
s 12.25 inasistencias
=
=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
Li - Ls y fi
[25 - 30) 27.5 40 -10 10000 40000 [30 - 35) 32.5 50 -5 625 1250 [35 - 40) 37.5 100 0 0 0 [40 - 45) 42.5 50 5 625 1250 [45 - 50) 47.5 40 10 10000 40000
Total - 280 - - 82500Donde:
c) Luego hallamos los momentos de orden 4 (M4 ) :
Además:
Por lo tanto el coeficiente de cúrtosis está dao por::
_________________________________________ 27Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
i(y y)− 4i(y y)− 4
i i(y y) f− ×
45
i ii 1
(y y) f 82500=
− × =∑
54
i i4 i 1
54
i i4 i 1
54
i i4 i 1
54
i i4 4i 1
(y y) f10000 40 625 50 0 100 625 50 10000 40M
280 280
(y y) f40000 1250 0 1250 40000M
280 280
(y y) f82500M
280 280
(y y) fM 294.64años
280
=
=
=
=
− ×× + × + × + × + ×= =
− ×+ + + += =
− ×= =
− ×= =
∑
∑
∑
∑
2 2
4 4
s 37.5 años
Entonces :
s 1406.25 años
=
=
Universidad Católica Los Ángeles de Chimbote CURSO ESTADÍSTICAFACULTAD DE INGENIERÍA______________________________________________________________________________________________________
La distribución de trabajadores según su edad de años es platicúrtica.
_________________________________________ 28Elaborado por : Mg. Carmen Barreto R.Fecha : Febrero 2010Versión : 2
4
4
Mks
294.64k1406.25
k 0.21 3
=
=
= <