medidas de dispersion
DESCRIPTION
Variables estadisticas como desviacion estandar , coeficiente de variavilidad y grafico de distribucion.TRANSCRIPT
Medidas de
DISPERSIÓN William Jaime León Velásquez
ESTADISTICA Y
PROBABILIDADES
Universidad
Nacional Mayor de
San Marcos
4
NOTA:
Para cambiar
la imagen de
esta
dispositiva,
seleccione la
imagen y
elimínela. A
continuación
haga clic en el
icono
Imágenes en el
marcador de
posición e
inserte su
imagen. MEDIDAS
DE
DISPERSION Ing. William León Velásquez
Las Medidas de Dispersión, son
indicadores de variabilidad y cuya
importancia reside en la necesidad
de tomar decisiones, basadas en
estadísticas básicas.
MEDIDAS DE DISPERSIÓN
3 ING.
WILLIAM LEON V.
DEFINICIÓN
Ejemplo: Se tiene una producción de franelas y se sabe
que semanalmente se producen un promedio
de 500 franelas, se puede decir que todos los
días se producen 100 franelas
Nada nos garantiza eso porque podrían
producirse en sólo dos días 250 franelas y el
promedio semanal nos daría un valor idéntico,
MEDIDAS DE DISPERSIÓN
4 ING.
WILLIAM LEON V.
DEFINICIÓN
Si adicionalmente nos informan que tiene
una variación de 5 franelas, tendremos
entonces una mejor comprensión del
proceso, pues este último número nos
indica que semanalmente se producen
entre 495 y 505 franelas, es decir, que
diariamente sí se deben producir
aproximadamente 100 franelas.
MEDIDAS DE DISPERSIÓN
5 ING.
WILLIAM LEON V.
DEFINICIÓN
La Dispersión se refiere a la variabilidad
entre los valores, es decir, qué tan
grandes son las diferencias entre los
valores.
La idea de dispersión se relaciona con la
mayor o menor concentración de los
datos en torno a un valor central,
generalmente la media aritmética.
MEDIDAS DE DISPERSIÓN
6 ING.
WILLIAM LEON V.
DEFINICIÓN
Observe las dos figuras. La primera presenta una distribución con
datos más concentrados alrededor de su promedio 400 que la otra
figura con respecto a su promedio 800, es decir la primera figura es
una distribución con menos dispersión.
MEDIDAS DE DISPERSIÓN
7 ING.
WILLIAM LEON V.
DEFINICIÓN
Ejemplos:
Las figuras siguientes muestran a tres distribuciones
con promedio 70, sin embargo las tres difieren en
cuanto a su variabilidad alrededor de la media.
MEDIDAS DE DISPERSIÓN
8 ING.
WILLIAM LEON V.
DEFINICIÓN
poca variabilidad alguna variabilidad gran variabilidad
Ejemplos:
Se tienen dos grupos de estudiantes que sometidos a una prueba arrojaron
los siguientes puntajes:
MEDIDAS DE DISPERSIÓN. EJEMPLO
9 ING.
WILLIAM LEON V.
EJEMPLO
GRUPO A GRUPO B
Puntaje
Nº
estudiantes
Puntaje Nº estudiantes
9 2 11 5
10 4 12 10
11 6 13 5
13 4 Total 20
15 2
17 2
Total 20
MEDIDAS DE DISPERSIÓN
Al calcular el promedio aritmético para ambos grupos se obtiene:
Este resultado puede conducir a conclusiones equivocadas cuando se está comparando distribuciones,
Pues se podría pensar que ambas secciones son idénticas en su rendimiento,
ING. WILLIAM LEON V. 10
EJEMPLO
12BA xx
Siendo esta conclusión falsa ya que observando
los datos se aprecia que la sección B es más
homogénea.
Por lo tanto
En este caso el promedio no tiene suficiente
grado de representatividad por lo tanto poco
podrá describirnos acerca de los datos en
estudio.
MEDIDAS DE DISPERSIÓN
11 ING.
WILLIAM LEON V.
EJEMPLO
MEDIDAS DE DISPERSIÓN
12 ING.
WILLIAM LEON V.
EJEMPLO
iX
Es necesario entonces calcular otras
medidas estadísticas para mostrar
cómo varían los datos alrededor del
promedio y esto se logra mediante las
medidas de dispersión.
1.- Para evaluar la confiabilidad del promedio que se
está utilizando:
Una dispersión pequeña indica que los datos se
encuentran acumulados muy cerca, alrededor de la
medida de tendencia central establecida.
Por tanto, la medida de tendencia central se considera confiable o bastante
representativa de los datos.
Por el contrario, una dispersión grande indica que la medida escogida para
representar los datos no es muy confiable, es decir, no es muy representativa de
los datos.
FUNCIONES DE LAS MEDIDAS DE DISPERSIÓN
13 ING.
WILLIAM LEON V.
Es necesario estudiar las medidas de dispersión:
2.- Para apreciar cuán dispersas están dos o más distribuciones:
Para poder comparar dos distribuciones de frecuencias entre sí, no sólo necesitamos la medida de tendencia central, sino también la dispersión entre las observaciones para no elaborar conclusiones erróneas.
A mayor medida de dispersión el grupo es más heterogéneo.
A menor medida de dispersión el grupo es más homogéneo o uniforme.
FUNCIONES DE LAS MEDIDAS DE DISPERSIÓN
14 ING.
WILLIAM LEON V.
Es necesario estudiar las medidas de dispersión:
MEDIDAS DE DISPERSIÓN ABSOLUTA
15 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Cuantifican el grado de
concentración o de dispersión de
los valores de la variable en torno
de un promedio de la distribución.
MEDIDAS DE DISPERSIÓN ABSOLUTA
16 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Principales medidas de dispersión absoluta:
Rango o Recorrido : R
Varianza : S2
Desviación Estándar : S
Es la diferencia entre los valores máximo y
mínimo de los datos.
Esta medida es muy fácil de calcular sin
embargo no es muy recomendable porque sólo
toma en cuenta los valores extremos, sin
considerar los demás valores.
RANGO O RECORRIDO: R
17 ING.
WILLIAM LEON V.
mínXmáxXR
MEDIDAS DE DISPERSIÓN ABSOLUTA
Interpretación de Rango: El Rango se puede interpretar como la amplitud existente entre una serie de datos,
Es decir,
mide cuán lejos está el valor más pequeño y el valor más grande de la muestra o población.
RANGO O RECORRIDO: R
18 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Se tiene una producción de franelas y se sabe que
diariamente se producen un promedio de 500
franelas. Si un día se produce un mínimo de 415
franelas y otro día se produce un máximo de 573
franelas entonces el RANGO de producción estará
entre 158 franelas, es decir,
Podemos tener una producción de 158 franelas a
partir del valor mínimo.
RANGO O RECORRIDO: R
19 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo
Es un valor numérico que cuantifica el
grado de dispersión de los valores de una
variable respecto a su media aritmética.
Es el promedio de los cuadrados de las
desviaciones de la variable respecto a su
media aritmética.
VARIANZA S2 , V X
20 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
2xiXMXV
Notación:
Varianza muestral.
Varianza poblacional.
VARIANZA S2 , V X
21 ING.
WILLIAM LEON V.
:2S
:2
MEDIDAS DE DISPERSIÓN ABSOLUTA
VARIANZA S2 , V X
22 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Nota:
La varianza nunca es negativa.
Cuando la variable toma un único valor; es decir cuando es constante entonces la varianza es cero.
Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
S2 para datos no agrupados:
23 ING.
WILLIAM LEON V.
2
n
iXn
2i
X1n
1)x(V
MEDIDAS DE DISPERSIÓN ABSOLUTA
Calcular e interpretar la varianza de los pesos de un grupo de personas.
Los datos son los siguientes:
56 65 68 70 72 76 78 80
S2 para datos no agrupados:
24 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
n = 8
S2 para datos no agrupados:
25 ING.
WILLIAM LEON V.
565
8
1iiX 32940
8
1i
2i
X
2oskil6184,60
2
8
565832940
7
12XS
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
En promedio los pesos del
grupo de personas, se alejan
con respecto al promedio
aritmético en
aproximadamente 61 kilos al
cuadrado.
S2 para datos no agrupados:
26 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
a) Si n < 30 :
S2 para datos agrupados
27 ING.
WILLIAM LEON V.
2
n
k
1iiXif
nk
1i
2i
Xif1n
12X
S
MEDIDAS DE DISPERSIÓN ABSOLUTA
1.- Calcular e interpretar la varianza para la siguiente tabla de
frecuencias.
S2 para datos agrupados 28
ING. WILLIAM LEON V.
Edad
Ii
n = 20
4 - 6 4
6 - 10 5
10 - 16 7 n < 30
16 - 20 3
20 - 30 1
Total n = 20
Nº de
personas
if
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
V ( X ) = 29,21 29 años2
En promedio la edad de estas personas se aleja con respecto a su promedio aritmético en aproximadamente 29 años al cuadrado.
S2 para datos agrupados
29 ING.
WILLIAM LEON V.
2
20
230203200
19
1
2
n
k
1iiXif
nk
1i
2i
Xif1n
1)X(V
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
b) Si n 30 :
S2 para datos agrupados
30 ING.
WILLIAM LEON V.
22i
2k
1iiXih
k
1iXihS
22i
2
n
k
1iiXif
n
k
1iXif
S
Usando frecuencias
relativas:
Usando frecuencias
absolutas:
MEDIDAS DE DISPERSIÓN ABSOLUTA
Calcular e interpretar la varianza de la siguiente tabla.
S2 para datos agrupados
31 ING.
WILLIAM LEON V.
Peso
Ii
Nº de
ingenieros
fi
n = 40
n > 30
50 - 60 6
60 - 70 8
70 - 80 10
80 - 90 9
90 -100 7
Total n = 40
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
En promedio el peso de los ingenieros se aleja con
respecto al peso promedio en aproximadamente 172 kilos
al cuadrado.
S2 para datos agrupados
32 ING.
WILLIAM LEON V.
94,171
2
40
3030
40
400236
n
k
1iiXif
n
k
1iXif
S
22i
2
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
Si una muestra de tamaño n se particiona en k muestras de
tamaño
cada una con su correspondiente promedio
aritmético,
y
su varianza
VARIANZA TOTAL O GLOBAL
33 ING. WILLIAM LEON V.
1 2 k
………..
……….
……….. 2kS2
2S21S
kx2x1x
kn2n1n
MEDIDAS DE DISPERSIÓN ABSOLUTA
La varianza para los k grupos juntos se calcula mediante la fórmula:
VARIANZA TOTAL O GLOBAL
34 ING.
WILLIAM LEON V.
2
n
xn
n
)Sx(n
S
k
1i
ii
k
1i
2i
2
ii
2
T
k
1i
inn
donde
MEDIDAS DE DISPERSIÓN ABSOLUTA
Se tienen tres grupos, de seis, nueve y siete
estudiantes respectivamente. Si las notas
correspondientes a cada uno de ellos son:
VARIANZA TOTAL O GLOBAL
35 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
Grupo 1: 12 16 08 11 10 12
Grupo 2: 17 14 07 13 11 18 13 15 14
Grupo 3: 10 13 11 08 12 09 12
= 2,98
En promedio las notas de los estudiantes de los tres grupos se alejan con
respecto al promedio total en aproximadamente 3 puntos.
VARIANZA TOTAL O GLOBAL
36 ING.
WILLIAM LEON V.
89,809,1222
)24,371,10(7)53,1056,13(9)1,75,11(621
222
2
k
i
TS
TS
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
Es la raíz cuadrada positiva de la varianza
y posee las mismas unidades que la media
aritmética,
Estas unidades ya no están elevadas al
cuadrado como en la varianza.
DESVIACIÓN ESTÁNDAR
37 ING.
WILLIAM LEON V.
)X(VS
MEDIDAS DE DISPERSIÓN ABSOLUTA
La desviación estándar o desviación típica se obtiene para
simplificar la interpretación de la varianza.
Cuando se calcula la varianza, se basa en datos elevados al
cuadrado, por lo que, el resultado obtenido debe
interpretarse en unidades al cuadrado;
por esta razón se obtiene la desviación estándar como la raíz
cuadrada de la variancia.
DESVIACIÓN ESTÁNDAR
38 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Interpretación de la Desviación Estándar:
Es una medida que muestra la distancia
promedio de los valores observados con
respecto a su media.
La distancia de cada valor con su media se
mide tomando el valor absoluto de la
diferencia entre ese valor y la media, es
decir, es la distancia de cada dato respecto
a su promedio.
DESVIACIÓN ESTÁNDAR
39 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Si se tiene una producción de franelas y
sabemos que diariamente se producen un
promedio de 500 franelas, adicionalmente
tenemos también que la desviación es de 25
franelas, tendremos entonces una mejor
comprensión del proceso pues este último
número nos indica que diariamente se
producen entre 475 y 525 franelas
DESVIACIÓN ESTÁNDAR
40 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo :
DESVIACIÓN ESTÁNDAR
Distribuciones con igual promedio aritmético y
diferente desviación estándar
ING. WILLIAM LEON V. 41
MEDIDAS DE DISPERSIÓN ABSOLUTA
=52
S=24
=52
S=12
=52
S=6
=52
S=12
DESVIACIÓN ESTÁNDAR
1.- Si la desviación típica del salario de
los ingenieros de sistemas es
$1,000 y la media aritmética es
$3,000,
Entonces los salarios de los
ingenieros fluctúan entre $2,000 y
$4,000 dólares.
ING. WILLIAM LEON V. 42
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplos:
DESVIACIÓN ESTÁNDAR
2.- Calcular la desviación estándar de las notas
obtenidas por un grupo de alumnos del cuarto
ciclo de la Facultad de Ingeniería Industrial de
la UNMSM en la primera evaluación de
estadística.
12 07 14 11 16 18 09 14 10
ING. WILLIAM LEON V. 43
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplos:
DESVIACIÓN ESTÁNDAR
n = 9
ING. WILLIAM LEON V. 44
1119
1iiX 4671
9
1i
2i
X
puntos5,325,12XS25,12
2
9
11194671
8
1XV
Por lo tanto:
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplos:
DESVIACIÓN ESTÁNDAR
Nota:
La varianza y la desviación estándar se utilizan
para comparar grupos cuya variable está
expresada en las mismas unidades.
Así, el grupo más homogéneo, más uniforme o
en el que la media aritmética es más
representativa será aquel en el cual la
varianza o la desviación estándar es menor.
ING. WILLIAM LEON V. 45
MEDIDAS DE DISPERSIÓN ABSOLUTA
DESVIACIÓN ESTÁNDAR
En varias semanas consecutivas, los
oficiales de policía: Martínez y Castro
aplicaron las siguientes infracciones por
exceso de velocidad:
ING. WILLIAM LEON V. 46
¿Cuál de los oficiales es más homogéneo con respecto al número de
infracciones?
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
Martínez : 31 38 42 32 39 26
Castro : 35 43 38 37 33 28 27
DESVIACIÓN ESTÁNDAR
Solución:
ING. WILLIAM LEON V. 47
35,87
2
6
20863907
5
1S2
M31,95
2
7
24174898
6
1S2
C
2M
S2C
S
El oficial Castro es más homogéneo en aplicar infracciones por
exceso de velocidad porque su varianza es menor.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
1. La desviación estándar será siempre un valor positivo o
cero, en el caso de que las puntuaciones sean iguales.
ING. WILLIAM LEON V. 51
MEDIDAS DE DISPERSIÓN ABSOLUTA
PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
2.- Si a todos los valores de la variable se les suma un número la desviación
estándar no varía.
ING. WILLIAM LEON V. 52
MEDIDAS DE DISPERSIÓN ABSOLUTA
PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
3.- Si todos los valores de la variable se multiplican por un número la
desviación estándar queda multiplicada por dicho número.
ING. WILLIAM LEON V. 53
MEDIDAS DE DISPERSIÓN ABSOLUTA
PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
4. Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones estándar se puede calcular la desviación
estándar total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
ING. WILLIAM LEON V. 54
MEDIDAS DE DISPERSIÓN ABSOLUTA
La variancia y la desviación típica también tienen sus
limitaciones.
Es similar a la media aritmética que es vulnerable a la
influencia de casos extremos.
Además, cuando las medias aritméticas no son
iguales o cuando las unidades de medición son
distintas, la comparación de desviaciones típicas
puede no ser significativa.
MEDIDAS DE DISPERSIÓN RELATIVA
55 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN RELATIVA
Es la desviación estándar dividida sobre la media aritmética multiplicada por 100. El mismo nos permite comparar desviaciones típicas de variables con unidades de medición distintas.
COEFICIENTE DE VARIACIÓN
56 ING.
WILLIAM LEON V.
100x
SCV
MEDIDAS DE DISPERSIÓN RELATIVA
El coeficiente de variación se expresa en unidades independientes de la naturaleza de la variable.
Interpretación del Coeficiente de Variación:
El Coeficiente de Variación, mide la
variabilidad relativa a la Media. Expresa la
proporción de variabilidad de una
característica por cada unidad de la Media.
COEFICIENTE DE VARIACIÓN
57 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN RELATIVA
Sabemos que la fábrica de textiles
produce 500 franelas diarias con una
desviación típica de más o menos (
)
25 franelas, entonces, el Coeficiente de
Variación será 25/500 = 0,05, es decir,
tenemos una variación de 5% en la
producción diaria de franelas.
COEFICIENTE DE VARIACIÓN
58 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN RELATIVA
En la práctica, se acostumbra considerar que un coeficiente de
variación según la tabla.
COEFICIENTE DE VARIACIÓN
59 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN RELATIVA
Valor del coeficiente
De variación (%)
Interpretación del coeficiente
Variabilidad Estabilidad
Igual a cero Nula Muy alta
Mayor de 0 hasta 20 Baja Alta
Mayor de 20 hasta 60 Moderada Moderada
Mayor de 60hata 90 Alta Baja
Mayor de 90 Muy alta Nula
Se desea comparar los sueldos de los
trabajadores de dos empresas A y B. Para
tal efecto se tienen los datos de la tabla
siguiente :
¿Se puede afirmar que los sueldos de los
trabajadores de la empresa A son más
uniformes? ¿Por qué?
COEFICIENTE DE VARIACIÓN
60 ING.
WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN RELATIVA
Ejemplo:
COEFICIENTE DE VARIACIÓN
61 ING.
WILLIAM LEON V.
Empresa A Empresa B
Sueldos
( $ )
Nº trabajadores Sueldos
( S/.)
Nº trabajadores
380 10 600-650 7
410 9 650-700 9
450 12 700-750 14
480 8 750-800 6
500 7 800-850 4
MEDIDAS DE DISPERSIÓN RELATIVA
Por lo tanto, los sueldos de los trabajadores de la empresa A no
son más uniformes; sino los sueldos de la empresa B porque
presenta menor coeficiente de variación.
COEFICIENTE DE VARIACIÓN
62 ING.
WILLIAM LEON V.
78,439x A 75,713xB
55,42SA
67,59SB
%68,910078,439
55,42CVA %36,8100
75,713
67,59CVA
MEDIDAS DE DISPERSIÓN RELATIVA
Tipificación. Valor Z
La tipificación es el proceso de restar la media y dividir entre su
desviación típica a una variable X.
De este modo se obtiene una nueva variable
ING. WILLIAM LEON V. 63
de media 0 y desviación estándar σ z = 1, que se denomina variable
tipificada.
Ejemplo:
Podemos preguntar si un elefante es más
grueso que una hormiga determinada, cada
uno en relación con su población.
ING. WILLIAM LEON V. 64
Esta nueva variable carece de unidades y permite hacer comparables dos
medidas que en un principio no lo son, por aludir a conceptos diferentes.
Tipificación. Valor Z
Ejemplo: Comparar el nivel académico de dos
estudiantes de diferentes Universidades para la
concesión de una beca de estudios.
En principio sería injusto concederla
directamente al que posea una nota media más
elevada, ya que la dificultad para conseguir una
buena calificación puede ser mucho mayor en un
centro que en el otro, lo que limita las
posibilidades de uno de los estudiante y favorece
al otro. ING. WILLIAM LEON V. 65
Ejemplo. Tipificación. Valor Z
También es aplicable al caso en que se quieran comparar individuos
semejantes de poblaciones diferentes.
Ejemplo: Tipificación
Se desea dar una beca a uno de dos estudiantes de sistemas educativos
diferentes. Se asignará al que tenga mejor expediente académico.
La estudiante A tiene una calificación de 8 en un sistema donde la
calificación de los alumnos se comporta como N(6,1).
La estudiante B tiene una calificación de 80 en un sistema donde la
calificación de los alumnos se comporta como N(70,10).
Tema 5: Modelos probabilísticos 66 Bioestadística. U. Málaga.
Ejemplo: Tipificación
Solución
No se puede comparar directamente 8 puntos de A frente a los
80 de B,
Pero como ambas poblaciones se comportan de modo normal,
Entonces se puede tipificar y observar las puntuaciones sobre
una distribución de referencia N(0,1)
Tema 5: Modelos probabilísticos 67 Bioestadística. U. Málaga.
Ejemplo: Tipificación
68
110
7080
21
68
B
BBB
A
AAA
xz
xz
Como ZA>ZB, se puede decir que el porcentaje
de compañeros del mismo sistema de estudios
que ha superado en calificación el estudiante A
es mayor que el que ha superado el estudiante
B.
Se puede concluir que el estudiante A es
mejor candidato para la beca.
Teorema de Chebyshev.
La desigualdad de Chebyshev es un resultado estadístico que ofrece
una cota inferior a la probabilidad de que el valor de una variable
aleatoria con varianza finita esté a una cierta distancia de su
esperanza matemática o de su media;
Equivalentemente, el teorema proporciona una cota superior a la
probabilidad de que los valores caigan fuera de esa distancia respecto
de la media.
El teorema es aplicable incluso en distribuciones que no tienen forma
de "curva de campana" y acota la cantidad de datos que están o no
"en medio".
15/04/2015 Ing. William Jaime León Velásquez 69
Teorema de Chebyshev.
Teorema: Sea X una variable aleatoria de media µ y varianza
finita s².
Entonces, para todo número real k > 0,
15/04/2015 Ing. William Jaime León Velásquez 70
Sólo los casos con k > 1 proporcionan información útil.
Teorema de Chebyshev. Ejemplo
El número de artículos producidos en una fábrica
durante una semana es una variable aleatoria con
media 50.
Si la varianza de una semana de producción se sabe
que es igual a 25, entonces
¿Qué se puede decir acerca de la probabilidad de
que en esta semana la producción difiera en más de
10 a la media?
15/04/2015 Ing. William Jaime León Velásquez 71
Teorema de Chebyshev. Ejemplo
Solución:
Por la desigualdad de Chebyshev
μ=50, σ2=25, K=10, Reemplazando:
15/04/2015 Ing. William Jaime León Velásquez 72
entonces la probabilidad de que en la semana de producción
el número de artículos exceda en mas de 10 a la media es a
lo más 0.25.
Teorema de Chebyshev.
Otra consecuencia del teorema es que para cada distribución de media
µ y desviación típica finita s, al menos la mitad de los valores caerán
en el intervalo
15/04/2015 Ing. William Jaime León Velásquez 73
Teorema de Chebyshev. En una clínica infantil se ha ido anotando, durante un mes, el número
de metros que cada niño anda, seguido y sin caerse, el primer día que
comienza a caminar, obteniéndose la tabla de información adjunta:
número de metros 1 2 3 4 5 6 7 8
número de niños 2 6 10 5 10 3 2 2
Se pide:.
a)Calcular la media aritmética,
b) Varianza y desviación típica.
c) ¿Entre qué dos valores se encuentra, como mínimo, el 75% de las
observaciones?
15/04/2015 Ing. William Jaime León Velásquez 74
Teorema de Chebyshev.
a)La media x viene dada por:
15/04/2015 Ing. William Jaime León Velásquez 75
b) Ahora determina las medidas de dispersión.
Utilizar la relación
Teorema de Chebyshev.
Consecuentemente, la desviación típica es
15/04/2015 Ing. William Jaime León Velásquez 76
Teorema de Chebyshev.
c) El Teorema de Chebyshev garantiza que, como mínimo,
el (1−
)· 100% de los datos se concentran en el intervalo
(
−kσ,
+kσ) y, por tanto, fuera de dicho intervalo se encuentra,
a lo sumo, el
· 100% de ellos.
Conforme a este teorema, imponemos que
De donde
y
15/04/2015 Ing. William Jaime León Velásquez 77
Teorema de Chebyshev.
Por lo tanto, k = 2.
Podemos así garantizar que, al menos, el 75% de los datos se
encuentran entre los valores
y
15/04/2015 Ing. William Jaime León Velásquez
78
NOTA:
Para cambiar
la imagen de
esta
dispositiva,
seleccione la
imagen y
elimínela. A
continuación
haga clic en el
icono
Imágenes en el
marcador de
posición e
inserte su
imagen. MEDIDAS
DE
FORMA Ing. William León Velásquez
MEDIDAS DE FORMA
80 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Una distribución es asimétrica
cuando sus datos tienden a
agruparse hacia uno de los extremos
de la distribución.
Cuando una curva es asimétrica,
tiene un sesgo.
ASIMETRÍA O SESGO
81 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
El sesgo puede ser de dos tipos:
Si los datos tienden a agruparse en las primeras clases, se
dice que el distribución tiene un sesgo positivo o que es
asimétrica positiva.
Si los datos tienden a agruparse en las últimas clases de la
distribución, se dice que esta tiene sesgo negativo o que es
asimétrica negativa.
ASIMETRÍA O SESGO
82 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Si una distribución es simétrica, entonces: = Me = Mo.
Entre más diferencia halla entre la y la Mo, más asimétrica es la
distribución. El coeficiente de Karl Pearson que simbolizamos como SK,
mide ésta diferencia en unidades de desviación estándar así:
El coeficiente de asimetría
COEFICIENTE DE KARL PEARSON
83 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
X
X
Si la media es mayor que la moda, entonces, SK es positivo. Es decir, el
sesgo es positivo.
Si la media es menor que la moda, SK es negativo, es decir el sesgo es
negativo.
Si la media es igual a la moda, SK=0 y la distribución es simétrica.
El coeficiente de asimetría
COEFICIENTE DE KARL PEARSON
84 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Según es grado de asimetría una distribución puede
ser:
El coeficiente de asimetría (CA)
85 ING.
WILLIAM LEON V.
Simétrica
sk = 0
Asimétrica positiva
sk > 0
Asimétrica negativa
sk< 0
MEDIDAS DE FORMA
EJEMPLO
Se ha recopilado la información del contenido de
grasa(expresado en libras) de 200 frascos de
Yogur en presentación de 2.5 libras, referidos a
una muestra aleatoria extraída de un lote de
3.600 frascos correspondientes a la producción
de un mes de la compañía LÁCTEOS S.A.
El valor de la media es 0.2608, el valor de la
moda es 0.258 y el valor de la desviación
estándar es 0.0408. Calcular el el coeficiente de
karl Pearson
EJEMPLO
SK = (0.2608 - 0.258)/0.0408 = 0.069.
Lo anterior significa que la asimetría es positiva.
Significa además, que la diferencia entre la
y la Mo equivale a 0.069 veces la desviación
estándar.
Aplicando la formula:
X
Mide el grado de elevación o
de agudeza de una
distribución comparada con la
curva normal.
CURTOSIS O APUNTAMIENTO
88 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Según su grado de curtosis, una distribución puede ser:
CURTOSIS O APUNTAMIENTO
89 ING. WILLIAM LEON V.
MEDIDAS DE FORMA
a) En la medida en que los diferentes tramos de la variable presenten frecuencias muy similares en todo su recorrido, entonces podemos afirmar que existe poca curtosis o concentración de los datos. Esta situación contribuye a que la dispersión sea alta. Una distribución con éstas características, se denomina PLATICÚRTICA O ACHATADA
PLATICÚRTICA O ACHATADA
90 ING. WILLIAM LEON V.
MEDIDAS DE FORMA
b) Por el contrario, si existe una cantidad muy significativa de datos que se encuentran concentrados en algún tramo de la variable, entonces decimos que la distribución es altamente concentrada o que tiene alta curtosis. Una distribución de éstas características se denomina LEPTOCÚRTICA O APUNTADA.
LEPTOCÚRTICA O APUNTADA
91 ING. WILLIAM LEON V.
MEDIDAS DE FORMA
c) Si la concentración es intermedia entre las dos situaciones anteriores, se dice que la distribución es MESOCÚRTICA o MODERADA CONCENTRACIÓN DE LOS DATOS. Una distribución con esta característica es propia de la distribución normal,
MESOCÚRTICA o MODERADA
92 ING. WILLIAM LEON V.
MEDIDAS DE FORMA
Coeficiente de Curtosis
93 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Éste coeficiente, resulta del cociente existente entre el momento de orden cuatro respecto a la media y la desviación estándar elevada a la cuarta.
COEFICIENTE DE CURTOSIS A4
94 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
La mayoría de los autores consideran que:
a) Si A4 - 3 = 0, la distribución es mesocúrtica o moderada
concentración de los datos. Tal es el caso de la distribución
normal
b) Si A4 - 3 > 0, la distribución es apuntada o leptocúrtica o alta
concentración de los datos.
Si A4 - 3 < 0, la distribución es achatada o platicúrtica o baja
concentración de los datos.
COEFICIENTE DE CURTOSIS A4
95 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Las tablas siguientes, nos permiten aclarar aún más el concepto de concentración de los
datos.
La tabla (a) es una distribución platicúrtica, puesto que las frecuencias son más o menos
similares.
La tabla (b), es una distribución leptocúrtica, puesto que la cuarta categoría, se destaca por
tener una frecuencia muy alta frente a las demás.
La tabla (c), es una distribución intermedia entre la (a) y la (b), por lo cual es muy posible
que se acerque a una distribución mesocúrtica.
COEFICIENTE DE CURTOSIS A4
96 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Se ha recopilado la información del contenido de
grasa(expresado en libras) de 200 frascos de Yogur en
presentación de 2.5 libras, referidos a una muestra aleatoria
extraída de un lote de 3.600 frascos correspondientes a la
producción de un mes de la compañía LÁCTEOS S.A.
Se tiene el siguiente cuadro
COEFICIENTE DE CURTOSIS A4
97 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
Reemplazando en la fórmula
COEFICIENTE DE CURTOSIS A4
98 ING.
WILLIAM LEON V.
MEDIDAS DE FORMA
En éste caso, la distribución es achatada o platicúrtica o poca
concentración de los datos. No obstante observemos, que el valor “-
0.47”, es muy cercano a cero, lo cual quiere decir, que la distribución
es casi una distribución mesocúrtica.