medidas de dispersion

100
Medidas de DISPERSIÓN William Jaime León Velásquez [email protected] ESTADISTICA Y PROBABILIDADES Universidad Nacional Mayor de San Marcos 4

Upload: glendy-guevara-alva

Post on 20-Dec-2015

74 views

Category:

Documents


4 download

DESCRIPTION

Variables estadisticas como desviacion estandar , coeficiente de variavilidad y grafico de distribucion.

TRANSCRIPT

Page 1: MEDIDAS DE DISPERSION

Medidas de

DISPERSIÓN William Jaime León Velásquez

[email protected]

ESTADISTICA Y

PROBABILIDADES

Universidad

Nacional Mayor de

San Marcos

4

Page 2: MEDIDAS DE DISPERSION

NOTA:

Para cambiar

la imagen de

esta

dispositiva,

seleccione la

imagen y

elimínela. A

continuación

haga clic en el

icono

Imágenes en el

marcador de

posición e

inserte su

imagen. MEDIDAS

DE

DISPERSION Ing. William León Velásquez

Page 3: MEDIDAS DE DISPERSION

Las Medidas de Dispersión, son

indicadores de variabilidad y cuya

importancia reside en la necesidad

de tomar decisiones, basadas en

estadísticas básicas.

MEDIDAS DE DISPERSIÓN

3 ING.

WILLIAM LEON V.

DEFINICIÓN

Page 4: MEDIDAS DE DISPERSION

Ejemplo: Se tiene una producción de franelas y se sabe

que semanalmente se producen un promedio

de 500 franelas, se puede decir que todos los

días se producen 100 franelas

Nada nos garantiza eso porque podrían

producirse en sólo dos días 250 franelas y el

promedio semanal nos daría un valor idéntico,

MEDIDAS DE DISPERSIÓN

4 ING.

WILLIAM LEON V.

DEFINICIÓN

Page 5: MEDIDAS DE DISPERSION

Si adicionalmente nos informan que tiene

una variación de 5 franelas, tendremos

entonces una mejor comprensión del

proceso, pues este último número nos

indica que semanalmente se producen

entre 495 y 505 franelas, es decir, que

diariamente sí se deben producir

aproximadamente 100 franelas.

MEDIDAS DE DISPERSIÓN

5 ING.

WILLIAM LEON V.

DEFINICIÓN

Page 6: MEDIDAS DE DISPERSION

La Dispersión se refiere a la variabilidad

entre los valores, es decir, qué tan

grandes son las diferencias entre los

valores.

La idea de dispersión se relaciona con la

mayor o menor concentración de los

datos en torno a un valor central,

generalmente la media aritmética.

MEDIDAS DE DISPERSIÓN

6 ING.

WILLIAM LEON V.

DEFINICIÓN

Page 7: MEDIDAS DE DISPERSION

Observe las dos figuras. La primera presenta una distribución con

datos más concentrados alrededor de su promedio 400 que la otra

figura con respecto a su promedio 800, es decir la primera figura es

una distribución con menos dispersión.

MEDIDAS DE DISPERSIÓN

7 ING.

WILLIAM LEON V.

DEFINICIÓN

Ejemplos:

Page 8: MEDIDAS DE DISPERSION

Las figuras siguientes muestran a tres distribuciones

con promedio 70, sin embargo las tres difieren en

cuanto a su variabilidad alrededor de la media.

MEDIDAS DE DISPERSIÓN

8 ING.

WILLIAM LEON V.

DEFINICIÓN

poca variabilidad alguna variabilidad gran variabilidad

Ejemplos:

Page 9: MEDIDAS DE DISPERSION

Se tienen dos grupos de estudiantes que sometidos a una prueba arrojaron

los siguientes puntajes:

MEDIDAS DE DISPERSIÓN. EJEMPLO

9 ING.

WILLIAM LEON V.

EJEMPLO

GRUPO A GRUPO B

Puntaje

estudiantes

Puntaje Nº estudiantes

9 2 11 5

10 4 12 10

11 6 13 5

13 4 Total 20

15 2

17 2

Total 20

Page 10: MEDIDAS DE DISPERSION

MEDIDAS DE DISPERSIÓN

Al calcular el promedio aritmético para ambos grupos se obtiene:

Este resultado puede conducir a conclusiones equivocadas cuando se está comparando distribuciones,

Pues se podría pensar que ambas secciones son idénticas en su rendimiento,

ING. WILLIAM LEON V. 10

EJEMPLO

12BA xx

Page 11: MEDIDAS DE DISPERSION

Siendo esta conclusión falsa ya que observando

los datos se aprecia que la sección B es más

homogénea.

Por lo tanto

En este caso el promedio no tiene suficiente

grado de representatividad por lo tanto poco

podrá describirnos acerca de los datos en

estudio.

MEDIDAS DE DISPERSIÓN

11 ING.

WILLIAM LEON V.

EJEMPLO

Page 12: MEDIDAS DE DISPERSION

MEDIDAS DE DISPERSIÓN

12 ING.

WILLIAM LEON V.

EJEMPLO

iX

Es necesario entonces calcular otras

medidas estadísticas para mostrar

cómo varían los datos alrededor del

promedio y esto se logra mediante las

medidas de dispersión.

Page 13: MEDIDAS DE DISPERSION

1.- Para evaluar la confiabilidad del promedio que se

está utilizando:

Una dispersión pequeña indica que los datos se

encuentran acumulados muy cerca, alrededor de la

medida de tendencia central establecida.

Por tanto, la medida de tendencia central se considera confiable o bastante

representativa de los datos.

Por el contrario, una dispersión grande indica que la medida escogida para

representar los datos no es muy confiable, es decir, no es muy representativa de

los datos.

FUNCIONES DE LAS MEDIDAS DE DISPERSIÓN

13 ING.

WILLIAM LEON V.

Es necesario estudiar las medidas de dispersión:

Page 14: MEDIDAS DE DISPERSION

2.- Para apreciar cuán dispersas están dos o más distribuciones:

Para poder comparar dos distribuciones de frecuencias entre sí, no sólo necesitamos la medida de tendencia central, sino también la dispersión entre las observaciones para no elaborar conclusiones erróneas.

A mayor medida de dispersión el grupo es más heterogéneo.

A menor medida de dispersión el grupo es más homogéneo o uniforme.

FUNCIONES DE LAS MEDIDAS DE DISPERSIÓN

14 ING.

WILLIAM LEON V.

Es necesario estudiar las medidas de dispersión:

Page 15: MEDIDAS DE DISPERSION

MEDIDAS DE DISPERSIÓN ABSOLUTA

15 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Cuantifican el grado de

concentración o de dispersión de

los valores de la variable en torno

de un promedio de la distribución.

Page 16: MEDIDAS DE DISPERSION

MEDIDAS DE DISPERSIÓN ABSOLUTA

16 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Principales medidas de dispersión absoluta:

Rango o Recorrido : R

Varianza : S2

Desviación Estándar : S

Page 17: MEDIDAS DE DISPERSION

Es la diferencia entre los valores máximo y

mínimo de los datos.

Esta medida es muy fácil de calcular sin

embargo no es muy recomendable porque sólo

toma en cuenta los valores extremos, sin

considerar los demás valores.

RANGO O RECORRIDO: R

17 ING.

WILLIAM LEON V.

mínXmáxXR

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 18: MEDIDAS DE DISPERSION

Interpretación de Rango: El Rango se puede interpretar como la amplitud existente entre una serie de datos,

Es decir,

mide cuán lejos está el valor más pequeño y el valor más grande de la muestra o población.

RANGO O RECORRIDO: R

18 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 19: MEDIDAS DE DISPERSION

Se tiene una producción de franelas y se sabe que

diariamente se producen un promedio de 500

franelas. Si un día se produce un mínimo de 415

franelas y otro día se produce un máximo de 573

franelas entonces el RANGO de producción estará

entre 158 franelas, es decir,

Podemos tener una producción de 158 franelas a

partir del valor mínimo.

RANGO O RECORRIDO: R

19 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo

Page 20: MEDIDAS DE DISPERSION

Es un valor numérico que cuantifica el

grado de dispersión de los valores de una

variable respecto a su media aritmética.

Es el promedio de los cuadrados de las

desviaciones de la variable respecto a su

media aritmética.

VARIANZA S2 , V X

20 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

2xiXMXV

Page 21: MEDIDAS DE DISPERSION

Notación:

Varianza muestral.

Varianza poblacional.

VARIANZA S2 , V X

21 ING.

WILLIAM LEON V.

:2S

:2

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 22: MEDIDAS DE DISPERSION

VARIANZA S2 , V X

22 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Nota:

La varianza nunca es negativa.

Cuando la variable toma un único valor; es decir cuando es constante entonces la varianza es cero.

Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

Page 23: MEDIDAS DE DISPERSION

S2 para datos no agrupados:

23 ING.

WILLIAM LEON V.

2

n

iXn

2i

X1n

1)x(V

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 24: MEDIDAS DE DISPERSION

Calcular e interpretar la varianza de los pesos de un grupo de personas.

Los datos son los siguientes:

56 65 68 70 72 76 78 80

S2 para datos no agrupados:

24 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 25: MEDIDAS DE DISPERSION

n = 8

S2 para datos no agrupados:

25 ING.

WILLIAM LEON V.

565

8

1iiX 32940

8

1i

2i

X

2oskil6184,60

2

8

565832940

7

12XS

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 26: MEDIDAS DE DISPERSION

En promedio los pesos del

grupo de personas, se alejan

con respecto al promedio

aritmético en

aproximadamente 61 kilos al

cuadrado.

S2 para datos no agrupados:

26 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 27: MEDIDAS DE DISPERSION

a) Si n < 30 :

S2 para datos agrupados

27 ING.

WILLIAM LEON V.

2

n

k

1iiXif

nk

1i

2i

Xif1n

12X

S

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 28: MEDIDAS DE DISPERSION

1.- Calcular e interpretar la varianza para la siguiente tabla de

frecuencias.

S2 para datos agrupados 28

ING. WILLIAM LEON V.

Edad

Ii

n = 20

4 - 6 4

6 - 10 5

10 - 16 7 n < 30

16 - 20 3

20 - 30 1

Total n = 20

Nº de

personas

if

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 29: MEDIDAS DE DISPERSION

V ( X ) = 29,21 29 años2

En promedio la edad de estas personas se aleja con respecto a su promedio aritmético en aproximadamente 29 años al cuadrado.

S2 para datos agrupados

29 ING.

WILLIAM LEON V.

2

20

230203200

19

1

2

n

k

1iiXif

nk

1i

2i

Xif1n

1)X(V

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 30: MEDIDAS DE DISPERSION

b) Si n 30 :

S2 para datos agrupados

30 ING.

WILLIAM LEON V.

22i

2k

1iiXih

k

1iXihS

22i

2

n

k

1iiXif

n

k

1iXif

S

Usando frecuencias

relativas:

Usando frecuencias

absolutas:

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 31: MEDIDAS DE DISPERSION

Calcular e interpretar la varianza de la siguiente tabla.

S2 para datos agrupados

31 ING.

WILLIAM LEON V.

Peso

Ii

Nº de

ingenieros

fi

n = 40

n > 30

50 - 60 6

60 - 70 8

70 - 80 10

80 - 90 9

90 -100 7

Total n = 40

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 32: MEDIDAS DE DISPERSION

En promedio el peso de los ingenieros se aleja con

respecto al peso promedio en aproximadamente 172 kilos

al cuadrado.

S2 para datos agrupados

32 ING.

WILLIAM LEON V.

94,171

2

40

3030

40

400236

n

k

1iiXif

n

k

1iXif

S

22i

2

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 33: MEDIDAS DE DISPERSION

Si una muestra de tamaño n se particiona en k muestras de

tamaño

cada una con su correspondiente promedio

aritmético,

y

su varianza

VARIANZA TOTAL O GLOBAL

33 ING. WILLIAM LEON V.

1 2 k

………..

……….

……….. 2kS2

2S21S

kx2x1x

kn2n1n

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 34: MEDIDAS DE DISPERSION

La varianza para los k grupos juntos se calcula mediante la fórmula:

VARIANZA TOTAL O GLOBAL

34 ING.

WILLIAM LEON V.

2

n

xn

n

)Sx(n

S

k

1i

ii

k

1i

2i

2

ii

2

T

k

1i

inn

donde

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 35: MEDIDAS DE DISPERSION

Se tienen tres grupos, de seis, nueve y siete

estudiantes respectivamente. Si las notas

correspondientes a cada uno de ellos son:

VARIANZA TOTAL O GLOBAL

35 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Grupo 1: 12 16 08 11 10 12

Grupo 2: 17 14 07 13 11 18 13 15 14

Grupo 3: 10 13 11 08 12 09 12

Page 36: MEDIDAS DE DISPERSION

= 2,98

En promedio las notas de los estudiantes de los tres grupos se alejan con

respecto al promedio total en aproximadamente 3 puntos.

VARIANZA TOTAL O GLOBAL

36 ING.

WILLIAM LEON V.

89,809,1222

)24,371,10(7)53,1056,13(9)1,75,11(621

222

2

k

i

TS

TS

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 37: MEDIDAS DE DISPERSION

Es la raíz cuadrada positiva de la varianza

y posee las mismas unidades que la media

aritmética,

Estas unidades ya no están elevadas al

cuadrado como en la varianza.

DESVIACIÓN ESTÁNDAR

37 ING.

WILLIAM LEON V.

)X(VS

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 38: MEDIDAS DE DISPERSION

La desviación estándar o desviación típica se obtiene para

simplificar la interpretación de la varianza.

Cuando se calcula la varianza, se basa en datos elevados al

cuadrado, por lo que, el resultado obtenido debe

interpretarse en unidades al cuadrado;

por esta razón se obtiene la desviación estándar como la raíz

cuadrada de la variancia.

DESVIACIÓN ESTÁNDAR

38 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 39: MEDIDAS DE DISPERSION

Interpretación de la Desviación Estándar:

Es una medida que muestra la distancia

promedio de los valores observados con

respecto a su media.

La distancia de cada valor con su media se

mide tomando el valor absoluto de la

diferencia entre ese valor y la media, es

decir, es la distancia de cada dato respecto

a su promedio.

DESVIACIÓN ESTÁNDAR

39 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 40: MEDIDAS DE DISPERSION

Si se tiene una producción de franelas y

sabemos que diariamente se producen un

promedio de 500 franelas, adicionalmente

tenemos también que la desviación es de 25

franelas, tendremos entonces una mejor

comprensión del proceso pues este último

número nos indica que diariamente se

producen entre 475 y 525 franelas

DESVIACIÓN ESTÁNDAR

40 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo :

Page 41: MEDIDAS DE DISPERSION

DESVIACIÓN ESTÁNDAR

Distribuciones con igual promedio aritmético y

diferente desviación estándar

ING. WILLIAM LEON V. 41

MEDIDAS DE DISPERSIÓN ABSOLUTA

=52

S=24

=52

S=12

=52

S=6

=52

S=12

Page 42: MEDIDAS DE DISPERSION

DESVIACIÓN ESTÁNDAR

1.- Si la desviación típica del salario de

los ingenieros de sistemas es

$1,000 y la media aritmética es

$3,000,

Entonces los salarios de los

ingenieros fluctúan entre $2,000 y

$4,000 dólares.

ING. WILLIAM LEON V. 42

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplos:

Page 43: MEDIDAS DE DISPERSION

DESVIACIÓN ESTÁNDAR

2.- Calcular la desviación estándar de las notas

obtenidas por un grupo de alumnos del cuarto

ciclo de la Facultad de Ingeniería Industrial de

la UNMSM en la primera evaluación de

estadística.

12 07 14 11 16 18 09 14 10

ING. WILLIAM LEON V. 43

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplos:

Page 44: MEDIDAS DE DISPERSION

DESVIACIÓN ESTÁNDAR

n = 9

ING. WILLIAM LEON V. 44

1119

1iiX 4671

9

1i

2i

X

puntos5,325,12XS25,12

2

9

11194671

8

1XV

Por lo tanto:

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplos:

Page 45: MEDIDAS DE DISPERSION

DESVIACIÓN ESTÁNDAR

Nota:

La varianza y la desviación estándar se utilizan

para comparar grupos cuya variable está

expresada en las mismas unidades.

Así, el grupo más homogéneo, más uniforme o

en el que la media aritmética es más

representativa será aquel en el cual la

varianza o la desviación estándar es menor.

ING. WILLIAM LEON V. 45

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 46: MEDIDAS DE DISPERSION

DESVIACIÓN ESTÁNDAR

En varias semanas consecutivas, los

oficiales de policía: Martínez y Castro

aplicaron las siguientes infracciones por

exceso de velocidad:

ING. WILLIAM LEON V. 46

¿Cuál de los oficiales es más homogéneo con respecto al número de

infracciones?

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Martínez : 31 38 42 32 39 26

Castro : 35 43 38 37 33 28 27

Page 47: MEDIDAS DE DISPERSION

DESVIACIÓN ESTÁNDAR

Solución:

ING. WILLIAM LEON V. 47

35,87

2

6

20863907

5

1S2

M31,95

2

7

24174898

6

1S2

C

2M

S2C

S

El oficial Castro es más homogéneo en aplicar infracciones por

exceso de velocidad porque su varianza es menor.

MEDIDAS DE DISPERSIÓN ABSOLUTA

Ejemplo:

Page 48: MEDIDAS DE DISPERSION

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

Page 49: MEDIDAS DE DISPERSION

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

Page 50: MEDIDAS DE DISPERSION

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

Page 51: MEDIDAS DE DISPERSION

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

1. La desviación estándar será siempre un valor positivo o

cero, en el caso de que las puntuaciones sean iguales.

ING. WILLIAM LEON V. 51

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 52: MEDIDAS DE DISPERSION

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

2.- Si a todos los valores de la variable se les suma un número la desviación

estándar no varía.

ING. WILLIAM LEON V. 52

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 53: MEDIDAS DE DISPERSION

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

3.- Si todos los valores de la variable se multiplican por un número la

desviación estándar queda multiplicada por dicho número.

ING. WILLIAM LEON V. 53

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 54: MEDIDAS DE DISPERSION

PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR

4. Si tenemos varias distribuciones con la misma media y conocemos sus

respectivas desviaciones estándar se puede calcular la desviación

estándar total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

ING. WILLIAM LEON V. 54

MEDIDAS DE DISPERSIÓN ABSOLUTA

Page 55: MEDIDAS DE DISPERSION

La variancia y la desviación típica también tienen sus

limitaciones.

Es similar a la media aritmética que es vulnerable a la

influencia de casos extremos.

Además, cuando las medias aritméticas no son

iguales o cuando las unidades de medición son

distintas, la comparación de desviaciones típicas

puede no ser significativa.

MEDIDAS DE DISPERSIÓN RELATIVA

55 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN RELATIVA

Page 56: MEDIDAS DE DISPERSION

Es la desviación estándar dividida sobre la media aritmética multiplicada por 100. El mismo nos permite comparar desviaciones típicas de variables con unidades de medición distintas.

COEFICIENTE DE VARIACIÓN

56 ING.

WILLIAM LEON V.

100x

SCV

MEDIDAS DE DISPERSIÓN RELATIVA

El coeficiente de variación se expresa en unidades independientes de la naturaleza de la variable.

Page 57: MEDIDAS DE DISPERSION

Interpretación del Coeficiente de Variación:

El Coeficiente de Variación, mide la

variabilidad relativa a la Media. Expresa la

proporción de variabilidad de una

característica por cada unidad de la Media.

COEFICIENTE DE VARIACIÓN

57 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN RELATIVA

Page 58: MEDIDAS DE DISPERSION

Sabemos que la fábrica de textiles

produce 500 franelas diarias con una

desviación típica de más o menos (

)

25 franelas, entonces, el Coeficiente de

Variación será 25/500 = 0,05, es decir,

tenemos una variación de 5% en la

producción diaria de franelas.

COEFICIENTE DE VARIACIÓN

58 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN RELATIVA

Page 59: MEDIDAS DE DISPERSION

En la práctica, se acostumbra considerar que un coeficiente de

variación según la tabla.

COEFICIENTE DE VARIACIÓN

59 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN RELATIVA

Valor del coeficiente

De variación (%)

Interpretación del coeficiente

Variabilidad Estabilidad

Igual a cero Nula Muy alta

Mayor de 0 hasta 20 Baja Alta

Mayor de 20 hasta 60 Moderada Moderada

Mayor de 60hata 90 Alta Baja

Mayor de 90 Muy alta Nula

Page 60: MEDIDAS DE DISPERSION

Se desea comparar los sueldos de los

trabajadores de dos empresas A y B. Para

tal efecto se tienen los datos de la tabla

siguiente :

¿Se puede afirmar que los sueldos de los

trabajadores de la empresa A son más

uniformes? ¿Por qué?

COEFICIENTE DE VARIACIÓN

60 ING.

WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN RELATIVA

Ejemplo:

Page 61: MEDIDAS DE DISPERSION

COEFICIENTE DE VARIACIÓN

61 ING.

WILLIAM LEON V.

Empresa A Empresa B

Sueldos

( $ )

Nº trabajadores Sueldos

( S/.)

Nº trabajadores

380 10 600-650 7

410 9 650-700 9

450 12 700-750 14

480 8 750-800 6

500 7 800-850 4

MEDIDAS DE DISPERSIÓN RELATIVA

Page 62: MEDIDAS DE DISPERSION

Por lo tanto, los sueldos de los trabajadores de la empresa A no

son más uniformes; sino los sueldos de la empresa B porque

presenta menor coeficiente de variación.

COEFICIENTE DE VARIACIÓN

62 ING.

WILLIAM LEON V.

78,439x A 75,713xB

55,42SA

67,59SB

%68,910078,439

55,42CVA %36,8100

75,713

67,59CVA

MEDIDAS DE DISPERSIÓN RELATIVA

Page 63: MEDIDAS DE DISPERSION

Tipificación. Valor Z

La tipificación es el proceso de restar la media y dividir entre su

desviación típica a una variable X.

De este modo se obtiene una nueva variable

ING. WILLIAM LEON V. 63

de media 0 y desviación estándar σ z = 1, que se denomina variable

tipificada.

Page 64: MEDIDAS DE DISPERSION

Ejemplo:

Podemos preguntar si un elefante es más

grueso que una hormiga determinada, cada

uno en relación con su población.

ING. WILLIAM LEON V. 64

Esta nueva variable carece de unidades y permite hacer comparables dos

medidas que en un principio no lo son, por aludir a conceptos diferentes.

Tipificación. Valor Z

Page 65: MEDIDAS DE DISPERSION

Ejemplo: Comparar el nivel académico de dos

estudiantes de diferentes Universidades para la

concesión de una beca de estudios.

En principio sería injusto concederla

directamente al que posea una nota media más

elevada, ya que la dificultad para conseguir una

buena calificación puede ser mucho mayor en un

centro que en el otro, lo que limita las

posibilidades de uno de los estudiante y favorece

al otro. ING. WILLIAM LEON V. 65

Ejemplo. Tipificación. Valor Z

También es aplicable al caso en que se quieran comparar individuos

semejantes de poblaciones diferentes.

Page 66: MEDIDAS DE DISPERSION

Ejemplo: Tipificación

Se desea dar una beca a uno de dos estudiantes de sistemas educativos

diferentes. Se asignará al que tenga mejor expediente académico.

La estudiante A tiene una calificación de 8 en un sistema donde la

calificación de los alumnos se comporta como N(6,1).

La estudiante B tiene una calificación de 80 en un sistema donde la

calificación de los alumnos se comporta como N(70,10).

Tema 5: Modelos probabilísticos 66 Bioestadística. U. Málaga.

Page 67: MEDIDAS DE DISPERSION

Ejemplo: Tipificación

Solución

No se puede comparar directamente 8 puntos de A frente a los

80 de B,

Pero como ambas poblaciones se comportan de modo normal,

Entonces se puede tipificar y observar las puntuaciones sobre

una distribución de referencia N(0,1)

Tema 5: Modelos probabilísticos 67 Bioestadística. U. Málaga.

Page 68: MEDIDAS DE DISPERSION

Ejemplo: Tipificación

68

110

7080

21

68

B

BBB

A

AAA

xz

xz

Como ZA>ZB, se puede decir que el porcentaje

de compañeros del mismo sistema de estudios

que ha superado en calificación el estudiante A

es mayor que el que ha superado el estudiante

B.

Se puede concluir que el estudiante A es

mejor candidato para la beca.

Page 69: MEDIDAS DE DISPERSION

Teorema de Chebyshev.

La desigualdad de Chebyshev es un resultado estadístico que ofrece

una cota inferior a la probabilidad de que el valor de una variable

aleatoria con varianza finita esté a una cierta distancia de su

esperanza matemática o de su media;

Equivalentemente, el teorema proporciona una cota superior a la

probabilidad de que los valores caigan fuera de esa distancia respecto

de la media.

El teorema es aplicable incluso en distribuciones que no tienen forma

de "curva de campana" y acota la cantidad de datos que están o no

"en medio".

15/04/2015 Ing. William Jaime León Velásquez 69

Page 70: MEDIDAS DE DISPERSION

Teorema de Chebyshev.

Teorema: Sea X una variable aleatoria de media µ y varianza

finita s².

Entonces, para todo número real k > 0,

15/04/2015 Ing. William Jaime León Velásquez 70

Sólo los casos con k > 1 proporcionan información útil.

Page 71: MEDIDAS DE DISPERSION

Teorema de Chebyshev. Ejemplo

El número de artículos producidos en una fábrica

durante una semana es una variable aleatoria con

media 50.

Si la varianza de una semana de producción se sabe

que es igual a 25, entonces

¿Qué se puede decir acerca de la probabilidad de

que en esta semana la producción difiera en más de

10 a la media?

15/04/2015 Ing. William Jaime León Velásquez 71

Page 72: MEDIDAS DE DISPERSION

Teorema de Chebyshev. Ejemplo

Solución:

Por la desigualdad de Chebyshev

μ=50, σ2=25, K=10, Reemplazando:

15/04/2015 Ing. William Jaime León Velásquez 72

entonces la probabilidad de que en la semana de producción

el número de artículos exceda en mas de 10 a la media es a

lo más 0.25.

Page 73: MEDIDAS DE DISPERSION

Teorema de Chebyshev.

Otra consecuencia del teorema es que para cada distribución de media

µ y desviación típica finita s, al menos la mitad de los valores caerán

en el intervalo

15/04/2015 Ing. William Jaime León Velásquez 73

Page 74: MEDIDAS DE DISPERSION

Teorema de Chebyshev. En una clínica infantil se ha ido anotando, durante un mes, el número

de metros que cada niño anda, seguido y sin caerse, el primer día que

comienza a caminar, obteniéndose la tabla de información adjunta:

número de metros 1 2 3 4 5 6 7 8

número de niños 2 6 10 5 10 3 2 2

Se pide:.

a)Calcular la media aritmética,

b) Varianza y desviación típica.

c) ¿Entre qué dos valores se encuentra, como mínimo, el 75% de las

observaciones?

15/04/2015 Ing. William Jaime León Velásquez 74

Page 75: MEDIDAS DE DISPERSION

Teorema de Chebyshev.

a)La media x viene dada por:

15/04/2015 Ing. William Jaime León Velásquez 75

b) Ahora determina las medidas de dispersión.

Utilizar la relación

Page 76: MEDIDAS DE DISPERSION

Teorema de Chebyshev.

Consecuentemente, la desviación típica es

15/04/2015 Ing. William Jaime León Velásquez 76

Page 77: MEDIDAS DE DISPERSION

Teorema de Chebyshev.

c) El Teorema de Chebyshev garantiza que, como mínimo,

el (1−

)· 100% de los datos se concentran en el intervalo

(

−kσ,

+kσ) y, por tanto, fuera de dicho intervalo se encuentra,

a lo sumo, el

· 100% de ellos.

Conforme a este teorema, imponemos que

De donde

y

15/04/2015 Ing. William Jaime León Velásquez 77

Page 78: MEDIDAS DE DISPERSION

Teorema de Chebyshev.

Por lo tanto, k = 2.

Podemos así garantizar que, al menos, el 75% de los datos se

encuentran entre los valores

y

15/04/2015 Ing. William Jaime León Velásquez

78

Page 79: MEDIDAS DE DISPERSION

NOTA:

Para cambiar

la imagen de

esta

dispositiva,

seleccione la

imagen y

elimínela. A

continuación

haga clic en el

icono

Imágenes en el

marcador de

posición e

inserte su

imagen. MEDIDAS

DE

FORMA Ing. William León Velásquez

Page 80: MEDIDAS DE DISPERSION

MEDIDAS DE FORMA

80 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 81: MEDIDAS DE DISPERSION

Una distribución es asimétrica

cuando sus datos tienden a

agruparse hacia uno de los extremos

de la distribución.

Cuando una curva es asimétrica,

tiene un sesgo.

ASIMETRÍA O SESGO

81 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 82: MEDIDAS DE DISPERSION

El sesgo puede ser de dos tipos:

Si los datos tienden a agruparse en las primeras clases, se

dice que el distribución tiene un sesgo positivo o que es

asimétrica positiva.

Si los datos tienden a agruparse en las últimas clases de la

distribución, se dice que esta tiene sesgo negativo o que es

asimétrica negativa.

ASIMETRÍA O SESGO

82 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 83: MEDIDAS DE DISPERSION

Si una distribución es simétrica, entonces: = Me = Mo.

Entre más diferencia halla entre la y la Mo, más asimétrica es la

distribución. El coeficiente de Karl Pearson que simbolizamos como SK,

mide ésta diferencia en unidades de desviación estándar así:

El coeficiente de asimetría

COEFICIENTE DE KARL PEARSON

83 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

X

X

Page 84: MEDIDAS DE DISPERSION

Si la media es mayor que la moda, entonces, SK es positivo. Es decir, el

sesgo es positivo.

Si la media es menor que la moda, SK es negativo, es decir el sesgo es

negativo.

Si la media es igual a la moda, SK=0 y la distribución es simétrica.

El coeficiente de asimetría

COEFICIENTE DE KARL PEARSON

84 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 85: MEDIDAS DE DISPERSION

Según es grado de asimetría una distribución puede

ser:

El coeficiente de asimetría (CA)

85 ING.

WILLIAM LEON V.

Simétrica

sk = 0

Asimétrica positiva

sk > 0

Asimétrica negativa

sk< 0

MEDIDAS DE FORMA

Page 86: MEDIDAS DE DISPERSION

EJEMPLO

Se ha recopilado la información del contenido de

grasa(expresado en libras) de 200 frascos de

Yogur en presentación de 2.5 libras, referidos a

una muestra aleatoria extraída de un lote de

3.600 frascos correspondientes a la producción

de un mes de la compañía LÁCTEOS S.A.

El valor de la media es 0.2608, el valor de la

moda es 0.258 y el valor de la desviación

estándar es 0.0408. Calcular el el coeficiente de

karl Pearson

Page 87: MEDIDAS DE DISPERSION

EJEMPLO

SK = (0.2608 - 0.258)/0.0408 = 0.069.

Lo anterior significa que la asimetría es positiva.

Significa además, que la diferencia entre la

y la Mo equivale a 0.069 veces la desviación

estándar.

Aplicando la formula:

X

Page 88: MEDIDAS DE DISPERSION

Mide el grado de elevación o

de agudeza de una

distribución comparada con la

curva normal.

CURTOSIS O APUNTAMIENTO

88 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 89: MEDIDAS DE DISPERSION

Según su grado de curtosis, una distribución puede ser:

CURTOSIS O APUNTAMIENTO

89 ING. WILLIAM LEON V.

MEDIDAS DE FORMA

Page 90: MEDIDAS DE DISPERSION

a) En la medida en que los diferentes tramos de la variable presenten frecuencias muy similares en todo su recorrido, entonces podemos afirmar que existe poca curtosis o concentración de los datos. Esta situación contribuye a que la dispersión sea alta. Una distribución con éstas características, se denomina PLATICÚRTICA O ACHATADA

PLATICÚRTICA O ACHATADA

90 ING. WILLIAM LEON V.

MEDIDAS DE FORMA

Page 91: MEDIDAS DE DISPERSION

b) Por el contrario, si existe una cantidad muy significativa de datos que se encuentran concentrados en algún tramo de la variable, entonces decimos que la distribución es altamente concentrada o que tiene alta curtosis. Una distribución de éstas características se denomina LEPTOCÚRTICA O APUNTADA.

LEPTOCÚRTICA O APUNTADA

91 ING. WILLIAM LEON V.

MEDIDAS DE FORMA

Page 92: MEDIDAS DE DISPERSION

c) Si la concentración es intermedia entre las dos situaciones anteriores, se dice que la distribución es MESOCÚRTICA o MODERADA CONCENTRACIÓN DE LOS DATOS. Una distribución con esta característica es propia de la distribución normal,

MESOCÚRTICA o MODERADA

92 ING. WILLIAM LEON V.

MEDIDAS DE FORMA

Page 93: MEDIDAS DE DISPERSION

Coeficiente de Curtosis

93 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 94: MEDIDAS DE DISPERSION

Éste coeficiente, resulta del cociente existente entre el momento de orden cuatro respecto a la media y la desviación estándar elevada a la cuarta.

COEFICIENTE DE CURTOSIS A4

94 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 95: MEDIDAS DE DISPERSION

La mayoría de los autores consideran que:

a) Si A4 - 3 = 0, la distribución es mesocúrtica o moderada

concentración de los datos. Tal es el caso de la distribución

normal

b) Si A4 - 3 > 0, la distribución es apuntada o leptocúrtica o alta

concentración de los datos.

Si A4 - 3 < 0, la distribución es achatada o platicúrtica o baja

concentración de los datos.

COEFICIENTE DE CURTOSIS A4

95 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 96: MEDIDAS DE DISPERSION

Las tablas siguientes, nos permiten aclarar aún más el concepto de concentración de los

datos.

La tabla (a) es una distribución platicúrtica, puesto que las frecuencias son más o menos

similares.

La tabla (b), es una distribución leptocúrtica, puesto que la cuarta categoría, se destaca por

tener una frecuencia muy alta frente a las demás.

La tabla (c), es una distribución intermedia entre la (a) y la (b), por lo cual es muy posible

que se acerque a una distribución mesocúrtica.

COEFICIENTE DE CURTOSIS A4

96 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 97: MEDIDAS DE DISPERSION

Se ha recopilado la información del contenido de

grasa(expresado en libras) de 200 frascos de Yogur en

presentación de 2.5 libras, referidos a una muestra aleatoria

extraída de un lote de 3.600 frascos correspondientes a la

producción de un mes de la compañía LÁCTEOS S.A.

Se tiene el siguiente cuadro

COEFICIENTE DE CURTOSIS A4

97 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

Page 98: MEDIDAS DE DISPERSION

Reemplazando en la fórmula

COEFICIENTE DE CURTOSIS A4

98 ING.

WILLIAM LEON V.

MEDIDAS DE FORMA

En éste caso, la distribución es achatada o platicúrtica o poca

concentración de los datos. No obstante observemos, que el valor “-

0.47”, es muy cercano a cero, lo cual quiere decir, que la distribución

es casi una distribución mesocúrtica.

Page 99: MEDIDAS DE DISPERSION

FIN [email protected]

Page 100: MEDIDAS DE DISPERSION