medidas de tendencia central y dispercion

29
Caracterización de variables cuantitativas José David Ojeda

Upload: jose-ojeda

Post on 02-Aug-2015

1.759 views

Category:

Education


1 download

TRANSCRIPT

Page 1: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Caracterización de variables cuantitativas

José David Ojeda

Page 2: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Datos no agrupados

Page 3: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de tendencia central

Page 4: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de tendencia central

1. El diagrama de dispersiónEs la representación de los datos en la recta numérica mediante puntos.Ejemplo: A continuación se relacionan las cantidades de artículos vendidos en una tienda de computadores durante 15 días.25, 32, 20, 21, 29, 26, 30, 25, 19, 22, 17, 28, 30, 21, 40.

Page 5: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

1. El diagrama de dispersión• Elaborar un diagrama de dispersión y

analizarlo.

En la gráfica se puede observar que la mayoría de los datos, exceptuando el dato 40, se encuentran cercanos entre si. Es decir que el numero de artículos vendidos fue muy parecido en 14 de los 15 días.

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Page 6: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de tendencia central

2. La Media:La media aritmética o promedio se representa por y se interpreta como el individuo típico de la población:

1 2 31,

n

ini

XX X X X

Xn n

X

Page 7: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

2. La Media:• Ejemplo: El jefe de recursos humanos de

una empresa esta interesado en determinar el numero medio de cigarrillo que consumen los trabajadores en un día. Para ello pregunto a 16 empleados por la cantidad de cigarrillos que fumaron ese día, los resultados fueron:

• 3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 0Calcular el numero promedio de cigarrillos que consume un trabajador.

Page 8: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

2. La Media:• Solución: Calculamos la media aritmética

El numero medio de cigarrillos que consume un trabajador en un día es de tres. Se espera que al escoger al azar un empleado de la empresa, fume alrededor de 3 cigarrillos

3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 016

X

483

16X

Page 9: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de tendencia central

3. La Mediana:Es el dato que divide un grupo de datos en dos partes iguales. Se simboliza .Para calcular la mediana es necesario ordenar los datos de menor a mayor, una vez ordenados se ubica el valor que esta en el centro de ellos.

Page 10: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

3. La Mediana:• En el calculo de la mediana se pueden

presentar dos casos:• Caso 1: Numero de datos impar: En

este caso se suma 1 a la cantidad de datos y se divide entre 2. La mediana será el dato que esta en esa posición.Por ejemplo si se tienen 11 datos, la mediana estará en la posiciónluego de ordenar los datos.11 1

62

Page 11: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

3. La Mediana:

• Ejemplo: Un biólogo desea probar que el diámetro del tronco de un árbol influye en la producción de oxigeno para ello hace la medición del diámetro de 7 arboles en centímetros:110, 79, 128, 161, 158, 175, 50.Calcular la mediana de los diámetros de tronco.

Page 12: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

3. La Mediana:

• Solución:Ordenamos los datos de menor a mayor50, 79, 110, 128, 158, 161, 175

Se concluye que el 50% de los diámetros de tronco son iguales o superior a 128.

47 12

128x x

Page 13: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

3. La Mediana:• Caso 2: Numero de datos par: Se

divide el total de datos entre 2. Se toma el dato que esta en esa posición y el dato siguiente, la mediana será el promedio de estos dos datos.

Page 14: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

3. La Mediana:• Ejemplo 2: En un simulacro se midió el

tiempo de reacción de seis patrullas de policías luego de recibir una llamada de emergencia. Los resultados en minutos fueron:

6,0 5,99 5,41 5,44 5,21 5,48Calcular la mediana de los tiempos de reacción.

• Solución: Ordenamos los datos de menor a mayor.

Page 15: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

3. La Mediana:

5,21 5,41 5,44 5,48 5,99 6,0

Se puede concluir que el 50% de las patrullas llegaron en 5,46 minutos o menos.

6 61

2 2 3 4 5,44 5,485,46

2 2 2

x xx x

Page 16: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

Page 17: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

Page 18: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

Page 19: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

2

2 1

( )

1

n

ii

x XS

n

Page 20: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión• Ejemplo: El entrenador de un equipo

de futbol pregunto a los jugadores sobre el tiempo en horas que dedican al entrenamiento por semana. Los resultados fueron:

5, 5, 6, 8, 7, 7, 9, 5, 6, 8, 4, 11, 6, 10, 8.

Solución: Hallamos la media de los datos

5 5 6 8 7 7 9 5 6 8 4 11 6 10 815

X

10515

7X

Page 21: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión• Hallamos la desviación de cada uno de

los datos con respecto a la media y su cuadrado.

• Teniendo en cuenta la tabla anterior, la varianza es:

2 4 4 1 1 0 0 4 4 1 1 9 16 1 9 115 1

S

2 25614

4 HorasS

Page 22: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

3. Desviación EstándarSe nota como S, y es la raíz cuadrada de la varianza

La desviación estándar se utiliza para interpretar el comportamiento de los datos y la representatividad del promedio

2

2 1

( )

1

n

ii

x XS S

n

Page 23: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

• La varianza al ser sumada y restada dos veces a la media, proporciona un intervalo en el cual se encuentra el 95% de los datos, este intervalo se denomina intervalo de extremos :

• Si este intervalo es muy grande, se dice que el promedio no representa bien a los datos. En el caso contrario se dirá que el promedio es un buen representante de los datos.

2 , 2X s X s

Page 24: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión• Para el ejemplo del equipo de futbol

la desviación estándar sería:

• Construimos el intervalo de extremos:

Se observa que los datos están muy alejados entre si, ya que el 95% de los futbolistas entrena entre 3 y 11 horas semanales.

2 2 2 Horas4 HorasSS

7 2(2) 2 , 2 3, 7 2(2) , 11X s X s

Page 25: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

• Ejemplo: A continuación se muestran las edades de 20 pacientes del pabellón de adultos del Hospital General55, 78, 50, 41, 55, 35, 41, 42, 51, 54, 41, 54, 72, 76, 75, 47, 62, 59, 75, 46.

• Caracterizar la variable utilizando la media, el rango, la varianza y la desviación estándar y el intervalo de extremos.

Page 26: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

1). Hallamos la media

2). Hallamos el rango

55 78 50 41 55 35 41 42 51 54 41 54 72 76 75 47 62 59 75 4620

X

110920

55,45X

78 35

43

Mayor MenorRango D D

Rango

Rango

Page 27: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

3). Hallamos la VarianzaEn la siguiente tabla hallamos la desviación de cada dato y el cuadrado de estaDato 55 78 50 41 55 35 41 42 51 54

Desviación

-0,45 22,55 -5,45-

14,45-0,45

-20,45

-14,45

-13,45

-4,45 -1,45

Cuad. Des.

0,203

508,5

29,7208,

80,20

3418,

2208,

8180,

919,8

2,103

Dato 41 54 72 76 75 47 62 59 75 46

Desviación

-14,45

-1,45 16,55 20,55 19,55 -8,45 6,55 3,55 19,55 -9,45

Cuad. Des.

208,8

2,103

273,9

422,3

382,2

71,4 42,9 12,6382,

289,3

Page 28: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión

• Utilizando los resultados de la tabla anterior, hallamos la varianza:

4). Hallamos la Desviación Estándar:

2 20,203 508,5 29,7 ... 89,3

20 1182,36 añosS

2 2182,36 añ 13,5 os añosS S

Page 29: MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

Medidas de Dispersión5). Hallamos el intervalo de extremos

Dentro de este intervalo se encuentra el 95% de los datos, como el intervalo es muy grande, aproximadamente de 28 a 83 años, la variabilidad es muy alta.Las edades de los pacientes son entonces muy heterogéneas, la media no representa bien los datos

55,45 2(13,5) 55,45 2(13,5)

2 , 2 ,

28, , 45 82,45

X s X s