parte ii - universidad centroamericana josé … · web view1.5 medidas de tendencia central 1.5.1...

31
INDICE . PARTE II. ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA 1. Estadística Descriptiva 1.1 Introducción 1.2 Organización de los datos de un conjunto 1.3 Distribuciones de frecuencias 1.3.1 Definición de distribución de frecuencia. Terminología 1.3.2 Reglas generales para formar distribuciones de frecuencia 1.3.3 Ejercicios 1.4 Representación grafica de los datos de un conjunto 1.4.1 Variables Cualitativas 1.4.2 Variables Cuantitativas Discretas 1.4.3 Variables Cuantitativas Continuas 1.4.4 Ejercicios 1.5 Medidas de tendencia central 1.5.1 La media aritmética (Media Ponderada) 1.5.2 La moda 1.5.3 La mediana 1.5.4 Ejercicios 1.6 Medidas de dispersión 1.6.1 Amplitud (recorrido o rango) 1.6.2 Desviación típica (o estándar).Varianza 1.6.3 Ejercicios 1.7 Medidas de Posición 1.7.1 Cuantiles(cuartiles, deciles y percentiles) 1.7.2 Ejercicios 1

Upload: truongthuy

Post on 27-Sep-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

INDICE .

PARTE II. ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

1. Estadística Descriptiva 1.1 Introducción 1.2 Organización de los datos de un conjunto 1.3 Distribuciones de frecuencias 1.3.1 Definición de distribución de frecuencia. Terminología 1.3.2 Reglas generales para formar distribuciones de frecuencia 1.3.3 Ejercicios 1.4 Representación grafica de los datos de un conjunto

1.4.1 Variables Cualitativas1.4.2 Variables Cuantitativas Discretas1.4.3 Variables Cuantitativas Continuas1.4.4 Ejercicios

1.5 Medidas de tendencia central 1.5.1 La media aritmética (Media Ponderada) 1.5.2 La moda

1.5.3 La mediana 1.5.4 Ejercicios

1.6 Medidas de dispersión 1.6.1 Amplitud (recorrido o rango)

1.6.2 Desviación típica (o estándar).Varianza 1.6.3 Ejercicios

1.7 Medidas de Posición 1.7.1 Cuantiles(cuartiles, deciles y percentiles) 1.7.2 Ejercicios

1

PARTE II. ELEMENTOS DE PROBABILIDAD Y ESTADISTICA

1. ESTADÍSTICA DESCRIPTIVA

1.1 INTRODUCCION

La estadística se puede definir como la ciencia encargada de recopilar, organizar e interpretar conjuntos de datos, de manera que pueda llevar a conclusiones válidas. Los datos se obtienen (de una muestra o población) observando o experimentando.

- La primera parte de la definición: recopilar, organizar e interpretar conjuntos de datos se llama “Estadística Descriptiva”.

- La segunda parte: interpretar datos de manera que pueda llevar a conclusiones válidas se llama “Estadística Inferencial”.

Nos ocuparemos de la Estadística Descriptiva.Cuando el número de datos es relativamente grande, resulta conveniente, para facilitar su interpretación, primero organizarlos y luego representarlos gráficamente.

1.2 ORGANIZACIÓN DE LOS DATOS DE UN CONJUNTO

Los datos recopilados se analizan de acuerdo con una característica: “CUALITATIVA”, por ejemplo, el estado civil, sexo y nacionalidad de una persona; calidad de un plaguicida, como dañino o no dañino para la salud. Cuando la característica es “CUANTITATIVA” se distinguen dos casos: características discretas, como el número de hijos en la familia. En este caso la variable toma valores aislados, 0, 1, 2, 3, etc. Características continuas, como el peso y la estatura de una persona. Aquí la variable en consideración toma todos los valores reales en un intervalo.

1.3 DISTRIBUCIONES DE FRECUENCIAS

1.3.1DEFINICION DE FRECUENCIA Y TERMINOLOGÍA

Definición:Las distribuciones de frecuencias son disposiciones tabulares de los datos, por clases con sus respectivas frecuencias absolutas.

Terminología:CLASES. (Para una característica continua): Son intervalos abiertos o cerrados. Deben ser exhaustivos y excluyentes; es decir, tales que se elimine la posibilidad

Lic. Mauro H. Henríquez Rauda

2

de que un dato dado no corresponda a clase alguna o que pueda quedar incluido en más de una.FRECUENCIA ABSOLUTA: Es el número de datos que pertenecen a la clase.Ejemplo 1. Distribución de frecuencias de puntajes obtenidos por 120 estudiantes en un examen de matemática.

Clase Puntajes (x) Frecuencias Absolutas1ra. 28 - 32 102da. 33 - 37 153ra. 38 – 42 204ta. 43 – 47 355ta. 48 – 52 196ta. 53 – 57 127ma. 58 - 62 9

Total 120

- Los números que definen una clase: 28-32, 33-37, etc. se llaman Límites de Clase.

- Los valores a la izquierda: 28, 37, etc. se llaman Limites Inferiores aparentes, los valores a la derecha: 32, 37, etc. son los Limites Superiores aparentes de la clase.

- La diferencia entre el límite superior (ls) y el límite inferior (li), más 1, es un Intervalo de Clase (o Amplitud de Clase); y se denota por ic . En símbolos:

ic = ls – li + 1 - Marca de clase o punto medio: Es la mitad de la suma de los límites de la clase.Los datos que corresponden a una variable continua, generalmente no son medidas exactas. Así decimos por ejemplo que 58 es un valor que está entre 57.5 y 58.5; el primero es el límite real inferior y el segundo es el límite real superior. Para estas distribuciones ic = lrs – lri.A continuación se presenta la distribución de frecuencias del ejemplo anterior, con límites reales.Ejemplo 2.

Clase Puntajes Frecuencias Absolutas1ra. 27.5 a menos de 32.5 102da. 32.5 a menos de 37.5 153ra. 37.5 a menos de 42.5 204ta. 42.5 a menos de 47.5 355ta. 47.5 a menos de 52.5 196ta. 52.5 a menos de 57.5 127ma. 57.5 a menos de 62.5 9

Total 120

Lic. Mauro H. Henríquez Rauda

3

En general, la distribución de frecuencias para una muestra de tamaño n y un número k de clases, con frecuencias fk, respectivamente, se representa así:

Clase Frecuencia Absolutaclase 1 F1clase 2 F2

clase i Fi

clase k FkTotal n

La frecuencia relativa es fi/n, donde 0 ≤ fi/n ≤ 1 y “ = 1.Cuando fi/n se multiplica por 100, se llama frecuencia porcentual. La frecuencia acumulada menor que fi se denota por Fi y es la suma de las frecuencias absolutas que van desde la clase 1 hasta la clase i. En símbolos:

Fi = f1 +f2 + f3 +…+ fiEjemplo 3. Distribución de frecuencias porcentuales y acumuladas, basada en los datos que aparecen en la ejemplo 1.

Puntajes (x)

Frecuencias absolutas

Frecuencia porcentual

fa Fia menor que Fia más que28 - 32 10 8.33 10 8.33 10033 - 37 15 12.50 25 20.83 91.6738 - 42 20 16.67 45 37.50 79.1743 - 47 35 29.17 80 66.67 62.5048 - 52 19 15.83 99 82.50 33.3353 - 57 12 10.00 111 92.50 17.5058 - 62 9 7.50 120 100.00 7.50

Con ésta distribución de frecuencias podemos tener, entre otras, las siguientes informaciones:

- El 29.17 % de los estudiantes obtuvieron puntaje entre 43 y 47.- El 61.67 % sacaron puntajes entre 38 y 52.- La Fa, 45, que aparece en la tercera clase significa que 45 estudiantes

sacaron puntajes de 42 o menos.- El 17.5 % de estudiantes obtuvieron 53 y más puntos.

Lic. Mauro H. Henríquez Rauda

4

1.3.2 REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE FRECUENCIAS

1. Determinar el mayor y el menor de todos los datos, hallando así el rango (diferencia entre ambos).

2. Dividir el rango en un número adecuado de intervalos de clase del mismo tamaño (de igual amplitud).

3. Mediante una hoja de recuentos, determinar el numero de datos que caen dentro de cada intervalo de clase; esto es hallar la frecuencia de clases.

1.3.3 EJERCICIOS

1. A continuación se le presenta las calificaciones de un examen de matemática, de un grupo de 40 estudiantes.

6.7 6.3 8.7 7.9 8.8 9.2 8.6 8.3 7.8 4.16.6 6.8 7.7 4.6 7.6 8.1 9.2 8.4 8.6 7.06.0 7.7 8.1 9.8 7.5 8.1 8.2 8.7 7.8 7.06.1 9.4 8.1 5.2 7.9 8.2 7.7 7.7 7.0 7.4

a) Transforme la serie simple en una distribución de clases y frecuencias, utilizando ic = 0.5.b) Haga lo mismo utilizando ic = 0.7.c) Determine las marcas de clase .

2. Con los datos del ejercicio anterior, utilizando un ic = 0.7 calcule:

a) Las frecuencias relativas.b) Las frecuencias relativas acumuladas “menos que” y “mas que”.c) Haga un comentario de ésta variable.

3. Utilizando la siguiente tabla: Estatura en cm

f Fa“menos que”

Fa “más que” f % Fa %“más que”

Fa %“menos que”

178 –184 4 40 4 10.00

100.00 10.00

171 –177 10 36 14 25.00

90.00 35.00

164 - 170 15 26 29 37.50

65.00 72.50

157 -163 8 11 37 20.00

27.50 92.50

150 - 156 3 3 40 7.50 7.50 100.00Total 40

5

Lic. Mauro H. Henríquez Rauda

a) ¿Qué % de personas tienen estaturas de más de 1.70 metros?.b) ¿Qué % de personas tienen estaturas de 1.64 o más metros?.c) ¿Qué % de personas tienen estaturas de menos de 1.64 metros?.d) ¿Cuántas personas tienen estaturas debajo de 1.64 metros ?.e) ¿Cuántas personas tienen estaturas arriba de 1.63 metros ?.f) ¿Qué % de personas tienen estaturas entre 1.78 y 1.84 metros inclusive ?.

4) Dada la siguiente distribución de frecuencias:

Xi f80 - 81 682 – 83 1484 – 85 3086 – 87 3388 - 89 1390 - 91 4

a) Calcule las frecuencias acumuladas del tipo “menos que” y ”más que”.b) Calcule el % de datos de 87 o menos.c) Calcule el % de datos mayores o iguales a 82.d) Calcule el % de datos mayores o iguales a 82 pero menores o iguales que 89

5. A continuación se presenta los resultados del rendimiento escolar de los alumnos de dos secciones A y B de un sexto grado de una escuela:

Calificaciones F (sección A) F (sección B)1-2 2 23-4 5 85-6 15 227-8 5 99-10 3 5

Cree usted que la sección B, ha salido mejor que la sección A, ya que en la sección B hay 22 alumnos cuyas calificaciones están entre 5 y 6, mientras que en la sección A sólo hay 15 alumnos entre esas calificaciones. Justifique su respuesta.Sugerencia: Transforme las frecuencias absolutas, en frecuencias relativas.

7. La siguiente información corresponde al peso, en libras, de un grupo de 50 estudiantes.

6

Lic. Mauro Henríquez Rauda100 103 113 110 110 107 108 110 114 115116 117 118 117 117 120 117 121 120 120124 124 124 124 127 125 125 128 128 130131 131 131 132 133 134 135 136 138 138140 141 142 145 148 146 145 162 152 150

Transforme esta serie en una distribución de clases y frecuencias, con 9 clases.

8. Transforme la serie del ejercicio anterior en una distribución de clases y frecuencias, utilizando un intervalo de clase de ic = 10.

9. Dada la siguiente distribución de clases y frecuencias:

x F100-106 2107-113 6114-120 11121-127 8128-134 9135-141 6142-148 5149-155 2156-162 1

Total 50

Calcule las siguientes columnas: frecuencia relativa, frecuencia relativa acumulada y marcas de clase.

10. A continuación se presentan 40 mediciones del diámetro de arandelas:

0.19 0.29 0.30 0.27 0.32 0.22 0.22 0.15 0.22 0.270.35 0.19 0.32 0.27 0.39 0.32 0.24 0.27 0.23 0.280.37 0.17 0.37 0.26 0.37 0.27 0.32 0.29 0.26 0.280.25 0.20 0.22 0.27 0.32 0.27 0.34 0.27 0.26 0.27

Presente ésta información mediante una distribución de clases y frecuencias, usando un intervalo de 0.05. Comience la primera clase con 0.15 como límite aparente inferior.

Lic. Mauro H. Henríquez Rauda

7

1.4 REPRESENTACION GRAFICA DE LOS DATOS DE UN CONJUNTO

La selección apropiada de una gráfica puede relacionarse con el carácter de la variable en estudio. Los principales tipos de gráficas que corresponden a las variables cualitativas , cuantitativas discretas y continuas, se pueden ver en el cuadro siguiente:

Variable Tipo de Gráfica

CualitativaBarras separadas

Circular o de Pastel

Cuantitativa discretaBarras

Circular o de Pastel

Cuantitativa continuaHistograma

Polígono de frecuencias

1.4.1VARIABLES CUALITATIVAS.

BARRAS SEPARADAS. Ejemplo 4.Una pequeña encuesta estudiantil sobre preferencias de bebidas gaseosas produjo los siguientes resultados:

Pepsi coca fanta coca fanta coca pepsi salva pepsiSalva coca fanta coca pepsi pepsi pepsi salva spriteSprite fanta pepsi fanta coca salva coca pepsiSprite pepsi coca pepsi sprite sprite salva cocasalva salva coca coca fanta pepsi salva cocacoca coca pepsi coca coca fanta coca fanta

Después del conteo, la distribución en clases y frecuencias queda como sigue:

i bebida fi fri % Fi %1 Coca 17 34 34%2 Fanta 8 16 50%3 Pepsi 11 22 72%4 Salva 8 16 88%5 Sprite 6 12 100%

total 50

8

Lic. Mauro H. Henríquez Rauda

Grafica de barras separadas para las compras de bebidas gaseosas.

CIRCULAR

Grafica circular para las compras de bebidas gaseosas.

1.4.2VARIABLES CUANTITATIVAS DISCRETAS

Ejemplo 5.Distribución de frecuencias del número de maestros en una muestra de escuelas públicas, en Chalatenango.

9

Lic. Mauro H. Henríquez Rauda

Número de maestros Cantidad de escuelas5 66 87 108 129 810 1111 712 4

1.4.3 VARIABLES CUANTITATIVAS CONTINUAS

Un histograma es una gráfica constituida por barras verticales no separadas(límites reales).Para construirlo se marcan en el eje horizontal las clases y en el eje vertical las frecuencias. Sobre el intervalo correspondiente a cada clase se dibuja una barra de área proporcional a su frecuencia.

Ejemplo 6.Clasificación de 40 alumnos de una escuela rural de acuerdo a su peso en libras.

Clases Frecuencia Puntos mediosFrecuencia acumulada“menos de”

Frecuenciarelativa

29.5 – 34.5 1 32 1 0.02534.5 – 39.5 3 37 4 0.075

10

39.5 – 44.5 8 42 12 0.20044.5 – 49.5 9 47 21 0.22549.5 – 54.5 7 52 28 0.17554.5 – 59.5 4 57 32 0.10059.5 – 64.5 3 62 35 0.07564.5 – 69.5 3 67 38 0.07569.5 – 74.5 2 72 40 0.050

Total 40 1.000

La comparación de dos o mas distribuciones de frecuencias resulta fácil, si en lugar de levantar una barra sobre el intervalo correspondiente al la clase, se marca un punto con abscisa el punto medio y como ordenada la frecuencia. Luego los puntos se une con segmentos de recta y la figura resultante se denomina polígono de frecuencias. El área bajo el polígono de be ser igual al área comprendida por el histograma. Para lograr esto, usualmente el polígono se prolonga tal como puede apreciarse en la gráfica siguiente, procediendo como si existiera una clase adicional al principio y otra al final, ambas con frecuencia de cero.

11

Lic. Mauro H. Henríquez Rauda

1.4.4 EJERCICIOS PROPUESTOS: Ver guía de ejercicios.

1.5 MEDIDAS DE TENDENCIA CENTRAL

1.5.1 LA MEDIA ARITMETICA

Entre las medidas de tendencia central, la mas popular es la “media aritmética”, que comúnmente se llama “promedio”

DEFINICION: La media aritmética de un conjunto de N datos: x1, x2, ….., xN, se denota por y se define así:

=

NOTA: El símbolo es la letra griega “sigma mayúscula” que corresponde a la letra S.

EJEMPLO 1: Calcular la media de 8, 16, 4, 12 y 10

SOLUCION:

Advierta: la media es uno de los datos.

Lic. Mauro H. Henríquez Rauda

12

Suma de todos los datosNúmero total de datos

EJEMPLO 2: Calcular la media de 8, 16, 4, 12 y 5

SOLUCION:

La media, 9, no es uno de los datosSi los números ocurren veces, respectivamente (o sea con frecuencias ), la media aritmética es

EJEMPLO 3: 5,8,6 y 2 ocurren con frecuencias 3,2,4 y 1 respectivamente. Hallar la media.SOLUCION:

A veces asociamos con los números , unas ponderaciones (o pesos) , dependiente de la relevancia asignada a cada número (no a su frecuencia). En este caso:

Se llama “media aritmética ponderada” con pesos w1, w2,......, wn

EJEMPLO 4: El primer examen parcial vale el 20%, el segundo parcial, el 25%, las tareas el 30% y el examen final el 25% de la nota final. Si un estudiante tiene las calificaciones 1er. P: 3.0; 2º.P: 5.8; tareas: 8.0 y EF: 6.4, ¿Cuál es la media aritmética ponderada (nota final)?SOLUCION:

VERIFICANDO SU COMPRENSIÓN

1. Calcule la media aritmética para el conjunto de datos. a) 6,8,3,9 y 5 b) 6,6,8,8,3,9,9,9,5 y 5

Lic. Mauro H. Henríquez Rauda

13

2. Calcule la media aritmética ponderada para el conjunto de datos 3.0, 2.0, 6.5 y 8.4 con los pesos: 20%, 20%, 30% y 30% respectivamente.

1.5.2 LA MODA

DEFINICION: La moda de un conjunto de números es el valor que ocurre con mayor frecuencia (valor más frecuente)

NOTA: La moda de un conjunto puede no existir, e incluso no ser única, en caso de existir.EJEMPLO 5. El conjunto 1,2,3,3 y 4 tiene moda 3EJEMPLO 6. El conjunto 1,2,3, y 4 no tiene moda EJEMPLO 7. El conjunto 1,1,2,2,3 y 4 tiene dos modas: 1 y 2; se dice que es bimodal.

1.5.3LA MEDIANA

DEFINICION: La mediana (med) de un conjunto de números ordenados en sentido creciente (decreciente) es: el valor central, si el número de datos es impar; o la media de los valores centrales, si el número de datos es par.

EJEMPLO 8. El conjunto de números 3,4,4,5,6,8,8,8 y 10 tiene mediana 6EJEMPLO 9. El conjunto de números 5,5,6,8,9 y 10 tiene mediana EJEMPLO 10. Calcular la mediana del conjunto: 8,5,10,7,6,9,2,2,5 y 6

SOLUCION:Primero se ordenan los números (orden creciente): 2,2,5,5,6,6,7,8,9 y 10. Como hay un número impar de datos, la mediana es 6 (la mediana es uno de los datos)EJEMPLO 11. Calcular la mediana del conjunto: 7,4,7,4,5,5,6,6,6,3,3,2,1 y 1SOLUCION:Primero se ordenan los números (orden creciente): 1,1,2,3,3,4,4,5,5,6,6,6,7 y 7. Como hay un número par de datos, la mediana es (la mediana no es uno de los datos)VERIFICANDO SU COMPRENSIONCalcule la mediana a cada uno de los conjuntos de números dados.

a) 7,5,6,4,4,4,3,3,1 y 10 b) -4, -6, -1, 1, 4, 10 y 3Lic. Mauro H. Henríquez Rauda

1.5.4EJERCICIOS

14

1. Explicar que es una medida de tendencia central; cuales son y como se definen.

2. ¿Cuál de las siguientes fórmulas se utiliza para calcular la media de ?

a) b) c)

3. Encuentre la media, mediana y moda del conjunto de datosa) 1,2,3,4 y 5 c) 4,7,10,6,9 y 10b) 12,13,14 y 15 d) 79,90,95,95 y 96

e) 9,12,8,10,9,11,12,15,20,9,14,15,21 y 10

4. Considérese el conjunto de datos: 4,5,6,3,4,3,3,31 y 4. a) Encontrar la media b) Hallar la mediana

5. Elimine el 31 del conjunto de datos en 4. c) encontrar la media; d) Hallar la mediana

e)Comparar los resultados a), b), c) y diga ¿Cuál de las medidas de tendencia central, la media o la mediana, es mejor para evitar la distorsión producida por un valor extremo?.

6. Se pidió a 30 reclutas de la Academia de Policía se sometieran a una prueba que mide la capacidad para el ejercicio. Se midió esta capacidad de cada recluta (en minutos)

25 27 30 33 30 32 30 34 30 27 26 25 29 31 31 32 34 32 33 30 27 30 31 36 28 30 31 26 29 32

Calcular la moda, media y mediana.

Lic. Mauro H. Henríquez Rauda

15

1.6 MEDIDAS DE DISPERSION

La localización o tendencia central no necesariamente proporciona información para describir datos de manera adecuada. Para el caso, consideramos los siguientes ejemplos.

EJEMPLO 1.Suponga que en un hospital, el nivel de azúcar en la sangre de cada paciente se mide tres veces por semana. En cierta semana los registros de dos pacientes indican:

Paciente A: 90, 100 y 110 miligramos por decilitroPaciente B: 40, 100 y 160 miligramos por decilitroEl promedio de ambos pacientes es 100.

En efecto:Paciente A:

Paciente B: Observe la diferencia en variabilidad. Mientras que el paciente A es bastante estable, el nivel del paciente B fluctúa ampliamente. Este resultado deberá tomarse en cuenta cuando se prescriba su tratamiento. COMENTARIO: Un paciente con un nivel de azúcar en la sangre de 40 mg/dl, convulsiona; con un nivel de 160 mg/dl podría ser diabético.

EJEMPLO 2.Se va a seleccionar a un atleta para que represente a la Universidad en los juegos estudiantiles, en la prueba de los 100 metros. Se tienen dos candidatos: A y B. Para decidir por uno de ellos se les toman los tiempos que se tardan en recorrer los 100 metros en cinco ocasiones. A continuación de detallan:

Atleta A: 11.0, 11.8, 11.6, 11.3 y 12.3 segundosAtleta B: 11.5, 11.6, 11.6, 11.8 y 11.5 segundos

El tiempo promedio de ambos atletas es 11.6 segundos (verificarlo) pero el grado de variabilidad del atleta B es menos que el del atleta A. Por tener menos altibajos, el atleta B tendría que ser el seleccionado.

Casos como los anteriores (medicina, deportes) muestran la necesidad de descripciones estadísticas que midan el grado en que se dispersan (o varían) los

Lic. Mauro H. Henríquez Raudadatos, respecto a su centro; es decir; la necesidad de las medidas de dispersión. Dos de ellas son: la amplitud (o rango) y la desviación típica.

16

1.6.1 AMPLITUD (RECORRIDO O RANGO)

DEFINICION: La amplitud (recorrido o rango) de un conjunto de datos numéricos es la diferencia entre el mayor y el menor de todos ellos.

EJEMPLO 3.En el ejemplo 1, el rango para el nivel de azúcar en la sangre del paciente A es 110 – 90 = 20 y de 160 – 40 = 120, para el paciente B.

En el ejemplo 2, el rango para el tiempo del atleta A es de 12.3 – 11.0 = 1.3 segundos, y de 11.8 – 11.5 = 0.3 segundos, para el atleta B.

1.6.2DESVIACION TIPICA (O ESTANDAR)

El rango se utiliza principalmente como indicación fácil y rápida de la variabilidad, pero por lo general, no es medida de dispersión útil. Su principal inconveniente radica en que nada se dice acerca de la dispersión de los valores que están entre el mayor y el menor valor.Por ejemplo, cada uno de los conjuntos de datos siguientes:Conjunto A: 3,4,5,6,11,16,17,18 y 19Conjunto B: 3,8,9,10,11,12,13,14 y 19.

Tiene un rango de 19 - 3 = 16 ( y una media de 11); pero la dispersión (como se ve en el diagrama adjunto) es completamente distinta en cada caso. mediaConjunto A: 3 4 5 6 11 16 17 18 19

mediaConjunto B: 3 8 9 10 11 12 13 14 19

Observamos que la dispersión en un conjunto de datos:

Es pequeña si los datos están ubicados muy cerca alrededor de su media aritmética y

Es grande si los datos están ubicados distantes alrededor de su media.

Por lo tanto, parece razonable tener una medida para la dispersión de un conjunto de datos, en términos de las cantidades por las que difieren de su

Lic. Mauro H. Henríquez Raudamedia aritmética. A estas cantidades les asignaremos un nombre, en la siguiente definición.

17

DEFINICION: Si un conjunto de datos tiene la media , las diferencias , se llaman “desviaciones de la media”.

DEFINICION: La desviación típica de una población de N datos: se denota por , (letra griega sigma) y se define como

Si ocurren con frecuencias respectivamente, la desviación típica puede expresarse como

donde N =

En palabras: es la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones. DEFINICION: La desviación típica de una muestra de N datos: se denota por S y se define como

para datos sin agrupar

para datos agrupados en tablas de frecuencia

NOTA: “Muestra” es el conjunto de datos que se pueden utilizar, en forma razonable, para hacer generalizaciones acerca de la población de la cual provienen.

ADVIERTA: Las fórmulas para S se obtienen escribiendo N-1 en el denominador de las formulas para .

CASO 1: Desviación típica para datos sin agruparEJEMPLO 1. Considérese cada una de las siguientes muestras:Muestra A: 3,4,5,6,11,16,17,18 y 19Muestra B: 3,8,9,10,11,12,13,14 y 19

Lic. Mauro H. Henríquez Rauda

Obtenga la desviación típica de cada muestra e indique cuál de ellas es la que presenta mayor dispersión.

18

SOLUCION.Para la muestra A.Paso 1.

Paso 2. El cálculo de se facilita con una tabla como la que sigue:

Variable x Desviación Cuadrado de la desviación

3 -8 644 -7 495 -6 366 -5 2511 0 016 5 2517 6 3618 7 4919 8 64

= 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348 y

= = = 6.6

Para la muestra BPaso 1.

Paso 2. Calculamos

Variable x Desviación Cuadrado de la desviación

3 -8 648 -3 99 -2 410 -1 111 0 012 1 113 2 414 3 919 8 64

19

= 64 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 64 = 156 y

= = = 4.4

Puesto que la desviación típica del conjunta A es mayor que la del conjunto B, concluimos que la muestra A es la más dispersa.

DEFINICION: La varianza de un conjunto de datos se define como el cuadrado de la desviación típica, de modo que y representan la varianza de la población y la varianza de la muestra, respectivamente.

VERIFICANDO SU COMPRENSION

1. Determine cuál de las siguientes muestras es la más dispersa. a) 6,3,12,5,8 y 9 b) 3,5,6,7,4,10 y 82. Determine cuál de las siguientes muestras es la menos dispersa a) 7,9,3,6,5,4 y 2 b) 8,7,4,11,2 y 5

3. Hallar, en cada caso, la desviación típica y la varianza a) 3,6,2,1,7 y 5 b) 3,2,4,6,5 y 8

CASO 2: Desviación típica para datos agrupadosEJEMPLO 2. Supóngase que en 9º grado hay 40 alumnos, cuyas edades se resumen en la siguiente tabla de frecuencias

Edades x No. de alumnos (f)14 615 1516 1617 3

Hallar el valor de S.

SOLUCIONPara facilitar los cálculos usamos la siguiente tabla

Lic. Mauro H. Henríquez RaudaX f14 6 84 -1.4 1.96 11.7615 15 225 -0.4 0.16 2.4016 16 256 0.6 0.36 5.7617 3 51 1.6 2.56 7.68

20

TOTAL 40 616 27.60

VERIFICANDO SU COMPRENSION

1. Hallar en cada caso, la desviación típica y la varianza. a) 3,2,4,6,2,8,5,2,4 y 4 b) 0,0,0,0,0,1,1 y 1

2. Hallar el valor de S para los datos agrupados en la siguientes tablas de frecuencia

1.6.3 EJERCICIOS

Seleccione la respuesta correcta

1. El recorrido de un conjunto de datos: a) Se obtiene con las desviaciones promedio de los datos y la media b) Es la diferencia entre el dato mayor y el dato menor c) Es una medida de tendencia central d) Es el promedio de la moda y la mediana

2. La desviación estándar de un conjunto de datos: a) Está cerca de cero si los datos están dispersos. b) Promedia las desviaciones entre cada dato y la media c) No toma en consideración todos los datos d) Promedia las desviaciones entre cada dato y la mediana

3. Explicar que es una medida de dispersión

4. Comparar la desviación estándar y el recorrido

Lic. Mauro H. Henríquez Rauda5. Explicar que representa la desviación estándar de un conjunto de datos

6. Si la desviación estándar fuese cero ¿qué podrías decir acerca del conjunto de datos?

En los ejercicios 7 - 10. Encontrar el recorrido, la varianza y la desviación estándar del conjunto de datos7. 1,2,3,4 y 5 9. 3,5,8,13 y 21

X f6 55 43 6

x f2 43 34 55 2

21

a)

8. 21,22,23,24 y 25 10. 79,90,95,95 y 96

11. Realizar las operaciones indicadas con los siguientes datos

a) Encontrar el recorrido.b) Hallar la media.c) Determinar la desviación estándar poblacional.d) Determinar la desviación estándar muestral.

1.7 MEDIDAS DE POSICIÓN

1.7.1CUANTILES

Para muchos propósitos, es importante obtener valores que dividen un conjunto de datos ordenados, en fracciones especificas. LA mediana es un ejemplo de éste tipo de medida; ella divide al conjunto en dos partes iguales: La mitad de los valores son inferiores a la mediana y la otra mitad superiores. En forma similar se pueden calcular: - Los cuartiles, que son valores de la variable que dividen a conjunto en cuartas partes.

Así, el primer cuartil, Q1, es un valor tal que una cuarta parte de los datos son menores que él y tres cuartas partes son mayores. Q2, es igual a la mediana y Q3, supera a los tres cuartos de los datos y solo es superado por un cuarto de ellos.Además de la mediana y los cuartiles pueden calcularse también lo deciles: D1, D2, ......D9, los cuales dividen al conjunto en décimas. Los percentiles: P1, P2,....P99, que lo dividen en centésimos. Todos éstos valores reciben el nombre de cuantiles y pueden resultar muy apropiados para apreciar la posición de los datos de un conjunto y su posición.Tanto la mediana como los cuartiles y los deciles constituyen casos particulares de los percentiles y pueden expresarse como percentiles.

Por ejemplo: Mediana = P50, Q3 = P75, D4 = P40, etc.Lic. Mauro H. Henríquez Rauda

Resulta entonces que teniéndose una fórmula para el calculo de la posición de los percentiles, puede obtenerse con ella, la posición de cualquier cuantil.

Para el calculo de la posición de los percentiles se debe, en primer lugar, ordenar los datos.Una vez hecho esto, puede aplicarse la fórmula siguiente:La posición de k-ésimo percentil se encuentra calculando ( )k, donde n es el número de datos. Sí el resultado es un número decimal, seleccione como indicador del orden al entero próximo superior y el percentil a localizar es Pi.

22

Si el resultado es un entero seleccione como indicadores de orden al entero obtenido i y al siguiente i + 1. El percentil se obtiene haciendo Pk = Ejemplo.Calcular Q2 y la mediana. Considérense para ello, los siguientes datos, que se refieren a los pesos de 40 estudiantes de una escuela rural y que se presentan en el orden en que fueron pesado los alumnos:

49 60 45 37 5444 59 40 62 4746 52 55 41 6645 36 50 51 4842 53 53 68 5635 74 43 47 6051 67 40 70 4941 46 32 57 43

Así como están los datos resulta difícil sacar una conclusión, por lo tanto, como no son muchos, puede iniciarse el análisis haciendo una ordenación en forma creciente.

32 42 47 52 6035 43 47 53 6036 43 48 53 6237 44 49 54 6640 45 49 55 6740 45 50 56 6841 46 51 57 7041 46 51 59 74

La posición de Q2 es igual a la posición de P50, la cual se obtiene así: =

20 Los datos a localizar son: X20 y X21. El valor de Q2 es: Lic. Mauro H. Henríquez Rauda

Q2 = = 51.5La mediana es igual a P50 = Q2 = 51.5

1.7.2 EJERCICIOS .

1. Calcule los cuartiles uno, dos y tres en la siguiente serie simple: 0.10, 0.12, 0.15, 0.15, 0.18, 0.20, 0.25.

2. La siguiente distribución corresponde a salarios mensuales de un grupo de 56 personas.

23

Salarios (x) f500-599 8600-699 12700-799 18800-899 10900-999 6

1000-1099 2

Calcule:a) El valor del cuartil uno.b) El valor del cuartil dos.c) El valor del cuartil tres.d) El valor del decil cinco.e) El valor del decil cinco. f) El valor del percentil ochenta.g) El valor del percentil cincuenta.h) El salario que limita el 20% superior de la distribución.i) El salario que se deja sobre sí, el 70% de los casos.j) Entre qué salarios está el 60% central de la distribución.

3. Determine la escala percentilar de la siguiente serie de puntajes de un examen.____Xi f____ 30 1 25 5 38 10 40 4 45 2

4. Calcule el percentil del punto medio de la clase 700-799 de la distribución del ejercicio 2. Luego compruébelo.

Lic. Mauro H. Henríquez Rauda

24