estadística descriptiva (v2)
TRANSCRIPT
Estadística descriptiva
MatemáticaGUICAAMTGEA05019V2
Guía de ejercitación avanzada
Guía de ejercitación avanzadaM
atem
ática
Marco teóricoDEFINICIONES BÁSICAS
Estadística. Análisis de datos.
Población estadística. Todo el conjunto sobre el cual se aplican las conclusiones de la estadística.
Muestra estadística. Subconjunto de la población al cual se le toman los datos. Si la población no es muy grande, podrían ser iguales.
Variable estadística. Dato que se va a analizar. Puede ser del tipo:
• Cualitativa o nominal. Corresponde a nombres o cualidades: preferencia electoral, color de pelo.
• Cuantitativa discreta. Corresponde a números enteros, que no se pueden fraccionar: cantidad de hijos, cantidad de alumnos de los cursos
• Cuantitativa continua. Corresponde a números reales, que se pueden fraccionar: peso, estatura.
DISTRIBUCIÓN DE FRECUENCIAS DE DATOS NO AGRUPADOS
Datos no agrupados. Los valores de los datos se consideran en forma individual.
Frecuencia. Cantidad de veces que aparece un dato dentro de la muestra.
N: número total de datos que tiene la muestra (se obtiene sumando todas la frecuencias)
cpech Preuniversitarios2
Matemática G
uía d
e ejercitación
avanzad
a
TABLA DE DISTRIBUCIÓN DE FRECUENCIASDE DATOS NO AGRUPADOS
Dato Frecuencia Frecuencia acumulada Frecuencia relativa
x1 f1 f1
f1
N · 100%
x2 f2 f1 + f2
f2
N · 100%
x3 f3 f1 + f2 + f3
f3
N · 100%
......
......
xn fn f1 + f2 + f3 + ... + fn fn
N · 100%
GRÁFICO DE BARRAS
La frecuencia de cada dato aparece repre-sentada mediante la altura de una barra.
GRÁFICO CIRCULAR
La frecuencia relativa de cada dato aparece representada mediante un sector circular proporcional a su valor.
fi
xi
Frecuencia
Dato
x1
x2
x3
xn
cpech Preuniversitarios 3
Guía de ejercitación avanzadaM
atem
ática
DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS
Datos agrupados. Los valores de los datos se consideran dentro de intervalos.
Clase. Corresponde a un intervalo.
Marca de clase. Corresponde al promedio entre los extremos de un intervalo.
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE DATOS AGRUPADOS
Dato Marca de clase Frecuencia Frecuencia acumulada Frecuancia relativa
C1 a1 f1 f1
f1
N · 100%
C2 a2 f2 f1 + f2
f2
N · 100%
C3 a3 f3 f1 + f2 + f3
f3
N · 100%
......
......
...
Cn an fn f1 + f2 + f3 + ... + fn fn
N · 100%
HISTOGRAMA
La frecuencia de cada clase aparece representada mediante la altura de una barra. En el eje horizontal se representa el inicio y final de cada intervalo o la marca de clase.
fi
Ci
Frecuencia
Clase
cpech Preuniversitarios4
Matemática G
uía d
e ejercitación
avanzad
a
MEDIDAS DE TENDENCIA CENTRAL
Moda. Corresponde al dato que más se repite, es decir, que tiene la mayor frecuencia.
Si varios datos (pero no todos) tienen la mayor frecuencia, entonces todos ellos son moda.
Si todos los datos de la muestra tienen igual frecuencia, entonces la muestra no tiene moda.
En datos agrupados se llama intervalo modal o clase modal
Mediana. Al ordenar todos los datos de menor a mayor, corresponde al dato que ocupa
la posición central.
En caso que la muestra tenga un número impar de datos, la mediana se encuentra en la po-
sición N + 1
2 (N: número de datos)
En caso que la muestra tenga un número par de datos, la mediana corresponde al promedio
entre el dato que se encuentra en la posición N2 y el dato que se encuentra en la posición
N2 + 1(N: número de datos)
En datos agrupados sólo se puede determinar el intervalo al cual pertenece la mediana.
Media aritmética (o promedio). Corresponde a la suma de todos los datos dividido por el número de datos.
En una distribución de frecuencias, se calcula:
x = x1 · f1 + x2 · f2 + x3 · f3 + ...xn · fn
N
x : promedio de la muestra.
x1, x2, x3, …, xn: datos de la muestra.
f1, f2, f3, …, fn: frecuencia de cada uno de los datos de la muestra.
N: número de datos de la muestra.
cpech Preuniversitarios 5
Guía de ejercitación avanzadaM
atem
ática DESVIACIÓN ESTÁNDAR
Es un resultado que indica qué tan alejados están los datos del promedio.
Mientras menor es la desviación estándar, menos dispersos están los datos con respecto al promedio. En tal caso se habla de una muestra homogénea.
Mientras mayor es la desviación estándar, más dispersos están los datos con respecto al pro-medio. En tal caso se habla de una muestra heterogénea.
La desviación estándar se calcula:
σ = � (x1 – x )2 + (x2 – x )2 + (x3 – x )2 +...+ (xn – x )2
N
Donde:
σ : desviación estándar.
x1, x2, x3, …, xn: datos de la muestra.
x : promedio de la muestra.
N: número de datos de la muestra.
cpech Preuniversitarios6
Matemática G
uía d
e ejercitación
avanzad
a
Ejercicios PSU
1. En la siguiente tabla se muestran los resultados obtenidos al tomar distintos datos de tres alumnos de un curso.
Dato Edad(años)
Peso(Kg)
Estatura(mts)
Colorde ojos
Alberto 17 65 1,73 Azul
Catalina 17 60 1,68 Verde
Francisco 17 68 1,78 Café
¿Para cuál de los datos obtenidos NO existe la mediana ni el promedio (o media
aritmética)?
A) Edad.B) Peso.C) Estatura.D) Color de ojos.E) Dato.
cpech Preuniversitarios 7
Guía de ejercitación avanzadaM
atem
ática
2. Una institución quiere estudiar los hábitos de entretención de los chilenos entre 18 y 30 años. Para esto, se realiza una encuesta al azar entre cien chilenos entre 18 y 30 años, mediante el siguiente volante
¿Qué actividad prefieres para divertirte?
Marca con una X una de las siguientes opciones:
Salir a bailar
Salir a comer
Hacer deporte
Ir al cine
Al analizar los resultados, la institución llega a la conclusión que la opción que tuvo mayor cantidad de preferencias fue “Ir al cine”.
Con respecto al estudio realizado, la población estadística corresponde a
A) todos los chilenos.B) sólo los chilenos entre 18 y 30 años.C) sólo los cien chilenos entre 18 y 30 años que respondieron la encuesta.D) las cuatro opciones que se dieron en el volante.E) los hábitos de entretención de los chilenos entre 18 y 30 años.
3. Si se suman las temperaturas de 30 días registradas en Santiago y se dividen por 30, se obtiene
A) la desviación estándar. B) la moda. C) la media aritmética (o promedio). D) la mediana. E) ninguno de los indicadores estadísticos anteriores.
cpech Preuniversitarios8
Matemática G
uía d
e ejercitación
avanzad
a
4. El promedio (o media aritmética) de las edades de 7 personas es 9 años. Si la suma de las primeras 6 personas es 59, ¿cuál es la edad de la última persona?
A) 10 años B) 9 años C) 7 años D) 4 años E) Ninguna de las edades anteriores.
5. Dados los puntajes obtenidos por 7 personas en una prueba: 81, 76, 80, 84, 78, 91 y 84, ¿cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
I) La moda es 84. II) El promedio (o media aritmética) es 82. III) La mediana coincide con la moda.
A) Solo I B) Solo II C) Solo I y II D) Solo I y III E) I, II y III
6. Dados los siguientes datos: 2n – 5, 2n – 3, 2n – 1, 2n + 1, 2n + 3, 2n + 5, con n ∈ IN, ¿cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
I) La moda es 2n + 5. II) La media aritmética (o promedio) es 2n. III) La mediana es 2n.
A) Solo I B) Solo II C) Solo III D) Solo II y III E) I, II y III
cpech Preuniversitarios 9
Guía de ejercitación avanzadaM
atem
ática
7. En una muestra estadística existen las condiciones necesarias para determinar la moda, la mediana y la media aritmética (o promedio). ¿Cuál(es) de esas medidas debe(n) obligatoriamente corresponder con alguno de los datos de la muestra?
I) La moda.II) La media aritmética (o promedio).III) La mediana.
A) Solo IB) Solo IIC) Solo IIID) Solo I y IIIE) I, II y III
8. ¿En cuál(es) de las siguientes muestras coinciden la moda, la media aritmética (o promedio) y la mediana?
I) 1 – 1 – 2 – 2 – 3 – 3II) 1 – 2 – 2 – 3III) 1 – 2 – 2 – 3 – 3 – 3
A) Solo IB) Solo IIC) Solo IIID) Solo I y IIE) I, II y III
cpech Preuniversitarios10
Matemática G
uía d
e ejercitación
avanzad
a
9. La tabla adjunta, muestra la distribución de los pesos de un grupo de estudiantes. De acuerdo con esta información, ¿cuál de las siguientes fórmulas permite determinar el peso promedio de la muestra?
A) Xa + Xb + Xc + Xd + Xe
5
Peso Frecuencia
Pa Xa
Pb Xb
Pc Xc
Pd Xd
Pe Xe
B) Pa + Pb + Pc + Pd + Pe
5
C) Pa ∙ Xa + Pb ∙ Xb + Pc ∙ Xc + Pd ∙ Xd + Pe ∙ Xe
5
D) Pa ∙ Xa + Pb ∙ Xb + Pc ∙ Xc + Pd ∙ Xd + Pe ∙ Xe
Xa + Xb + Xc + Xd + Xe
E) Ninguna de las fórmulas anteriores.
10. La tabla adjunta, muestra la distribución del color de ojos de un grupo de estudiantes.
Colorde ojos
Cantidad deestudiantes
C1 N1
C2 N2
C3 N3
Si N1 = N2 y N1 < N3, ¿cuál(es) es(son) la(s) moda(s) del color de ojos?
A) C3
B) C1 y C2
C) N3
D) N1 y N2
E) La muestra no tiene moda.
cpech Preuniversitarios 11
Guía de ejercitación avanzadaM
atem
ática
11. La tabla adjunta, muestra el resultado de 2 cursos en una misma prueba. ¿Cuál es el promedio (o media aritmética) entre el total de los alumnos de ambos cursos?
Curso Nº Alumnos Promedio2º A 40 5,52º B 35 4,6
A) 5,0 B) 5,05 C) 5,08 D) 5,5 E) Ninguno de los promedios anteriores.
12. La tabla adjunta, muestra el resultado obtenido al lanzar un dado. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
Número Frecuencia1 42 63 24 55 16 3
I) El total de lanzamientos del dado fue 21. II) La frecuencia de la moda es 6. III) La mediana es 3.
A) Solo I B) Solo II C) Solo III D) Solo I y II E) I, II y III
cpech Preuniversitarios12
Matemática G
uía d
e ejercitación
avanzad
a
13. La tabla adjunta, muestra la cantidad de kilos de pan vendidos en una pequeña amasandería en distintos días de la semana. ¿Cuál(es) de las siguientes afirmaciones es(son) FALSA(S)?
Días Kilos de pan Total acumulado Lunes 35 Martes 75 Miércoles 42 Jueves 162 Viernes 50 Sábado 63 Domingo 346
I) Hasta el término del día viernes se vendieron en total 212 kilos de pan.II) La moda corresponde al día sábado.III) El martes se vendieron 40 kilos de pan.
A) Solo I B) Solo II C) Solo I y III D) I, II y III E) Ninguna de ellas.
14. La tabla adjunta, muestra el sueldo recibido por los trabajadores de un banco. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
Sueldo ($) Frecuencia250.000 3260.000 4370.000 8380.000 2390.000 6400.000 7
I) Hay exactamente 7 personas que ganan a lo menos $ 260.000.II) La mediana es $ 375.000.III) El 50% de los trabajadores tiene un salario superior a $ 370.000.
A) Solo I B) Solo III C) Solo I y III D) Solo II y III E) I, II y III
cpech Preuniversitarios 13
Guía de ejercitación avanzadaM
atem
ática
15. Un curso se divide en tres grupos, con la misma cantidad de alumnos cada uno, para preparar la PSU. La siguiente tabla muestra los promedios obtenidos por cada grupo en los ensayos rendidos.
Ensayo 1 Ensayo 2
Grupo 1 630 570
Grupo 2 510 600
Grupo 3 660 540
Considerando que todos los alumnos del curso rindieron los dos ensayos, ¿cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
I) El promedio (o media aritmética) entre todos los ensayos rendidos por el grupo 2 es 555.
II) El promedio (o media aritmética) entre todos los alumnos del curso en el segundo ensayo es 570.
III) El promedio (o media aritmética) del curso considerando todos los ensayos rendidos es 585.
A) Solo IB) Solo IIC) Solo IIID) Solo I y II E) I, II y III
16. Las edades de los 24 participantes de un taller de arte se representan en la tabla adjunta.
Edad (años) Frecuencia Frecuencia acumulada
8 x y
9 6 z
10 y w
Según los datos, el valor numérico de z es
A) 8B) 9C) 15D) 18E) faltan datos para determinarlo.
cpech Preuniversitarios14
Matemática G
uía d
e ejercitación
avanzad
a
17. El gráfico de la figura, muestra el resultado obtenido al lanzar un dado. De acuerdo con esta información, ¿cuántos lanzamientos se hicieron?
10
8
6
4
2
1 2 3 4 5 6
Frecuencia
Número
A) 6 B) 10 C) 16 D) 27 E) 39
18. El gráfico de la figura, muestra el resultado obtenido al lanzar un dado. De acuerdo con esta información, ¿cuál es la mediana?
10
8
6
4
2
1 2 3 4 5 6
Frecuencia
Número
A) 3,5 B) 4 C) 6 D) 7 E) Ninguno de los valores anteriores.
cpech Preuniversitarios 15
Guía de ejercitación avanzadaM
atem
ática
19. El gráfico de la figura, muestra el resultado de una encuesta realizada a un grupo de personas sobre su preferencia con respecto a un color. ¿Cuál(es) de las siguientes afirmaciones es(son) FALSA(S)?
8
7
6
5
4
3
2
1
Azul Rojo Café Blanco Amarillo Verde
Frecuencia
Color
I) La moda es 8.
II) El 25% de las personas encuestadas prefiere el color azul.
III) 316
de las personas encuestadas prefirió el color amarillo.
A) Solo I B) Solo I y III C) Solo II y III D) I, II y III E) Ninguna de ellas.
20. En el siguiente gráfico de barras se representan las edades de un grupo de personas, con a y b números naturales, a ≠ 1. ¿Cuál(es) de los siguientes parámetros depende(n) solamente del valor de a?
3b
2b
b
a – 1 a a + 1
Frecuencia
Edad(años)
I) La moda.II) La frecuencia de la moda.III) La media aritmética (o promedio).
A) Solo IB) Solo IIC) Solo I y IID) Solo I y IIIE) Solo II y III
cpech Preuniversitarios16
Matemática G
uía d
e ejercitación
avanzad
a
21. En un estudio estadístico se consulta a un grupo de estudiantes acerca del área de estudio que les interesa, representándose los resultados en la siguiente tabla.
Frecuencia
Científico 25
Humanista 35
Artístico 20
Si se representa dicho estudio en un gráfico circular, el ángulo del centro que le
corresponde a la opción “Artístico” es
A) 20ºB) 25ºC) 40ºD) 72ºE) 90º
22. El gráfico circular de la figura, muestra las preferencias de un grupo de estudiantes en carreras universitarias. ¿Cuál(es) de las siguientes afirmaciones es(son) FALSA(S)?
I) La frecuencia relativa del grupo que prefiere Ingeniería es de 25%. II) La frecuencia relativa del grupo que prefiere Leyes es de 40%. III) La frecuencia relativa del grupo que NO prefirió Leyes ni Ingeniería es de 35%.
Ingeniería20
Pedagogía15
Teatro13
Leyes32
A) Solo II B) Solo III C) Solo I y II D) I, II y III E) Ninguna de ellas.
cpech Preuniversitarios 17
Guía de ejercitación avanzadaM
atem
ática
23. La tabla adjunta, muestra la duración en horas de una cierta cantidad de pilas alcalinas iguales sometidas a un control de calidad. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
Intervalos de horas Frecuencia400 – 499 3500 – 599 5600 – 699 4700 – 799 11800 – 899 7
I) El total de pilas sometidas al control de calidad es 30.II) La mediana se encuentra en el intervalo 600 – 699.III) El intervalo modal (o clase modal) es 700 – 799.
A) Solo I B) Solo II C) Solo III D) Solo I y III E) I, II y III
cpech Preuniversitarios18
Matemática G
uía d
e ejercitación
avanzad
a
24. La tabla adjunta, muestra la edad en años de los residentes de un condominio. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
Edad Marca de clase Frecuencia Frecuencia
acumulada0 – 10 610 – 20 1520 – 30 a 3130 – 40 b 5640 – 50 850 – 60 560 – 70 370 – 80 180 – 90 1
I) a = 25II) b = 25II) El total de residentes es 74.
A) Solo I B) Solo II C) Solo III D) Solo II y III E) I, II y III
cpech Preuniversitarios 19
Guía de ejercitación avanzadaM
atem
ática
25. El gráfico de la figura, muestra el resultado obtenido por un grupo de estudiantes universitarios en una prueba. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
20
18
15
12
1 2 3 4 5 6 7
Frecuencia
Nota
I) La mediana se encuentra en el intervalo 4 – 5.II) El intervalo modal (o clase modal) es 18 – 20.III) El total de alumnos que rindió la prueba es 65.
A) Solo I B) Solo II C) Solo III D) Solo I y III E) Solo II y III
cpech Preuniversitarios20
Matemática G
uía d
e ejercitación
avanzad
a
26. El gráfico de la figura, muestra el resultado obtenido por un grupo de estudiantes universitarios en una prueba de estadística. ¿Cuál(es) de las siguientes afirmaciones es(son) siempre verdadera(s)?
50
40
30
20
10
1 2,5 4 5,5 7
Frecuencia
Nota
I) La frecuencia del intervalo modal (o clase modal) es 50. II) La mediana se encuentra en el intervalo 2,5 – 4. III) 30 alumnos obtuvieron nota superior a 4.
A) Solo I B) Solo II C) Solo III D) Solo I y II E) I, II y III
27. Los datos de una muestra son 3, 5, 7 y 9. La desviación estándar de la muestra es
A) 0B) �5C) 3D) 2�5 E) 6
cpech Preuniversitarios 21
Guía de ejercitación avanzadaM
atem
ática
28. La tabla adjunta, muestra el resultado obtenido por dos cursos de un preuniversitario en un ensayo de matemática. ¿Cuál(es) de las siguientes afirmaciones es(son) verdadera(s)?
Curso Promedio Desviación EstándarA 458 60B 542 100
I) El curso A es el más homogéneo. II) El curso B presenta menor dispersión en los puntajes. III) La media aritmética (o promedio) considerando los puntajes de los alumnos de
ambos cursos es 500.
A) Solo I B) Solo II C) Solo III D) Solo I y III E) Ninguna de ellas.
29. Se puede determinar la mediana de una muestra no tabulada si:
(1) El promedio (o media aritmética) de la muestra es 75. (2) La muestra no tiene moda y los datos son números consecutivos. A) (1) por sí sola. B) (2) por sí sola. C) Ambas juntas, (1) y (2). D) Cada una por sí sola, (1) ó (2). E) Se requiere información adicional.
30. En la tabla adjunta, están representados los resultados obtenidos en el lanzamiento de un dado. Se puede determinar el valor de x si:
Número Frecuencia1 72 33 64 x5 46 5
(1) El total de lanzamientos fue 30. (2) La mediana es 3. A) (1) por sí sola. B) (2) por sí sola. C) Ambas juntas, (1) y (2). D) Cada una por sí sola, (1) ó (2). E) Se requiere información adicional.
cpech Preuniversitarios22
Matemática G
uía d
e ejercitación
avanzad
a
Tabla de corrección
Nº Pregunta Clave Habilidad1 Conocimiento
2 Comprensión
3 Conocimiento
4 Aplicación
5 Análisis
6 Análisis
7 Análisis
8 Análisis
9 Conocimiento
10 Conocimiento
11 Aplicación
12 Análisis
13 Análisis
14 Análisis
15 Análisis
16 Análisis
17 Comprensión
18 Aplicación
19 Análisis
20 Análisis
21 Aplicación
22 Análisis
23 Análisis
24 Análisis
25 Análisis
26 Análisis
27 Aplicación
28 Análisis
29 Evaluación
30 Evaluación
cpech Preuniversitarios 23