Capítulo
Medidas de
posición
© 2010 Pearson Prentice Hall. All rights reserved
33
3-2© 2010 Pearson Prentice Hall. All rights reserved
La regla empírica
La duración de vida de los lagartos en un zoológico en
particular se distribuye normalmente. En promedio duran
3.1 años con una desviación estándar de 0.6 años. Use la
regla empírica para estimar el porciento de lagartos
que duran menos de 2.5 años.
3-3
Aplicaciones de la Regla Empírica
Solución:
A una gran muestra de mujeres se les midió la presión
arterial sistólica. La presión sanguínea media fue 125
milímetros de mercurio y la desviación estándar fue 10
milímetros de mercurio.
¿Qué porcentaje de mujeres tenía presión arterial entre
105 y 135 milímetros de mercurio?
3-4
Aplicaciones de la Regla Empírica
En la muestra del ejercicio anterior participaron un total de
400 mujeres. Aproximadamente, ¿cuántas mujeres en la
muestra tenían presiones sanguíneas más altas que 145
ml-hg?
3-5
Aplicaciones de la Regla Empírica (cont.)
MEDIDAS DE POSICIÓNSec. 3.4
Medidas de posición
• Las medidas de posición, describen la posición relativa de una cierta observación dentro de todo el conjunto de datos.
– Z-score
– Percentiles
– Quartiles
z Score (valor estándarizado)
identifica el número de desviaciones estándares al
cual se encuentra un valor por debajo o porencima de la media de un conjunto
Z score (valor Z)
Para una muestra Para una población
x – µz =
Se redondean valores z a 2 lugares decimales.
Medidas de posición: z Score
z =x – x
s
Interpretación de valores Z
Siempre que una observación es menor que la media, la puntuación z correspondiente es negativo.
Valores ordinaries o típicos: –2 ≤ z score ≤ 2
Valores atípicos: z score < –2 ó z score > 2
Ejemplo
Determine cuál medida es más extrema en un hombre: una estatura de 76.2 in. o un peso de 237.1 lb. si sabemos lo siguiente sobre los conjuntos a los cuales pertenecen los datos:
– Estatura promedio de un hombre: 68.34 in– Desviación estándar de las estaturas: 3.02 in– Peso promedio de un hombre: 172.55 lb.– Desviación estándar de los pesos: 26.33 lb.
• Nota: Las estaturas y los pesos se miden en diferentes escalas con diferentes unidades de medida, pero podemos estandarizar los valores de los datos mediante la conversión a puntuaciones z.
Ejemplo - continuación
• Estatura promedio de un hombre: 68.34 in
• Desviación estándar de las estaturas: 3.02 in
• Peso promedio de un hombre: 172.55 lb.
• Desviación estándar de los pesos: 26.33 lb.
Solución:
Ejemplo
Determine si los Angelinos de Los Angeles (de la Liga Americana) o los Rockies de Colorado (de la Liga Nacional) tuvieron una temporada de producción de carreras relativamente mejor si:
– Los Angelinos anotaron 773 carreras.– En la Liga Americana la media de carreras anotadas fue
m = 677.4 y la desviación estándar fue s = 51.7 carreras. – Los Rockies anotaron 755 carreras .– En la Liga Nacional el número medio de carreras
anotadas fue m = 640.0 y la desviación estándar fue s = 55.9 carreras.
Sullivan, Michael III. Fundamentos de estadística (página 148). Educación Pearson. Versión Kindle.
Ejemplo - continuación
• Los Angelinos anotaron 773 carreras.
• En la Liga Americana la media de carreras anotadas fue m = 677.4 y la desviación estándar fue s = 51.7 carreras.
• Los Rockies anotaron 755 carreras .
• En la Liga Nacional el número medio de carreras anotadas fue m = 640.0 y la desviación estándar fue s = 55.9 carreras.
Solución:
El k-ésimo percentil de un conjunto de datos
• se denota, Pk
• es el valor tal que k porciento de las observaciones
es menor o igual al valor.
• Entonces los percentiles dividen un conjunto de
datos ordenado de forma ascendente en100 partes.
3-15© 2010 Pearson Prentice Hall. All rights reserved
Percentiles
Ejemplo:
𝑃90 se refiere al valor de un conjunto que separa el 90% de los
datos inferiores del 10% de los datos superiores.
Muchos exámenes estandarizados usan percentiles para que los
estudiantes sepan cómo estuvieron sus puntuaciones en relación
con todos los demás estudiantes que tomaron el examen.
El Graduate Record Examination (GRE) es una prueba necesaria para
la admisión a muchas escuelas graduadas de Estados Unidos. La
Escuela Graduada de Salud Pública de la Universidad de Pittsburgh
requiere una puntuación en el GRE no menor que el percentil 70 para
la admisión en su program graduada de Genética Humana (Fuente:
http://www.publichealth.pitt.edu/interior.php?pageID=101.)
Interprete este requisito de admisión.
3-16© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO
3-17© 2010 Pearson Prentice Hall. All rights reserved
Calcular percentiles:
Valor percentil de x = • 100número de valores menores que x
número total de valores
Determinar el percentil de un valor de
un conjuntoLa tabla siguiente contiene 35 valores que representan los
presupuestos ordenados (en millones de dólares) de una muestra
aleatoria simple de películas taquilleras. Encuentre el percentil para el
valor de $68 millones.
Solución:
Hallar el valor de un conjunto de datos
que representa el késimo percentil
1. Ordenar los datos de menor a mayor.
2. Calcular 𝐿 =𝑘
100𝑛, donde n es la cantidad de valores, y
k el percentil dado.
3. Si L es un entero, hallar el promedio del valor en la
posición L y la posición L + 1.
4. Si L no es entero, redondearlo al entero mayor. El valor
correspondiente a 𝑃𝑘 es valor en la posición L.
Ejemplo
Encuentre el presupuesto en el percentil setenta (𝑃70).
Solución:
Los cuartiles dividen un conjunto de datos en cuartos o 4
partes iguales.
• El 1er cuartil, se denota Q1, separa el 25% inferior de los
datos del 75% superior. Por lo tanto, el 1er cuartil es
equivalente al percentil 25.
• El 2do cuartil, se denota Q2, separa el 50% inferior de los
datos del 50% superior. Por lo tanto, el 2do cuartil es
equivalente a la mediana.
• El 3er cuartil, se denota Q3, separa el 75% inferior de los
datos del 25% superior. Por lo tanto, el 3er cuartil es
equivalente al percentil 75.
3-21© 2010 Pearson Prentice Hall. All rights reserved
Cuartiles
3-22© 2010 Pearson Prentice Hall. All rights reserved
Cuartiles - resumen
•Q2 es la mediana del conjunto completo.
•Q1 es la mediana de la mitad inferior del conjunto.
•Q3 es la mediana de la mitad superior del conjunto.
Un grupo de estudiantes recolectó datos sobre la velocidad de
vehículos que viajan por una zona de construcción en una carretera
estatal, donde la velocidad máxima es 25 mph. La velocidad
registrada de 14 vehículos seleccionados al azar, es la siguiente:
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
Determinar e interpretar los cuartiles para la velocidad en la zona de
construcción.
3-23
EJEMPLO Determinar e interpretar los cuartiles
3-24© 2010 Pearson Prentice Hall. All rights reserved
El rango intercuartil, se denota IQR, es el rango del
50% central de los datos. Esto es la diferencia entre Q3 y Q1 .
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
Rango intercuartil
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
3-25© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Determinar e interpretar el rango intercuartil
para los datos sobre velocidad en la zona de construcción
Se toma la velocidad de un 15to auto que atraviesa la zona de
construcción y su velocidad es 100 mi/hr. ¿Qué impacto tiene
sobre la media, mediana, desviación estándar y rango intercuartil?
Con 14 autos Con 15 autos
Media 32.1 mph
Mediana 32.5 mph
Desviación estándar 6.2 mph
IQR 10 mph
3-26© 2010 Pearson Prentice Hall. All rights reserved
Resumen: ¿Cuál medida debes reportar?
Forma de la distribución
Medida de tendencia central
Medida de dispersión
Simétrica Media Desviación estándar
Sesgado Mediana Rango intercuartil
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
36.7 mph
33 mph
18.5 mph
11 mph
, 100
Teorema de Chebyshev
• Dice que, independientemente de la naturaleza de la distribución de frecuencia de una variable, existen límites garantizados para el porciento de observaciones que se encuentran dentro de una cierta cantidad de desviaciones estándares de la media.
• Al menos 1 −1
𝑘2∙ 100% de los datos está
entre 𝜇 − 𝑘𝜎 y 𝜇 + 𝑘𝜎, para k>1
3-27© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Usar el Teorema de Chebyshev
Usando los datos del ejemplo anterior, sobre el HDL total en la
sangre para 54 pacientes del sexo femenino de un médico de
familia,
(a) determine el porcentaje de pacientes, segun Chebyshev, que
tienen un nivel de HDL dentro de 2 desviaciones estándares de
la media.
3-28
(b) determine el porcentaje real de pacientes que tienen un nivel de
HDL en [𝑢 − 2𝜎, 𝑢 + 𝜎2].
35 37 38 39 41 43 44 44 4445 47 47 48 48 48 50 52 5253 54 54 54 55 55 56 56 56
57 58 58 59 60 60 60 61 6262 63 64 64 64 65 67 69 69
70 72 74 74 74 75 77 82 85
3-29© 2010 Pearson Prentice Hall. All rights reserved
𝑥𝑖 se considera un valor extremo si:
• 𝑥𝑖 < 𝑄1 − 1.5(𝐼𝑄𝑅) ó
• 𝑥𝑖 > 𝑄3 + 1.5(𝐼𝑄𝑅)
donde
𝑄1 − 1.5(𝐼𝑄𝑅) es el límite inferior de los valores típicos
y
𝑄3 + 1.5(𝐼𝑄𝑅) es el límite superior de los valores típicos
Valores Extremos
3-30
EJEMPLO Determinar valores extremos en el conjunto de
velocidades en la zona de construcción
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
3-31© 2010 Pearson Prentice Hall. All rights reserved
Cinco valores que resumen un conjunto de datos
son:
Resumen de 5 valores
Mínimo 𝑸𝟏 M 𝑸𝟑 Máximo
Resumen de 5 valores
Cada seis meses, la Junta de la Reserva Federal
de los Estados Unidos lleva a cabo un estudio de
los planes de tarjetas de crédito en los EE.UU. Los
datos siguientes son las tasas de interés cobradas
por los 10 emisores de tarjetas de crédito,
seleccionados al azar para la encuesta de julio de
2005.
Determine el resumen de cinco valores para los
datos que se muestran a continuación.
3-32© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Obtener un resumen de cinco valores
Institución Taza
Pulaski Bank and Trust Company 6.5%
Rainier Pacific Savings Bank 12.0%
Wells Fargo Bank NA 14.4%
Firstbank of Colorado 14.4%
Lafayette Ambassador Bank 14.3%
Infibank 13.0%
United Bank, Inc. 13.3%
First National Bank of The Mid-Cities 13.9%
Bank of Louisiana 9.9%
Bar Harbor Bank and Trust Company 14.5%
Fuente:
http://www.federalreserve.gov/pubs/SHOP/survey.htm
3-33© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Obtener un resumen de cinco valores (cont.)
3-34
Diagrama de caja
1. Determinar los extremos inferior y superior del diagrama. a) 𝑄1 − 1.5(𝐼𝑄𝑅)b) 𝑄3 + 1.5(𝐼𝑄𝑅)donde IQR = 𝑄3 − 𝑄1
2. Marcar los extremos encontrados en paso 1.3. Dibujar una caja que va desde 𝑄1 hasta 𝑄3. Dibujar una línea
vertical dentro de la caja en M.3. Dibujar una línea desde 𝑄3 hasta el máximo y desde 𝑄1
hasta el mínimo.4. Cualquier valor menor que el extremo inferior o mayor que
el extremo superior se marca con *5. Borrar extremos.
Institución Taza
Pulaski Bank and Trust Company 6.50%
Bank of Louisiana 9.90%
Rainier Pacific Savings Bank 12.00%
Infibank 13.00%
United Bank, Inc. 13.30%
First National Bank of The Mid-Cities 13.90%
Lafayette Ambassador Bank 14.30%
Wells Fargo Bank NA 14.40%
Firstbank of Colorado 14.40%
Bar Harbor Bank and Trust Company 14.50%
Fuente:
http://www.federalreserve.gov/pubs/SHOP/survey.htm
Usando el resumen
de 5 valores:
Mínimo:
Máximo:
𝑄1 =
𝑄2 ó M =
𝑄3 =
3-35© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Construir un diagrama de caja y describir la
forma de la distribución de los datos.
Paso 1: IQR
Paso 2: límites inferior y superior:
Paso 3:
3-36© 2010 Pearson Prentice Hall. All rights reserved
6.50%, 9.90%, 12.00%, 13.00%, 13.30%, 13.90%, 14.30%, 14.40%, 14.40%, 14.50%Datos:
El diagrama de caja anterior sobre la taza de interés indica que la
distribución es sesgada hacia la izquierda.
3-37© 2010 Pearson Prentice Hall. All rights reserved
Describir la forma de la distribución de los datos usando un diagrama de caja
Teorema de Chebyshev
• Dice que, independientemente de la naturaleza de la distribución de frecuencia de una variable, existen límites garantizados para el porciento de observaciones que se encuentran dentro de una cierta cantidad de desviaciones estándares de la media.
• Al menos 1 −1
𝑘2∙ 100% de los datos está
entre 𝜇 − 𝑘𝜎 y 𝜇 + 𝑘𝜎, para k>1
3-38© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Usar el Teorema de Chebyshev
Usando los datos un ejemplo anterior se presentan las edades de los
54 pacientes del sexo femenino de un médico de familia.
(a) Determine el porcentaje de pacientes, segun Chebyshev, que
tienen una edad dentro de 2 desviaciones estándares de la media.
3-39
(b) Determine el porcentaje real de pacientes que tienen una edad en
[𝑢 − 2𝜎, 𝑢 + 𝜎2].
35 37 38 39 41 43 44 44 4445 47 47 48 48 48 50 52 5253 54 54 54 55 55 56 56 56
57 58 58 59 60 60 60 61 6262 63 64 64 64 65 67 69 69
70 72 74 74 74 75 77 82 85