Medidas de dispersión
En un supermercado , se le dio la orden a uno de los empleados de t o m a r la t e m p e
ratura de los refr igeradores c o n vegetales cada 20 m i n u t o s y , en su caso , con t ro la r l a
o humec ta r lo s pa ra que no pierdan sus propiedades . Él in te rpre tó que pod ía h a c e r
las i n specc iones c a d a 20 minu tos en p romedio . En los ú l t imos dos días se e c h a r o n
a perder varios vegeta les y rec ib ió una a m o n e s t a c i ó n verbal . Para defenderse, m o s
t ró a su jefe el repor te de los t i empos que t r anscur r i e ron en t re revisiones en un día,
según se m u e s t r a en la t ab la 1.37.
Tabla 1.37 T iempos entre revisiones
DATO 10 12 13 15 16
Tiempo transcurrido (min) 14 21 24 20 21 23 16 17 19 16 22 28 19 20 20 18
Efec t ivamente , la m e d i a a r i tmé t i ca es de 20 minu tos , pe ro la dispersión de los
datos impl ica que a lgunos lapsos de t i e m p o ent re u n a y o t ra in specc ión son mayo
res a 20 minu tos . En el repor te del empleado, 4 de los pe r iodos son mayores que o
iguales a 22 minu tos .
Las medidas de dispers ión de los datos j u n t o c o n la m e d i d a de un p romed io m e
jo ran la descr ipc ión: Un p romed io solo no p ropo rc iona m u c h a información; po r s í
m i s m o , sólo ind ica la pos i c ión del cen t ro , mien t r a s que u n a medida de d ispers ión
pe rmi te c o n o c e r c u á n t o se esparcen los da tos a l rededor del cen t ro .
T o m e m o s c o m o referencia e l s iguiente caso , pa ra c o m p r e n d e r la diferencia en
tre medidas de tendencia central y medidas de dispersión.
El d i rec tor de u n a escue la invest iga cuá l es e l c o n s u m o diario de papel pa ra im
presora en su escue la durante per iodos de e x á m e n e s (E) y en per iodos n o r m a l e s de
t rabajo (EE). Ob t i ene u n a mues t r a del c o n s u m o en mi les de hojas durante seis días
en el per iodo n o r m a l de t rabajo: 1 . 5 , 1 . 4 , 1 . 3 , 1 . 5 , 1 . 6 y 1.3. U n a mues t r a de c i n c o días
en per iodo de e x á m e n e s arrojó los s iguientes datos: 1.8, 2 . 4 , 1 . 6 , 2.8 y 1.4. Calculó la
med ia a r i tmé t i ca y el rango para cada con jun to de da tos y obtuvo lo s iguiente:
xEE — 1.433 mil lares /d ía ; rango — 0.3 mi l la res /d ía ,
xE = 2 mi l lares /d ía ; rango = 1.4 mi l la res /d ía .
El rango es u n a medida de dispersión que se define c o m o la diferencia en t re el
dato mayor y el menor , y expl ica entre qué valores e s t án dispersos los datos . Así, en
es te c a s o se infiere que en per iodos de e x á m e n e s , además de que se g a s t a m á s pa
pel d ia r iamente , las can t idades de los c o n s u m o s se pa recen m e n o s .
Algunas de las med idas de d ispers ión m á s usadas pa ra descr ib i r da tos son las
que se m u e s t r a n en el e s q u e m a de la f igura 1.35.
Figura 1.35
Medidas de dispersión
N O U S A N T O D A L A
I N F O R M A C I Ó N
D I S P O N I B L E
R A N G O P E R C E N T I L E S
C U A R T I L E S
R A N G O E N T R E P E R C E N T I L E S
R A N G O I N T E R C U A R T Í L I C O
U S A N T O D A L A
I N F O R M A C I Ó N
D I S P O N I B L E
D E S V I A C I Ó N
M E D I A
V A R I A N Z A
/
D E S V I A C I Ó N
E S T Á N D A R
L a s m á s ef icientes son aquel las en las que se ut i l iza toda la i n fo rmac ión disponible ,
pe ro las o t ras son a m p l i a m e n t e usadas pa ra efectuar desc r ipc iones de d i s t r ibuc io
nes de f recuencias . Todas ellas son estadísticos s i se ca lcu lan c o n da tos de una
mues t ra , y son parámetros si en su cá l cu lo se ut i l iza toda la i n f o r m a c i ó n de u n a
población.
1.4.1 I Rango
El rango de un con jun to de datos es la m e d i d a de dispers ión m á s s imple .
Rango de un con jun to de da tos n u m é r i c o s : Es la diferencia entre los valores
mayor y menor.
Deforma simbólica:
R — valor da to mayor — valor da to menor.
El rango t i ene var ias propiedades que d e t e r m i n a n su uso:
• Es a fec tado p o r un valor ex t r emo; p o r e jemplo , u n o m u y grande en e l c o n t e x t o
de los demás .
• No mide ni descr ibe la dispersión de los datos ent re los valores m á x i m o y mín imo .
• Su valor es m u y útil cuando se c o m p a r a n var ias mues t r a s pequeñas .
a Ejemplo 1.59
El rango de los valores 2, 3, 4 y 1 0 0 es 98 ; 1 0 0 es un valor e x t r e m o y a fec ta el valor
del rango, e l cua l en es te caso no p r o p o r c i o n a in fo rmac ión ace rca de la d ispers ión
de los da tos en t r e el 2 y el 100.
I Actividades de aprendizaje
Analiza los siguientes ejercicios y contesta lo que se te pide. Compara los procedi
mientos que sigas y las respuestas que obtengas con las de algunos compañeros
de tu grupo.
Q L O N G I T U D E S D É T O R N I L L O S
En un p r o c e s o se miden las long i tudes de 5 torni l los en c e n t í m e t r o s y se ob
t i enen los s iguientes resul tados: 10 .09 , 9 .98, 9 . 9 9 , 1 0 . 0 4 y 10 .10 .
H ¿Cuál es el rango?
\b\ ¿Cuál es la media a r i tmé t i ca? .
H ¿Cuál es la med iana?
\á\ C o m p a r a la media a r i t m é t i c a c o n la med iana :
x
X0.5
¿Qué significa el resul tado?
Un p e q u e ñ o n e g o c i o que se dedica a l p l anchado de ropa r ec ibe ped idos ge
ne ra lmen te p e q u e ñ o s . L o s pedidos de las dos ú l t imas s e m a n a s , en can t idad
de p rendas que se t i e n e n que planchar , se m u e s t r a n a c o n t i n u a c i ó n .
Pedidos de la semana 20 Pedidos de la semana 21
P E D I D O ¡ P R E N D A S
1 ! 25
2 ! 46
3 ! 24
4 ¡ 20
5 | 15
6 ! 28
7 ! 35
8 ¡ 40
9 ! 3 4
10 ! 36
11 ! 28
12 ! 37
13 ! 29
14 ¡ 18
15 ! 38
16 ! 28
17 ! 54
18 ! 16
P E D I D O i P R E N D A S
1 ! 34
2 ! 56
3 ! 17
4 ! 12
5 ! 26
6 i 35
7 ¡ . 4 0
8 ¡ 14
9 ! 28
10 ! 23
11 ¡ 40
12 ¡ 120
13 ! 12
14 ! 12
15 ! 16
16 ¡ 18
17 ! • 38
18 ¡ 40
19 | 29
20 ! 23
21 ! 4 3 '
22 ! 34
H Calcula el rango de c a d a s e m a n a y compára los :
¿Cuán tas veces es mayor o m e n o r el rango de la s e m a n a 1 al rango de la
s e m a n a 2? ¿Qué signif ica eso?
\b\ ¿Cuál es la med ia a r i t m é t i c a de p rendas po r pedido de c a d a s e m a n a ?
0 ¿Cuál es la m e d i a n a del n ú m e r o de prendas por c a d a ped ido de c a d a se
m a n a ?
\á\ ¿En qué s e m a n a ex i s t e un valor ano rma l? ¿Cuál es ese valor? ¿ C ó m o
afec ta al rango, a la m e d i a a r i t m é t i c a y a l a m e d i a n a ? Exp l i ca .
1.4.2 I Percentiles
Para ver cuál es la ut i l idad de los percen t i l es , t o m e m o s c o m o referencia e l s iguiente
caso .
° Ejemplo 1.60
Genera lmen te se apl ican e x á m e n e s de ingreso a las in s t i tuc iones de educac ión su
perior. Los resul tados de esos e x á m e n e s suelen ordenarse del mayor al menor , o vi
ceversa, y cada par t i c ipan te adquiere así u n a pos ic ión de orden den t ro del con jun
to . Cuaren ta datos de ese t ipo, p roven ien tes de ca l i f icac iones en u n a esca la que va
de 7 0 0 a 1 3 0 0 puntos , se m u e s t r a n en la t ab la 1.38, o rdenados del m e n o r a l mayor.
Tabla 1.38 Resultados de un examen de ingreso a una universidad
DATO | 1 2 3 4 5 6 7 8 9 1 0
C A L I F I C A C I Ó N ¡ 774 7 8 6 8 5 3 8 9 0 8 9 4 9 0 3 9 0 8 9 2 5 9 2 6 9 3 0
DATO ! 1 1 1 2 1 3 1 4 1 5 1 6 i B É 1 8 1 9 2 0
C A L I F I C A C I Ó N ¡ 9 3 3 9 3 7 9 3 9 9 5 2 9 5 6 9 6 9 9 9 1 9 9 3 9 9 3
DATO | 21 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9 3 0
C A L I F I C A C I Ó N ¡ 9 9 9 1 0 0 2 1 0 0 7 1 0 0 7 1 0 1 0 1 0 1 0 1 0 1 3 1 0 2 1 1 0 2 3 1 0 3 4
DATO ¡ 31 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 9 4 0
C A L I F I C A C I Ó N ¡ 1 0 4 0 1 0 4 3 1 0 4 5 1 0 5 6 1 0 5 8 1 0 5 9 1 0 6 1 1105 1 1 8 4 1 2 1 5
De es tos datos, se quiere d e t e r m i n a r u n a cal i f icación que p a r t a a l grupo de da tos
en dos subgrupos: uno c o n 75 p o r c i en to m e n o r e s a esa ca l i f icación, y o t ro c o n 25
p o r c i en to mayores . En es te p r o b l e m a se requiere ca lcu la r e l percentil 75° .
El percen t i l p de un grupo de da tos ordenados: Es el valor x ( p ) para el cual p
por ciento de las mediciones son menores que él
El cá l cu lo de un pe rcen t i l de u n a m u e s t r a o rdenada se real iza de la s igu ien te
manera .
1) Se ca l cu la el da to p e r c e n t i l p c o n la fórmula
p{n) +p D(p).
1 0 0
d o n d e p es e l po rcen ta j e de datos que deben ser m e n o r e s que e l valor del p e r c e n
til requer ido: 1 0 % , 2 5 % , 3 8 % , 7 5 % , ...;yn es e l n ú m e r o de datos .
E l cá lcu lo del da to pe rcen t i l 75 po r c ien to , en nues t ro e jemplo , se h a c e as í
7 5 ( 4 0 ) + 7 5 = 3 0 7 5 -
1 0 0
Así, e l valor del dato percent i l es mayor que 1 0 3 4 puntos , pero m e n o r que 1 0 4 0
puntos.
2) Se interpola pa ra o b t e n e r el valor del da to percen t i l p: x(p), y se ca l cu la s egún la
regla
x{p) =Dp_1
Jr [Dp + i — Dp_1] [par te dec ima l del dato D(p)]?
donde Dp_1es e l da to an te r io r al da to D(p), y D p + 1 e s el da to pos t e r io r al da to
D(p).
Cálculo pa ra nues t ro e jemplo: T o m a en c u e n t a que 30 .75 es tá en t re los d a t o s 30
( 1 0 3 4 ) y 31 ( 1 0 4 0 ) ; así , t e n e m o s que
4 7 5 ) = 1 0 3 4 + [ 1 0 4 0 - 1 0 3 4 ] ( 0 . 7 5 ) = 1 0 3 8 . 5 pun tos .
Luego, 75 po r c i en to de las ca l i f icac iones son m e n o r e s a ese valor.
C U A R T I L E S
Los cuar t i les son percen t i l es que pa r t en un grupo de m e d i c i o n e s o rdenadas a s c e n
dente o d e s c e n d e n t e m e n t e en cuartos, es decir, en subgrupos de da tos c a d a u n o
con 2 5 % de ellos, de acuerdo c o n las s iguientes def inic iones y n o t a c i ó n (véase la f i
gura 1.36).
• Cuart i l 1
• Cuart i l 2:
• Cuart i l 3:
Q ( l ) = percen t i l 2 5 % = x(25).
Q(2) = percen t i l 5 0 % = x(50) =xQ5 = la. med iana .
Q(3 ) = percen t i l 7 5 % = x{75).
DATO
M E N O R 1 1 1 Cuartil 1: QO) Percentil x(25)
25% de los datos es menor a Q(1)
Cuartil 2:0(2) Percentil x(50)
M E D I A N A
50% de los datos es menor a 0(2)
Cuartil 3:0(3) Percentil x(75)
75% de los datos es menor a Q(3)
DATO
M A Y O R
En virtud de lo anterior, el cá lcu lo de los cuar t i les se real iza c o m o el de los res- Figura 136
pect ivos percent i les . Significado de los valores de los cuartiles
Actividades de aprendizaje
Reúnete con tres de tus compañeros de grupo para relizar la siguiente actividad.
Si tienen alguna duda, coméntenla con su maestro(a).
Q T E R M O S T A T O
El con t ro l del t e r m o s t a t o de un ca l en t ado r de gas enc i ende c u a n d o la t e m
pera tura baja . En un e x p e r i m e n t o c o n un nuevo t e r m o s t a t o , se p r a c t i c a r o n
60 ensayos ob ten iéndose los s iguientes resul tados, los cua les han s ido orde
nados del m e n o r al mayor.
°C a los que reacciona el te rmosta to
12.0 16.8 17.9 18.6 19.9 20.4 21.5 22.2 23.0 24.0
12.5 16.9 18.0 18.7 19.9 20.5 21.6 22.4 23.6 25.3
12.9 17.0 18.1 18.7 19.9 20.6 21.6 22.7 23.8 25.5
15.3 17.1 18.1 18.9 20.0 20.9 21.9 22.7 23.9 25.7
15.8 17.5 18.3 19.1 20.2 21.2 21.9 22.8 24.0 26.1
16.3 17.8 18.5 19.4 20.3 21.2 22.0 22.8 24.0 28.4
[a ] ¿Cuál es el valor del rango?
[b] Ca lcu len el valor de los cuar t i les Q ( l ) , Q ( 2 ) y Q ( 3 ) .
0 ¿Qué porcen ta j e de da tos es mayor que Q(2 )? ¿Por qué? ¿Qué signif icado
t i ene ese valor?
Gráfico de cajas y bigotes
Con los cuar t i les es pos ib le cons t ru i r un gráfico m u y senci l lo l l amado gráfico de
ca jas y b igo tes . Es tud ia la s iguiente s i tuac ión y su solución, en la que se ob t i ene un
gráfico de es te est i lo.
a Ejemplo 7 . 6 7
Los s iguientes da tos co r r e sponden a l n ú m e r o de empleados p o r e m p r e s a de la c o n s
t rucc ión , e n c o n t r a d o med ian t e un m u e s t r e o a lea tor io de 70 empresas en la Repú
b l i ca M e x i c a n a . El regis t ro lo real izó un conse jo empresar ia l de la c o n s t r u c c i ó n a
f ina les del a ñ o 2 0 0 5 c o n la f ina l idad de posee r un regis t ro rápido para t o m a r algu
nas dec i s iones . En e l padrón de empresa s de ese t ipo en e l pa ís apa recen registra
das 8 5 0 0 .
Tabla 1.39
1 13 35 55 68 91 132 153 213 333
3 20 39 57 71 94 133 166 221 334
6 20 39 60 77 95 138 175 229 340
6 22 42 61 78 101 142 178 248 351
8 22 50 66 86 113 147 180 258 454
10 32 53 66 87 127 150 184 261 693
12 35 55 66 88 132 153 204 326 718
El obje t ivo de la e n c u e s t a fue de t e rmina r a p r o x i m a d a m e n t e e l n ú m e r o de em
pleados en todas las empresas y descr ib i r su c o m p o r t a m i e n t o .
1) La var iable que se es tudia es e l n ú m e r o de empleados p o r e m p r e s a de la c o n s
t rucc ión .
2) Se prefiere es tudiar u n a m u e s t r a y no la pob l ac ión en te ra po rque se t i ene pr isa
en adquir i r in formac ión .
3) El valor de la m e d i a n a es
88 + 91 = 89 .5 .
Así, s i la m u e s t r a es represen ta t iva de la poblac ión , a p r o x i m a d a m e n t e 5 0 % de
las empresas t i ene 90 t raba jadores o m e n o s .
4) Los valores de los pe rcen t i l e s percen t i l es 25 y 75 es tán , según la fórmula dada al
pr ic ipio de es ta secc ión , en los da tos s iguientes:
= 2 5 ( 7 0 ) + 25 ?
100 3 .
7 5 ( 7 0 ) + 75 = 5 3 _ 2 5 _
100
In te rpo lando m e d i a n t e l a segunda fórmula dada en e s t a s ecc ión , se ob t i ene
• Cuart i l 1 o Q ( l ) :
x ( 2 5 ) = 39 + [42 - 39] [0 .75] = 4 1 . 2 5 t rabajadores .
• Cuart i l 3 o Q ( 3 ) :
JE (75) = 178 + [180 - 178] [0 .25] = 178 .5 t rabajadores .
El h i s tog rama de f recuenc ias de los datos se m u e s t r a en la f igura 1.37. Nótese
que ex i s t e un e n o r m e sesgo a la derecha , lo cua l t a m b i é n puede no ta r se cons t ru
yendo un gráfico de cajas y bigotes, c o m o se m u e s t r a en la figura 1.38.
Figura 1.38
Gráfico de cajas y bigotes
E M P R E S A S D E L A C O N S T R U C C I Ó N Marco x Barra del rango
Dato menor: 1
Cuartil 1,Q(1):42
Línea de la mediana, 0(2): 89.5 J _
Dato mayor: 718
-100 0 / 100 200 300 400 500 600 700 800
Cuartil 3,0(3): 178
Los p a s o s pa ra la c o n s t r u c c i ó n de es te gráf ico son los s iguientes .
1) Se cons t ruye un m a r c o dent ro del cua l se cons t ru i r á el gráfico de ca jas y b igo tes .
2) Se ident i f ican los valores de los da tos mayor y menor , 1 y 7 1 8 , y c o n esos valores
se cons t ruyen los e x t r e m o s de los "bigotes" , c o m o se ve en la f igura 1.38, c o n
unas p e q u e ñ a s l íneas ver t icales , a m a n e r a de l ími tes del gráfico.
3) Desde esas p e q u e ñ a s l íneas se t r aza u n a l ínea auxi l iar hor izon ta l que las una : la
ba r r a del rango.
4) Sob re la ba r ra del rango se dibujan p u n t o s que seña len los cur t i les Q ( l ) , Q ( 2 ) y
Q(3 ) . Desde ellos se cons t ruyen las ca jas c o n la a l tura que se desee.
5) Se t r aza c o n l ínea gruesa, sin a t ravesar las ca jas , la l ínea del rango.
La l ec tu ra e in te rp re tac ión del gráfico es la s iguiente .
1) Desde e l da to m e n o r h a s t a Q ( l ) se c o n c e n t r a 2 5 % de los datos .
2) Desde Q ( l ) h a s t a Q(2 ) se c o n c e n t r a o t ro 2 5 % de datos .
3) En t r e Q(l) y Q(3) se c o n c e n t r a 5 0 % de los da tos .
Así,
4) Hay m u c h a c o n c e n t r a c i ó n de da tos a la izquierda, es to es, para valores p e q u e ñ o s
del n ú m e r o de t rabajadores .
5) El b igo te de la de recha es m u c h o m á s largo que el de la izquierda, de lo cua l se
deduce que la d i s t r ibuc ión t i ene un sesgo a la derecha . Compáre se el gráf ico de
ca jas de la f igura 1.38 c o n el h i s t o g r a m a de f recuenc ias de la f igura 1.37.
Actividades de aprendizaje
Reúnete con tres de tus compañeros de grupo, y resuelvan la siguiente actividad.
Si tienen alguna, duda pregunten a su maestro(a).
Q La can t idad de lluvia en c e n t í m e t r o s p o r día regis t rada en el año 2 0 0 4 en
una región desé r t i ca del nor te del país en los días que llovió se m u e s t r a en la
tab la s iguiente .
C A N T I D A D D E L L U V I A E N C E N T Í M E T R O S ( 2 0 0 4 )
0.03 0.22 ¡ 0.38 0.47 0.58 0.72 0.86 1.21 | 1.65 2.46
0.05 0.31 ¡ 0.40 0.47 0.59 0.73 0.87 1.27 | 1.75 2.50
0.09 0.32 | 0.41 0.49 0.60 0.74 0.91 1.29 ¡ 1.81 2.57
0.17 0.35 ¡ 0.41 0.52 0.66 0.75 0.93 1.33 | 1.87 2.90
0.1.8 0.36 | 0.43 0.54 0.66 0.75 0.97 1.34 | 1.93 3.12
0.21 0.37 ¡ 0.46 0.54 0.69 0.79 1.16 1.40 | 2.38 3.87
[a] ¿Cuál es la variable en es tudio?
[b] Calculen los cuar t i les Q ( l ) , Q (2 ) y Q(3 ) .
0 Exp l iquen el significado de cada u n o de los cuar t i les .
[d] Cons t ruyan el gráfico de cajas y b igo tes .
C E N T Í M E T R O S D E L L U V I A
-0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
Rea l i cen la l ec tu ra e in te rp re tac ión de los da tos .
4.0 4.5
Cálculo de cuartiles para datos agrupados
C u a n d o se t i enen da tos agrupados , los cuar t i les pueden ca lcu la r se de fo rma equi
va len te a c o m o se ca lcu la la m e d i a n a pa ra da tos de ese t ipo .
° Ejemplo 1.62
En u n a inves t igac ión sobre las cua l idades de la r edacc ión de un gran novel is ta , se
mid ió e l n ú m e r o de pa labras p o r orac ión . Los resul tados que se ob tuv ie ron se
m u e s t r a n en la t ab la de f r ecuenc ias 1.40.
Tabla 1.40 Palabras por oración
C L A S E i
I N T E R V A L O S R E A L E S
DE C L A S E
P A L A B R A S / O R A C I Ó N
1 F R E C U E N C I A
¡ /
F R E C U E N C I A ¡
RELATIVA i
fr
F R E C U E N C I A
R E L A T I V A
A C U M U L A D A
fra
¡
1 ! 2 0 < P < 2 5 ¡ 2 0.02 ¡ !
2 ¡ 2 5 < P < 3 0 ¡ 3 0.03 ¡ 5 ¡
3 ¡ 3 0 < P < 3 5 ! 17 0.17 ¡ 22 ¡
4 i 3 5 < P < 4 0 | 30 0.30 ¡ 52 ! Clase 0(1)
5 ¡ 4 0 < P < 4 5 ! 30 0.30 J 82 ¡
6 ! 4 5 < P < 5 0 ! i i 0.11 ¡ 93 !
7 ¡ 5 0 < P < 5 5 ! 6 0.06 ¡ 99 !
8 ! 5 5 < P < 6 0 ¡ i 0.01 | 100 ¡
i Totales | 100
1
1.000 | ¡
El cá l cu lo de los cuar t i les se rea l iza c o m o se ejemplif ica a c o n t i n u a c i ó n .
Cuar t i l Q ( l ) :
1) Se b u s c a la c lase Q ( l ) , que es en la que es tá e l dato:
2 5 ( . ) + 2 5 = 2 5 ( 1 0 0 ) + 2 5 = 2 5 2 5 _
1 0 0 100
Así , la c lase Q ( l ) , cuar t i l 1 o pe rcen t i l 2 5 , es la c lase 4.
2) Se in terpola: e l valor del da to Q ( l ) debe ser mayor que 35 pe ro m e n o r que 4 0 .
Po r cons igu ien te , e l valor del da to Q ( l ) es
OK — 9 9
Q ( l ) = 35 + ( 4 0 - 3 5 ) = 3 5 . 5 4 pa labras .
Lo cua l significa que 2 5 % de las o rac iones que esc r ibe e l novel is ta t i ene m e n o s
de 3 5 . 5 4 pa labras (debe deci rse m e n o s de 36 palabras , ya que la variable es dis
c re ta ) .
I Actividades de aprendizaje
Reúnete con tres de tus compañeros de grupo, y calculen el valor de Q ( 3 ) del ejem
plo 1.62 anterior.
R A N G O E N T R E P E R C E N T I L E S
Con los pe rcen t i l e s se pueden cons t ru i r rangos, los cua les inc luyen porcen ta jes de
datos . Algunos de es tos rangos son ut i l izados f r ecuen temen te pa ra descr ib i r la va
r iac ión de los datos . Por e jemplo, la d i ferencia x(80) — x(20) es un rango ent re per
cent i les , y se l l ama rango 80-20. E s t a med ida pe rmi t e c o n o c e r el rango ent re el cua l
var ía 6 0 % de los da tos en e l c en t ro de la d is t r ibución .
Así, po r e jemplo , en un e x a m e n explora tor io de un con jun to de datos , se puede
ca lcular var ios de es tos rangos pa ra descr ib i r c o n mayores deta l les su dispersión.
Ahora b ien , u n o de los rangos c o n percen t i l e s m á s usado es el rango intercuartilico,
el cual se r ep resen ta de la fo rma
/ = Q ( 3 ) - Q ( 1 ) ,
que pe rmi t e de te rminar e l rango en el c e n t r o de la d i s t r ibuc ión en el cua l se con
cen t ra 5 0 % de todos los datos. Se ut i l iza en lugar del rango c o m ú n porque evade los
valores e x t r e m o s que lo afectan; é s t a es su ventaja .
° Ejemplo 1.63
En un gran a l m a c é n de ropa, e l admin i s t r ador i n t en t a cuant i f icar las pérdidas dia
r ias en p rendas de vestir por robo . Para ello, t o m a en su es tudio los resul tados agru
pados en orden a scenden te del m e s de j u n i o del año 2 0 0 5 (véase la t ab la 1.41).
Tabla 1.41 Número de prendas perdidas por día
6 12 23 30 35 40
10 13 23 30 37 42
10 15 24 31 38 43
11 18 26 33 39 43
12 19 28 35 40 45
El p roced imien to seguido por él se b a s ó en el cá lcu lo de los cuar t i l e s p r i m e r o y
te rcero :
• Cuart i l Q ( l ) :
1) Se ob t i ene el va lor del da to
Cuar t i l 1 = da to percen t i l 25 = D(25) = * 2 5 = 7 .75 .
Es to ind ica que e l valor de Q ( l ) es mayor que 13 pero m e n o r que 15 .
2) Se ca lcu la el valor de Q ( l ) po r in te rpolac ión:
0 ( 1 ) = 13 + [15 - 1 3 ] ( 0 . 7 5 ) = 14.5 .
E s t o ind ica que 2 5 % de los días se roban 15 p rendas o m e n o s .
• Cuart i l Q(3 ) :
1) Da to cuar t i l 3 = da to percen t i l 75 = D(75) - ? 5 ^ Q
+ ? 5 = 2 3 . 2 5 . Por lo t an to ,
e l valor del da to Q ( 3 ) es mayor que 38 pero m e n o r que 39 .
2) Valor de Q(3) , p o r in te rpo lac ión :
0 ( 3 ) = 38 + [39 - 3 8 ] ( 0 . 2 5 ) = 38 .25 .
Es to es, 7 5 % de los días se roban 38 o m e n o s p rendas de vestir.
En virtud de lo anterior , el rango in te rcuar t í l i co es
* 0 ( 3 ) - Q ( l ) = 38 .25 - 14.5 = 23 .75 .
El significado de es te resu l tado es que 5 0 % de los días las pérd idas de p rendas de
vestir, en el cen t ro de la d i s t r ibuc ión de las med ic iones , var ía en un rango de 15
unidades, en t re 24 y 38 prendas .
A par t i r del in te rcuar t í l i co , se ob t i ene una med ida del rango de la m i t a d que
se encuen t r a en el c e n t r o de toda la d is t r ibución, l l amada rango semiintercuartüico
o desviación entre cuartiles. E s t a med ida es igual al p romed io del r ango in t e rcua r
t í l ico:
Q M = Q ( 3 ) - Q ( D
2
Al igual que e l rango in te rcuar t í l i co , es ta med ida no es tá a fec t ada po r los va lores
ex t r emos de un con jun to de datos. Cuando el valor de QM es p e q u e ñ o , e s to ind ica
que la variación entre los datos en el centro de la distribución que constituyen 50%
del total de datos es pequeña. En c a s o cont ra r io , es grande. En la figura 1.39 se i lus
t ra e s t a idea.
QO) Q(2) 0(1) 0(2)
50% de los datos en el centro 50% de los datos en el centro, con menos variación
Anal iza el p roced imien to seguido en el e jmplo 1.64 para e s t ab lece r en t re dos
con jun tos de datos cuáles del 5 0 % del to t a l que e s t án en e l cen t ro var ían m e n o s .
° Ejemplo 1.64
L o s tu rbor reac tores o m o t o r e s a r eacc ión p o s e e n una c á m a r a de c o m b u s t i ó n en la
cual se generan a l tas t empera tu ras . An te s de saca r a l m e r c a d o un nuevo mode lo , se
real izan pruebas minuc iosa s de su func ionamien to y capac idad c o m o con t ro l de
calidad. La t empera tu ra m á x i m a de res i s t enc ia de la c á m a r a debe c o n o c e r s e a f in
de cons t ru i r y p robar los mate r ia les c o n que se cons t ruye , los m e c a n i s m o s suje tos
al calor y el r end imien to en su uso. Se real izó un e x p e r i m e n t o c o n dos mo to re s , A y
B; el m o t o r A se p robó 20 veces y el B, 1 0 0 veces , ob ten iéndose las s iguientes t e m
peraturas m á x i m a s que se regis t ran en la c á m a r a , en grados cen t íg rados (véanse
las tablas 1.42 y 1.43).
Tabla 1.42 °C de temperatura en las
cámaras de combust ión
(motor t ipo A)
616.88 673.94 698.88 717.00
642.07 679.38 699.02 724.50
654.35 689.32 701.43 741.70
664.21 694.00 705.17 742.94
668.46 697.77 706.51 743.26
Tabla 1.43 °C de temperatura en las cámaras de combust ión (motor t ipo B)
706.98 756.31 764.49 767.38 772.25 775.44 778.24 781.26 783.96 786.38
719.25 756.96 764.57 767.66 772.76 775.91 778.50 781.45 784.13 786.49
737.88 758.36 764.73 767.74 772.86 776.22 778.68 781.56 784.16 786.67
739.15 758.83 764.80 767.85 773.59 776.33 778.70 781.63 784.43 786.68
749.90 759.72 764.90 768.40 774.70 777.08 779.02 781.86 784.67 786.82
750.00 760.75 766.07 769.37 774.71 777.29 779.50 782.05 785.31 786.82
Figura 1.39
Indicador de la variación de
los datos centrales por medio
del OM
751.40 760.75 766.32 769.71 775.28 777.41 779.96 782.63 785.50 787.06
751.57 761.77 766.69 770.04 775.34 777.65 779.96 782.67 785.64 787.06
751.66 764.14 766.98 770.58 775.41 777.65 780.62 783.51 785.85 787.10
753.18 764.16 76725 771.79 775.41 778.06 780.78 783.84 785.97 787.45
Al ap l icar las ope rac iones cor respondien tes , se ob tuvieron los cuar t i les de las
t empera tu ra s de los respect ivos m o t o r e s .
i M O T O R
C U A R T I L A ! B
Q(1) 669.83 i 765.19
Q(2) 698.325 ¡ 775.425
Q(3) 714.38 ! 782.00
Así, los rangos semi in te rcuar t í l i cos pa ra cada m o t o r son los s iguientes .
M o t o r A : Q M = 7 1 4 - 3 8 - 6 6 9 - 8 3
= 2 2 . 2 7 5 , y M o t o r B : Q M = 7 8 2 ~ 7 6 5 1 9 — 8 .405. 2 2
Es tos cá lcu los ind ican que las t empera tu ra s ub icadas en e l c e n t r o de la dis t r ibu
c ión equivalentes a 5 0 % del to ta l de las producidas en la c á m a r a del m o t o r B es tán
m á s c o n c e n t r a d a s , es decir, son m á s h o m o g é n e a s , que las t empera tu ra s ub icadas
en el c e n t r o de la d i s t r ibuc ión equivalentes a 5 0 % del to ta l de las p roduc idas en la
Figura l 40 c á m a r a del m o t o r A.
°C de temperaturas en la Ensegu ida se m u e s t r a n los h i s tog ramas de f recuenc ias pa ra las t empera tu ra s de
cámara de combustión c ada m o t o r en cada mues t r a (véanse las figuras 1.40 y 1.41).
del motor a reacción A M O T O R A
6 I i 1 1 1 1 i 1 1 1
5 . _ _ ___ _____ _
616.8752 637.9393 659.0033 680.0674 701.1315 722.1955
Grados centígrados
743.2596
Tabla 1.43 °C de temperatura en las cámaras de combust ión (motor t ipo B) [continúa]
M O T O R B
706.9763 715.0241 723.0718 731.1195 739.1673 747.2150 755.2627 763.3105 771.3582 779.4059 787.4537
Grados centígrados
Las t empera tu ras en la c á m a r a del m o t o r B se c o n c e n t r a n en gran med ida a la
derecha. L a s co r respond ien tes a la c á m a r a del m o t o r A se e spa rcen m á s uni forme
m e n t e a lo largo del rango de los da tos .
C o m o puedes ver, los percen t i l es en genera l desc r iben la d ispers ión de los datos
po r med io de pa r t i c iones y rangos . Por cons igu ien te , no usan todas las med ic iones
disponibles n i se re lac ionan a a lguna med ida de t e n d e n c i a cen t ra l t a l c o m o la m e
dia a r i tmé t i ca o la mediana . Ahora b ien , evi tan los valores e x t r e m o s que a fec tan al
rango. El defec to de los percen t i l es puede subsanarse c o n o t ras m e d i d a s de disper
sión, c o m o la desviación media , la va r i anza y la desviación estándar .
Figura 1.41
°C de temperaturas en la
cámara de combustión
del motor a reacción B
Actividades de aprendizaje
Reúnete con tres de tus compañeros de grupo y realicen la siguiente actividad. Si
tienen dudas, coméntenlas con su maestro(a).
D La p roducc ión s emana l de a c e r o en tone ladas en u n a s iderúrgica en e l nor te
del país , durante e l año 2 0 0 4 , ha sido resumida en la s iguiente tab la .
Toneladas de acero producidas por semana
77.43 •
85,08 87.31 88.48 89.19 89.96 90.78 93.22 94.89 96.77
79.29 85.32 87.38 88.61 89.43 ! 90.54 91.54 93.35 95.54 97.16
82.76 85.35 87.43 88.73 89.60 | ,90.63 91.71 93.65 96.16 97.53
84.64 85.50 87.59 88.84 89.73 ¡ 90.66 92.99 93.65 96.33 97.70
85.04 86.42 88.31 88.94 89.86 I 90.70 93.16 93.74 96.43 99.04
H ¿Cuál es la variable en es tud io?
[b] ¿Cuál es el rango de las m e d i c i o n e s en la mues t r a?
[ i ] ¿Por qué e s é s t a u n a mues t r a? Expl iquen .
[d] Ca lcu len los cuar t i les , el rango in te rcuar t í l i co y el rango s e m i i n t e r c u a r -
t í l i co de la d i s t r ibuc ión . R e s u m a n la i n fo rmac ión en la s iguiente tab la .
Q(1) ¡ 0(2) = M E D I A N A ! Q(3) ! OM
Toneladas por semana ¡ ¡ ¡ % ¡
0 ¿Cuál es el s i gnif icado de cada u n o de los resul tados e n c o n t r a d o s ? Expl i
quen.
1.4.3 | Desviación media
Un anál is is e s t ad í s t i co en e l que se ut i l iza t o d a la i n fo rmac ión d isponib le p e r m i t e
o b t e n e r me jo re s conc lus iones . Para descr ib i r la d ispers ión de los datos , se prefiere
ut i l izar u n a med ida de t e n d e n c i a cen t ra l c o m o referencia porque se ca l cu la c o n
todos los valores de las m e d i c i o n e s y su pos i c ión es cent ra l . Es to es lo que sucede
c o n la desviación media, una medida de la dispersión de las mediciones alrededor
de la media aritmética.
La desviación media, D M , de un conjunto de valores numéricos de una mues
tra se define como
n
Y}xi~A ; _ I \x-x\ + \X0-x\ + ... + \X -X\
donde x { es el i-ésimo valor numérico, i = 1, 2 , n ; | x i — x| es el valor absoluto
de la diferencia entre el i-ésimo valor numérico y la media aritmética, esto es,
se toma el valor positivo de la diferencia, y n es el total de datos en la muestra.
Dado que se ut i l izan valores absolu tos , la desviac ión med ia s iempre es posi t iva .
C o m o se m e n c i o n ó an tes , l a desviación m e d i a es un es tad í s t i co s i se ca l cu la c o n
datos de una mues t ra , y es un p a r á m e t r o s i se ca l cu l a c o n todos los da tos de u n a
poblac ión .
Una propiedad del valor de la desviación m e d i a es la s iguiente:
• Si x ± DM incluye a p r o x i m a d a m e n t e 5 8 % de las med ic iones , su d i s t r ibuc ión de
f recuenc ias es a p r o x i m a d a m e n t e s imé t r i ca .
I : Actividades de aprendizaje
Reúnete con tres de tus compañeros de grupo y realicen la siguiente actividad.
Comparen sus resultados con los de algunos de sus compañeros.
Q Un CD con t i ene 12 melodías ; los t i e m p o s de durac ión en minu tos de c a d a
una se m u e s t r a n enseguida .
M E L O D Í A ¡ 1 2 3 4 5 ¡ 6 ¡ 7 ¡ 8 ¡ 9 1 0 n 1 2
Tiempo i l i
| 3.56 ¡4.02 ¡ 3.18 3.67 J 5.15 ¡ 4.50 ¡ 5.88 ¡ 6.00 ¡ 4.19 ¡ 5.18 4.13 ¡ 3.60
0 Calculen la med ia a r i tmé t i c a del t i e m p o de durac ión de las melodías ,
[bj Calculen la desviación med ia del t i e m p o de durac ión de las melodías ,
[c ] ¿Qué po rcen ta j e de obse rvac iones caen den t ro del rango x ± DM?
1.4.4 | Varianza y desviación estándar
La med ia a r i tmé t i ca es e l p romed io m á s usado porque p o s e e propiedades de m u e s -
t reo que los o t ros p romed ios no t ienen. Ahora bien, r ecordarás que una de las pro
piedades a lgebra icas de la m e d i a a r i tmé t i ca impl ica que la s u m a de las desviacio
nes de cada med ic ión r e spec to a la med ia a r i t m é t i c a es cero :
¿ ( x - x ) = 0 .
Por este mot ivo, para o b t e n e r un promedio de las desviaciones x t — x se ut i l iza el
cuadrado de esas desviac iones . Se sabe t a m b i é n que el cuadrado de es tas desvia
c iones ,
i=l
es m í n i m a entre todas las s u m a s de los cuadrados de las diferencias de cada da to y
un n ú m e r o cualquiera , lo que la h a c e u n a med ida efect iva pa ra ca lcular la disper
sión o desviación de los valores en es tudio r e spec to a la m e d i a a r i tmét ica . Al pro
medio de las desviac iones cuadrá t i cas se le l l ama varianza.
La varianza de una muestra de n mediciones es
Í > ; - * ) 2
0 I = I
s¿ = « - 1
La forma reducida de esta ecuación es
n / n
E 2 = . i=l
n(n — l)
La varianza de una población de tamaño N es
N N
A 2 -i=l 1 = 1
N N
La le t ra cr es gr iega y se l l ama sigma. (Recue rda que la m e d i a a r i t m é t i c a de u n a
pob l ac ión se represen ta c o n
La va r i anza es un c o n c e p t o abs t r ac to , s iendo sus unidades cuadrá t i cas ( m 2 , k g 2 ,
e t cé t e ra ) . Por lo que para medi r la d i spers ión de los datos en unidades "normales" ,
se ca l cu la la raíz cuadrada de la var ianza , que se d e n o m i n a desviación estándar (o
t íp ica) .
La desviac ión es tándar o t íp ica de u n a m u e s t r a es \ls2 — s.
L a desviac ión es tándar o t íp ica d e u n a pob lac ión e s V A 2 " = A .
Figura 1.42
Efecto del tamaño de la
desviación estándar
La desviac ión es tándar de un c o n j u n t o de datos mide e l grado en que los da tos
se d i spersan alrededor de la med ia a r i tmé t i ca . A m e n o r desviación, los da tos se
c o n c e n t r a n fue r temente alrededor de x. A mayor desviación, los da tos se d ispersan
m á s a l rededor de la media . En la f igura 1.42 se mues t r an dos h i s tog ramas de fre
c u e n c i a s y u n a curva con t inua que los representa ; cada u n o de ellos co r r e sponde a
u n a m u e s t r a c o n med ia x = 100 ( M u e s t r a 1, Mues t r a 2 ) , pero las desv iac iones es
t ánda res son diferentes.
C O M P A R A C I Ó N D E L E F E C T O D E L T A M A Ñ O D E L A D E S V I A C I Ó N T Í P I C A
E N U N A D I S T R I B U C I Ó N D E F R E C U E N C Í A S
220
200
180
160
140
120
100
80
60
40
20
0
i —- • i —- •
i i- i j - • - i " -"""¡rHi TI B
33.4001 58.9901 84.5800 110.1699 135.7598 161.3497 Muestra 1: S = 5.
46.1951 71.7850 97.3749 122.9648 148.5548 Muestra 2: S = 20.
Observa que c u a n d o s es pequeña , los da tos se c o n c e n t r a n fue r t emente alrede
dor de la media . Cuando s es re la t ivamente grande, el rango es mayor; p o r lo que los
datos se d ispersan m u c h o m á s compara t i vamen te . Dado que en la desviación es
t ándar se u t i l iza t o d a la in formac ión pa ra de t e rmina r la dispers ión de los datos ,
j u n t o c o n la va r i anza son las dos medidas de d ispers ión m á s usadas en es tad ís t ica .
Para c o m p r e n d e r el s ignificado de la desviación estándar , anl iza el e j emplo 1.65.
° Ejemplo 1.65
En u n a granja se m i d e e l to ta l de l i t ros diarios de l eche que p roducen las 1 0 0 vacas
en e l es tablo . L o s resul tados diarios de la p r i m e r a s e m a n a de mayo de 2 0 0 5 fueron
4 0 0 , 4 3 5 , 4 5 0 , 4 2 0 , 4 1 0 , 4 2 0 y 4 4 0 .
El p romed io de l i t ros diarios de l eche p roduc idos p o r las 1 0 0 vacas es
7
i=i 1 4 0 0 + 4 3 5 + 4 5 0 + . . . + 4 4 0 2 9 7 5 = 4 2 5 .
7 7 8 5
La desviac ión e s t ánda r de la p roducc ión de l eche se puede ca lcu la r c o n la fór
mula reducida, ca l cu lando p r imero lo s iguiente:
7
J > ¿ = 2 9 7 5 , I ' = L .
^ C * ¿ j = 2 9 7 5 2 = 8 8 5 0 6 2 5 , y
7
^ x 2 - 4 0 0 2 + 4 3 5 2 + 4 5 0 2 + . . . 4 4 0 2 = 1 2 6 6 2 2 5 .
¿ = I
Sust i tuyendo en la fórmula de la var ianza, s 2 = —— — , se ob t i ene
n(n — í)
, - = I \ í = i i 7 ( 1 2 6 6 2 2 5 ) - 8 8 5 0 6 2 5
s 2 = — — ' — = — = 3 0 8 . 3 3 .
r a ( n - l ) 7 ( 6 )
Luego, la desv iac ión es tándar de la p roducc ión de l eche de la s e m a n a es
s = V s ^ = V 3 0 8 . 3 3 = 1 7 . 5 6 £ .
Cuando los datos e s t án agrupados en u n a d is t r ibuc ión de f recuencias , e l cá l cu lo
de la desviación es t ándar se debe efec tuar de o t ra manera . Ana l iza e l e j emplo 1.66.
D Ejemplo 1.66
S u p o n g a m o s que las med idas del c o n s u m o semana l de agua en una escue la p r ima
ria se distr ibuyen c o m o se obse rva en la d is t r ibución de f recuencias de la t ab l a 1.44.
Tabla 1.44 .
Clase ¡ I n te rva los rea les de c lase
metros cúbicos por semana (m 3 /sem)
Frecuenc ia
/
F recuenc ia I re la t iva ¡
fl !
M a r c a de c lase
MC
i ! 8 < M < 1 0 ¡ 4 0.047 ¡ 9
2 ¡ 10</\/ l<12 8 0.094 ¡ 11
3 ¡ 1 2 < M < 1 4 14 0.164 ¡ 13
4 1 4 < M < 1 6 30 0.353 ¡ 15
5 ¡ 16</Vf <18 15 0.176 ¡ 17
6 ! 18 < A/1 < 20 9 0.105 ¡ 19
7 ! 2 0 < M < 2 2 5 0.058 ¡ 21
Totales n - 8 5 0.999 ¡
La desviación es t ándar del c o n s u m o de agua s emana l se ca lcu la c o n la fó rmula
ra-1
donde f¡ es la f recuencia de la c l ase i, MCi es la m a r c a de c lase de la c lase i, x es la
m e d i a a r i tmé t i ca de los datos , y n es el t o t a l de datos .
Así. la med ia a r i tmé t i c a del c o n s u m o semana l de agua es
¿=i
85
4 ( 9 ) + 8 ( 1 1 ) + 1 4 ( 1 3 ) + 3 0 ( 1 5 ) + 1 5 ( 1 7 ) + 9 ( 1 9 ) + 5 ( 2 1 )
= 1 5 . 1 4 m 3 / s e m .
Luego, la desviación es tándar del c o n s u m o de agua semana l en me t ros cúbicos es
_ _ 1 4 ( 9 - 1 5 . 1 4 ) 2 + 8 ( 1 1 - 1 5 . 1 4 ) 2 + 1 4 ( 1 3 - 1 5 . 1 4 ) 2 + . . . + 5 ( 2 1 - 1 5 . ! 4 ) 2
5 \ • ^ ^ 8 5
s = 2 .89 m 3 / s e m .
1.4.5 | Precisión y exactitud
Fernando y M a n u e l juegan a la rayuela, ese j uego en el cua l se l anza u n a m o n e d a
desde de t e rminada d is tanc ia a u n a l ínea que se p in t a sobre el piso. Fe rnando ha
p rac t i cado c o n dos t é cn i ca s específ icas , TI y T 2 , y M a n u e l no t i ene t é c n i c a alguna.
En un con jun to de 20 juegos , a m b o s t o m a n med idas en c e n t í m e t r o s de l a d i s t anc ia
a la que cae la m o n e d a de la raya. Fe rnando t i ró 10 veces c o n la t é c n i c a T I , y las
o t ras diez c o n T 2 . Las medidas fueron las s iguientes .
Tabla 1.45
F E R N A N D O : T I ¡ 10.1 8.8 10.6
I
9.5 ¡ 9 .6 9.7 9 .6 9 . 4 8.3 ¡ 9 .6
F E R N A N D O : T 2 | 1.2 3 3 1.6 ¡ 1.5 ; 2.1 1.2 0.3 - 1 . 3 ¡ 2.2
M A N U E L | - 2 . 0 8 .4 10.1 - 2 . 5 ¡ - 4 . 3 2.0 1.4 - 9 . 4 - 4 . 4 | - 6 . 3
M A N U E L ¡ - 6 . 8 - 4 . 3 2.7 - 1 . 6 ¡ 0 .0 0 .6 0.8 - 2 . 5 - 1 . 9 - 1 . 6
El m é t o d o TI de Fe rnando impl i ca que l a m o n e d a ca iga s iempre an tes de l a raya.
Por eso t odas las med ic iones son posi t ivas . E l m é t o d o T2 impl ica que l a m o n e d a
ca iga lo m á s c e r c a de la raya sin pasarse , aunque a veces se p a s a (med ic ión c o n sig
no negat ivo) . Si la m o n e d a cayera sobre la raya se t endr ía un 0. M a n u e l t i ra a la
raya, así que su m o n e d a cae a veces an tes y a veces después de la raya. Los cá lcu los
arrojan los s iguientes es tad ís t icos .
Tabla 1.46
V A R I A B L E S
E S T A D Í S T I C A S D E S C R P T I V A S
n I M E D I A M Í N I M O 1 M Á X I M O i s
10 ¡ 9.51 cm 8.29 cm ¡ 10.58 cm 0.62 cm
10 1.47 cm -1.27 cm ¡ 2.96 cm | 1.27 cm
20 ! -1.09 cm -9 .40 cm ! 10.06 cm 4.70 cm
Fernando: T I
Fernando: T2
Manuel
De m a n e r a gráfica, los resu l tados se represen tan en el gráfico de la f igura 1.43.
H I S T O G R A M A S
14
12
10
1 l 1 l i l i l í i i 14
12
10 — i —
8
1 6 A 4 -/ \
2
i 1 x -
J « - i i i ^ ™ i Jt .... V i i
-12 -10 -8 - 6 - 4 - 2 0 2 4 6 8 10 12 14
Figura 1.43 Distancia de la moneda a la raya
L a s conc lus iones que se ob t i enen son las s iguientes :
1) C o n e l m é t o d o T I , Fe rnando es m u y prec i so porque la desviación e s t ánda r es
m u y pequeña ; pe ro no es e x a c t o , po rque su m o n e d a queda lejos de la raya, dado
que la med ia de las d i s t anc ias es de 9.51 cm de ret i rado.
2) Con el m é t o d o T 2 , Fe rnando a l canza m u y b u e n a prec i s ión y exac t i tud , po rque la
m o n e d a queda c e r c a de la raya (med ia igual a 1.47 c m ) y la desviac ión e s t ánda r
no e s m u y grande (1 .27 c m ) .
3) M a n u e l es e x a c t o porque la m e d i a de la d i s t anc ia de la m o n e d a a la raya es pe
queña (—1.08 c m ) ; sin embargo , es p o c o prec i so porque la desviación e s t ánda r es
m u y grande (2 .29 c m ) .
Los c o n c e p t o s de prec i s ión y exac t i t ud se hal lan fue r temente r e l ac ionados c o n
la var ianza y la desviac ión estándar. Un e x p e r i m e n t o c o n u n a desviac ión es t ándar
m u y p e q u e ñ a debida a errores a lea tor ios pequeños , se d ice que posee a l t a prec i
sión. Cuando un e x p e r i m e n t o t i ene u n a desviación es tándar m u y p e q u e ñ a debido
a p e q u e ñ o s errores s i s t emá t i cos , se d ice que t i ene a l ta exac t i tud .
I Actividades de aprendizaje
Trabaja en equipo con tres de tus compañeros de grupo y resuelvan la siguiente
actividad. Si tienen alguna duda, acudan con algún otro compañero o con su pro
fesora).
D C O R D O N E S D E A C E R O
Para real izar la c o n s t r u c c i ó n de un puen te se requieren c o r d o n e s de ace ro
que res i s tan la t ens ión po r el pe so del puen te . D o s fabr icantes , E y F, ofrecen
su p roduc to . El ingen ie ro del p royec to dec ide real izar p ruebas de t ens ión a
los co rdones de a m b o s . Sol ic i tó 10 de c a d a u n o pero de diferentes lo tes ; rea
lizó el expe r imen to y obtuvo los s iguientes resul tados , dados en mi les de ki
logramos .
E ¡ 31.9 35.03 36.85 32.70 35.52 38.56 35.25 32.26 32.19 41.44
F ¡ 28.14 23.51 36.01 42.13 34.27 36.31 20.08 38.49 34.10 27.28
Calcula , para cada con jun to de datos:
H La med ia a r i tmé t i ca .
[b] La med iana .
0 La desviación media .
[d\ La desviación estándar.
H ¿Cuál es tu conc lus ión? ¿Cuál co rdón de ace ro pa rece ser m e j o r ? ¿Por
qué? ¿Tiene que ver la p rec i s ión y la exac t i t ud de las med idas en la dec i
s ión?
1.4.6 | Relación entre sy la simetría de una distribución de frecuencias
Veamos ahora c ó m o se logra es tab lece r la re lac ión de s c o n la s imet r ía de u n a dis
t r ibuc ión de f recuencias . Para ello, c o n s i d e r e m o s el e jemplo 1.67.
n Ejemplo 1.67
Se es tudió la ve locidad en vuelo de un p l aneador l iviano, y se e n c o n t r ó que su m e
dia es x = 1 0 0 k m / h , c o n u n a desviación e s t ánda r s = 10 . Los da tos se r ecog ie ron de
1 0 0 0 med ic iones de esa variable a diferentes niveles de la velocidad del aire y d i rec
c iones de vuelo (a favor del aire, en con t ra , a u n o ángulo de a taque) , y se g ranea ron
en un h i s t og rama de f recuencias (véase la f igura 1.44). En el h i s tog rama se m u e s t r a
que las ve locidades son s imé t r i cas . Se ha g raneado t a m b i é n u n a espec ie de c a m p a
na que m o d e l a el h i s tog rama de f recuencias . E s e mode lo se l l ama campana de
Gauss o distribución normal, y represen ta el m o d e l o de d is t r ibuc ión de f recuenc ias
más i m p o r t a n t e en la es tadís t ica .
Una d i s t r ibuc ión de f recuencias s imét r i ca , c o m o la d i s t r ibuc ión normal , se rela
c iona c o n la desviación es tándar de la s iguiente mane ra :
• E n e l in tervalo que v a d e i - 5 a i + s c a e a p r o x i m a d a m e n t e 6 8 % d e los da tos .
• En el in tervalo que va de x — 2s a x + 2s c ae a p r o x i m a d a m e n t e 9 5 % de los datos .
• En el in tervalo que va de x — 3s a x 4- 3s c a e cas i 1 0 0 % de los datos .
D l S T R I B U C I Ó N N O R M A L : C A M PAN A DE G A U S S
Figura 1.44
Distribución normal
131.03
Una d is t r ibuc ión no rma l posee med ia igual a áu m e d i a n a y a su moda . De a c u e r
do c o n es ta propiedad de la d i s t r ibuc ión s imé t r i ca de los datos , r e l ac ionada c o n la
desviación estándar, dado que la velocidad del vuelo t i ene u n a d i s t r ibuc ión s i m é t r i
ca normal , se conc luye que las velocidades se dis t r ibuyen de la s iguiente m a n e r a .
• x + s:
En el in tervalo que va de 90 k m / h = 1 0 0 k m / h — 10 k m / h a 1 1 0 k m / h
= 100 k m / h + 10 k m / h cae a p r o x i m a d a m e n t e 6 8 % de las med ic iones .
• x + 2s:
En el in tervalo que va de 80 k m / h = 100 k m / h - 2 ( 1 0 k m / h ) a 120 k m / h
= 100 k m / h + 2 ( 1 0 k m / h ) cae ap rox imadamente 9 5 % de las medic iones .
• x + 3s: "
En e l in tervalo que va de 70 k m / h = 100 k m / h - 3 ( 1 0 k m / h ) a 1 3 0 k m / h
= 100 k m / h + 3 ( 1 0 k m / h ) c a e cas i 1 0 0 % de las med ic iones .
Una d i s t r ibuc ión a c a m p a n a d a y s imé t r i c a posee ot ras propiedades :
1) La mayor c o n c e n t r a c i ó n de med ic iones se da en el cen t ro .
2) Los e x t r e m o s o co las de la d i s t r ibuc ión ag lomeran la m e n o r f recuenc ia o p o r
cen ta je de med ic iones .
3)x=x05 = mo es el eje de s ime t r í a de la d i s t r ibuc ión y por lo t a n t o allí se ha l la el
m á x i m o de la d is t r ibución.
1.4.7 | Medida de asimetría
La d is t r ibuc ión no rma l es i m p o r t a n t e porque m u c h o s f e n ó m e n o s natura les y ar t i f i
c iales se dis t r ibuyen de esa forma. F r e c u e n t e m e n t e en la inves t igac ión se p a r t e del
supuesto de que las med ic iones de u n a variable se dis t r ibuyen de forma s i m é t r i c a
acampanada , y se h a c e n inferencias; por t an to , se t o m a n dec i s iones c o n b a s e en e se
supuesto. Sin embargo , no s iempre los da tos numér i cos asoc iados a u n a variable
a sumen la fo rma de u n a c a m p a n a de Gauss , po r lo que es necesa r io c o n o c e r la for
ma de la d is t r ibuc ión para p roceder c o n s e c u e n t e m e n t e . Los s iguientes son e jem
plos de f enómenos que se dis t r ibuyen de fo rma ap rox imadamen te a c a m p a n a d a :
1) Los niveles de in te l igencia de p e r s o n a s med idos c o n e x á m e n e s es tandar izados .
2) Los er rores de med ic ión al ut i l izar el m i s m o in s t rumen to de medida .
3) La ve locidad a la que se desplazan las m o l é c u l a s de los gases.
4) Las a l turas de individuos de un m i s m o sexo en un rango de edad de 21 a 40 años .
Para med i r e l sesgo de una d i s t r ibuc ión de f recuencias , u t i l i za remos la re lac ión
entre la m e d i a a r i tmét ica , la m e d i a n a y la desviación es tándar
c 3(x-x05) sg- s .
El resul tado del cá lculo impl ica que:
• Si Sg < 0 e n t o n c e s el sesgo es a la izquierda.
• Si Sg— 0, hay s imetr ía .
• Si Sg> 0, el sesgo es a la derecha .
A mayor sesgo, Sg t endrá un valor m á s negat ivo o m á s posi t ivo. Se requiere un
gran sesgo pa ra que Sg t o m e el valor de +1 o de —1.
° Ejemplo 1.68
Una inves t igadora educat iva p lan teó 4 p r o b l e m a s de m a t e m á t i c a s a u n a m u e s t r a
de 1 0 0 0 n iños de escuelas p r imar ias púb l i cas en e l la c iudad de Pachuca . U n a de las
variables de es tudio fue el t i e m p o que t a rda ron en resolver los p rob lemas . L o s da
tos n u m é r i c o s ob ten idos produjeron el h i s t o g r a m a de f recuencias de la f igura 1.45. Figura 1.45
Tiempo de entrega
del examen
H I S T O G R A M A D E F R E C U E N C I A S
40 60 80 100 120
Tiempo de entrega: minutos
L o s es tad í s t i cos e n c o n t r a d o s fueron:
• x = 19 .24 min,
" % 5 = m i n >
. Q ( l ) = 5.62 min,
. Q ( 3 ) = 26 .83 min, y
. s = 19 .13 min.
As í que
g 3 ( x - ^ 5 ) = 3 ( 1 9 . 2 4 - 1 3 . 2 0 ) =
5 s 19 .13
E s t o ind ica que la d i s t r ibuc ión de f recuencias de la var iable tiempo de entrega t i ene
un gran sesgo a la derecha .
I Actividades de aprendizaje
Junto con otro de tus compañeros de grupo, contesten las siguientes preguntas
acerca del ejemplo 1.68 anterior. Discutan las respuestas en el grupo.
H ¿Qué signif ica el valor Q ( l ) ?
\b\ ¿Qué signif ica el valor Q(3)?
1.4.8 | El análisis estadístico
La es tad í s t i ca es u n a c i e n c i a cuyas t é c n i c a s h a c e n pos ib le recopi la r datos, resumir
los, anal izar los y o b t e n e r inferencias . Ahora posees un c o n j u n t o de esas t é c n i c a s
que sirven para resumir y ana l izar med ic iones .
El anál is is de los da tos es un p roceso que con juga a l m e n o s c i n c o acc iones :
1) La an t i c ipac ión de u n a o var ias t é c n i c a s es tad í s t i cas út i les pa ra ob tene r infor
m a c i ó n a par t i r de da tos .
2) El r e sumen de los da tos en t ab las o gráficos.
3) El uso de m é t o d o s e s t ad í s t i cos c o m o la t o m a de mues t r a s ; e l cá lculo de pe rcen
ti les, p romedios , med idas de dispersión, e tcé te ra .
4) La descr ipc ión y la in t e rp re t ac ión de los resu l tados o la inferencia , que se apo
yan s iempre en los c o n c e p t o s es tad ís t icos y en los resu l tados de los m é t o d o s
apl icados en e l c o n t e x t o del es tudio.
5) La c o m u n i c a c i ó n de las conc lus iones .
En este t ex to se t e han p l an t eado diversas act ividades guiadas . En u n a s i tuac ión
p rác t i ca , ta l guía no exis te : debe cons t ru i r se . Sin embargo , las p regun tas que se te
han p lan teado perfilan aquel las que deben guiar e l anál is is . M á s ade lan te t endrás
opor tun idad de resolver p r o b l e m a s sin que se te dé u n a guía, c o m o en el s iguiente
e jemplo.
D Ejemplo 1.69
Dos velocis tas que cor ren los 1 0 0 m e t r o s p lanos son p robados po r su c o m i t é o l ím
p ico para de te rminar quién es el m á s rápido o el m á s ef iciente, a f in de cons t ru i r
una es t ra tegia para c o m p e t i r en los 4 0 0 m e t r o s c o n relevos. E l que c u m p l a las con
dic iones debe cerrar la carrera . Pa ra ta l efecto, los cor redores son observados en
diez carreras uno con t r a el o t ro y se regis t ran sus t i empos . L o s resul tados de los
t i e m p o s ob ten idos en segundos p o r cada uno se m u e s t r a n en la t ab la 1.47.
Tabla 1.47
C A R R E R A ' V E L O C I S T A A V E L O C I S T A B
1 ¡ 9 . 4 1 9 .17
2 | 9 . 8 3 9 . 9 4
3 ¡ 11.13 9 . 0 5
4 ¡ 12 .00 9 : 9 6
5 ¡ 1 0 . 6 9 8.11
6 ¡ 8 . 9 5 9 . 0 1
7 ¡ 9 . 4 3 9 . 8 0
8 ¡ 9 . 3 5 9 . 5 0
9 ¡ 10 .03 1 0 . 0 4
1 0 ¡ 1 0 . 0 0 10 .03
L o s datos son pocos , 10 pa ra cada corredor. Para c o n o c e r algo a c e r c a del c o m
p o r t a m i e n t o de cada uno, se ca l cu lan las es tad ís t icas m á s impor t an t e s . És t a s se
mues t r an en la tab la 1.48.
Tabla 1.48 Estadísticas descript ivas
C O R R E D O R ¡ n ¡ AAEDIA M E D I A N A M O D A ¡ F R E C U E N C I A I „ i
i R A N G O DE LA M O D A ¡ ¡
D E S V I A C I Ó N
E S T Á N D A R
A 1 0 ¡ 10 .08 ¡ 9 . 9 1 5 Múltiples 1 ¡ 3 . 05 ¡ 0 . 9 3 7 7 0 2
B ¡ 1 0 ¡ 9 . 4 6 ¡ 9 . 6 5 0 Múltiples 1 ¡ 1.93 ¡ 0 . 6 2 6 8 1 6
Se obse rva lo s iguiente :
En p r o m e d i o e l co r redor B r ecor re los 1 0 0 m e t r o s en m e n o s t i e m p o que e l co r re
dor A: 9.65 s c o n t r a 10 .08 s.
2) De acuerdo c o n las medianas , el co r redor B recor re la d i s tanc ia ap rox imada
m e n t e 5 0 % de las veces en m e n o s de 9 .65 segundos , mien t ra s que e l c o r r e d o r A
5 0 % de las veces la recor re en m e n o s de 9 .915 segundos .
3) La desviac ión e s t ánda r de B es m e n o r que la de A; por lo t an to , sus reg is t ros son
m á s pa rec idos o e s t án concen t r ados a l rededor de la med ia a r i tmé t i ca , e s to es,
en genera l m á s p r ó x i m o s a 9.65 segundos . No sucede así con el co r redor A, lo
cua l ind ica m e n o r prec i s ión a l rededor de su p romedio . El cor redor A es , a d e m á s
de m á s rápido en general , m á s p rec i so o c o n s t a n t e c o n respec to a su ve loc idad
p romedio .
Luego, el a t l e t a A debe cor rer ce r rando la carrera .
Actividades generales 1 4 : ,
Enseguida se te proponen varias actividades complementarias que te servirán
para reafirmar tu comprensión de los conceptos de medidas de variación. Estas
situaciones planteadas en diversos ámbitos te permitirán que asocies con más
amplitud las ideas que has estudiado y aplicado hasta este punto. Igual que an
tes, para resolver cada actividad deberás aplicar una combinación de varios
conceptos, los cuales se han enriquecido con los de esta unidad. Te sugerimos
que trabajes en compañía de otros compañeros de tu grupo.
Q E x a m i n a los s iguientes con jun tos de da tos . Considéra los c o m o mues t r a s .
C O N J U N T O 1 | 1 2 2 3 3 6
C O N J U N T O 2 , 1 4 4 5 5 6
W\ Ca lcu la la m e d i a a r i tmét ica , la med iana , el rango, la var ianza y la desvia
c ión e s t ánda r de cada con jun to de da tos .
C O N J U N T O
\h\ ¿En cuál c o n j u n t o de datos hay mayor d ispers ión? ¿Por qué?
¡jO ¿En cua l c o n j u n t o hay m á s sesgo?
[d] ¿De qué t ipo son los sesgos? ¿Qué ind ican?
[e] En cada caso , ¿ cuán to s da tos son mayores que las can t idades x ± s? ¿Y m e
nores t
Enseguida se m u e s t r a n dos h i s tog ramas de f recuenc ias co r re spond ien tes a dos
variables, 1 y 2. Se quiere de te rmina r cuál de las dos var iables t i ene mayor dis
persión.
50
40
30
20
10
N 1 1 R
5 10 15 20 25 30 35 40 45
Variable 1
50 55 60 65 70
80 I i i r — i i r
70
60
.5 5 0
'u c 3 40 u <3J
u= 30
20
10
40 45 50 55 60 65 70 75 80
Variable 2
H ¿Cuál es a p r o x i m a d a m e n t e el rango en c a d a c a s o ?
¡b] En cada h i s tog rama m a r c a a p r o x i m a d a m e n t e e l s i t io de la m e d i a a r i tmét i
ca. ¿Cuál es mayor? ¿Qué significa es to?
@ ¿Será el valor de cada m e d i a n a a p r o x i m a d a m e n t e igual al de la m e d i a de la
respect iva var iable? Exp l i ca por qué.
[d] Si ca lcularas la va r ianza y la desviación e s t ánda r de cada c o n j u n t o de da
tos, ¿cuál ser ía mayor? ¿Por qué?
H ¿Afec ta el valor de la m e d i a a r i tmé t i ca el valor de la desviación es tándar?
¿Por qué?
GG ¿Por qué es m á s f recuente que se u t i l ice la desviación es tándar y no la va
r i anza pa ra descr ib i r la d ispers ión de un con jun to de da tos?
Se p r a c t i c a 20 veces en diferentes mues t r a s u n a p rueba a la r es i s t enc ia a l quie
bre de un p lás t i co de rec ien te c reac ión , t o s da tos ob ten idos de la fuerza en ki
l og ramos ap l icada a l m o m e n t o de quebra rse e l p lás t i co son los s iguientes .
85 85 87 ¡ 88 88.5 88 89 89.4 ¡ i
89.8 | 90
90.2 90.4 90.7 ¡ 91 91 91.5 91.5 92 : i i
92 ¡ 92.5
[a] Ca lcu la los percent i les s iguientes .
0(20) : 0(30) 0(40) | 0 ( 5 0 ) 0 ( 6 0 ) 0 ( 7 0 ) ¡ 0 ( 8 0 ) I 0 ( 9 0 )
[b] ¿Qué signif icado t iene e l valor del pe rcen t i l 3 0 ?
\J] ¿Qué porcen ta j e de los qu iebres del p lás t i co se dieron a m á s de 91 .5 ki lo
g r a m o s ?
[d] ¿En t r e qué fuerzas apl icadas al p lás t i co ocur r ió 2 0 % de los resul tados de
quebradura en el cen t ro de la d i s t r ibuc ión de los da tos?
[e] ¿Cuál es la m e d i a n a de la fuerza de qu iebre? ¿Qué signif ica?
[T] Ca lcu la la desviación m e d i a de las fuerzas.
[§0 ¿Cuál es la desviación es t ándar de las fuerzas? ¿Qué signif ica?
En un e x p e r i m e n t o ps ico lóg ico , se les m u e s t r a en t res ocas iones a cada uno de
o c h o n iños de cua t ro años s e l ecc ionados a l azar l a m a n e r a de a r m a r un jugue
te . Se h a c e igual c o n e l m i s m o j u g u e t e y c o n o t ros o c h o n iños de seis años . En
c a d a c a s o se t o m a r o n los t i e m p o s en m i n u t o s que t a rdaban en a rmar ellos mis
m o s el jugue te , y se m u e s t r a n en la t ab l a s iguiente .
TlEAAP O EN MI ÑUTOS
Seis años i
! 1-4 1.6 : i.4 1.5 1.2 ¡ 1.4 1.3
Cuatro años ! 1-6 2.4 ! 1.8 1.9 1.8 ¡ 2.0 1.4
H Observa los datos y, sin real izar cálculos , di qué grupo de n iños pa rece que
produjo u n a m e n o r desviación es tándar y sugiere a qué puede deberse es to .
[b] Calcula la desviación es t ándar de cada con jun to de datos .
0 Calcula la desviación m e d i a de c a d a con jun to de da tos .
[di Calcula la m e d i a a r i tmé t i c a pa ra c a d a con jun to de datos .
[e] C o m p a r a med ian t e un c o c i e n t e las respect ivas desv iac iones es tándares y
medias . ¿Qué signif icado t i enen?
|T] ¿Qué unidades t i enen las c o m p a r a c i o n e s an ter iores p o r c o c i e n t e ?
Q Una operac ión en el t e rminado de un au to cons i s t e en c o l o c a r en pos ic ión y
apre tar un torni l lo que suje ta a l acumulador . En u n a t o m a de t i empos , se obt ie
ne u n a med ia a r i tmé t i c a de la m u e s t r a de 40 segundos y u n a desviación es tán
dar igual a 5 segundos . Se t o m a r o n cua t ro obse rvac iones , pe ro sólo se c o n o c e n
los da tos 4 0 , 4 1 y 38 segundos . ¿Cuál es e l da to fa l tante?
Q Se requiere enviar a un b u e n t i rador a África para que dispare dardos c o n cal
m a n t e s a an ima les en una reserva. Se t i enen dos candida tos , Ay B. A a m b o s se
les pidió que l anzaran 50 t i ros desde un he l icóp te ro en e l aire hac i a b l ancos f i
j o s en e l t e r reno , s imulando lo que deber ían h a c e r después . Se mid ió la dis tan
c ia en c e n t í m e t r o s ent re el dardo l anzado y el b l anco . L a s es tad í s t i cas y los
h i s tog ramas de cada uno se observan enseguida .
T I R A D O R i
X s ¡ DM R
A ! 25 ¡ 3 ! 4 21
B- ! 23 ¡ 9 | 9.5 4 4
H I S T O G R A M A
40
30
25
20
15
10
5
0
—
1 1 ! i ! i i
_
*** ^ \
1 1 i 1 •
7.2211 12.5122 17.8033 23.0945 28.3856
Centímetros del blanco
33.6768 38.9679 44.2590
¿A quién dirías que debe con t r a t a r se y por qué? ¿Cuál t i rador es m á s prec i so y
cuá l es m á s e x a c t o ? ¿Por qué?
Q En u n a empresa ded icada a la p roducc ión de a rneses para car ros c o m p a c t o s ,
se c a p a c i t a a los operar ios manua l e s de nueva con t r a t ac ión durante d e t e r m i
n a d o t i e m p o en u n a act iv idad de ensambla je . E l t i e m p o de c a p a c i t a c i ó n en h o
ras es u n a variable, que se mide pa ra f ines de cont ro l . L a s sesen ta o b s e r v a c i o
nes m á s rec ien tes , o rdenadas de la m e n o r a la mayor, se mues t r an en la t a b l a
s iguiente .
20.29 22.07 22.26 23.16 23.42 23.70 23.91 24.22 24.43 24.80
20.70 22.08 22.55 23.16 23.48 23.70 23.95 24.24 24.45 24.81
21.26 22.10 22.63 23.18 23.55 23.71 23.96 24.28 24.57 25.07
21.36 22.11 22.83 23.19 23.57 23.78 24.02 24.30 24.67 25.41
21.91 22.15 23.09 23.28 23.60 23.84 24.13 24.32 24.67 25.47
22.03 22.24 23.14 23.34 23.69 23.90 24.14 24.40 24.76 25.55
0 Calcula el rango. ¿Qué signif icado t i ene p á r a l o s adminis t radores?
[b] Calcula los pe rcen t i l e s 30 y 70 . Da el s ignif icado de cada uno.
0 Calcula los cuar t i les 1 y 3 y da su signif icado.
[d] Obten el valor del rango in te rcuar t í l i co y expresa su significado.
0 Obten el valor del rango semi in te rcuar t í l i co y expresa su signif icado.
En la s iguiente t ab la se da un r e s u m e n de las es tad ís t icas descr ipt ivas de la
mues t ra .
! E S T A D Í S T I C A S D E S C R PT1VAS
V A R I A B L E ¡ n M E D I A ¡ M E D I A N A ¡ M Í N I M O ¡ M Á X I M O ¡ D E S V I A C I Ó N
E S T Á N D A R
Tiempo en horas ¡ 60 23.47 | 23.69 ¡ 20.29 ! 25.55 ¡ 1.1578
0 Calcula la med ida de sesgo del con jun to de datos .
0 Observa el gráfico de los da tos que se da enseguida, y en base a los resu l ta
dos anter iores y lo que se obse rva en el gráfico descr ibe el c o m p o r t a m i e n t o
del t i empo de c a p a c i t a c i ó n de los nuevos operar ios .
H I S T O G R A M A
'u
19.5 20.0 20.5 21.0 21.5 22.0 22.5 23.0 23.5 24.0 24.5 25.0 25.5 26.0 26.5 27.0
Tiempo de capacitación en horas
0 Se sabe que los t i e m p o s que ta rdan los t r aba jadores de la empresa a u t o m o t r i z
AVF, que cons t ruye autos c o m p a c t o s , pa ra c o l o c a r la l l an ta de refacción debajo
del chas is , es u n a variable cuyos t i e m p o s t i enen u n a g ran var iación. El superin
t enden t e t o m ó 15 t i e m p o s a l azar, duran te t o d o un día de ese ensambla je , de
cada u n o de los cua t ro t rabajadores que rea l izan la operac ión: Juan , Jo sé , Virgi
lio y Mar io . E s o s t i e m p o s se m u e s t r a n enseguida , dados en minu tos .
J U A N ¡ 4 .5 4 .3 4.5 4 . 6 4 .3 4.7 4 .3 4.5 4 . 4 4 .2 4 .5 4.7 4.5 4 .5 4 .5
J O S É ¡ 4 .5 5.0 5.0 5.3 4 .8 4 .3 4.7 5.4 4 .2 4.7 5.0 5.0 4 . 6 5.4 5.0
V I R G I L I O 5.1 5.2 5.0 5.2 5.1 5.0 5.2 5.2 5.0 5.1 5.2 5.1 5.0 5.2 5.2
M A R I O ¡ 4.1 4 . 2 4 . 0 4 . 0 4 . 4 4 .3 4 . 2 4 .3 4 . 4 4 .2 4 .3 4 .2 4 .3 4 .2 4 .2
H Para cada u n o de los t rabajadores , ca l cu la los es tad ís t i cos : med ia a r i tmé t i
ca, med iana , moda , rango, var ianza y desv iac ión estándar.
J u a n
J o s é
Virgilio
Mario
[b] ¿Por qué el rango y la desviación e s t ánda r son es tad í s t i cos?
fe] ¿Los da tos son los de u n a m u e s t r a o los de u n a p o b l a c i ó n ? ¿Por qué?
[á] De acuerdo c o n los resu l tados ob ten idos en las diferentes e s t ad í s t i cas ,
¿cuá l t raba jador p a r e c e ser e l m e j o r de todos? ¿Cuál t raba jador p a r e c e ser
e l p e o r de el los? ¿Por qué?
Q U n a e m p r e s a b a n c a d a del pa ís ha dec id ido mejora r el servic io a los c l i en tes
que acuden a sus b a n c o s los días p i c o o m á s concur r idos , que son los lunes y
viernes . Aquél los deben formarse en la hi lera ha s t a l legar a u n a ca ja y ser a ten
didos. E s e t i e m p o en m i n u t o s se supone que a c t u a l m e n t e se c o m p o r t a según
los da tos de la s iguiente m u e s t r a a lea to r ia den = 1 0 0 datos .
Tiempo en minutos que tarda un cl iente en ser atendido (método anterior)
5.13 9.16 10.16 10.86 11.58 12.09 12.72 i— -
13.29 •
13.99 14.67
7.17 9.20 10.16 10.96 11.68 12.29 12.73 1332 14.16 14.75
7.53 9.29 10.26 11.10 11.69 12.38 12.78 13.34 14.19 15.00
8.06 9.31 10.27 11.13 11.77 12.38 12.84 13.36 14.42 15.43
8.27 9.47 10.28 11.19 11.79 12.46 13.03 13.38 14.47 15,62
8.69 9.55 10.31 11.19 11.94 12.51 13.05 13.46 14.48 15.64
8.85 9.79 10.63 11.45 11.95 12.52 13.09 13.51 14.52 15.76
8.87 10.11 10.63 11.46 12.01 12.56 13.16 13.68 14.53 16.39
9.04 10.11 10.79 11.47 12.05 12.69 13.19 13.77 14.58 16.83
9.05 10.14 10.82 11.52 12.07 12.70 13.29 13.91 14.65 17.24
Se ha in t roduc ido un nuevo m é t o d o de a t enc ión c o n s i s t e n t e en evaluar en la
p rop ia hi lera los c a s o s que l legarán a las ca jas , y resolver los que no requieran
m u c h o t i e m p o de a t e n c i ó n enviándolos a u n a caja especia l izada , m i e n t r a s los
que requer i rán m á s t i e m p o se env ían a o t ra caja que t i ene equ ipo espec ia l y
donde se puede a tender los m á s rápido. Se t o m ó u n a m u e s t r a a lea tor ia t a m b i é n
de t a m a ñ o n = 1 0 0 de es tos t i e m p o s , la cua l se mues t r a enseguida .
Tiempos de atención con el nuevo método
5.05 7.27 1
7.89 ¡ 8.30 8.71 9.09 9.44 9.84 1
¡ 10.04 10.72
5.69 7.34 7.93 ¡ 8.31 8.80 9.11 9.50 9.86 10.09 10.76
6.31 7.57 7.96 ¡ 8.33 8.80 9.17 9.59 9.86 10.28 10.77
6.40 7.62 7.96 ¡ 8.33 8.86 9.17 9.62 9.87 ¡ 10.29 10.78
6.46 7.63 8.06 | 8.42 8.87 9.18 9.63 9.88 | 10.41 10.78
Tiempos de.atencíón con el nuevo método [continúa]
6.75 7.69 | 8.14 ¡ 8.42 8.92 9.21 9.63 9.91 10.43 10.96
6.86 7.73 ¡ 8.14 | 8.42 8.95 9.23 9.64 9.93 10.44 11.38
7.09 7.74 j 8.23 | 8.45 9.00 9.27 9.65 9.94 10.50 11.60
7.19 7.78 ¡ 8.24 | 8.52 9.04 9.34 9.71 10.01 10.58 12.62
7.22 7.79 ¡ 8.26 | 8.64 9.04 9.38 9.72 10.02 10.69 13.04
Una p r e g u n t a obvia es: ¿El nuevo m é t o d o redujo e l t i e m p o que t a rdan los c l ien
tes en ser a tendidos? Antes de dar u n a r e spues t a a e s t a pregunta , p o n a t e n c i ó n
en lo s iguiente .
H ¿Qué var iable se es tudia? Defínela .
[b] ¿De qué t ipo y dens idad es la var iable que se es tudia?
0 ¿Se es tud ia (n ) una o dos p o b l a c i o n e s ? ¿Cuál es ( son)?
Ensegu ida se te p ropone la c o n s t r u c c i ó n de e l emen tos e s t ad í s t i cos pa ra que
c o n t e s t e s la p regun ta que se p l an teó an tes : ¿El nuevo m é t o d o es super ior a l
an te r io r?
0 C o m p l e t a las s iguientes d i s t r ibuc iones de f recuenc ia pa ra c a d a m é t o d o .
Tabla de frecuencias (método anterior de atenc ión; t iempo en minutos)
C L A S E ¡ I N T E R V A L O S
R E A L E S DE C L A S E
i F R E C U E N C I A I
f
F R E C U E N C I A
RELATIVA
fr
\ P O R C E N T A J E
1 ¡ 4 < 7 < 6 ¡ 1 !
2 | 6 < 7 < 8 ! 2 ¡
3 ¡ 8 < 7 < 1 0 ¡ 14 ¡
4 ! 10<7~<12 | 30 ¡
5 | 12<7<14 ! 34 ¡
6 ! 14<7~<16 ! 16 ¡
7 ¡ 16<7"<18 ! 3 !
! Totales ¡ 100 ¡
Tabla de f recuencias (nuevo método de atención; t i empo en minutos)
C L A S E ¡ I N T E R V A L O S
R E A L E S D E C L A S E
i F R E C U E N C I A I
f
F R E C U E N C I A
R E L A T I V A
/*•
¡ P O R C E N T A J E
1 1 5 < T < 6 ¡ 2 ¡
2 ¡ 6 < 7 < 7 ! 5 ¡
3 ¡ 7 < 7 < 8 ¡ 17 J
4 ! 8 < T < 9 . ¡ 24 ¡
5 ! 9<7"<10 | 30 ¡
6 | io<r<n ! 18 ¡
7 ¡ n<r<i2 ! 2 ¡
8 ¡ 12<7<13 ! i !
9 ¡ 1 3 < 7 < 1 4 ! 1 ¡
! Totales | 100 ¡
H ¿Qué porcen ta je de c l ien tes , ba jo el m é t o d o anterior , t a rdaba m á s de 12
minu tos en ser a t end ido?
|T] ¿Qué porcen ta je de c l i en tes , ba jo e l m é t o d o nuevo, t a rda m á s de 12 minu
tos en ser a tend ido?
[Ki Calcula para cada m é t o d o los cuar t i les Q ( l ) , Q(2) y Q(3), y expresa su signi
ficado.
[h] Ob ten el valor del rango semi in te rcuar t í l i co y expresa su s ignif icado.
[T] En la s iguiente t ab l a se m u e s t r a un r e sumen de es tad í s t i cas descr ip t ivas
i n c o m p l e t o po r m é t o d o . C o m p l e t a l a tabla .
E S T A D Í S T I C O X X 0.5 1 R 5
Método anterior 12.02 12.08 ¡
Método actual 8.99 9.06 ¡
[T] ¿Qué significa pa ra los c l i en tes que los t i e m p o s del m é t o d o an te r io r t engan
una desviación e s t ánda r mayor?
Re] Supon iendo que la m e d i a del m é t o d o an te r io r p e r m a n e c e en 12 .02 minu
tos , ¿podría ser la desv iac ión es tándar de ese m é t o d o m e n o r que la del m é
todo nuevo? Exp l i ca p o r qué.
Q] Observando los da tos en las t ab las y los es tad í s t i cos , ¿c rees que el nuevo
m é t o d o redujo e l t i e m p o de a t enc ión a los c l i en tes? E x p l i c a p o r qué, c o n
ba se en los resul tados ob ten idos .
B3 Un consu l to r io méd ico r ec ibe u n a gran can t idad de l l amadas de pac i en t e s pa ra
los doc tores . Dos secre ta r ias , Lula y Alejandra, a t i enden las l l amadas y h a c e n
a lgunas preguntas en tes de decidi r s i la l l amada debe ser c o n t e s t a d a po r e l
d o c t o r que es sol ici tado. El t i e m p o que t a rdan en c o n t e s t a r las l l amadas y t o
m a r da tos en un formular io es u n a var iable que adquiere diversos valores. Se
t o m ó u n a mues t r a a lea tor ia del t i e m p o de a t enc ión en segundos pa ra cada se
c re ta r ia , y se obtuvieron los s iguientes datos .
Tiempo de atención en segundos de n = 100 l lamadas (Lula)
12.61 ¡ 20.8 22.74 ¡ 26.11 ¡ 27.66 28.81 I 29.75 31.49 ¡ 34.00 | 35.71
16.90 ¡ 20.89 22.92 ¡ 26.33 ¡ 27.71 28.95 ¡ 29.91 31.60 ¡ 34.03 ! 35.91
17.21 ¡ 21.72 23.07 ¡ 26.48 ¡ 28.02 29.01 | 30.04 31.77 ¡ 34.12 ¡ 35.95
18.22 1 21.90 23.63 ¡ 26.55 ¡ 28.09 29.04 [ 30.06 31.99 ¡ 34.36 ¡ 37.37
18.56 ¡ 21.98 23.64 1 26.56 ¡ 28.46 29.10 ¡ 30.07 32.01 ¡ 34.54 ¡ 38.24
18.77 ¡ 21.99 23.96 ¡ 26.79 ¡ 28.48 29.17 ¡ 30.15 32.18 ¡ 34.69 | 38.33
18.90 ¡ 22.17 24.39 ¡ 26.86 | 28.52 29.35 ¡ 30.19 32.22 ¡ 34.84 ¡ 39.43
19.20 ¡ 22.26 24.42 ¡ 27.12 ¡ 28.57 29.41 ¡ 30.72 32.96 ¡ 34.85 ¡ 39.77
19.23 ¡ 22.50 25.69 •¡ 27.16 | 28.75 29.53 ¡ 30.89 33.70 J 35.17 ¡ 39.86 '
19.23 ¡ 22.73 25.69 ¡ 27.63 ¡ 28.76 29.62 | 31.34 33.90 ¡ 35.31 I 42.78
Tiempo de ate.nc ón en sej fundos de n = 80 l amadas (Alejandra)
0.33 | 5.00 ¡ 9.66 ¡ 16.49 25.83 ¡ 37.28 52.01 78.64
0.46 ¡ 5.02 ¡ 9.8 ¡ 17.68 25.89 | 40.26 54.69 ! 79.57
0.60 ¡ 5.43 | 10.15 ¡ 18.20 27.13 ¡ 40.58 | 54.97 ¡ 80.74
2.26 ¡ 5.68 | 11.28 ¡ 20.28 28.25 ¡ 45.69 ¡ 56.08 ¡ 81.17
2.34 ¡ 5.82 ¡' 12.68 ¡ 20.38 29.13 ¡ 46.23 I 56.51 ¡ 84.57
2.74 ¡ 6.24 | 14.04 ¡ 21.13 30.03 | 47.46 | 58.13 ¡ 85.48
3.51 ¡ 6.81 ¡ 14.46 | 22.36 32.10 ¡ 47.66 í 58.72 ¡ 85.55
3.56 ¡ 7.30 | 15.23 | 22.53 32.25 | 48.10 | 64.89 ! 103.33
4.28 | 8.47 ¡ 15.43 ¡ 22.54 32.32 ¡ 49.38 ¡ 6 8 . 0 0 ¡ 134.57
4.52 ¡ 8.77 | 16.25 ¡ 24.56 35.42 | 50.15 ¡ 69.42 ¡ 140.53
[~a] ¿Qué variable se es tud ia y de qué t ipo y dens idad es?
[b] ¿Cuán tas pob lac iones se e s tud ian? ¿Cuáles son?
0 En teor ía , ¿ c u á n t o s e l e m e n t o s posee c a d a p o b l a c i ó n ?
0 ¿Cuál es el r ango de los t i empos de cada sec re ta r i a y qué signif ica c a d a u n o
y c o m p a r a t i v a m e n t e ?
Ensegu ida se m u e s t r a n u n o a l lado del o t ro los h i s tog ramas de f r ecuenc ia del
t i e m p o de a t e n c i ó n de c a d a secre ta r ia
LU LA A L E J A N D R A
40
35
30
25
20
15
10
5
0 10 15 20 25 30 35
Tiempo en segundos
40 45
40
35
30 -
25 -
20 ~
15 ~
10 -
.5 ~
- 2 0 0 20 40 60 80 100 120 140 160
Tiempo en segundos
0 Sobre la b a s e de su con ten ido , desc r ibe en genera l e l c o m p o r t a m i e n t o de
c a d a u n a de el las a l c o n t e s t a r las l l amadas .
0 ¿Cuál d i s t r ibuc ión de da tos pa rece t e n e r un c o m p o r t a m i e n t o s i m é t r i c o ?
¿Por qué?
0 Ca lcu la los cuar t i l e s Q ( l ) , Q(2 ) y Q ( 3 ) pa ra c a d a caso , c o m p á r a l o s y deter
m i n a su s ignif icado.
0 Ca lcu la el valor del rango semi in te rcuar t í l i co y expresa su s ignif icado.
Algunas e s t ad í s t i cas descr ipt ivas se m u e s t r a n en la t ab la s iguiente .
E S T A D Í S T I C A S D E S C R I P T I V A S
V A R I A B L E S
n M E D I A M E D I A N A i D E S V I A C I Ó N
¡ E S T Á N D A R
Lula 100 28.36 28.78 ¡ 5.88
Alejandra 80 34.03 25.19 ¡ 30.81
0 Ca lcu la el nivel del sesgo de cada d i s t r ibuc ión de t i empos .
0 ¿Qué s ignif icado t i ene c a d a desviación e s t ánda r pa ra los p a c i e n t e s ? Apóya
te en los valores de las desviaciones , en los gráf icos y en los valores de los
cuar t i les pa ra dar tu exp l icac ión .
0 Si los pac i en t e s son a tend idos al azar po r Lula o Alejandra, ¿cuá l de ellas
pa rece ser m á s ef iciente en su t raba jo? Expl ica .
0 Si Lula a t iende a 5 0 0 p a c i e n t e s ba jo las cond i c iones ac tua les , y según la in
fo rmac ión de la m u e s t r a respect iva , ¿ c u á n t o s de ellos a p r o x i m a d a m e n t e
serán a tendidos en m e n o s de 40 segundos?
H Igualmente , ¿ cuán to s de 5 0 0 pac i en t e s a tendidos por Ale jandra ser ían
a tendidos en m e n o s de 40 segundos?
0 ¿Cuántas l l amadas supones que c o n t e s t a r á Lula en t é r m i n o m e d i o en u n a
hora?
0 ¿Podría sos t ene r se que la probabilidad de que Lula a t i enda u n a l l amada en
m e n o s de 25 segundos es a p r o x i m a d a m e n t e 0 .30? ¿Bajo que supues tos?
H El encargado de un autolavado en Ba ja California Nor te obse rva c o n a t e n c i ó n
e l t i empo que t a rdan sus empleados en real izar un servicio e s t ánda r de lavado.
Sesen ta regis t ros en m i n u t o s se m u e s t r a n o rdenados en la s iguiente tabla .
17.26 22.10 23.25 23.99 25.13 25.69 "
25.97 26.22 26.68 27.42
17.52 2236 23.51 24.14 25.16 25.70 26.00 26.39 26.87 27.53
18.71 22.73 23.55 24.51 25.29 25.76 26.05 26.41 26.87 27.86
20.28 22.87 23.66 24.57 25.29 25.84 26.08 26.53 26.88 27.89
20.98 23.01 23.76 24.78 25.51 25.94 26.12 26.67 27.12 28.08
21.07 23.10 23.97 25.04 25.58 25.96 26.22 26.68 27.17 28.20
0 Calcula los cuar t i les Q ( l ) , Q ( 2 ) y Q(3) , y exp l ica su signif icado.
0 Const ruye el gráfico de ca jas y b igo tes e in te rpre ta su con t en ido .
0 Calcula el rango in te rcuar t í l i co y da su signif icado.
0 Calcula el rango semi in te rcuar t í l i co .
0 De acuerdo c o n el valor del rango semi in te rcuar t í l i co , ¿es s i m é t r i c a la dis
t r ibuc ión de los t i e m p o s ? ¿Apoya es te resul tado a l ob ten ido en la gráfica de
cajas?
0 Calcula la med ida de sesgo de los da tos hac i endo uso de las m e d i d a s es ta
dís t icas s iguientes .
E S T A D Í S T I C A S D E S C R I P T I V A S
V A R I A B L E S I
n M E D I A ¡ M E D I A N A i D E S V I A C I Ó N
¡ E S T Á N D A R
60 24.85 ¡ 25.63 1 2.43
¿Coinc ide es te resul tado c o n e l ob ten ido an tes?
ES El pe rcen t i l 90 de los resu l tados ob ten idos en un e x a m e n de admis ión p o r un
grupo de 4 0 0 0 es tud ian tes de bach i l l e ra to que c o n c u r s a n pa ra ingresar a u n a
univers idad fue de 78 puntos , c o n u n a cal i f icación m á x i m a de 83 pun tos .
0 ¿Cuál es el valor de la m e d i a n a y qué significa?
[~bj ¿Cuál es el valor del percen t i l 70 y qué s ignif ica?
0 Si se supone una esca la de m e d i c i ó n de re lación, ¿ c u á n t o s es tud ian tes ob
tuvieron m á s de 38 pun tos pero m e n o s de 63 pun to s?
0 ¿Cuál es el rango de los da tos?
0 ¿Puede ca lcu la r se la med ida del sesgo de la d i s t r ibuc ión de los da tos? ¿Por
qué?
d D o s caba l los de res i s tenc ia , R e o y Pet rarca , c o m p i t e n f r ecuen t emen te u n o c o n
t r a o t ro . Sus respec t ivos dueños h a n regis t rado los s iguientes da tos para los
t i e m p o s que h a n h e c h o a l cor re r cua t ro mil las en c o m p e t e n c i a en t re ellos.
, , , , , _ ¡ E S T A D Í S T I C A S D E S C R I P T I V A S
C A B A L L O S I
n ¡ M E D I A M E D I A N A D E S V I A C I Ó N I
E S T Á N D A R ]
DATO
M E N O R
DATO
M A Y O R
Reo | 40 ] 4.55 min 4.50 min 0.20 min ¡ 4.45 min 5.40 min
Petrarca 40 ¡ 4.57 min 4.58 min 0.15 min ¡ 4.40 min 5.00 min
0 ¿Cuál d i s t r ibuc ión de t i e m p o s es m á s s imé t r i ca? ¿Alguna es n o r m a l ? ¿Por
qué?
pb] ¿Hac ia dónde se da el sesgo de c a d a d i s t r ibuc ión? ¿Qué significa es to? Di
bu ja u n a sobre o t ra las d i s t r ibuc iones de f recuenc ias respect ivas aproxi
m a d a s para cada cabal lo .
0 ¿S iempre gana R e o a Pe t ra rca? ¿Por qué? Exp l i ca c o n b a s e en los datos .
0 ¿ L a desviac ión es tándar de R e o se ve a fec tada p o r e l da to mayor? Exp l i ca
por qué.
ED D o s máqu inas , A y B, deben produc i r válvulas m a e s t r a s c o n roscas de diez cen
t í m e t r o s de d iámet ro . C o m o es tas válvulas son para in se r t a r en un equipo dise
ñ a d o en o t ra empresa , deben t ene r e l d i áme t ro requer ido. Sin embargo , los pro
c e s o s m a q u i n a d o s p roducen var iac ión , la cua l debe reduci rse y con t ro l a r se
pa ra o b t e n e r e l p roduc to requer ido. En u n a supervis ión e fec tuada a la m i s m a
h o r a y día, se obtuvieron los s iguientes datos .
V Á L V U L A A ¡ 9.69 9.84 10.13 10.18 10.31 9.96 10.00 10.22 ¡ 9.91 ¡ 10.30
V Á L V U L A B \ 10.10 9.98 10.00 9.93 10.03 9.99 9.88 10.09 ¡ 9.83 ¡ 9.78
[aj Calcula la med ia a r i t m é t i c a y la desviación es t ándar de cada con jun to de
datos .
[b] ¿Cuál m á q u i n a p roduce válvulas de m a n e r a m á s p rec i sa?
@ ¿ A m b a s m á q u i n a s son igua lmen te e x a c t a s ? ¿Por qué?
[d] ¿Provendrán los datos de u n a d i s t r ibuc ión n o r m a l ? ¿ C ó m o puede probarse
eso?
H Dos asesores f inancieros pub l i can los resul tados de los r end imien to s que obtu
vieron sus c l ien tes sobre u n a inversión de un mi l lón de p e s o s en un año. Un
c l ien te observa la in fo rmac ión a f in de decidir c o n cuá l de el los part icipar. Los
datos que t i ene son los s iguientes .
Resultados del asesor A
8 4 . 5 6 1 4 8 . 0 2 1 6 2 . 6 9 1 6 8 . 2 9 178.32 189 .91 2 0 5 . 5 9 213 .39 225 .16 242 .74
112.32 150.53 1 6 2 . 9 2 1 6 8 . 8 6 1 8 0 . 2 2 1 9 4 . 4 9 2 0 7 . 6 2 213.50 227 .30 2 5 3 . 9 4
114.85 152.54 164 .61 176.25 185.76 197.93 212.62 2 1 3 . 9 4 232.11 2 5 6 . 9 6
1 3 2 . 4 6 161.06 1 6 6 . 2 4 177.84 1 8 9 . 0 6 198 .76 213.12 221.27 2 3 9 . 2 3 2 7 0 . 3 6
Resultados del asesor B
1 6 6 . 4 6 179.97 1 8 4 . 5 0 185 .69 1 8 8 . 2 6 1 9 0 . 6 4 1 9 2 . 2 9 1 9 3 . 2 9 195.77 201.31
169 .13 183 .08 184 .63 186 .57 1 8 8 . 6 8 191.07 1 9 2 . 6 0 1 9 4 . 2 4 1 9 6 . 2 3 2 0 3 . 7 8
173.24 183.27 184 .95 187.99 188.73 191.25 192 .67 195.17 198 .18 2 0 4 . 1 2
173.56 184 .28 185.27 188 .25 189 .33 191.85 193.15 1 9 5 . 6 6 199 .13 2 0 9 . 8 2
E S T A D Í S T I C A S D E S C R I P T I V A S
( M I L E S D E P E S O S / A Ñ O )
V A R I A B L E S * V A R I A B L E S *
n M E D I A M E D I A N A ¡ D E S V I A C I Ó N
E S T Á N DAR
A 4 0 189 .18 1 8 9 . 4 8 | 4 0 . 7 8
B 4 0 1 8 9 . 4 5 1 8 9 . 9 8 ¡ 9 . 9 9
H ¿Cuáles y c ó m o son los r end imien tos p r o m e d i o anua les que ob t i enen los
asesores?
[b] ¿ S o n s imé t r i cas o sesgadas las respect ivas d i s t r ibuc iones de los rendimien
t o s ? Calcula y expl ica .
[c] ¿Qué significado t i enen las desviac iones e s t ándares de los asesores?
[á\ Si el invers ion is ta es p ruden te y quiere o b t e n e r c o n mayor probabi l idad un
r e n d i m i e n t o anual mayor a 1 7 0 mi l pesos , ¿ c o n cuál asesor debe t raba ja r?
H Calcu la los cuar t i les de cada d i s t r ibuc ión de da tos y compára los . E x p r e s a
e l s ignif icado de esa c o m p a r a c i ó n .
[U Cons t ruye el gráfico de ca jas y b igo tes pa ra los dos con jun tos de da tos e
in t e rp re ta su con ten ido . Puedes hacer lo en un m i s m o m a r c o pa ra que l a
c o m p a r a c i ó n sea m á s efectiva.
R E N D I M I E N T O
Asesor B
Asesor A
100 120 140 160 180 200 220 240 260 280
H En un l abora to r io ps i co lóg ico se rea l izan p r u e b a s ace r ca del c o c i e n t e in t e l ec
tual de dos grupos de n iños , A y B, de o c h o a ñ o s de edad que provienen de dife
ren tes reg iones marg inadas del e s t ado de Veracruz . Los n iños del grupo A fue
ron apoyados duran te los ú l t imos dos a ñ o s c o n un p rog rama de e s t imu lac ión
espec ia l de habi l idades m a t e m á t i c a s y c o m p r e n s i ó n de la lec tura . L o s del gru
po B no rec ib ie ron ese t r a t amien to . A n t e s de in ic ia r e l p rograma, los coef ic ien
tes de los grupos eran s imilares . L o s resu l tados de las p ruebas fueron granea
dos c o m o se m u e s t r a en la s iguiente f igura .
El invest igador ob tuvo un con jun to de e s t ad í s t i cas descr ipt ivas que se
mues t r an enseguida para cada con jun to de datos , pe ro se han revuelto. D e
t e r m i n a cuá l p e r t e n e c e a cuál: n = l 0 0 0 , Max = 1 2 7 . 1 5 4 8 , Med ia = 8 4 . 5 0 4 4 ,
n = 1 0 0 0 , M i n = 71 .042 ; s = 18 .1685 , M e d i a = 98 .2487 , Max = 1 3 8 . 9 1 1 8 ,
M i n = 3 6 . 5 3 0 5 , s = 9 . 5534
N I Ñ O S M E D I A M Í N I M O M Á X I M O
[b] ¿Qué grupo de n iños posee ahora un m e j o r c o c i e n t e in te lec tua l? ¿Qué nú
m e r o lo sugiere?
@ ¿Qué s ignif icado t iene la desviación e s t ánda r del grupo de n iños B c o n res
p e c t o a la del grupo de n iños A?
[d] ¿ C ó m o son las d i s t r ibuc iones de f recuenc ias de los da tos? ¿Son n o r m a l e s ?
¿Puedes mos t r a r lo? Desc r ibe su con t en ido .
[e] ¿ A p r o x i m a d a m e n t e qué porcen ta je de n iños del grupo A demos t ró un c o
c ien te in t e l ec tua l mayor a 98 .25 pun to s?
\T\ ¿ A p r o x i m a d a m e n t e qué porcen ta je de los n iños del grupo B d e m o s t r ó un
coef ic ien te mayor a 98 .25 pun tos?
[f] ¿Qué po rcen t a j e de n iños tuvo en c a d a c a s o un coef ic ien te de in te l igenc ia
ent re x±s? ¿Por qué son iguales a m b o s po rcen t a j e s?
H Se midió la segregac ión diar ia en mil i l i t ros de j u g o gás t r i co en un grupo de 1 0 0
voluntar ios varones . Los resul tados se g ranea ron y produjeron u n a dis t r ibu
c ión n o r m a l c o n m e d i a igual a 2 4 5 0 mi, c o n u n a va r i anza igual a 25 mi .
0 ¿Cuál es el valor de la m e d i a n a y qué s ignif icado t i ene en el c o n t e x t o ?
\b\ ¿Qué po rcen t a j e de los voluntar ios segregaron al día m á s de 2 4 7 5 mi de
jugo gás t r i co?
E ¿Qué po rcen t a j e de los varones segregó al día m e n o s de 2 3 7 5 mi de j u g o
gás t r i co?
\é\ ¿Qué po rcen t a j e de ellos segregó en t re 2 4 2 5 mi y 2 5 2 5 mi de jugo gás t r i co
al día?
H3 ¿Puede o b t e n e r s e u n a desviación es tándar nega t iva? ¿Por qué?
Actividades experimentales 14 : :
Las siguientes actividades implican que practiques algún experimento aleatorio
y apliques los instrumentos de análisis que conoces para descubrir cómo se com
porta la variable en estudio. Ensaya conforme a lo que se te indica y obten tus
conclusiones. Se te recomienda trabajar en equipo y comparar siempre los resul
tados obtenidos con los de otros.
D En tu grupo se regis t rarán los p e s o s en k i logramos de las muje res y de los h o m
bres . Si no hay individuos de a lguno de los géneros, o son m u y p o c o s los de al
guno de ellos, pueden regis t rar los pesos de su grupo y de o t ro grupo: só lo h o m
bres o sólo mujeres . Ensegu ida se dan dos tab la para h a c e r es to .
H O M B R E S
M U J E R E S
[a ] ¿Qué grupo t iene m á s peso? ¿Qué es tad í s t i co usarán pa ra c o n t e s t a r e s to?
[b] Calculen las med ianas y den el s ignif icado de cada una.
0 Ca lcu len las desviaciones e s t ánda res y compáren l a s m e d i a n t e un c o c i e n t e ,
dando el significado del resu l tado .
[~d] E s c r i b a n sus conc lus iones genera les . En promedio , ¿los m i e m b r o s de un
grupo pesan m á s que los o t ro s?
H Una fo rma de t o m a r una m u e s t r a a lea tor ia cons i s t e en ut i l izar n ú m e r o s alea
tor ios . ( R e c o r d e m o s : números de es te t ipo se pueden ob t ene r c o n la ca lcu lado
ra, u t i l i zando la t ec la fctf. Apl icándola , se cons iguen n ú m e r o s en t re 0 y 1, c o n
unos 3 o 4 dec imales . ) Usarán u n a ca l cu ladora pa ra ob tene r u n a m u e s t r a de 30
n ú m e r o s a lea tor ios , pero t o m a r á n sólo el p r i m e r dígito, o sea, el déc imo . (Por
e jemplo , c o n f^tjff [¿_§¡¡ se puede o b t e n e r 0 .359 , y se t o m a el 3; o se puede ob t e
ner 0 .817 , y se t o m a el 8. R e ú n a n su m u e s t r a en la t ab la s iguiente .
[ a j Si los n ú m e r o s son a leator ios , se supone que cada uno de los dígi tos 0, 1 ,
2 , 9 , ocur r i rán con a p r o x i m a d a m e n t e igual f recuencia . ¿Se cumple e s t a
h ipó tes i s?
[b] Ca lcu len las es tadís t icas s iguientes pa ra los datos .
E S T A D Í S T I C O ¡ X 1 X 0 .5 mo \ R A N G O P E R C E N T I L
75
D E S V I A C I Ó N
E S T Á N D A R
Valor | ¡ ¡ | ¡ ¡
\J] E s tud i en los es tadís t icos . ¿Revelan que e fec t ivamente los dígi tos ob ten idos
son a p r o x i m a d a m e n t e a lea tor ios? ¿Por qué?
Q Un e x p e r i m e n t o aleator io cons i s t e en l anza r cua t ro m o n e d a s de un peso, y re
gis t rar e l n ú m e r o de águilas que caen . Se rea l izarán 1 0 0 l a n z a m i e n t o s de las
cua t ro m o n e d a s , c o n la f ina l idad de saber c ó m o se distr ibuye e l n ú m e r o de las
águilas, es decir, para c o n o c e r qué n ú m e r o de águilas ocur re c o n mayor o m e
nor f recuenc ia . Cada m i e m b r o del grupo l anza rá sus m o n e d a s y regis t rarán los
da tos de t odos en una m i s m a tabla .
H ¿ C u á n t a s veces se puede repet i r es te e x p e r i m e n t o ?
\b\ ¿Cuál es la variable que se es tudia?
\J] ¿De qué t ipo y densidad es la var iable? ¿Por qué?
[d] ¿Puede t o m a r la variable el valor de 5 águi las? ¿Por qué?
[e] ¿Cuáles son los valores que puede t o m a r la var iable? Supongan que l l ama
m o s X a l a variable. Esc r íban los .
X = valores
\T\ An tes de p r a c t i c a r el expe r imen to , ¿cuál c reen que es el valor o los valores
m á s f recuentes que t o m a r á l a var iable? ¿Cuáles se rán los m e n o s f recuen
tes? ¿Por qué?
[fj ¿Podría ser cons ide rado e l resul tado m á s f recuente c o m o e l m á s p robab le?
¿Por qué? ¿Qué s ignif ica es to?
[h] S i se quiere sabe r c ó m o se dis tr ibuye e l n ú m e r o de águilas que c a e n c o n
u n a p rec i s ión m u y grande, ¿qué har ían?
[T] Si p r a c t i c a n e l e x p e r i m e n t o u n a vez, ¿pueden p redec i r c o n e x a c t i t u d cuán
t a s águilas c a e r á n ? ¿Por qué?
[T] An tes de real izar el expe r imen to , c o n t e s t e n lo s iguiente .
¿Cuál de los dos s iguientes eventos t i ene mayor f recuenc ia relat iva? ¿Por
qué?
> Caen m á s de dos águi las .
> Caen dos águi las .
[U Prac t iquen el e x p e r i m e n t o las 1 0 0 veces y o rgan icen los resu l tados en la
s iguiente t ab la de f recuencias . Después , m u e s t r e n g rá f i camente los resul
tados c o n un gráfico de espigas.
Tabla de f recuencias de la var iable " N ú m e r o de águi las que caen al lanzar 4 monedas de
un peso"
R E S U L T A D O S
P O S I B L E S
T A B L A D E D I S T R I B U C I Ó N D E F R E C U E N C I A S
V A R I A B L E :
F R E C U E N C I A
C O N T E O
I N D I V I D U A L
F R E C U E N C I A
fi
F R E C U E N C I A
RELATIVA
F R E C U E N C I A
RELAT IVA
A C U M U L A D A
fra,
o/ /o A C U M U L A D O
Total
[T] D e s c r i b a n las ca rac t e r í s t i ca s m á s obvias de la d i s t r ibuc ión de f recuenc ias
encon t rada . ¿Parece h a b e r s ime t r í a? ¿Ex i s t e algún sesgo?
\m\ ¿Cuál es la s u m a de las f recuenc ias relat ivas? ¿Por qué?
H Si se repi te el e x p e r i m e n t o o t ras 1 0 0 veces , ¿las f recuenc ias relat ivas se rán
idén t icas a las e n c o n t r a d a s ? ¿Por qué?
0 ¿Es t a r á p resen te la regular idad es tad í s t i ca si se repi te o t ro e x p e r i m e n t o
1 0 0 veces c o n las m i s m a s m o n e d a s ? ¿Por qué?
[p ] L o s diferentes equipos debe rán c o m p a r a r sus resul tados , p re sen tándo los
an te e l grupo. ¿Qué c o n c l u s i o n e s genera les pueden ob t ene r se?
Q En es te e x p e r i m e n t o se es tud ia rán var iables cuan t i t a t ivas y cual i ta t ivas . Se le
van ta rá la s iguiente e n c u e s t a a 30 a l u m n o s de su e scue la que cu r sen e l p r i m e r
semes t re . Pueden ser h o m b r e s o mujeres . P r i m e r o deben idear la fo rma de que
la e n c u e s t a se p roduzca al azar, s in t endenc ia .
A)¿En qué m e s nac i s t e? 1 I
B) ¿Cuál es tu edad en años cumpl idos? 1 1 a ñ o s
| M U C H O | P O C O | N A D A |
| ' M U C H O P O C O | N A D A |
H Regis t ren los resul tados en la t ab la s iguiente .
A L U M N O
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
P R E G U N T A
A L U M N O
P R E G U N T A
[jT| De acue rdo c o n los resul tados:
> ¿ E x i s t e un m e s privilegiado en c u a n t o a n a c i m i e n t o s ?
> ¿Cuál es el p r o m e d i o de edad de los en t rev is tados?
> ¿Cuál es la m o d a de la edad de los en t revis tados?
> ¿Les gus tan las m a t e m á t i c a s a los en t revis tados?
> ¿Les gus ta es tudiar inglés a los en t rev is tados?
Q Se p r a c t i c a r á de nuevo el e x p e r i m e n t o a lea tor io en el cua l se l anzan dos dados
para obse rva r la s u m a de los pun tos , pe ro ahora e l e x p e r i m e n t o se repe t i rá u n a
can t idad diferente de veces por var ios equipos (ese n ú m e r o se r ifará) .
Equ ipos 1 y 2: 30 veces .
Equ ipos 3 y 4: 60 veces .
Equ ipos 5 y 6: 90 veces .
Equ ipos 7 y 8 : 1 2 0 veces .
S i hay m á s equipos , pueden repet i r esas can t idades . Cada equipo c o n s t r u i r á (a)
u n a t ab l a de f recuenc ias , y (b) un gráfico de espigas; y (c ) ca lcu la rá a lgunos es
t ad í s t i cos de los da tos . Ensegu ida se dan las t ab las necesa r i a s para r e sumi r los
resul tados .
Tabla de distr ibución de f recuencias: Suma de los puntos que caen al lanzar dos dados
R E S U L T A D O S
P O S I B L E S
T A B L A D E D I S T R I B U C I Ó N D E F R E C U E N C I A S
V A R I A B L E : S U M A D E LOS P U N T O S
F R E C U E N C I A
C O N T E O
I N D I V I D U A L
F R E C U E N C I A
i,
F R E C U E N C I A
R E L A T I V A
fr,
F R E C U E N C I A
RELATIVA
A C U M U L A D A A C U M U L A D O
Continúa
Tabla de distr ibución de frecuencias: S u m a de los puntos que caen al lanzar dos dados
[Concluye]
R E S U L T A D O S
P O S I B L E S
T A B L A D E D I S T R I B U C I Ó N D E F R E C U E N C I A S
V A R I A B L E : S U M A D E LOS P U N T O S
F R E C U E N C I A
C O N T E O
I N D I V I D U A L
F R E C U E N C I A F R E C U E N C I A
R E L A T I V A
F R E C U E N C I A
RELAT IVA
A C U M U L A D A
o/ /o A C U M U L A D O
Total
Resumen de estadíst icas descriptivas
E Q U I P O
i T A M A Ñ O DE LA I
M U E S T R A ¡
n ¡
X 1 X 0.5 mo \ R ¡ MÁx MÍN | s
1 ! 30 ¡ ! 2 ! 30 ¡ ¡ ! 3 ¡ 6 0 ¡ ! 4 ! 60 ¡ ! ! 5 ! ioo ¡ ¡ ! 6 ¡ * ioo ¡ ¡ ¡ • ! ! ! í
Se c o m p a r a r á n los resul tados en u n a ses ión general . Para ello, c a d a equipo
cons t ru i rá el gráfico de espigas en un ace t a to , de idén t i co t a m a ñ o , y lo super
pondrá a los de los o t ros equipos pa ra observar las co inc idenc i a s y diferencias .
¿Qué conc lus iones pueden ob t ene r se de los resul tados? ¿El t a m a ñ o de la mues
t ra t i ene algún efecto i m p o r t a n t e pa ra adquir i r i n fo rmac ión? ¿Afec ta a la regu
lar idad es tad í s t i ca?
Un c o n j u n t o de m e d i c i o n e s se ca rac t e r i za m e d i a n t e tab las , n ú m e r o s y gráfi
c o s . Los p r o m e d i o s no son los ún icos n ú m e r o s pa ra represen ta r propiedades
i m p o r t a n t e s de da tos n u m é r i c o s . L a s med idas de dispers ión j u n t o c o n los
p romed ios cal i f ican m á s a d e c u a d a m e n t e un c o n j u n t o de datos .
En la t ab la s iguiente se r e s u m e n las ca rac t e r í s t i ca s de las med idas de disper
s ión es tudiadas .
M E D I D A S D E
D I S P E R S I Ó N
P R O P I E D A D E S M E D I D A S D E
D I S P E R S I Ó N D E F I N I C I Ó N Uso
Rango R = Dato mayor - Dato menor ° Medir la amplitud en la cual
se dispersan ios datos.
• Su valor se ve afectado por
valores extremos.
• No dice nada de la variación
de los datos entre los valores
extremos.
° No usa toda la información.
Percentil D(p) = P { n ) + P .
" 1 0 0
Es el dato percentil p.
° Partir conjuntos de datos
ordenados en porcentajes p
de ellos.
• Evita los valores extremos.
° No usa toda la información.
Percentil
x{p) = Dp_^ + [D p + 1 - D / 3 _ 1 ] [Par te decimal del dato D(p)},
donde
Dp_-] es el dato anterior al dato D(p),y
DP + 1 es el dato posterior al dato D(p).
° Partir conjuntos de datos
ordenados en porcentajes p
de ellos.
• Evita los valores extremos.
° No usa toda la información.
Cuartiles Cuartil 1 : 0 ( 1 ) = x ( 2 5 ) ° Partir conjuntos de datos en
cuatro partes iguales de
datos.
Cuartiles
Cuartil 2 : 0 ( 2 ) =x(50) = mediana
° Partir conjuntos de datos en
cuatro partes iguales de
datos.
Cuartiles
Cuartil 3 : 0 ( 3 ) = x ( 7 5 )
° Partir conjuntos de datos en
cuatro partes iguales de
datos.
Rango
intercuartílico
Q ( 3 ) - Q ( 1 ) ° Estimar el rango en que se
concentra 5 0 % de todos los
datos en el centro.
[continúa]
M E D I D A S D E
D I S P E R S I Ó N
P R O P I E D A D E S M E D I D A S D E
D I S P E R S I Ó N D E F I N I C I Ó N Uso
Rango
semiintercuartílico 2
° Estimar la medida de la
variación de 50% de todos
los datos que está en el
centro de una distribución.
• No usa toda la información.
Desviación media n \ | x ? . - x
f r f x R - X 1 + x 7 - x + . . . + x - x DM= =1 1 1 1 2 1 1
n n
donde
x ; e s el valor /-ésimo numérico: i = 1,2,n;
\xif —x| es el valor absoluto de la diferencia entre el /-ésimo
valor numéricoy la media aritmética, esto es, se toma el
valor positivo de la diferencia;y
n es el total de datos en la muestra.
• Medir la dispersión de los
datos alrededor de la media.
• Determinar la simetría de
una distribución.
Varianza y
desviación estándar
de una muestra
Para datos no agrupados:
n / n \ 2
s¿= R — es la varianza, y
s es la desviación estándar.
• Medir la dispersión de los
datos alrededor de la media
aritmética.
• Utiliza toda la información.
Varianza y
desviación estándar
de una muestra
Para datos agrupados:
£ / / W C , - x ) 2
Sz=\¡2^1 es la desviación estándar,
donde
^ • e s la frecuencia de la clase /,
MCj es la marca de clase de la clase /,
x es la media aritmética de los datos,y
n es el total de datos.
i
• Medir la dispersión de los
datos alrededor de la media
aritmética.
• Utiliza toda la información.
El sesgo de u n a d i s t r ibuc ión de f recuenc ias puede medi rse p o r Sg = —. s
Si Sg es m u y diferente de 0 e n t o n c e s ex i s t e sesgo. Si no, los da tos se d i s t r ibu
yen a p r o x i m a d a m e n t e de fo rma s imé t r i ca . Un gran sesgo t o m a r á va lores de
+ l o - l .
La d i s t r ibuc ión n o r m a l es un m o d e l o de d i s t r ibuc ión de da tos n u m é r i c o s . Es
p e r f e c t a m e n t e s imé t r i ca y t i ene fo rma de c a m p a n a . Una d i s t r ibuc ión de fre
c u e n c i a s es a p r o x i m a d a m e n t e n o r m a l o s i m é t r i c a s i sucede a p r o x i m a d a m e n
te lo s iguiente :
E N T R E
1
¡ ESTÁN, A P R O X I M A D A M E N T E
x±s ¡ 68% de los datos
x±2s ¡ 95% de los datos
x±3s ¡ 100% de los datos
Recapitulación Unidad 1
La estadíst ica descr ip t iva y el anál is is es tad ís t ico
E S T A D Í S T I C A D E S C R I P T I V A
construye y aplica
Técnicas para recopilar, organizar, analizar y extraer conclusiones a partir
de datos con variación en una investigación
mediante
El resumen de las
mediciones en tablas
o gráficos.
Estos son útiles para
descubrir patrones
o relaciones ocultas
en los datos.
T
El uso de números como
la media aritmética, la
desviación estándar,
etcétera.
Si se calculan con
los datos de una
muestra
La interpretación de los
resultados sobre la base
de un contexto, los
números y los gráficos.
La conclusión o
inferencia, que
representa la
información buscada.
Toda inferencia es
acerca de una
población representada
por parámetros.
Los datos son
números, generalmente
redondeados con
un error.
esos números
se llaman
estadísticos, como la
media muestral y la
desviación estándar de
la muestra
Estos números
estiman los
Los parámetros
son
números que
caracterizan a la
población, como la
media y la desviación
estándar: f i y s.
Represen tac iones n u m é r i c a s de las med ic iones
M E D I C I O N E S
D I R E C T A S : Se hacen comparando las cosas
con una unidad de medida
I N D I R E C T A S : Se calcula el valor numérico
de una magnitud mediante una ecuación
Ambas son medidas aproximadas
que producen
Existen reglas para
determinar las cifras
significativas
C I F R A S S I G N I F I C A T I V A S : Todas las cifras
exactas y la última de la derecha, que se
considera aproximada
Las operaciones con
medidas aproximadas
t ienen reglas
• Todas las cifras diferentes de 0 son significativas: 98.25.
• Ceros entre cifras diferentes de 0 son significativos: 90.32.
• Si un número entero termina en ceros, no se sabe si son
significativos: 200.
• Ceros entre un punto decimal y una cifra significativa no
son significativos: 0.0068.
• Al sumar o restar, el resultado tendrá tantos
decimales como la medida que tenga menos
de ellos: 2.3+ 7.81 = 10.1.
• Al multiplicar o dividir, el resultado tendrá
tantas cifras significativas como en la medida
que menos tiene: 30.30 5.2 = 5.8.
• Esca las de med ic ión
N O M I N A L O R D I N A L D E I N T E R V A L O D E R E L A C I Ó N
Consta de categorías sin
intensidad (sexo, estado
civil, etcétera)
Consta de categorías
con intensidad (tamaño
de la frente: a) grande
b) regular c) pequeña
Tienen un origen
arbitrarioy la variable
puede tomar valores a la
izquierda y a la derecha
de ese origen
(temperatura)
Las medidas que pueden
ser mayores que 0, el
origen absoluto (altura
de las personas)
Relac ión en t r e los da tos es tadís t icos y su represen tac ión tabu la r , numér i ca y gráf ica,
D A T O S E S T A D Í S T I C O S
E N B R U T O : Tal como se obtienen en una
investigación o experimento
Por orden ascendente
o descendente
Permiten calcular
fáci lmente
• El rango R.
• Los percentiles: Valores para los cuales el
p por ciento de los datos son menores.
• Los cuartiles: Valores que parten un
grupo de datos en cuartos, con los que se
construyen:
> El rango intercuartílico.
> El rango semiintercuartílico.
A G R U P A D O S
En una tabla
de distribución de
frecuencias
Describe
las frecuencias, frecuencias
relativas o porcentajes de
ocurrencia de la variable en
estudio por clase.
Permite
• Construir histogramas, polígonos y
gráficos de espigas de frecuencias.
• Calcular:
> Promedios: Media, moda y mediana.
> Medidas de dispersión: Desviación
estándary desviación media.
• Medidas del sesgo de una distribución
(a partir de los promedios y las medidas
de dispersión).
r ^4 continuación se presentan actividades de aprendizaje cuyo objetivo es que verifi
ques el alcance y comprensión de los conocimientos adquiridos por ti en la primera
unidad. Resuélvelas utilizando lo que has aprendido. En la siguiente sección, de A u -
toevaluación, se te dan las ideas básicas que debiste poner en acción para resolver
las actividades planteadas. Puedes consultarlas para confirmar las respuestas de
cada actividad.
Q Ordena los c o m p o n e n t e s de u n a inves t igac ión es tadís t ica , dados los s igu ien tes
enunc iados .
[a] La t o m a de u n a m u e s t r a o censo .
\b\ La ap l i cac ión de los resul tados .
0 La def inición de las var iables de interés .
\á\ La d e t e r m i n a c i ó n de un plan pa ra o b t e n e r los da tos n u m é r i c o s .
H L a s p regun tas a c e r c a del f e n ó m e n o en es tudio.
\T\ La conc lus ión a c e r c a del c o m p o r t a m i e n t o de las variables .
[f] La definición del universo o pob lac ión .
[h] El anál is is de los datos .
Q ¿ C ó m o se r e l ac ionan la es tad í s t i ca descr ipt iva y la es tad í s t i ca inferencia l p a r a
que és ta p roduzca inferenc ias? Da t res ideas.
O Se define la pob lac ión : "Los ingresos anuales de los t rabajadores emp leados en
la indus t r ia m i n e r a del país". E s c r i b e o t ras dos vers iones de e s t a p o b l a c i ó n r e
duc iendo el grado de general idad c a d a vez.
O Se p rueba u n a nueva v a c u n a para adul tos c o n t r a la gripe y se t o m a u n a m u e s
t ra de 20 vo lunta r ios que padecen f r ecuen t emen te la enfermedad, pa ra ap l ica r
la y c o n o c e r su e fec to .
H ¿Por qué en un c a s o c o m o éste se t o m a u n a mues t r a? Expl ica .
\b\ ¿Todos los individuos en la m u e s t r a t i enen que ser h o m b r e s o m u j e r e s ?
¿Qué ser ía m e j o r ? ¿ C ó m o debe t o m a r s e l a m u e s t r a de los vo lun ta r ios p a r a
asegurar que los e fec tos de la v a c u n a puedan genera l izarse?
D En la s i tuac ión A se te envía un sobre c o n u n a ho ja en la cual apa rece e l s igno • .
No hay nada m á s en ella. En ot ro escenar io B se te envía un sobre c o n u n a h o j a y
sobre ella e l s igno • . Además , se m e n c i o n a que l a l ibrería R o m b o ofrece l ib ros
de c ienc ias en p romoc ión .
H ¿Cuán tas h ipótes i s se puedan h a c e r en la s i tuac ión A? E s c r i b e t res . ¿Algu
na de ellas es conc luyen te , es to es, a b s o l u t a m e n t e c i e r t a?
0 C o n los datos de la s i tuac ión B, ¿qué conc lus iones puedes ob t ene r? En al
gunos casos , ¿son conc luyen tes?
0 Hac i endo uso de es tas dos s i tuac iones , e sc r ibe las diferencias fundamen
ta les ent re dato e in formación .
Q Se mide el m i s m o día, en diferentes l abora tor ios , la t empera tu ra del So l en su
superficie. Las medidas en e l l abora to r io M a c h fueron: 5 7 0 0 . 5 6 7 , 5 8 4 0 . 2 6 4 ,
5 9 0 0 . 8 7 5 y 5 9 9 5 . 7 4 3 . En e l l abora to r io Gal i leo fueron: 5 9 9 0 . 3 5 5 , 5 8 9 0 . 0 0 6 ,
5 8 8 0 . 9 9 9 y 5 9 9 8 . 4 0 0 .
0 ¿Es és te un expe r imen to? ¿Por qué?
[b] ¿Cuán tas cifras significativas t i ene c a d a med ida?
0 Redondea a c e n t e s i m o s de grado todas las med ic iones .
[d] Con los datos redondeados ca lcu la la m e d i a a r i tmé t i c a y la desviac ión es
t ánda r de cada con jun to de datos .
0 Es to s números , ¿son p a r á m e t r o s o e s t ad í s t i cos? Exp l i ca tu respues ta .
0 ¿Son los da tos de cada labora tor io u n a m ues t r a? Di por qué y de qué t a m a
ño es la pob lac ión es tudiada.
l~g] ¿En cuál labora tor io se t raba ja c o n un i n s t r u m e n t o m á s p rec i so? ¿ C ó m o se
sabe es to?
O ¿Cuáles de los s iguientes son e x p e r i m e n t o s a lea tor ios?
0 Se l anzan 20 piedras de 1 kg al vac ío s in ve loc idad inicial , y se mide la dis
t a n c i a recor r ida a los 10 segundos .
pb] Se regis t ran durante un año en u n a tor t i l le r ía las ven tas diarias de tor t i l las
en k i logramos .
0 Se observa un c o m e t a d i a r i amen te en su desp lazamien to por e l s i s t e m a so
lar para predeci r s i ex i s ten pos ib i l idades de que c h o q u e c o n la Tier ra .
0 El j uego de M E L A T E .
0 El n ú m e r o de reprobados en m a t e m á t i c a s en tu grupo el p r ó x i m o semes t re .
Q Cuando se l anza u n a m o n e d a al aire, var ios fac tores a fec tan el resu l tado al c a e r
la m o n e d a a l piso.
0 M e n c i o n a cua t ro factores .
0 Seña la dos de esos factores que sean a lea tor ios .
0 M e n c i o n a dos factores que sean s i s t emá t i cos .
Q Un t e r m ó m e t r o ana lóg ico se e n c u e n t r a den t ro de un e s t u c h e c i l indr ico y t r ans
pa ren te de p lás t i co . En e l l abora to r io se p rac t i can 10 m e d i c i o n e s c o n él, sin sa
car lo del e s tuche .
B ¿Qué t ipo de error de m e d i c i ó n se c o m e t e r á en la m e d i c i ó n ? ¿Cuál es la
c a u s a ?
B ¿ P r o b a b l e m e n t e c ó m o serán las med ic iones?
B ¿Podrán ser e x a c t a s las m e d i c i o n e s ? ¿Por qué?
B3 De c a d a m e d i c i ó n s iguiente , de t e rmina cuáles cifras son signif icat ivas.
B 9 .01 kg
B 0 . 0032 cm
0 10 .00 €
B 8.3 X 1 0 3 pa r t í cu las
B 0 .05 X 1 0 " 4
H . 0 .0350 .
EQ Rea l i za las s iguientes ope rac iones y en cada ca so e sc r ibe la respues ta c o n las
cifras s ignif icat ivas que co r respondan .
B 2 3 . 1 2 + 2.3
B 1 4 . 0 0 5 - 1 2 . 1
B 1 . 2 4 X 0 . 1 8 3 X 1 . 1
4 .35 B 0.025
0 L o s s iguientes da tos provienen de un es tudio desarrol lado en e l año 2 0 0 5 p o r
u n a c o m p a ñ í a de aviación a c e r c a de las edades de los pasa je ros en vuelos de la
c iudad de M é x i c o a la c iudad de Nueva York. L o s da tos se t o m a r o n al azar de
las l i s tas de vuelo, las cua les inc luyen a 12 0 0 0 pasajeros . Se quiere saber qué
servic io de pe l ícu las es conven ien te con t r a t a r para los vuelos , los cuales t r ans
p o r t a n 2 6 0 pasa je ros y gene ra lmen te van a cupo l leno. L a s pe l ícu las se clasifi
c a n así: (a) para n iños , (b ) pa ra n iños y jóvenes , (c ) pa ra j ó v e n e s y adul tos y (d)
sólo pa ra adul tos . El vuelo dura 6 horas .
6 17 23 27 30 35 38 42 49 55
6 17 23 28 32 36 38 43 49 55
10 18 25 28 32 36 38 43 50 56
10 18 26 28 32 36 39 44 51 57
11 19 26 28 33 36 40 44 53 61
12 20 26 29 33 37 40 45 53 61
14 20 27 30 34 37 40 46 55 64
16 23 27 30 35 37 42 48 -
55 70
H ¿Con qué p roced imien to pudo t o m a r s e la mues t r a a lea tor ia de las l is tas de
vuelo? Da una idea.
[b\ ¿En qué n o t a s que los da tos p o s e e n var iac ión?
0 ¿Los da tos provienen de un f e n ó m e n o a lea tor io? ¿Por qué?
[d] ¿Se apl icarán para resolver e s te p r o b l e m a los o c h o p a s o s de un p roceso de
inves t igación es tad í s t i ca? Esc r íbe lo s y c o m e n t a .
je] Define la pob lac ión en es tudio .
[T] ¿De qué t ipo es la p o b l ac ió n en es tudio?
[f] ¿Quién o cuál es el e l e m e n t o de la mues t r a?
[~h~| Para t o m a r una decis ión, ¿se ha r á sobre la base de p a r á m e t r o s o es tadís t i
cos? Expl ica .
¡T\ ¿De qué t ipo y dens idad es la var iable en es tudio?
[7] ¿En qué esca la se mide la edad? ¿Por qué?
\k] ¿Se puede real izar u n a in fe renc ia c o n los da tos? ¿ C ó m o se s abe?
[D ¿Cuál es la f recuencia relat iva según la mues t r a del evento: "Abordan perso
nas m e n o r e s de 18 años"?
H E s c r i b e t res eventos r e l ac ionados c o n el p rob l ema p lan teado .
[ñ] Observa los datos. ¿Qué infe renc ia pa rece adecuada? , es decir, de acuerdo
c o n las edades y can t idades de pasa jeros p o r viaje esperadas , ¿qué t ipo de
pe l ícu las sería r e c o m e n d a b l e co n t r a t a r ?
[o] ¿Por qué es és te un es tudio e s t ad í s t i co?
[P] Calcula los cuar t i les Q ( l ) , Q ( 2 ) y Q(3) , y da su s ignif icado.
[3 Cons t ruye el gráfico de ca jas e in te rpre ta su con t en ido . ¿Hay s imet r ía o
sesgo en los da tos?
B En una inves t igac ión pa ra en tende r los fac tores que in terv ienen en la ca l idad
de la uva, se es tud ian las doce t empera tu ras m í n i m a s en grados cen t íg rados en
la región vi t iv inícola de Ba ja California en dos t e m p o r a d a s diferentes de c r ec i
m i e n t o de la uva t o m a d a s a l azar en t re las b u e n a s y las malas . Las m e d i c i o n e s
fueron las s iguientes .
Temporada mala
° c ; 12 ; 16 ¡ 11 14 12 18 20 : 15 16 15 18 20
Temporada buena
°C ¡ 16 ¡ 15 ¡ 14 14 •17 19 17 : i s 20 19 18 16
H ¿Cuál es la var iable que se es tudia?
[b] ¿Los da tos son u n a m u e s t r a a lea tor ia de las t empera tu ra s en cada t e m p o
rada? ¿Por qué?
@ Define las p o b l a c i o n e s que se estudian.
[d] ¿En qué esca la se mide la var iable?
H ¿Es t án r edondeados los da tos?
\T\ ¿Cuán tas cifras significat ivas t i ene cada m e d i c i ó n ?
[ I ] Calcula e l rango de cada con jun to de t empera tu ra s .
H Calcula la m e d i a a r i t m é t i c a y la desviación e s t ánda r de cada c o n j u n t o de
datos .
Q] ¿Cuál es la med ida del sesgo de cada c o n j u n t o de da tos?
[7] ¿Qué puede inferirse p rov i s iona lmente c o n los da tos ace r ca del e f ec to de la
t empera tu ra en la cal idad de las uvas?
EQ Una c o m p a ñ í a de seguros invest iga el t i e m p o en m i n u t o s que requiere un t a sa
dor en la c iudad de More los desde que es avisado de un p e r c a n c e h a s t a que de
t e r m i n a e l m o n t o de los daños . L o s t i e m p o s de los ú l t imos sesen ta reg is t ros se
observan en la t ab la s iguiente .
77.15 85.84 91.06 92.90 94.62 98.54 100.59 102.69 104.85 108.21
82.49 87.16 91.15 92.90 95.45 98.96 100.77 103.56 105.10 108.27
83.32 87.40 91.58 92.94 95.66 99.30 101.17 103.65 105.56 111.39
84.31 88.33 91.75 94.09 97.37 99.77 101.79 103.84 107.22 116.42
84.81 90.69 92.44 94.41 97.76 99.96 101.95 104.43 107.57 118.69
85.06 91.02 92.74 94.57 98.44 100.19 102.48 104.64 108.09 121.92
H Const ruye u n a tab la de d is t r ibuc ión de f recuenc ias , e fec tuando los cá lcu
los necesa r ios .
C L A S E
I N T E R V A L O
DE C L A S E
( M I N U T O S )
I N T E R V A L O S
R E A L E S
DE C L A S E
F R E C U E N C I A
f
F R E C U E N C I A
R E L A T I V A
fr
M A R C A S
DE C L A S E
MC
Totales 60
[b] Const ruye el h i s t o g r a m a de f recuencias relat ivas de los t i empos .
\J] Desc r ibe las ca rac t e r í s t i ca s del t i e m p o que n e c e s i t a e l t a sador para ca lcu
lar los daños de acuerdo c o n lo que obse rvas en e l h i s t o g r a m a de frecuen
c ias relativas.
[d] Calcula la m e d i a a r i t m é t i c a de los da tos u t i l i zando la t ab la de d is t r ibuc ión
de f recuencias .
[e] Uti l iza la m i s m a tab la pa ra ca lcular la m e d i a n a de los datos .
[T] Calcula la desviac ión estándar.
[f] ¿Qué porcen ta je de o c a s i o n e s requir ió e l t a s a d o r m á s de 90 minu tos pa ra
real izar el t raba jo?
¿Qué porcen ta je de o c a s i o n e s uti l izó e l t a s a d o r en t re 90 m i n y 120 min pa ra
ob tene r el resu l tado?
E
ni ¿Son p a r á m e t r o s o es tad í s t i cos los resu l tados n u m é r i c o s an ter iores? Expl i
m
ca.
Calcula los pe rcen t i l e s 20 y 80; expl ica el s igni f icado de cada u n o y el que
t i ene e l c o n t e n i d o que se encuen t r an en t re el los.
Calcula el rango in te rcuar t í l i co y di qué s ignif icado t i ene .
H Un empresa r i o p lan ta en 10 h e c t á r e a s c a d a año alrededor de 20 0 0 0 p inos m u y
p e q u e ñ o s pa ra que c r ezcan y vender los en navidad h a s t a den t ro de dos t e m p o
radas . U n a m u e s t r a a lea tor ia de las a l turas en m e t r o s de unos 1 0 0 p inos le per
m i t e es t imar , an tes de cor tar los , e l m o n t o de las ut i l idades esperadas del año
de co r t e . En e l año 2 0 0 4 las a l turas de la m u e s t r a dio los s iguientes resul tados .
1.26 1.47 1.54 1.62 1.68 1.72 1.76 1.79 1.83 1.88
134 1.48 1.54 1.62 1.68 1.73 1.76 1.79 1.83 1.88
1.39 1.49 1.56 1.63 1.68 1.74 1.77 1.80 1.83 1.89
1.40 1.49 1.58 1.63 1.69 1.74 1.77 1.80 1.84 1.92
1.40 1.50 1.59 1.64 1.69 1.75 1.77 1.80 1.85 1.96
1.43 1.51 1.60 1.64 1.70 1.76 1.78 1.80 1.86 1.97
1.44. 1.52 1.60 1.65 1.71 1.76 1.78 1.82 1.86 1.98
1.46 1.53 1.60 1.66 1.71 1.76 1.78 1.82 1.86 1.98
1.47 1.53 1.62 1.67 1.71 1.76 1.78 1.82 1.86 2.03
1.47 1.54 1.62 1.67 1.72 1.76 1.78 1.83 1.86 2.13
El h i s t o g r a m a de f recuencias de las a l turas de los p inos en la m u e s t r a es el si
guiente .
H I S T O G R A M A
l i l i
31%
I I l
21% 21%
17%
13% .
21%
17%
13% .
21%
17%
5%
2%
13% .
21%
17%
2%
1
13% .
21%
17%
1 1.2568 1.3657 1.4747 1.5836 1.6926 1.8015 1.9104 2.0194 2.1283
Altura en metros
H ¿Cuál es rango de los da tos y qué s ignif icado t i ene?
¡b] ¿A qué c rees que se debe que no t o d o s los p inos c r ecen a l m i s m o t a m a ñ o ?
Da t res mot ivos posibles .
\±\ Cons t ruye la ojiva m e n o r qué para los datos .
[d] ¿Cuál es el po rcen ta j e esperado de las a l turas de los p inos m e n o r e s que
1,70 m ?
[e] ¿Qué po rcen t a j e de las al turas de los p inos pa rece que será mayor que
1.80 m ?
[T| ¿Qué po rcen ta j e de las al turas de los p inos e s t a rán en t re 1.50 m y 1.90 m?
[U ¿Cuál es e l valor de la m e d i a n a y qué signif ica?
[h] Calcula a p r o x i m a d a m e n t e el valor de los percen t i l es x(80) y x ( 4 0 ) , dando
su s ignif icado.
[T] ¿Cuál c rees que es el valor de la m e d i d a del sesgo de la d i s t r ibuc ión de las
a l turas? ¿Por qué?
[Q D o s t raba jadores de l a cons t rucc ión , A y B , a r m a n a des ta jo es t ruc tu ras metá l i
cas para cas t i l los . E l supervisor de a m b o s t o m a 50 t i e m p o s en minu tos de cada
uno de ellos. Cada t i empo cor responde a 20 nudos . L o s t i e m p o s se m u e s t r a n en
las tab las s iguientes . El supervisor ha p l an teado la h ipótes is de que a m b o s rea
l izan la t a r ea en igual t i empo .
Tiempos en segundos del operario A
15.62 14.32 16.95 14.77 15.28 16.46 13.44 15.09 14.84 14.72
14.92 13.24 14.69 15.87 15.01 14.64 17.99 13.99 13.75 15.55
15.52 15.17 14.69 15.00 14.35 15.34 15.37 16.04 14.87 14.27
16.66 15.50 15.67 15.40 15.37 15.20 14.69 16.20 15.09 15.11
15.28 14.98 15.82 15.40 15.93 14.26 12.83 14.94 15.12 15.11
T iempo en segundos del operario B
7.15 10.70 11.43 12.23 12.98 13.41 13.80 14.26 15.28 16.05
7.90 10.93 11.64 12.27 13.01 13.54 13.87 14.47 15.37 16.16
10.08 11.14 11.84 12.44 13.07 13.63 13.89 14.50 15.42 16.19
10.21 11.34 12.01 12.49 13.13 13.66 13.94 14.96 15.50 16.25
10.53 , 11.42 12.04 12.61 13.22 13.80 14.15 15.15 15.59 16.41
L a s es tad ís t icas descr ip t ivas e n c o n t r a d a s se m u e s t r a n en la t ab la s iguien te .
Estadíst icas descript ivas ( t iempos en minutos)
n M E D I A M E D I A N A M Í N I M O M Á X I M O ¡ R A N G O D E S V I A C I Ó N
E S T Á N D A R
Operario A 50 15.1264 15.1100 12.8300 17.990 ¡ 5.1600 0.8999
Operario B 50 13.1412 13.3150 7.1500 16.410 ¡ 9.2600 2.0775
[a ] ¿Cuál es e l c o n t e x t o de la s i tuac ión?
[b] ¿Cuál es la variable en es tudio?
0. Dec ide an tes de e fec tuar cua lqu ie r cá lcu lo dónde pueden e n c o n t r a r s e indi
c ios ace r ca de la verdad o falsedad de la h ipótes is del supervisor.
[á] Comple t a las d i s t r ibuc iones de f recuencias respec t ivas para los t i e m p o s de
los dos t rabajadores .
Distr ibución de frecuencias del operario A
C L A S E I N T E R V A L O S DE C L A S E ¡ F R E C U E N C I A F R E C U E N C I A I
RELATIVA | %
! % | A C U M U L A D O
1 12,00 < x < 13.00 ¡ 1 0.02 ¡ 2.00 ¡ 2.00
2 13.00 < x < 14.00 ¡ ; ¡ 10.00
3 14.00 < x < 15.00 | 0.32 ¡ ¡ 42.00
4 ¡ 0.46 | 46.00 ¡ 88.00
5 ¡ 5 [ 10.00 ¡ 98.00
6 ! i ¡ ¡ 100.00
¡ Totales ¡ 50 1.00 ¡ 100.00 !
Qistr ibución de f recuencias del operario B
C L A S E I N T E R V A L O S DE C L A S E ¡ F R E C U E N C I A F R E C U E N C I A ,
RELATIVA ¡ %
! % ¡ A C U M U L A D O
1 6.00 < x < 8.00 ¡ 2 ! 4.00 ¡ 4.00
2 | 0 ! 0.00 ¡ 4.00
3 10.00 < x < 12.00 ¡ 11 0.22 ¡ ¡ 26.00
4 ; 0.42 ¡ ¡ 68.00
5 ¡ 22.00 ¡ 90.00
6 ¡ 5 ! 10.00 ¡ 100.00
Totales 1.00 ¡ 100.00 !
H Cons t ruye los h i s tog ramas de f recuenc ias pa ra los t i e m p o s de cada opera
rio. D e s c r i b e su con ten ido . ¿Qué puede dec i rse a c e r c a de el los? ¿ C ó m o es
su fo rma? ¿Cuál mues t r a mayor rango? ¿Qué signif ica ese rango en e l con
t e x t o ?
H I S T O G R A M A : O P E R A R I O A
Tiempo en minutos
H I S T O G R A M A : O P E R A R I O B
6 8 10 12 14 16 18
Tiempo en minutos
[T] De acue rdo c o n los valores de las desv iac iones e s t ándares y los rangos, ¿al
gún operar io es más preciso en su t raba jo? ¿Por qué? ¿Qué signif icado t i ene
e s to en e l t raba jo?
[f] Ut i l iza la c o l u m n a de po rcen ta j e s a c u m u l a d o s pa ra c o n t e s t a r lo s iguiente:
¿Qué po rcen ta j e de las veces el t raba jador B real iza 20 nudos
> en 14 o m e n o s m i n u t o s ?
> en m á s de 12 minu tos?
> en t re 10 y 16 m i n u t o s ?
[h] ¿Cuál es el valor en m i n u t o s del pe rcen t i l 88 pa ra el t raba jador A y qué sig
nifica?
[T] ¿Cuál es el va lor en m i n u t o s del pe rcen t i l 90 para el t raba jador B y qué sig
nif ica?
[T] ¿Cuáles son las c o n c l u s i o n e s genera les? ¿La h ipótes i s del superv isor p a r e c e
c o r r e c t a o n o ? Da u n a exp l i cac ión de es te asun to .
EQ Dibuja sobre un cuad ro gráfico lo que se te pide.
[a] El c o n t o r n o de u n a d i s t r ibuc ión de f recuenc ias c o n sesgo Sg — 0 . 9 3 7 5 .
[b] La u b i c a c i ó n de la media , la m e d i a n a y la moda , s i los valores son 30 .26 ,
40 .21 y 39 .5 , pe ro no se sabe cuá l co r re sponde a cuá l medida .
0 El rango es 2 4 9 y el da to mayor es 2 5 8 .
\A\ La ba r ra c o n m a y o r f recuenc ia t i ene 3 4 % de datos .
EE3 El t i e m p o en m i n u t o s que t a rdan en l legar de su c a s a a la e scue la los es tud ian
tes de un p lan te l de educac ión m e d i a que viajan en c a m i ó n u rbano en la c iudad
de V i l l ahe rmosa depende de var ios fac tores o variables , pe ro u n o de el los es la
d is tancia . Se h a n t o m a d o 10 es tud ian tes a l azar y ellos h a n med ido ese t i e m p o ,
e l cua l se m u e s t r a en l a t ab la s iguiente , a soc iado a l a d i s t anc ia desde su c a s a en
k i lómet ros .
O B S E R V A C I Ó N i D I S T A N C I A I
¡ EN K I L Ó M E T R O S ¡
T I E M P O I
EN M I N U T O S ¡
1 i 8 ¡ 40 !
2 ! 5 i 30 ¡
3 ! 4 ¡ 18 ¡
4 i ' 7 ¡ 30 ¡
5 ! 9 ! 35 !
6 ! 12 ¡ 45 |
7 ! 4 ¡ 25 ¡
8 ! 7 ! 43 ¡
9 ¡ 8 | 30 ¡
10 ! 3 ¡ 20 ¡
Sumas ! !
Medias ! • ! ;
[a] ¿Cuál es la variable independ ien te y cuá l la variable depend ien te? E x p l i c a
po r qué las ca ta logas te así.
[b] Cons t ruye el gráfico de dispers ión de las var iables .
0 Ca lcu la e l coef ic iente d e regresión b r
[d] ¿Qué signif icado t i ene el valor de ¿ 1 ?
H Cons t ruye la e cuac ión de la r e c t a de regres ión de los datos .
[Tj Pred ice el t i e m p o ap rox imado que t a rda rá en l legar a la e scue la un es tu
d ian te que vive a 6 km de la escue la y t o m a el au tobús .
[f] ¿Es un p romed io e l valor e n c o n t r a d o en e l inc i so an te r ior? ¿Por qué? ¿ E n
qué sen t ido?
[h] ¿Es adecuada y útil la e c u a c i ó n p l an t eada pa ra predeci r e l t i e m p o que ta r
dan en l legar a la e scue la es tud ian tes que viven a un k i l óme t ro de la e s c u e
la y se t ras ladan a pie? ¿Por qué?
\±\ Dibuja la r e c t a de regres ión ent re los pun tos . (Sugerencia: ¿Cuán tos p u n t o s
se requieren para t r aza r una r e c t a ? )
Enseguida se te ofrecen indicaciones, procedimientos y respuestas a las actividades
de confirmación de conocimientos de la Unidad 1.
I B B E i a B B y B
[2] La e s t ad í s t i ca descr ipt iva pe rmi t e rea l izar un anál is is de los da tos an t e s de
p roceder a la o b t e n c i ó n de inferencias . As í que puedes ver qué c o s a s imp l i ca e l
anál is is es tad ís t ico .
| T | E l grado de general idad de u n a pob lac ión se r educe in t roduc iendo fac to res que
hagan m á s p rec i sa la definición de la pob lac ión . En es te e jemplo pudis te añad i r
los fac tores : mine ros del e s t ado de Coahui la y en t re 25 y 30 años , pa ra reduc i r
el grado de general idad.
S H No se puede ni debe apl icar u n a nueva v a c u n a a todo el m u n d o . Podr ía ge
nera r secue las indeseables , por e jemplo .
[b] T a n t o h o m b r e s c o m o mujeres p a d e c e n de gripe. Una m u e s t r a a d e c u a d a
pa ra es tudiar e l e fec to de la v a c u n a ser ía aquel la que se t o m a r a sin t e n d e n
c ias , es decir, al azar.
0 Un da to que l l ama nues t r a a t e n c i ó n pero que no t i ene un c o n t e x t o puede c o n
duci r nues t r a i m a g i n a c i ó n h a s t a e l grado de forzar la a que p r o d u z c a m o s m u
c h a s h ipó tes i s a c e r c a de su con ten ido , o s i m p l e m e n t e la o lv idemos . Pero u n a
h ipó tes i s no es u n a conc lus ión , es apenas un supues to . C u a n d o e l da to se pre
s en t a en un c o n t e x t o , puedes p l an tea r una conc lus ión ; p o r e jemplo , i r a ver los
l ibros pa ra c o m p r o b a r los p rec ios .
0 0 Si .hay repe t ic ión de un f e n ó m e n o y se real iza u n a o b s e r v a c i ó n s i s t emá t i ca ,
puede dec i rse que se t i ene un expe r imen to .
[b] L a s cifras signif icat ivas son siete .
[e] Cuando se ca lcu la un n ú m e r o pa r t i endo de los da tos de u n a m u e s t r a se
ob t i enen un es tad í s t i co .
0 Mues t r a . La med ida de la t empera tu ra de la superficie del So l puede t o
m a r s e en n ú m e r o i l imi tado .
[f] Aquel l abora tor io en el que se ob t i ene el m e n o r rango y desviac ión es t án
dar en t eo r í a t i ene e l i n s t r u m e n t o m á s prec iso .
S] S La ve loc idad a la que se l anza la moneda , la a l tura a la que l lega la m o n e d a ,
la c a r a hac i a a r r iba c o n que se l anza la monedad la ve loc idad del v iento , la
d i r ecc ión del v iento , si la m o n e d a se l anza a favor o en c o n t r a del v iento , el
p e s o de la moneda .
0 No se puede con t ro l a r la pa r t e de la m o n e d a que c h o c a p r i m e r o c o n e l sue
lo, n i e l n ú m e r o de vue l tas que da la m o n e d a en e l aire. L o s fac tores que no
se pueden con t ro la r son a lea tor ios .
0 Fac to re s s i s t emá t i cos son los que se pueden controlar , c o m o la ve loc idad
del l a n z a m i e n t o o la ca r a h a c i a a r r iba c o n que se l anza la m o n e d a .
0 0 Si la c ausa del error se puede con t ro l a r e n t o n c e s es s i s t e m á t i c o . Si no , .es
a lea tor io . E l t e r m ó m e t r o den t ro de un rec ip ien te podr ía med i r u n a t e m p e
ra tura adic ional .
0 Es pos ib le que las l ec tu ras sean mayores que las reales .
0 S i e l t e r m ó m e t r o m a r c a grados de más , no pueden ser e x a c t a s las m e d i c i o
nes . Además , la l ec tu ra depende t a m b i é n de quien lee la e sca la . Ot ra fuente
de var iac ión .
a E . B y B -
B
E
E
9 , 0 y l .
3 y 2 .
1 , 0 , 0 , 0 .
a 8 , 3 .
H 5.
| T | 3, 5 y el 0 a la derecha del 5.
S 0 2 5 . 4 2
0 1.91.
0 0 .25 .
a i 7 o .
@ [a] Se puede as ignar un n ú m e r o en t r e 1 y 1 2 0 0 0 a c a d a pasa jero , y de ahí se
s e l ecc ionan a la suer te 80 n ú m e r o s de los posibles , m e d i a n t e un so r t eo o
u t i l i zando una ca lcu ladora que p r o d u z c a n ú m e r o s a lea tor ios . Con la t ec l a
de las ca lculadoras c ien t í f icas se p roducen n ú m e r o s al aza r en t re 0 y 1.
La se l ecc ión cons i s t e en elegir a las 80 pe r sonas en la l i s ta r e l ac ionados a
los n ú m e r o s extra ídos .
[~b] Sus valores son diferentes y en p ropo rc iones desiguales.
0 P r o c e d e n de un f e n ó m e n o a lea to r io porque no se puede p redec i r la edad
individual de los pasa jeros en c a d a vuelo. Sólo se puede e s t i m a r u n a pro
p o r c i ó n según rango de edad.
0 Sí: ( 1 ) pregunta , (2) variable, ( 3 ) pob lac ión , (4 ) p lan de m u e s t r e o , ( 5 ) t o m a
de mues t ra , (6 ) análisis de da tos , ( 7 ) conc lus ión , y ( 8 ) dec is ión .
0 D e b e n ser las edades, o sea, la var iable en estudio, pe ro los d e m á s e l emen
tos que debis te haber cons ide rado son: a qu iénes se mide , la un idad de m e
dida de la variable, dónde se obse rva la variable, cuándo . "Las edades de los
pasa je ros que abordan vuelos M é x i c o - N u e v a York en la c o m p a ñ í a de avia
c ión X a quienes se les of recerá un servic io de c ine en el vuelo".
0 Só lo puede ser f ini ta o infinita. A h o r a bien, no puede c o n t a r s e en cua lqu ie r
m o m e n t o . Para f ines p r á c t i c o s puede cons idera rse infini ta.
[g] D e b e ser aquel la pe r sona o c o s a de la cua l se ob t i ene u n a medida . Un pasa
j e r o .
0 L o s p a r á m e t r o s son n ú m e r o s que se ob t i enen de un c e n s o , é s t e no es e l
c a s o . La decis ión se t o m a r á sobre la b a s e de a lgunos es t ad í s t i cos .
0 Cuant i ta t iva y con t inua .
0 Só lo puede ser la de in terva lo o la de re lación. Pero las edades de las pe r so
nas sólo pueden ser mayores que ce ro . Es de re lación.
0 Sí . Se p re tende genera l izar a pa r t i r de los da tos de u n a m u e s t r a a toda la
p o b l a c i ó n de viajeros en los vuelos de esa c o m p a ñ í a .
0 Deb i s t e usar la definición de f r ecuenc ia relativa, e fec tuar los c o n t e o s c o
r r ec tos y ca lcu la r la división re lac ionada . El resul tado es 1 2 . 5 % .
H Even to es un s u c e s o que puede o no suceder en re lac ión a es te f e n ó m e n o .
En es te ca so , p o r e jemplo: 1) Las edades de los pasa je ros son mayores que
30 años; 2 ) L a s edades de los pasa jeros n u n c a p a s a n de 60 años .
0 Un cr i te r io podr í a ser: Si las pe l ículas pa ra j óvenes y adul tos son ap tas pa ra
los n iños , ésas podr í an ser la base de la conc lus ión .
0 L e e la def in ic ión de es tad ís t ica .
0 Q (1 ) = 2 6 ; Q ( 2 ) = 3 5 ; Q ( 3 ) = 4 4 .
0 Los b igo tes de las ca jas son a p r o x i m a d a m e n t e de la m i s m a longitud; po r lo
t an to , puede dec i r se que la d i s t r ibuc ión de las edades es s imét r ica , c o n m e
diana igual a 35 años . {
Edades
10 20 30 40 50 60 70 80
@ H La ca r ac t e r í s t i c a que puede a fec ta r la ca l idad de la uva: La t empe ra tu r a en
grados cen t íg rados .
0 L a s t e m p e r a t u r a s tuvieron igual p robabi l idad de ser l levadas a la mues t r a .
E l fac tor h u m a n o no in terviene en su valor. S í es u n a m u e s t r a a leator ia .
0 S o n dos pob l ac iones : la de las t e m p o r a d a s m a l a s y la de las buenas . Deb i s t e
definirlas t o m a n d o en c u e n t a e l e m e n t o s ta les c o m o : l a variable, l a un idad
de medida , cuándo , dónde, e tcé te ra . Pob lac ión 1: Tempera tu ra s m í n i m a s
en grados cen t íg rados en la región vi t ivinícola de B a j a California c u a n d o la
uva es de m a l a cal idad. ,
0 La var iable es cuan t i t a t iva y de re lación.
0 ¿Podr ían las t empera tu ra s ser t a n e x a c t a s en en t e ros? Se han redondeado .
m 2.
H 9 ° C y 6 ° C .
[h] T e m p o r a d a mala : 1 5 . 5 8 3 °C y 3 .029 °C. T e m p o r a d a buena : 1 6 . 9 1 6 °C y
1 . 9 7 ° C .
[T] 0 .082 para la t e m p o r a d a m a l a y —0.128 para la o t ra t emporada .
[TI Debiste observar las diferencias entre las medias , las desviaciones es tándares
y los sesgos. Cuando se produce uva de m e n o r cal idad la t empera tura es m e
nor, pero con una desviación es tándar mayor que la de la o t ra temporada .
C L A S E I
I N T E R V A L O S R E A L E S
DE C L A S E :
M I N U T O S
1 F R E C U E N C I A
i—' r
F R E C U E N C I A ¡
RELATIVA i
fr
%
F R E C U E N C I A
RELAT IVA
A C U M U L A D A
fra
M A R C A S
i DE C L A S E
¡ MC
1 ¡ 77.15 < M < 83.55 ¡ .3 0.0500 ¡ 5 3 ¡ 80.35
2 ! 83.55 < M < 89.95 ¡ 7 0.1166 | 11.66 10 ¡ 86.75
3 ¡ 89.95 < M < 96.35 ! v 0.2833 ¡ 28.33 27 ¡ 93.15
4 ! 96.35 < M < 102.75 ¡ 16 0.2666 | 26.66 43 ¡ 99.55
5 ¡ 102.75 < A/1 < 109.15 i 13 0.2166 ¡ 21.66 56 ¡ 105.95
6 1 109.15 < M < 115.55 | 1 0.0166 ¡ 1.66 57 ¡ 112.35
7 ¡ 115.55 < M < 121.95
Totales
¡ 3 0.0500 ¡
60 ¡
5
100
60 ¡ 118.75
Los datos pa recen d is t r ibui rse de m a n e r a s imét r i ca . La mayor ía de ellos se c o n
cen t r a en e l c en t ro de la d i s t r ibuc ión . La c lase m e d i a n a es la c lase 4 . L a s c lases
3, 4 y 5 a c u m u l a n 7 6 . 6 5 % de todos los datos . Por lo t an to , gene ra lmen te el
t a sador ta rdará m á s de 8 9 . 9 5 m i n u t o s pero m e n o s de 109 .15 m i n u t o s en reali
zar un cá lculo . La m e d i a de los da tos es de 97 .85 minu tos . La desviación es tán
dar es de 9 m i n u t o s y la med iana , de 98 .49 m i n u t o s a p r o x i m a d a m e n t e . El t a sa
dor requir ió en t re 90 y 1 2 0 m i n u t o s para real izar un cá lcu lo 8 1 . 6 6 % de las veces .
Puedes usar la t ab la de da tos agrupados en orden, o b i en cons t ru i r u n a ojiva
m e n o r qué pa ra o b t e n e r la respues ta . És te es un es tad í s t i co , igual que los nú
meros anter iores . D e b e s cons ide ra r que s i un n ú m e r o se ob t i ene c o n todos los
da tos de u n a pob lac ión , es un pa ráme t ro . El rango in te rcuar t í l i co se define p o r
Q(3 ) - Q ( l ) . Los valores de los cuar t i les son: Q ( l ) = 91 .92 y Q(3 ) = 104 .10 . En
c o n s e c u e n c i a , e l rango semi in te rcua r t í l i co es de 12 .18 minu tos . E s t o quiere de
c i r que 5 0 % de todas las veces que real iza un cá lcu lo t a rda en t re 91 .92 m i n y
104 .10 min. E s t o s t i e m p o s son los del cen t ro de la d i s t r ibuc ión . La m e d i a n a es
igual a l cuar t i l 2 : Q(2 ) = 9 8 . 4 9 minu tos . En c o n s e c u e n c i a , 5 0 % de los cá lcu los
en la mues t r a se h ic i e ron en m e n o s de ese t i empo .
S H El r ango se define c o m o la d i ferencia en t r e el da to mayor y el da to m e n o r :
0.87 m.
[b] L a s p rop iedades de la t ier ra donde se p l an t an los p inos y las p l a n t a s m i s
m a s no son iguales. Ex i s t i r án o t ros fac tores que pueden hace r que las a l tu
ras no sean iguales.
[d] 4 5 % a p r o x i m a d a m e n t e . Puedes usa r e l gráfico ojiva m e n o r qué.
H 2 4 % a p r o x i m a d a m e n t e .
\T\ 7 9 % a p r o x i m a d a m e n t e .
[g] 1.72 m ap rox imadamen te . A p r o x i m a d a m e n t e 5 0 % de las a l turas de los pi
nos se rá m e n o r que 1.72 m.
[h] x(80) = 1.83 m ap rox imadamen te , y x(40) = 1.674 m a p r o x i m a d a m e n t e .
D e b i s t e ca lcu la r la media , la m e d i a n a y la desviación es tándar de los da tos ,
las cua le s son, ap rox imada y r e spec t ivamen te : 1.697, 1.72 y 0 . 1 6 2 3 . E n t o n
ces , es pos ib le ca lcular la m e d i d a del sesgo.
i B El c o n t e x t o de la s i tuac ión es un t r aba jo ( a rmar es t ruc tu ras m e t á l i c a s ) en
el cua l pa r t i c ipan dos t raba jadores , A y B. El supervisor t i ene la h ipó tes i s
de que a m b o s son igual de ef ic ientes .
\b\ La var iable de es tudio es "El t i e m p o que un t raba jador usa p a r a cons t ru i r
20 nudos en l a armazón".
0 L o s ind ic ios para responder la p r e g u n t a del supervisor se hal lan, p o r e j em
plo, en: la m e d i a a r i tmét ica , la med iana , algún percen t i l y la desv iac ión es
tándar .
a
Distr ibución de f recuencias del operario A
C l a s e
!
¡ I n t e r v a l o s de c l a s e F r e c u e n c i a F r e c u e n c i a I
r e l a t i v a ¡ %
! % ¡ ACUMULADO
1. ¡ 12.00 < x < 13.00 1 0.02 ¡ 2.00 ¡ 2.00
2 ¡ 13.00 < x < 14.00 4 0.08 ¡ 8.00 ¡ 10.00
3 ¡ 14.00 < x < 15.00 16 0.32 | 32.00 ¡ 42.00
4 ¡ 15.00 < x < 16.00 23 0.46 ¡ 46.00 ¡ 88.00
5 ¡ 16.00 < x < 17.00 5 0.10 ¡ 10.00 ¡ 98.00
6 ¡ 17.00 < x < 18.00 1 0.02 ¡ 2.00 ¡ 100.00
¡ Totales 50 1.00 ¡ 100.00 !
Distribución de f recuencias del operario B
C L A S E I N T E R V A L O S DE C L A S E F R E C U E N C I A F R E C U E N C I A I
R E L A T I V A | %
! % ¡ A C U M U L A D O
1 6.00 < x < 8.00 2 0.04 ¡ 4.00 ¡ 4.00
2 ¡ 8.00 < x < 10.00 0 0.00 ¡ 0.00 ¡ 4.00
3 | 10.00 < x < 12.00 11 0.22 | 22.00 1 26.00
4 | 12.00 < x < 14.00 21 0.42 ¡ 42.00 ¡ 68.00
5 ¡ 14.00 < x < 16.00 11 0.22 ¡ 22.00 ¡ 90.00
6 ¡ 16.00 < x < 18.00 5 0.10 1 10.00 ¡ 100.00
Totales 50 1.00 ¡ 100.00 ¡
13 14 15 18 17 18
Tiempo en minutos
O P E R A R I O B
20
6 8 10 12 V 14 16 18
Tiempo en minutos
A m b o s p a r e c e n ser s imé t r i cos . Según las esca las en los gráficos y el resu l tado
en las e s tad í s t i cas descr ipt ivas , e l t raba jador B p roduce los 20 nudos en t i em
p o s m e n o s c o n c e n t r a d o s que e l A, lo que sugiere que d o m i n a m e n o s su tarea .
00 El operar io A es m á s p rec i so , pues su desviación es t ándar es m e n o r que la
de B. E s t o significa quizás m á s c o n c e n t r a c i ó n , aunque el operar io B suele
hacer , a veces , la t a r ea m u y rápido, lo que signif icaría que t i ene p o t e n c i a l
pa ra l legar a ser m e j o r que A.
B > 6 8 % .
> 1 0 0 % - 2 6 % = 7 4 % .
. > 9 0 % - 2 6 % = 64%.
[h] 16 min . Signif ica que 8 8 % de las veces , t e r m i n a 20 nudos en m e n o s de ese
t i e m p o .
[T] 16 min .
[7] El t r aba jador A es a c t u a l m e n t e m á s p rec i so que el B, pe ro el B t i ene po t en
cial pa ra real izar la t a r e a en m e n o s t i e m p o que A. E s t o se ve en los rangos ,
p o r e jemplo . Para B el da to m e n o r es de unos 6 minu tos , mien t r a s que para
A es de 12 minu tos . Por ahora , la h ipótes i s del supervisor pa rece i nco r r ec
ta : A es m á s prec iso .
@ H Si el sesgo es posi t ivo, la d i s t r ibuc ión t i ene un sesgo hac ia la derecha . E s t o
es lo que debis te considerar .
[b] La media , l a m e d i a n a y la m o d a p o s e e n u n a re lac ión ca rac t e r í s t i ca c u a n d o
ex i s t e u n a d i s t r ibuc ión c o n un gran sesgo. Si el sesgo es a la derecha , la
m o d a e s t á a la izquierda de la m e d i a n a y é s t a a la izquierda de la media .
Pjf] 0 La var iable " t i empo" depende de la d i s tanc ia . El t i e m p o es la var iable de
pend ien te .
H El coef ic ien te de regres ión a soc i a a las dos var iables . En es te c a s o
b 1 = 2 . 8 0 1 8 min.
' [dj El s ignif icado de b 1 es de s u m a i m p o r t a n c i a en el anál is is de regresión: Por
c a d a k i lóme t ro ad ic iona l en d i s t anc ia de la c a s a h a s t a la escuela , e l t ras la
do t a rda en p romed io 2.8 m i n u t o s más .
H La r e c t a de regresión a jus tada es y = 1 2 . 8 2 8 2 + 2 .8x.
[f] La p red icc ión se p r a c t i c a u t i l i zando la r e c t a de regres ión ajustada. La in
c ó g n i t a es y y x = 6. E n t o n c e s , y = 1 2 . 8 2 8 2 + 2 .8 (6 ) = 29 .62 min.
\J] S í es un p romedio . No puede u n o imag ina r que s iempre haga 29 .62 minu
tos e x a c t a m e n t e . La r e c t a de regres ión es un p romed io .
[h] No, po rque el es tudio se refiere a viajes en c a m i ó n .
H1 ( D o s puntos , de acuerdo c o n la g e o m e t r í a p lana . )