ejercicios probabilidad y estadistica

10
Desarrollos: 1.Inicialmente notamos que no se posee el dato a la sexta frecuencia relativa. Para calcularla podemos usar el hecho de que la suma de ellas debe ser la unidad. Es decir i=1 6 f i =1 0.12 +0.45+0.25 +0.10+0.05 + f 6 =1 ⇒f 6 = 10.97=0.03 Necesitamos todas las marcas de clase para calcular la varianza de Z, por lo que, considerando que el total de individuos en la muestra es de N=200 , podemos usar la definición de frecuencia relativa para calcular n 1 , como sigue f 1 = n 1 N ⇒n 1 =N f 1 =200 0.12=24 Del dato que z 1 n 1 =192 podemos encontrar la primera marca de clase z 1 = 192 n 1 = 192 24 =8 Teniendo en cuenta que al ser los intervalos de clase de la misma longitud, la que denotaremos como L, se concluye que las marcas de clase también estas separadas por este valor, es decir z i =z 1 +( i1 ) L para i=1 , 2 ,…, 6. Usando el dato de la media, la cual se puede calcular usando las frecuencias relativas y las marcas de clase obtenidas como z= i 6 z i f i = i=1 6 ( z ¿¿ 1+( i1 ) L) f i =z 1 +L i 6 ( i1) f i ¿ z=z 1 +L ( 0 0.12 +1 0.45+2 0.25 +3 0.10+4 0.05+ 5 0.03)= z 1 +1.6 L Podemos despejar L y así obtener las demás marcas de clase. Por tanto, debemos usar la igualdad 15.20=8 +1.6 L⇒L= 15.208 1.6 =4.5

Upload: andrea-oyarce-vidal

Post on 13-Apr-2016

42 views

Category:

Documents


0 download

DESCRIPTION

ejercicios resueltos probabilidad y estadistica

TRANSCRIPT

Page 1: ejercicios probabilidad y estadistica

Desarrollos:

1. Inicialmente notamos que no se posee el dato a la sexta frecuencia relativa. Para calcularla podemos usar el hecho de que la suma de ellas debe ser la unidad. Es decir

∑i=1

6

f i=1⇒0.12+0.45+0.25+0.10+0.05+ f 6=1⇒ f 6=1−0.97=0.03

Necesitamos todas las marcas de clase para calcular la varianza de Z, por lo que, considerando que el total de individuos en la muestra es de N=200 , podemos usar la definición de frecuencia relativa para calcular n1, como sigue

f 1=n1N⇒n1=N ⋅ f 1=200 ⋅0.12=24

Del dato que z1⋅n1=192 podemos encontrar la primera marca de clase

z1=192n1

=19224

=8

Teniendo en cuenta que al ser los intervalos de clase de la misma longitud, la que denotaremos como L, se concluye que las marcas de clase también estas separadas por este valor, es decir zi=z1+(i−1) ⋅L para i=1 ,2 ,…,6. Usando el dato de la media, la cual se puede calcular usando las frecuencias relativas y las marcas de clase obtenidas como

z=∑i

6

zi ⋅ f i=∑i=1

6

(z¿¿1+ ( i−1 ) ⋅L)⋅ f i=z1+L∑i

6

(i−1)⋅ f i¿

z=z1+L (0⋅ 0.12+1 ⋅0.45+2 ⋅0.25+3 ⋅0.10+4 ⋅0.05+5 ⋅0.03 )=z1+1.6 ⋅L

Podemos despejar L y así obtener las demás marcas de clase. Por tanto, debemos usar la igualdad

15.20=8+1.6 ⋅L⇒L=15.20−81.6

=4.5

Por tanto, las marcas de clase para Z, y sus cuadrados son

i 1 2 3 4 5 6

z i 8 12.50 17 21.50 26 30.50

z i2 64 156.25 28

9 462.25 676 930.25

Así, podemos calcular la varianza de Z con la fórmula

Page 2: ejercicios probabilidad y estadistica

sZ2=∑

i

6

zi2⋅ f i−( z )2=258.175−231.04=27.135⇒ sz=√27.135=5.21

Considerando que las variables Z y W se relacionan entre sí mediante

Z=1.02⋅W⇒W=0.98 ⋅ZLuego, tenemos que

w=0.98 ⋅ z=0.98 ⋅15.20=14.896 y sW=0.98 ⋅ sZ=0.98 ⋅5.21=5.1058

Por tanto, el intervalo de sueldos aceptables en el mes de Marzo en miles de pesos está dado por

I=[w−sW ;w−sW ]=[14.896−5.1058 ;14.896+5.1058 ]=[9.7902;20.0018 ]

2. Para poder entregar respuestas a los ítems de este ejercicio, podemos extender la tabla dada usando las definiciones de marca de clase, x i, y el hecho de que las frecuencias relativas pueden ser obtenidas a partir de las frecuencias relativas acumuladas. Además se puede agregar una columna con los productos entre las marcas de clase y las frecuencias relativas, otra columna con los cuadrados de las marcas de clase y una última con estos cuadrados multiplicados por las frecuencias relativas. Así tenemos que

Tiempo de permanencia x i f i F i x i⋅ f i x i

2 x i2⋅ f i

(min)[ 40 - 60 ] 50 0,1 0,1 5 2500 250[ 60 - 80 ] 70 0,4 0,5 28 4900 1960[ 80 - 100 ] 90 0,4 0,9 36 8100 3240

[ 100 - 120 ] 110 0,06 0,96 6,6 12100 726

[ 120 - 140 ] 130 0,04 1 5,2 16900 676Sumas 80,8 6852

a) Para determinar el intervalo de tiempo que define a las dueñas de casa normales debemos calcular la media y la varianza de los datos dados. De la columna que tiene el producto entre las marcas de clase y las frecuencias relativas podemos obtener directamente el promedio de los datos de la fila sumas, es decir

x=∑i=1

5

x i ⋅ f i=80,8

Por otro lado, considerando la fila sumas intersectada con la columna que posee el producto entre el cuadrado de las marcas de clase y las frecuencias relativas, obtenemos el valor de

Page 3: ejercicios probabilidad y estadistica

∑i=1

5

x i2 ⋅ f i=6852

De donde la varianza de los datos es

sX2=∑

i=1

5

x i2⋅ f i−( x )2=6852−80,82=323,36⇒ sX=√323,36=17,98

Por tanto, el intervalo solicitado viene dado por

I=[ x−1,3 ⋅ sX ; x+1,3 ⋅s X ]=[80,8−1,3 ⋅17,98 ;80,8+1,3 ⋅17,98 ]

I=[57,43 ;104,17]

Así, una dueña de casa que demore entre 57,43 y 104,17 minutos en realizar sus compras en el supermercado se considera normal.

b) Aquí se debe calcular la cantidad de dueñas de casa que se consideran apuradas. Para esto podemos obtener el porcentaje que se acumula hasta el límite superior del intervalo calculado en a). Notamos que éste límite inferior se encuentra en el primer intervalo de clase, y como este intervalo acumula el f 1=10% del total de los datos, usamos la siguiente regla de tres

10% ⟵ 60−40=20

x ⟵ 57,43−40=17,43De donde

x=17,43 ⋅10%20

=8,715%

Por tanto, hasta el valor 57,43 se acumula un 8,715%. De esta manera sabemos que el 8,715% del total de las encuestadas corresponde a las dueñas de casa apuradas, esto es 8,715%⋅200=17,43≈18 dueñas de casa. Finalmente, para encuestar al 25% de ellas es necesario realizar 18 ⋅25%=4 ,5≈5 encuestas.

3. Las soluciones serían

a) Primero calculamos la cantidad de personas que tendrían como sueldo entre 63 y 72 dólares. Notando que 63 se encuentra en el segundo intervalo de clase, podemos obtener el número de personas que ganan entre 63 y 70 dólares mediante la siguiente regla de tres

10 ⟵ 70−60=10

Page 4: ejercicios probabilidad y estadistica

x ⟵ 70−63=7

De donde x=7 personas reciben un sueldo semanal de entre 60 y 63 dílares. Así mismo, debemos calcular la cantidad de personas que ganan entre 70y 72 dólares semanales. Para esto planteamos la regla de tres

8 ⟵ 80−70=10

y ⟵ 72−70=2

Por lo que y=1,6 personas reciben entre 70 y 72 dólares semanales. Esto significa que x+ y=8,6 personas reciben la bonificación de 20 dólares semanales.

Realizando un procedimiento similar para saber cuántas personas reciben 7 dólares de bonificación, es decir las que ganan entre 85 y 93 dólares semanales, debemos plantear las siguientes reglas de tres

6 ⟵ 90−80=10y

3 ⟵ 100−90=10

u ⟵ 90−85=5 v ⟵ 93−90=3 Queda que u=3 y v=0,9, de donde u+v=3,9 personas reciben la bonificación de 7 dólares semanales.

En general afirmamos que un total de 8,6+3,9=12,5 personas reciben bonificación, para éstas personas el promedio de esa bonificación es de

Bon. Prom.=8,6 ⋅20+3,9⋅ 712,5

=15,944dólares .

En general, considerando que en la muestra hay 32 datos de trabajadores, la bonificación promedio sobre el conjunto completo es de

BP=8,6 ⋅20+3,9 ⋅732

=6,64dólares

Se presupone que ésta bonificación es semanal (no lo dice).

b) Para calcular una medida de variabilidad de los sueldos en la sucursal de Santiago, variable que denotaremos por X , podemos completar la tabla dada con la marca de clase, la frecuencia relativa, el producto entre éstos dos, el cuadrado de la marca de clase y por último el producto entre este cuadrado y la frecuencia relativa, como sigue

Sueldos Número de trabajadore

s (ni)x i f i x i⋅ f i x i

2 x i2⋅ f i(dólares)

Page 5: ejercicios probabilidad y estadistica

[ 50 - 60 ] 5 55 0,156 8,59 3025 472,66

[ 60 - 70 ] 10 65 0,313 20,31 4225 1320,31

[ 70 - 80 ] 8 75 0,250 48,75 5625 1406,25

[ 80 - 90 ] 6 85 0,188 15,94 7225 1354,69

[ 90 - 100 ] 3 95 0,094 8,91 9025 846,09

Sumas 72,5 5400

De aquí, es claro que el sueldo promedio, sin considerar la bonificación es de

x=∑i=1

5

x i ⋅ f i=72,5dólares

Además, la varianza sería

sX2=∑

i=1

5

x i2⋅ f i−( x )2=5400−75,52=143,75⇒ sX=√143,5=11,99 dólares

Por otro lado, de los datos referentes a los sueldos en el extranjero, que denotaremos por la variable Y , tenemos que, sin considerar bonificaciones

y=1000dólares y además sY2=200dólares

Teniendo en cuenta que la bonificación sólo modifica la media de ambas variables bajo estudio, considerando bonificaciones, se tiene

xB=72,25+6,64=78,89 y además yB=1000+70=1070

Para compara variabilidad podemos usar el coeficiente de variación, quedando

C .V .XB=sX

xB=11,9978,89

=0,152 y C .V .YB=sYyB

= 2001070

=0,187

Así, al ser C .V .XB<C .V .YB, se concluye que los sueldos en Santiago resultan ser más homogéneos.

4. Para resolver los ejercicios planteados en este problema podemos extender la tabla dada como se muestra a continuación

Límites de intervalo Frecuencia (n i) x i N i f i F i x i⋅ f i3,75 - 5,95 2 4,85 2 0,05 0,05 0,245,95 - 8,15 4 7,05 6 0,10 0,15 0,718,15 - 10,35 10 9,25 16 0,25 0,40 2,31

10,35 - 12,55 16 11,45 32 0,40 0,80 4,58

Page 6: ejercicios probabilidad y estadistica

12,55 - 14,75 6 13,65 28 0,15 0,95 2,0514,75 - 16,95 2 15,85 40 0,05 1,00 0,79

Total 40 10,68

a) Como nos encontramos frente a 40 datos, el 12% de ellos corresponde a 4,8≈5 datos, lo cuales deben ser removidos de ambos extremos, es decir, debemos considerar la siguiente tabla, a la cual se le extiende adecuadamente para calcular la media solicitada

Límites de intervalo Frecuencia (n i) x i f i x i⋅ f i5,95 - 8,15 1 7,05 0,0

3 0,24

8,15 - 10,35 10 9,25 0,33 3,08

10,35 - 12,55 16 11,45 0,53 6,11

12,55 - 14,75 3 13,65 0,1 1,37Totales 30 10,79

De donde es claro que la media ajustada al 12% está dada por

x ajustada=10,79

b) De los datos originales, notaos que la mediana se encuentra en el cuarto intervalo de clase, por lo que la calculamos usando la siguiente fórmula, considerando que el largo del intervalo A=2,2, el límite inferior del cuarto intervalo de clase es L I 4=10,35 y los datos obtenidos al principio, quedando

Me=L I 4+

N2

−N3

n4⋅ A=10,35+ 20−16

16⋅2,2=10,9

Notando además que de la tabla hecha antes de a) que x=10,68, tenemos que

x<x ajustada<Me

De dónde concluimos que efectivamente se cumple la afirmación.

5. Si consideramos los datos entregados, y llamamos por Y a la variable edad de las trabajadoras podemos calcular los mismos datos entregados para las edades de los trabajadores, como sigue

Page 7: ejercicios probabilidad y estadistica

∑i=1

15

yi=31,1+39,8+37,1+24,3+32,0+27,5+27,6+26,5+33,3+24,4+29,8+38,7+44,6+35,1+37,3=489,1años

∑i=1

15

yi2=31,12+39,82+37,12+24,32+32,02+27,52+27,62+26,52+33,32+24,42+29,82+38,72+44,62+35,12+37,32=16464,85año s2

a) Notando que para X tenemos N X=25 datos y que para Y tenemos NY=15 datos, para la empresa completa tenemos N=N X+N y=40 datos. Luego podemos calcular la desviación estándar de la empresa usando la fórmula

s2=∑i=1

40 z i2

40−( z )2=

∑i=1

25

x i2+∑

i=1

15

y i2

40−(∑i=1

25

x i+∑i=1

15

y i

40 )2

s2=24757,27+16464,8540

−(780,9+489,140 )2

=22,49

Esto significa que la desviación estándar de los años de los trabajadores, sin importar sexo, es de s=√22,49=4,74 años.

b) Para realizar la comparación requerida es necesario calcular las desviaciones estándar de X e Y , cálculos que se muestran a continuación

sX2 =

∑i

25

xi2

25−(∑i

25

xi

25 )2

=2475725

−( 780,925 )2

=14,60⇒ sX=3,82

sY2=

∑i

15

y i2

15−(∑i

5

y i

15 )2

=16464,8515

−( 489,115 )2

=34,46⇒ sY=5,87

De aquí se concluyesX<s<sY

Así, concluimos que las edades de las trabajadoras tienen mayor variabilidad con respecto de los trabajadores, e incluso esa variabilidad es mayor cuando se compara con la del grupo completo. Lo contrario ocurre con las edades de los trabajadores, que están menos dispersas y por tanto tienen menor variabilidad.