trabajo estadistica iii toñito.pdf

211
“Año de la Inversión para el Desarrollo Rural y la Seguridad Alimentaria” Universidad Nacional Mayor de San Marcos (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE CIENCIAS ECONÓMICAS CURSO : ESTADÍSTICA III PROFESOR : ISABEL LÁZARO ARANDA INTEGRANTES: MONTES PAUCAR ROLLER HINO FASANANDO CHÁVEZ REITER ANTONIO Ciudad Universitaria, 11 de Julio del 2013

Upload: tono-fasanando

Post on 31-Jan-2016

220 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: trabajo estadistica III toñito.pdf

“Año de la Inversión para el Desarrollo Rural y la Seguridad Alimentaria”

UUnniivveerrssiiddaadd NNaacciioonnaall MMaayyoorr ddee

SSaann MMaarrccooss

((UUnniivveerrssiiddaadd ddeell PPeerrúú,, DDEECCAANNAA DDEE AAMMÉÉRRIICCAA))

FFAACCUULLTTAADD DDEE CCIIEENNCCIIAASS EECCOONNÓÓMMIICCAASS

CUURRSSOO : ESTADÍSTICA III

PROFESOR : ISABEL LÁZARO ARANDA

INTEGRANTES: MONTES PAUCAR ROLLER HINO

FASANANDO CHÁVEZ REITER ANTONIO

Ciudad Universitaria, 11 de Julio del 2013

Page 2: trabajo estadistica III toñito.pdf

Con mucho aprecio para la

profesora Isabel Lázaro que con su experiencia en la materia nos forja

para ser economistas que el mundo necesita y no economistas que el

mundo espera.

Page 3: trabajo estadistica III toñito.pdf

Ciudad Universitaria, 11 de Julio del 2013

Trabajo de Aplicación 1) Nombre del Tema

‘’Influencia de la alimentación en el rendimiento académico en la facultad de administración de las bases 2009, 2010 y 2011’’

2) Objetivos - Dar a conocer el nivel de ingreso disponible de los estudiantes de la facultad de economía y el

tiempo que le dedican a los estudios y trabajo.

- Verificar si existe una relación entre el ingreso disponible y las horas de estudio que le

dedican a la facultad.

- Observar si existe relación entre trabajo y rendimiento académico.

- El propósito de este estudio fue investigar la influencia de la alimentación en el rendimiento

académico de los estudiantes de la facultad de administración bases 2009, 2010 y 2011. El

estudio se llevó a cabo en una muestra representativa de 100 alumnos que llevan la carga

académica regular correspondiente.

Para analizar la variable independiente, hábitos alimenticios, se desarrollan indicadores que

representan elementos implícitos de la variable, los cuales son: horario de alimentación, tipos

de alimentos que se consume, consumo de comida rápida, cantidad de comida que se

consume, y el fenómeno del ayuno. La variable de rendimiento académico incluye los

indicadores: calificaciones, carga académica, horarios de estudio y estrés. Para evaluar dichos

indicadores, se distribuyó una encuesta que incluye diversos ítems correspondientes a cada

uno de ellos, del cual se obtuvieron resultados que demostraban que, a pesar de tener el

Page 4: trabajo estadistica III toñito.pdf

conocimiento de los elementos y la necesidad de llevar adecuados hábitos alimenticios, los

estudiantes no siempre los ponen en práctica, pero a la vez, no se encontró evidencia de que

esto tenga efecto alguno sobre su rendimiento académico. Por muchos años se han llevado a

cabo varios estudios científicos alrededor de un tema que indudablemente plantea muchas

interrogantes que hasta el momento no se han podido despejar, refiriéndose al tema sobre la

relación que tienen los hábitos alimenticios y el rendimiento académico, y ciertos fenómenos

que otros han tomado en cuenta como factores que pueden llegar a influir en estos.

La investigación de la influencia de los alimentos en la salud es un ámbito en el que

administraciones públicas y organismos internacionales están volcando cada día más sus

esfuerzos, desarrollando directrices, normativas y políticas al respecto. Para la Organización

Mundial de la Salud (OMS), la alimentación resulta determinante en la prevención de las

enfermedades que constituyen la primera causa de muerte en los países desarrollados. Sin

embargo, a pesar de las campañas informativas y las acciones puestas en marcha por

instituciones de salud pública, aún existen numerosas propuestas sin base científica que

confunden y desinforman a los consumidores. Los estudiantes que buscan superar sus

exámenes finales deberían tener más cuidado con lo que comen, ya que una nueva

investigación ha desvelado una evidente correlación entre una dieta sana y mejores notas.

3) Variables

3.1) Cualitativas

1.- Sexo

2.- Lugar de residencia

3.- Trabajo

Page 5: trabajo estadistica III toñito.pdf

4.- Estado civil

5.- Deficiencia o enfermedad

6.- Interferencias en tu rendimiento académico

7.- Alimentación completa

8.- Nivelación en los cursos de carrera

9.- Rendimiento académico

10.- Alimentación fuera de las horas

11.- Servicio de la universidad

12.- Dieta

3.2) Cuantitativas

13.- N° Tiempo que le dedicas a la ingestión de alimentos

14.- N° de horas de trabajo

15.- Ingreso personal mensual

16.- Ingreso familiar mensual

17.- N° de horas de estudio (semanal)

18.- Edad

19.- Gasto personal mensual

20.- Gasto familiar

21.- Tiempo que viaja para llegar a la universidad (minutos)

22.- Horas de descanso

23.- N° de cursos que lleva

24.- Tiempo de preparación o compra de almuerzo

Page 6: trabajo estadistica III toñito.pdf

4) Diseño de la encuesta.

Datos Generales.

1) Sexo: Masculino Femenino

2) Edad

3) ¿Actualmente trabajas?

4) ¿Cuántas horas a la semana le dedicas a estudiar?

5) ¿Has tenido alguna deficiencia o enfermedad estomacal?

Si

No

6) Si la respuesta fue Sí ¿Cuántas veces esto ha interferido en tu rendimiento académico?

7) ¿Cuánto es tu ingreso personal mensual?

8) ¿Cuánto es tu gasto personal mensual?

“Año de la inversión para el desarrollo rural y la seguridad alimentaria”

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA)

Page 7: trabajo estadistica III toñito.pdf

9) ¿Cómo calificarías tu rendimiento académico?

Bueno

Regular

10) ¿Comes tus tres comidas al día?

Si

No

11) ¿Estás nivelado en los cursos de tu ciclo?

Si

No

12) ¿Vas al comedor frecuentemente?

Si

No

13) ¿Además de las 3 comidas al día, ingieres algo más?

Si

No

14) ¿Lugar de Nacimiento?

Capital

Provincia

15) ¿Lugar de Residencia?

Distrito Populoso

Distrito Residencial

16) ¿Vives en pensión?

Page 8: trabajo estadistica III toñito.pdf

Si

No

17) ¿Qué tipo de dieta sigues?

Saludable

Poco saludable

18) ¿Cuánto tiempo te demoras en llegar a la universidad?

1 hora

Más de 1 hora

19) ¿Cuál es tu ingreso familiar mensual?

20) ¿A cuánto asciende su gasto familiar mensual?

21) ¿Cuánto tiempo al día consumes en la ingestión de alimentos?

22) ¿Cuánto tiempo le dedicas a tu descanso?

23) ¿Qué cantidad de cursos llevas actualmente?

24) ¿Cuánto en promedio gastas en la preparación o compra de tu almuerzo?

Page 9: trabajo estadistica III toñito.pdf

5) Diseño Muestral

5.1) Marco Muestral Para los objetivos planteados en la primera parte de este trabajo, se eligieron 3 bases

de la facultad de administración de la Universidad Nacional Mayor de San Marcos, para evaluar

en ellas a los estudiantes y estudiarlas como diferentes estratos. Dichas bases son la base

2009, la base 2010 y la base 2011.

Para obtener el número total de estudiantes que hay en las bases anteriormente mencionadas

nosotros hemos pedido dicha información a la escuela de administración.

5.2) Piloto Para la determinación del tamaño de muestra óptimo, realizamos primero una encuesta

piloto, con una sola pregunta para 100 estudiantes de cada base elegidos completamente al

azar. La única pregunta que les hicimos fue la referente a su ingreso o presupuesto mensual.

De esta manera preguntamos a 300 estudiantes de las bases mencionadas anteriormente,

obteniendo los siguientes resultados:

Sea

Población de la base 09 N1=265 Población de la base 10 N2=273 Población de la base 11 N3=383 Población total NT=921

NOTA: Los datos(N) son reales

Page 10: trabajo estadistica III toñito.pdf

6) Datos de las bases

Base 09

350 120 250 300 450 400 480 320 490

180 210 270 240 400 650 370 210 260

230 300 250 300 350 550 290 480 350

280 600 300 300 500 450 410 320 270

360 40 180 400 300 300 190 340 340

450 500 350 400 300 250 400 240 280

220 100 250 300 500 400 190 210 180

250 380 300 350 350 330 390 300 310

350 400 230 400 600 430 180 410 400

380 300 280 650 600 520 510 300 310

300 250 290 190 430 320 240 480 270

450

338.8

N=265

Base 10

350 500 310 270 100 180 450 270 500

500 450 400 320 280 170 380 350 480

100 240 350 280 150 230 420 500 300

250 360 300 320 230 260 370 350 420

270 400 370 700 250 170 230 500 200

320 480 150 400 270 190 300 200 250

600 500 420 300 120 280 350 380 280

200 340 300 420 200 480 450 400 460

400 300 500 180 150 310 200 350 450

500 240 600 250 350 340 420 500 350

250 200 350 480 510 270 180 620 260

Page 11: trabajo estadistica III toñito.pdf

330

N=273

Base 11

420 800 200 120 600 230 500 330 450

260 80 180 100 400 200 410 350 440

180 240 250 310 480 180 350 450 560

450 300 250 80 450 300 240 350 340

320 500 100 150 600 450 100 600 280

280 180 200 60 420 550 400 150 320

200 600 150 150 300 250 430 160 310

200 350 200 250 550 200 650 340 210

350 150 200 150 620 350 250 210 230

330 250 150 500 450 200 300 350 300

290 460 220 290 580 170 310 170 190

280

N=383

Page 12: trabajo estadistica III toñito.pdf

230 300 250 300 350 550 290 480 350

280 600 300 300 500 450 410 320 270

360 40 180 400 300 300 190 340 340

450 500 350 400 300 250 400 240 280

220 100 250 300 500 400 190 210 180

250 380 300 350 350 330 390 300 310

350 400 230 400 600 430 180 410 400

380 300 280 650 600 520 510 300 310

300 250 290 190 430 320 240 480 270

450

350 500 310 270 100 180 450 270 500

500 450 400 320 280 170 380 350 480

100 240 350 280 150 230 420 500 300

250 360 300 320 230 260 370 350 420

270 400 370 700 250 170 230 500 200

320 480 150 400 270 190 300 200 250

600 500 420 300 120 280 350 380 280

200 340 300 420 200 480 450 400 460

400 300 500 180 150 310 200 350 450

500 240 600 250 350 340 420 500 350

250 200 350 480 510 270 180 620 260

330

420 800 200 120 600 230 500 330 450

260 80 180 100 400 200 410 350 440

180 240 250 310 480 180 350 450 560

450 300 250 80 450 300 240 350 340

320 500 100 150 600 450 100 600 280

280 180 200 60 420 550 400 150 320

200 600 150 150 300 250 430 160 310

200 350 200 250 550 200 650 340 210

350 150 200 150 620 350 250 210 230

330 250 150 500 450 200 300 350 300

290 460 220 290 580 170 310 170 190

280

Page 13: trabajo estadistica III toñito.pdf

- Juntamos estratos.

Estratos hN h

2

hS

Base 09 265 338.8 5185.82

Base 10 273 336.6 5559.57

Base 11 383 312.9 5911.67

- Error relativo de muestreo máximo permisible y nivel de confianza.

Error relativo de muestreo máximo

permisible

Nivel de confianza

90% 95% 99%

1% Roller Montes Paucar

240 255 272

3% Reiter Fasanando Chávez

93 117 157

5% Kevin Monteza Pacheco

42 56 85

Page 14: trabajo estadistica III toñito.pdf

Afijación de Neyman:

1

h hh L

h h

h

N Sn n

N S

Trabajaremos con el 99% de confianza y un error relativo máximo permisible del 3%:

√ √ √

n1=44

√ √ √

n2=47

√ √ √

n3=68

Por lo tanto, para ejecutar la encuesta, se trabajará con el siguiente tamaño de muestra para cada estrato:

Base 09: n=44

Base 10: n=47

Base 11: n=68

Luego de haber hecho la afijación de Neyman obtenemos los valores óptimos para poder hacer nuestra encuesta.

Page 15: trabajo estadistica III toñito.pdf

MONTES PAUCAR ROLLER HINO

VARIABLES

- CONSIDERACION DEL RENDIMIENTO ACADÉMICO

- HORAS DE ESTUDIO SEMANAL

Page 16: trabajo estadistica III toñito.pdf

Análisis de la variable como consideras tu rendimiento académico en la universidad

- Prueba de hipótesis para la proporción poblacional

Analizando la población 2, es decir, la base 09, tenemos este dato inicial, el cual representa la proporción muestra de alumnos que piensa que su promedio es bueno es 0.32. Con esto, formularemos nuestra hipótesis que dice que el promedio de lo de alumnos de la base 09 debería de ser de 0.50 con un nivel de confianza del 95%.

1) Planteamiento de la hipótesis:

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.

3) Nivel de significación:

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -1.64 Z = -1.14

Page 17: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Se observa que Z esta en la RA, se acepta la hipótesis nula y tenemos que la proporción poblacional de alumnos de la base 09 que piensa que su promedio académico es bueno es igual al 0.4

- Prueba de hipótesis para la diferencia de proporciones poblacionales

Analizando las poblaciones de la base 10 y 11 de la facultad de Administración, tenemos que la proporción de alumnos que piensa que su promedio es bueno es igual a 0.27 y 0.26 respectivamente. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas bases son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 10 que tiene esta opinión con respecto a su promedio es mayor que la de base 11. Px= base 11 Py= base 11 0

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H P P

H P P

2) Función Pivotal:

ˆ ˆ( ) ( )(0,1)

(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

3) Nivel de significación:

5% 1.64Z

Page 18: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z=0.12 Z = 1.64

5) Toma de decisiones:

Tenemos que Z se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la proporción poblacional de alumnos de la base 10 que piensa que su promedio es bueno es igual al de los alumnos de la base 11.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si la opinión respecto a como consideran su promedio los alumnos de la base 09 respecto al sexo de los mismos. Por lo tanto, nuestra hipótesis nula la opinión que tiene los alumnos con respecto a sus promedios con relación al sexo. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

Como consideras

tu promedio

Sexo

Masculino

Femenino

Bueno 8 6 regular 16 14 Total 24 20

1) Planteamiento de la hipótesis:

: El rendimiento académico y el sexo son independientes

Page 19: trabajo estadistica III toñito.pdf

: están relacionados o son dependientes 2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 2 (número de filas) C=2 (número de columnas)

3) Nivel de significación:

[ ] [

]=0.01

x=6.63

Frecuencias esperadas:

Como consideras

tu promedio

Sexo

Masculino

Femenino

Bueno 8 7 regular 16 13 Total 24 20

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

Page 20: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

……0.22Q=6.63

5) Toma de decisiones:

Tenemos que Q se encuentra en RA. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que el rendimiento académico y el sexo son independientes.

- Prueba de Homogeneidad (no paramétrica).

En esta sección vamos a analizar si los alumnos de las bases 09, 10 y 11 si son homogéneas con respecto a su rendimiento académico. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

Opinión sobre el destino de dicho aporte

Bases

Base 09 Base 10 Base 11 Total

Bueno 14 13 18 45 regular 30 34 50 114 Total 44 47 68 159

Page 21: trabajo estadistica III toñito.pdf

1) Planteamiento de la hipótesis:

{

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

[ ] [

]

x=5.99

Frecuencias esperadas:

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

Opinión sobre el

destino de dicho aporte

Bases

Base 09 Base 10 Base 11 Total

Bueno 13 13 20 45 Regular 31 34 48 114

Total 44 47 68 159

Page 22: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

0.39 5.99

5) Toma de decisiones:

Tenemos que Q se encuentra en la RA. Por lo tanto, se aceptar la hipótesis nula. Entonces aceptamos que los alumnos de las bases 09, 10 y 11 son homogéneos con respecto a su rendimiento académico.

Análisis de la variable horas de estudio semanal

- Prueba de hipótesis para la media poblacional.

Analizando la población de la base 09, tenemos la siguiente información para la variable horas

de estudio semanal con esto, formularemos nuestra hipótesis que dice que media poblacional de las horas de estudio semanal deben ser 10.

1) Planteamiento de la hipótesis:

{

2) Función Pivotal:

(0,1)X

Z NS n

Page 23: trabajo estadistica III toñito.pdf

√ √

3) Nivel de significación: 5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = 1.64Z=4.46

5) Toma de decisiones:

Tenemos que Z=4.46. Por lo tanto, se rechazamos la hipótesis nula y tenemos que las horas de estudio semanal son mayoras que de 10.

- Prueba de hipótesis para la diferencia de medias poblacionales.

Analizando las bases 10 y 11, es decir, tenemos que la media muestral y la varianza muestral

de las horas es estudio es:

respectivamente.

Con esto formulamos nuestra hipótesis que ambas son bases son iguales y como hipótesis alternativa, que la media poblacional de la base 10 es mayor que el de la base 11.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H

H

2) Función Pivotal:

( ) ( )

Page 24: trabajo estadistica III toñito.pdf

3) Nivel de significación:

5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = 0.42 Z = 1.64

5) Toma de decisiones:

Tenemos que Z se encuentra en RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que las medias poblaciones del número de horas de estudio de los alumnos de la base 10 y 11 son iguales.

- Prueba de hipótesis para la varianza poblacional.

De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del número de

horas de estudio de los alumnos de la base 09 es entonces planteamos la hipótesis

nula que la varianza horas de estudio mensual es igual a 20, y como hipótesis alternativa, que ésta es diferente de 20. Todo esto con un nivel de significación del 5%.

Page 25: trabajo estadistica III toñito.pdf

1) Planteamiento de la hipótesis:

{

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

3) Nivel de significación: 5%

[ ⁄

]

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V = 54.39 63

5) Toma de decisiones:

Tenemos que V pertenece a la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza del número de horas de estudio debe de ser 20. De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del número de

horas de estudio de los alumnos de la base 10 es entonces planteamos la

Page 26: trabajo estadistica III toñito.pdf

hipótesis nula que la varianza horas de estudio mensual es igual a 20, y como hipótesis alternativa, que ésta es diferente de 20. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

{

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

3) Nivel de significación: 5%

[ ⁄

]

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

29.2 V = 55.36

5) Toma de decisiones:

Tenemos que V se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza del número de horas de estudio debería de ser 20.

Page 27: trabajo estadistica III toñito.pdf

De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del número de

horas de estudio de los alumnos de la base 11 es entonces planteamos la

hipótesis nula que la varianza horas de estudio mensual es igual a 20, y como hipótesis alternativa, que ésta es diferente de 20. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

{

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

3) Nivel de significación: 5%

[ ⁄

]

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V = 66.50 91.5

5) Toma de decisiones:

Page 28: trabajo estadistica III toñito.pdf

Tenemos que V se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza del número de horas de estudio debería de ser 20. Finalmente tenemos que la varianza de esta variable es igual en todos los estratos.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si existe interdependencia entre el sexo y las horas de estudio semanal de la base 09 de la facultas de ciencias económicas. Para lo cual la variable horas de estudio se categorizado de la siguiente manera: muchas (16-a mas) regulares (9-15) y pocas de (0-8) horas. Todo esto con un nivel de significación del 1%.

1) Planteamiento de la hipótesis:

{

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 3(número de filas) C= 2(número de columnas)

3) Nivel de significación:

[ ] [

]

X=9.21

Horas de estudio semanal

Sexo

Masculino Femenino Total

Muchas 8 7 15

Regular 10 12 22

Pocas 6 1 7

Total 24 20 44

Page 29: trabajo estadistica III toñito.pdf

Frecuencias esperadas:

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

4.) Determinación de la región crítica (RR) y la región de aceptación (RA):

3.06 Q = 9.21

5.) Toma de decisiones: Tenemos que X se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que el sexo y las horas de estudio son independientes.

- Prueba de Homogeneidad (no paramétrica).

Horas de estudio semanal

Sexo

Masculino Femenino Total

Muchas 8 7 15

Regular 12 10 22

Pocas 4 3 7

Total 24 20 44

Page 30: trabajo estadistica III toñito.pdf

En esta sección vamos a analizar si los alumnos de las bases 09, 10 y 11 con respecto a las horas de estudio si existe homogeneidad. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

{

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

[ ] [

]

X=9.49

Frecuencias esperadas:

Horas de estudio

Bases

Base 09 Base 10 Base 11 Total

Muchas 15 16 24 55 Regular 22 27 38 87 Pocas 7 4 6 17 Total 44 47 68 159

Horas de estudio

Bases

Page 31: trabajo estadistica III toñito.pdf

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

1.37 Q =9.49

Base 09 Base 10 Base 11 Total

Muchas 15 16 24 55 Regular 24 26 37 87 Pocas 5 5 7 17 Total 44 47 68 159

Page 32: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Témenos que Q se encuentra en la RA. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que los alumnos de las bases 09, 10 y 11 son homogéneas con respecto a las horas de estudio

- Análisis de Varianza (ANAVA).

En esta sección si las horas de estudio para las tres bases es el mismo o si es diferente en al menos una de las tres bases Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales.

1) Planteamiento de la hipótesis:

0 1 2 3

1 1

:

: No todos los son iguales

H

H

2) Determinación del nivel de confianza.

1 (2,725)5% 3.02F

3) Formulación de la función pivotal.

2

( 1)

( 1, )2

( )

( 1)

( )

k

k n k

n k

X k CMCF F

X n k CME

1

SCCCMC

k

Cuadrado medio entre tratamientos (columnas)

SCE

CMEn k

Cuadrado medio dentro de los tratamientos (error)

4) Construcción de la tabla de análisis de varianza (ANAVA).

M1 M2 M3 Total

Total 589 687 968 2244

Page 33: trabajo estadistica III toñito.pdf

in 44 47 68 159

iX 13.38 14.61 14.23 14.08

2

i in X 7877.07 10032.25 13769.52 31678.84

Suma de cuadrados:

Con estos datos, realizamos nuestra tabla de análisis de varianza:

Fuente de variación

Suma de cuadrados Grados

de libertad

Cuadrado medio

Razón 0H

Entre tratamiento

s (columnas)

1

2

g k

g

3.46 i

Dentro de los

tratamientos (error)

Total

∑∑

Page 34: trabajo estadistica III toñito.pdf

5) Determinación de la región crítica (RR) y la región de aceptación (RA)

F =3.023.46

6) Toma de decisiones:

Tenemos que X pertenece a la RR. Por lo tanto rechazamos la hipótesis nula. Concluimos que las tres bases tienen diferentes horas de estudio semanal.

- Prueba de la bondad de ajuste (no paramétrica).

En esta sección verificaremos las notas promedio de los alumnos de la base 10 si sigue una distribución de normal con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:

Número de escalas

Número de alumnos

[0-10> 14 [10-15> 16 [15-20> 13 [20-25> 4

Total 47 Además, tenemos que :

1) Planteamiento de la hipótesis:

{

Page 35: trabajo estadistica III toñito.pdf

2) Función Pivotal:

22

( 1)

1

( )ki i

k m

i i

o eQ X

e

3) Nivel de significación:

[ ] [

]

X=5.99

Frecuencias esperadas:

iP io

2( )i i

i

o e

e

[0-10> [-2.9,-0.94> 0.17174 8.07178 14 [10-15>

[-0.94,0.077> 0.35827 16.83869 16

[15-20>

[0.077,1.097> 0.33245 15.62515 13

[20-25>

[1.097,2.11> 0.11824 5.55728 4

1 47

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

5.3342 5.99

Page 36: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Témenos que Q pertenece a RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que las horas de estudio semanal de los alumnos de la base 10 sigue una distribución de probabilidad de tipo Normal, lo cual se podía ver a simple vista ya que no existía simetría en las frecuencias de los datos.

Page 37: trabajo estadistica III toñito.pdf

VARIABLES

- TIEMPO DE VIAJE A LA UNIVERSIDAD (CUANTITATIVA)

- SERVICIO DE LA UNIVERSIDAD (CUALITATIVA)

Page 38: trabajo estadistica III toñito.pdf

Análisis Estadístico

- Prueba de Hipótesis de la Media.

Analizando la muestra del estrato 1, Alumnos de la base 09 de la Facultad de Administración, obtenemos como dato inicial una media muestral 159091.42X minutos y una desviación

estándar muestral de 11424426.21S minutos. Con esto, formulamos nuestra hipótesis nula que dice que la media poblacional del tiempo de viaje a la Universidad es igual a 45 minutos, con un nivel de confianza del 95%.

1) Planteamiento de Hipótesis:

45:

45:

1

0

H

H

2) Función Pivotal:

(0,1)X

Z NS n

89.044/11424426.21

45159091.4200

ZZ

3) Nivel de Significación:

5% 1.64Z

4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

Z = -1.64 Z = -0.89

Page 39: trabajo estadistica III toñito.pdf

5) Toma de Decisiones:

Tenemos que RAZZZ 00 64.189.0 . Por lo tanto, se acepta la hipótesis nula y

tenemos que la media poblacional del tiempo de viaje a la Universidad es igual a 45 minutos.

- Prueba de Hipótesis de la Diferencia de Medias.

Analizando los estratos 1 y 3, es decir, los alumnos de la base 09 y 11 de la Facultad de Administración, tenemos que la media muestral y la desviación estándar muestral del tiempo de

viaje a la Universidad para las 2 bases es respectivamente: 159091.42X , 11424426.21xS ,

101449.37Y , 35090795.22yS . Con esto, formulamos nuestra hipótesis nula que las medias

poblacionales de ambas bases son iguales con un nivel de confianza del 95%.

1) Planteamiento de Hipótesis:

yx

yx

H

H

:

:

1

0

2) Función Pivotal:

)1,0(11

2

)1()1(

)()(

22N

nnnn

SnSn

YXZ

yxyx

yyxx

yx

21.6

69

1

44

1

26944

5630862.499)169(8113107.445)144(

101449.37159091.4200

ZZ

3) Nivel de Significación:

5% 1.64Z

4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

Page 40: trabajo estadistica III toñito.pdf

Z = 1.64 Z = 6.21

5) Toma de Decisiones:

Tenemos que RRZZZ 00 64.121.6 . Por lo tanto, la hipótesis nula se rechaza,

entonces, las medias poblacionales del tiempo de viaje de la base 09 y 11 respectivamente son diferentes. Siendo la media poblacional de la base 09 mayor que la media poblacional de la base 11.

- Prueba de Hipótesis de la Proporción.

Analizando el estrato 2, es decir, la base 10 de la Facultad de Administración, tenemos como dato inicial que la proporción de alumnos que utiliza los servicios de la Universidad es 5.0ˆ p .

Con esto, formulamos nuestra hipótesis nula que nos dice que la proporción poblacional de alumnos que utilizan los servicios de la Universidad es del 45% con un nivel de confianza del 95%

1) Planteamiento de la Hipótesis:

45.0:

45.0:

1

0

PH

PH

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

68.0

47

)5.01(5.0

45.05.000

ZZ

Page 41: trabajo estadistica III toñito.pdf

3) Nivel de Significación:

5% 1.64Z

4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

Z = 0.68 Z =1.64

5) Toma de Decisiones:

Tenemos que RAZZZ 00 64.168.0 . Por lo tanto, aceptamos la hipótesis nula y

tenemos que la proporción poblacional de alumnos de la base 10 que utilizan los servicios universitarios es del 50%.

- Prueba de Hipótesis para la Diferencia de Proporciones.

Analizando los estratos 1 y 3, es decir, los alumnos de la base 09 y 11 de la Facultad de Administración, tenemos que la proporción de alumnos que utiliza los servicios de la

Universidad es 57.0ˆ xp y 49.0ˆ yp . Con esto, formulamos nuestra hipótesis que nos dice que

las proporciones poblacionales de ambas bases son iguales con un nivel de confianza del 95%.

1) Formulación de hipótesis:

yx

yx

PPH

PPH

:

:

1

0

2) Función Pivotal:

ˆ ˆ( ) ( )(0,1)

(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

Page 42: trabajo estadistica III toñito.pdf

83.0

69

)49.01(49.0

44

)57.01(57.0

)49.057.0(00

ZZ

3) Nivel de Significación:

5% 1.64Z

4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

Z = 0.83 Z = 1.64

5) Toma de Decisiones:

Tenemos que RAZZZ 00 64.183.0 . Por lo tanto, aceptamos la hipótesis nula y

tenemos que las proporciones poblacionales de las bases 09 y 11 de la Facultad de Administración son iguales al tratarse de servicios universitarios.

- Prueba de Hipótesis de la Varianza.

Analizando la muestra del estrato 1, Alumnos de la base 09 de la Facultad de Administración, obtenemos como dato inicial una desviación estándar muestral de 11424426.21S minutos. Con esto, formulamos nuestra hipótesis nula que dice que la desviación estándar poblacional es igual a 22 minutos, con un nivel de confianza del 95%.

1) Formulación de Hipótesis:

484:

484:

2

1

2

0

H

H

Page 43: trabajo estadistica III toñito.pdf

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

607.39484

8113107.445)144(00

VV

3) Nivel de Significación:

8.26%5 2

)43(,025.0 X

4) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

V = 26.8 V = 39.607

5) Toma de Decisiones:

Tenemos que RRVVV 00 8.26607.39 . Por lo tanto, rechazamos la hipótesis nula y

tenemos que varianza poblacional de la base 10 de la Facultad de Administración es mayor a 484 minutos.

- Prueba de la Bondad de Ajuste.

Verificamos si la variable “tiempo de viaje a la Universidad” de la base 10 de la Facultad de Administración sigue una distribución Normal con un nivel de significación del 5%. Así, obtenemos como dato inicial la media muestral 148936.44X y desviación estándar

58604679.22S .

Page 44: trabajo estadistica III toñito.pdf

Tiempo de viaje a la Universidad

Número de alumnos

[ 0 , 20 > 1

[ 20 , 40 > 22

[ 40 , 60 > 12

[ 60 , 80 > 7

[80,100 > 3

[ 100 ,120 ] 2

47

1) Formulación de la Hipótesis:

H0: El tiempo de viaje a la Universidad sigue una distribución Normal H1: El tiempo de viaje a la Universidad no sigue una distribución Normal

2) Función Pivotal:

22

( 1)

1

( )ki i

k m

i i

o eQ X

e

3) Nivel de Significación:

05.0%5 2

1

2

)1( xXPxXP mk

x = 3.84

4) Frecuencias Esperadas:

[ , XA LX [ Z , ZA L iP ii Pe 47 io 2( )i i

i

o e

e

[ 0 , 40 > [ -1.95, -0.18> 0.40692 19.12524 23 0.7850236

[ 40 , 60 > [-0.18, 0.70> 0.32632 15.33704 12 0.7260746

[ 60 , 80 > [0.70,1.59> 0.18491 8.69077 7 0.3289355

[ 80 , 120 ] [1.59 , 3.36> 0.08186 3.84742 5 0.3452809

1 47 Q = 2.1853

5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

Page 45: trabajo estadistica III toñito.pdf

Q = 2.1853 Q =3.84

6) Toma de Decisiones:

Tenemos que RAQQQ 00 84.31853.2 . Por lo tanto, aceptamos la hipótesis nula y

decimos que la variable “tiempo de viaje a la Universidad” posee una distribución Normal para la base 09 de la Facultad de Administración.

- Prueba de Independencia.

En esta sección vamos a analizar si existe interdependencia entre el tiempo de viaje a la Universidad y el uso de los servicios universitarios por parte de la base 11 de la Facultad de Administración. Todo esto con un nivel de significación del 1%. La información de la encuesta se muestra a continuación:

Uso de los servicios

universitarios

Tiempo de viaje a la Universidad

[0, 20 > [ 20 ,40

> [ 40 , 60 > [ 60 , 80] [ 80 , 120 ] Total

Si 2 19 9 2 1 33

No 3 15 11 6 1 36

Total 5 34 20 8 2 69

Page 46: trabajo estadistica III toñito.pdf

1) Planteamiento de la Hipótesis: H0: El tiempo de viaje a la Universidad y el uso de los servicios universitarios son independientes. H1: El tiempo de viaje a la Universidad está relacionado con el uso de los servicios universitarios.

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde: F = número de filas C = número de columnas

3) Nivel de Significación:

01.0%1 2

4

2

)1)(1( xXPxXP CF

x = 13.3

4) Frecuencias Esperadas:

Uso de los servicios

universitarios

Tiempo de viaje a la Universidad

[0, 20 > [ 20 ,40

> [ 40 , 60 > [ 60 , 80] [ 80 , 120 ] Total

Si 2 16 10 4 1 33

No 3 18 10 4 1 36

Total 5 34 20 8 2 69

8875.20 Q

5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

Q = 2.8875 Q =13.3

Page 47: trabajo estadistica III toñito.pdf

6) Toma de Decisiones:

Tenemos que RAQQQ 00 3.138875.2 . Por lo tanto, se acepta la hipótesis nula y se

puede afirmar que el tiempo de viaje y el uso de los servicios universitarios son independientes entre si para la base 11 de la Facultad de Administración.

- Prueba de Homogeneidad.

En esta sección vamos a analizar si las base 09,10 y 11 de la Facultad de Administración son homogéneas con respecto al uso de los servicios universitarios. Todo esto con un nivel de significación del 5%. La información de la encuesta se presenta a continuación:

Servicios Universitarios

Bases

Base 09 Base 10 Base 11 Total

Si 25 24 34 83

No 19 23 35 77

Total 44 47 69 160

1) Planteamiento de la Hipótesis: H0: Las tres bases son homogéneas respecto al uso de los servicios universitarios. H1: Las tres bases son heterogéneas respecto al uso de los servicios universitarios.

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde: F = número de filas C = número de columnas

3) Nivel de Significación:

05.0%5 2

2

2

)1)(1( xXPxXP CF

Page 48: trabajo estadistica III toñito.pdf

x = 5.99

4) Frecuencias esperadas:

Servicios Universitarios

Bases

Base 09 Base 10 Base 11 Total

Si 23 24 36 83

No 21 23 33 77

Total 44 47 69 160

60.00 Q

5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA):

Q = 0.60 Q = 5.99

6) Toma de Decisiones:

Tenemos que RAQQQ 00 99.560.0 . Por lo tanto, se acepta la hipótesis nula y

afirmamos que las 3 bases de la Facultad de Administración en estudio, son homogéneas con respecto a los servicios universitarios utilizados por sus alumnos.

- Análisis de la Varianza.

En esta sección analizaremos si el tiempo promedio de viaje a la Universidad en las tres bases es el mismo o si es diferente en por lo menos una base. Para esto usaremos en análisis de la varianza, todo esto con un nivel de significación del 5%. Suponemos, en este caso, que contamos con poblaciones homoscedásticas, en otras palabras, que las varianzas poblacionales de las tres bases son iguales.

Page 49: trabajo estadistica III toñito.pdf

1) Planteamiento de la Hipótesis:

0 1 2 3

1 1

:

: No todos los son iguales

H

H

2) Determinación del Nivel de Significación:

0017.3%5 )157,2(1 F

3) Formulación de la Función Pivotal:

2

( 1)

( 1, )2

( )

( 1)

( )

k

k n k

n k

X k CMCF F

X n k CME

1

SCCCMC

k

Cuadrado medio entre tratamientos (columnas)

SCE

CMEn k

Cuadrado medio dentro de los tratamientos (error)

4) Construcción de la tabla de análisis de la varianza (ANAVA):

Base 09 Base 10 Base 11 Total

Total 1855 2075 2560 6490

in 44 47 69 160

iX 42.159091 44.148936 37.101449 40.5625

2

i in X 78205.11397 91609.04185 94979.70874 264793.8646

625.263250)5625.40(160 22 Xn

Suma de Cuadrados:

375.78149625.2632503414001 1

22

k

i

n

j ij

i

XnXSCT

2396.1543625.2632508646.2647932

1

2 XnXnSCC

k

i ii

Con estos datos, realizamos nuestra tabla de análisis de varianza:

Page 50: trabajo estadistica III toñito.pdf

Fuente de variación

Suma de cuadrados Grados

de libertad

Cuadrado medio

Razón 0H

Entre tratamientos (columnas)

2

1

2 XnXnSCCk

i ii

2396.1543SCC

1

2

g k

g

6198.771

1

CMC

k

SCCCMC

58.10

0

F

CME

CMCF

i

Dentro de los

tratamientos (error) 1354.76606

2396.1543375.78149

SCE

SCE

SCCSCTSCE

157

g

kng

9372.487

CME

kn

SCECME

Total

k

i

n

j ij

i

XnXSCT1 1

22

375.78149SCT

159g

5) Determinación de la Región Crítica (RR) y la Región de Aceptación (RA): F = 1.58 F = 3.0017

6) Toma de Decisiones:

Tenemos que RAFFF 00 0017.358.1 . Por lo tanto, aceptamos la hipótesis nula y

podemos afirmar que el promedio de tiempo de viaje a la Universidad por parte de las tres bases es el mismo.

Page 51: trabajo estadistica III toñito.pdf

VARIABLES

- NÚMERO DE HORAS DEDICADAS A ESTUDIAR (SEMANAL) - SITUACIÓN LABORAL

Page 52: trabajo estadistica III toñito.pdf

Análisis de la variable número de horas dedicadas a estudiar (semanal).

- Prueba de hipótesis para la media poblacional.

Analizando la población del estrato 1, es decir, la base 09, tenemos la siguiente información para la variable número de horas (por semana) dedicadas a estudiar : media 13.39 y varianza 24.78 Con esto, formularemos nuestra hipótesis que dice que media poblacional del número de horas (por semana) dedicadas a estudiar es igual a 14.

1) Planteamiento de la hipótesis:

H0: U = 13

H1: U >13 prueba unilateral derecha.

2) Función Pivotal:

(0,1)X

Z NS n

Z0 =

√ √

Z0 = 0.519685 0.52 Z0 = 0.52

3) Nivel de significación:

= 0.05 Z95% = 1.65

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = 0.52 Z0= 1.65

Page 53: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Como Z0 = 0.52< Z = 1.65 Z0 RA Entonces se acepta la hipótesis nula y se rechaza la hipótesis alternativa, es decir, la cual se tiene que el verdadero decir que los alumnos de la base 09 estudian 13 horas semanales.

- Prueba de hipótesis para la diferencia de medias poblacionales.

Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y de la base 10, tenemos que la media muestral y la varianza muestral de la variable número de horas (por semana) dedicadas a estudiar para las 2 bases es respectivamente: ( media 13.39 y varianza 24.78) base 10 y (media 14.62 y varianza 23.56) base 11 Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas bases son iguales y como hipótesis alternativa, que la media poblacional de la variable número de horas (por semana) dedicadas a estudiar mayor en la base 10.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H

H

2) Función Pivotal:

Z0 =

Z0 = -1.192177 -1.19 Z0 = -1.19

3) Nivel de significación:

= 0.05 Z95% = 1.65

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 54: trabajo estadistica III toñito.pdf

Z0 = -1.65 Z = -1.19

5) Toma de decisiones:

Como T0 = -1.19> T 95%= -1.65 T0 RA

Tenemos que 0 05.74 1.64Z Z Z RR . Por lo tanto, rechazamos la hipótesis nula.

- Prueba de hipótesis para la varianza poblacional.

De los datos que obtuvimos en la encuesta, tenemos que (para cada una de las 3 bases involucradas en nuestro estudio): - La varianza muestral del número de escalas que deberían haber para el aporte en la base 09 es 24.78 entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas a estudiar es igual a 23, y como hipótesis alternativa, que ésta sea diferente a 23. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

H0:

H1:

2) Función Pivotal: 2

2

( 1)2

( 1)n

n SV X

V0 =

X2

(43)

V0 =46.328

3) Nivel de significación:

Page 55: trabajo estadistica III toñito.pdf

= 5% X2(

= X2

(0.025)(43) = 26.78

X2(

= X2 = (0.975)(43) = 62.99

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

26.78 V0 =46.33 62.99

5) Toma de decisiones:

Tenemos que 26.78< V0 = 46.33< 62.99 V0 RA .Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 23. - La varianza muestral del número de horas (por semana) dedicadas a estudiar en la base 10 es 23.56, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 25, y como hipótesis alternativa, que ésta sea diferente a 25. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

H0: U = 25

H1: U 25

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

Page 56: trabajo estadistica III toñito.pdf

V0 =

X2

(46)

V0 =43.35

3) Nivel de significación: 5%

= 5% X2(

= X2

(0.025)(46) = 29.16

X2(

= X2 = (0.975)(46) = 66.62

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

29.16 V = 43.35 66.62

5) Toma de decisiones:

Tenemos que 29.16< V0 = 43.35< 66.62 V0 RA .Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 25. - La varianza muestral del número de horas (por semana) dedicadas a estudiar en la base 11 es 19.56, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 18, y como hipótesis alternativa, que ésta sea diferente a 18. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

H0: U = 18

H1: U 18

Page 57: trabajo estadistica III toñito.pdf

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

V0 =

X2

(67)

V0 =72.80

3) Nivel de significación:

= 5% X2(

= X2

(0.025)(67) = 46.26

X2(

= X2 = (0.975)(67) = 91.51

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

46.26 V = 72.8091.51

5) Toma de decisiones:

Tenemos que 46.26< V0 = 72.80< 91.51 V0 RA .Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas a estudiar por su cuenta es igual a 18.

- Prueba de la bondad de ajuste (no paramétrica).

En esta sección verificaremos si el número de horas (por semana) dedicadas a estudiar en la base 09 sigue una distribución de tipo Normal con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:

Page 58: trabajo estadistica III toñito.pdf

Número de horas dedicadas a estudiar Tipos de estudiantes

[ 5 , 10> Estudiante poco interesado

[ 10 , 15> Estudiante en vías de superarse

[ 15 , 20> Estudiante regular

[ 20 , 25 > Estudiante muy interesado

Tipos de estudiantes Número de alumnos

Estudiante poco interesado

7

Estudiante en vías de superarse

18

Estudiante regular 12

Estudiante muy interesado

7

44

Además, tenemos que:

Media 13.39 y varianza 24.78

1) Planteamiento de la hipótesis:

H0: el número de horas (por semana) dedicadas a estudiar sigue una distribución de probabilidad de tipo normal. H1: el número de horas (por semana) dedicadas a estudiar no sigue una distribución de probabilidad de tipo normal.

2) Función Pivotal:

22

( 1)

1

( )ki i

k m

i i

o eQ X

e

3) Nivel de significación:

2 2

( 1) 25% 0.05

5.99

k mP X x P X x

x

Frecuencias esperadas:

Tipos de estudiantes io iP

2( )i i

i

o e

e

Estudiante poco interesado

7 0.1590 6.996

0.0000022870

Page 59: trabajo estadistica III toñito.pdf

Estudiante en vías de superarse

18 0.4090 17.996

0.0000008891

Estudiante regular

12 0.2727 11.999

0.0000000833

Estudiante muy interesado

7 0.1590 6.996

0.0000022870

44

1 Q=0.0000055465

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q = 0.0000055465 5.99

5) Toma de decisiones:

Tenemos que Q0 = 0.0000055465 <5.99 Q0 RA

Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que el número de horas (por semana) dedicadas a estudiar en la base 09 sigue una distribución de probabilidad de tipo Normal.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si existe interdependencia entre el número de horas (por semana) dedicadas a estudiar y el rendimiento académico. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

Page 60: trabajo estadistica III toñito.pdf

rendimiento académico

Número de horas (por semana) dedicadas a estudiar

[ 5,10> [10,15> [ 15,20> [ 20,25> Total

Buena 0 5 4 5 14

Regular 7 13 8 2 30

Total 7 18 12 7 44

1) Planteamiento de la hipótesis:

H0: el número de horas (por semana) dedicadas a estudiar y el rendimiento académico son independientes H1: están relacionados o son dependientes

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)

3) Nivel de significación:

2 2

( 1)( 1) 81% 0.01

20.1

F CP X x P X x

x

[ ] [

]

x =13.3 Frecuencias esperadas:

rendimiento académico

Número de horas (por semana) dedicadas a estudiar

[ 5,10 > [10,15> [ 15,20 > [ 20,25 > Total

Buena 2.23 5.73 3.82 2.23 14

Regular 4.77 12.27 8.18 4.77 30

Total 7 18 12 7 44

Page 61: trabajo estadistica III toñito.pdf

Calculo de :

2

1

( )ki i

i i

o eQ

e

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q = 8.48 13.3

5) Toma de decisiones:

Tenemos que Q0 = 8.48 <13.3 Q0 RA. Por lo tanto, se acepta la hipótesis nula. Entonces

aceptamos que entre el número de horas (por semana) dedicadas a estudiar por su cuenta y el rendimiento académico de la base 10 son independientes.

- Análisis de Varianza (ANAVA).

En esta sección analizaremos si el promedio del número de horas (por semana) dedicadas a estudiar por su cuenta en las 3 bases es el mismo o si es diferente en por lo menos en una base. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 facultades son iguales.

2.23 0.09 0.01 3.45

1.04 0.04 0.00 1.61

8.48

Page 62: trabajo estadistica III toñito.pdf

1) Planteamiento de la hipótesis:

0 1 2 3

1 1

:

: No todos los son iguales

H

H

2) Determinación del nivel de confianza.

1 (2,725)5% 3.01F

3) Formulación de la función pivotal.

2

( 1)

( 1, )2

( )

( 1)

( )

k

k n k

n k

X k CMCF F

X n k CME

1

SCCCMC

k

Cuadrado medio entre tratamientos (columnas)

SCE

CMEn k

Cuadrado medio dentro de los tratamientos (error)

4) Construcción de la tabla de análisis de varianza (ANAVA).

2 2728(20.94) 319216.06nX

nX=159*14.08=2238.72 Suma de cuadrados:

M1 M2 M3 Total

Total 265 273 383 921

44 47 68 159

13.39 14.62 14.23 14.08

7888.8524 10045.987 13769.517 31704.356

in

iX

2

i in X

Page 63: trabajo estadistica III toñito.pdf

Con estos datos, realizamos nuestra tabla de análisis de varianza:

Fuente de variación

Suma de cuadrados Grados

de libertad

Cuadrado medio Razón 0H

Entre tratamientos (columnas)

1

2

g k

g

i

Dentro de los

tratamientos (error)

SCE=SCT-SCC SCE=32995.28-29465.64 SCE=3529.64

Total

5) Determinación de la región crítica (RR) y la región de aceptación (RA):

3.01F = 651.03

6) Toma de decisiones:

Tenemos que . Por lo tanto rechazamos la hipótesis nula. Concluimos que en las 3 bases, el número promedio del número de horas (por semana) dedicadas a estudiar es diferente.

Page 64: trabajo estadistica III toñito.pdf

Análisis de la variable Situación Laboral

- Prueba de hipótesis para la proporción poblacional.

Analizando la población de la base 11 tenemos este dato inicial, el cual representa la

proporción muestral de alumnos que tienen un trabajo es: .Con esto, formularemos nuestra hipótesis que dice que la proporción poblacional de alumnos que tienen un trabajo es igual a 0.20 con un nivel de confianza del 95%.

1) Planteamiento de la hipótesis:

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.

3) Nivel de significación:

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -1.65Z = -0.899

Page 65: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que . Por lo tanto, se acepta la hipótesis nula y tenemos que la proporción poblacional de alumnos que tienen trabajo es 0.2.

- Prueba de hipótesis para la diferencia de proporciones poblacionales.

Analizando los estratos de la base 09 y la base 11 tenemos que la proporción de alumnos que trabajan es respectivamente 0.41 y 0.16. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 09 que tiene esta respuesta es mayor que la base 11.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H P P

H P P

2) Función Pivotal:

ˆ ˆ( ) ( )(0,1)

(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

3) Nivel de significación:

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 66: trabajo estadistica III toñito.pdf

Z = 1.65Z = 3.09

5) Toma de decisiones:

Tenemos que . Por lo tanto, se rechaza la hipótesis nula, entonces, rechazamos que la proporción poblacional de alumnos de la base 09 que trabajan es igual que la base 11.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si la situación laboral de los alumnos de la base 09 depende del género de éstos mismos. Por lo tanto, nuestra hipótesis nula será que la situación laboral de los alumnos depende del género de éstos mismos. Todo esto con un nivel de significación del 1%.

Género Situación Laboral

Trabaja No trabaja Total

Masculino 17 7 24

Femenino 12 8 20

Total 29 15 44

1) Planteamiento de la hipótesis:

0

1

: La situación laboral de los alumnos y el género

de éstos mismos son independientes

: Estan relacionados o son dependientes

H

H

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

2 2

( 1)( 1) 11% 0.01

6.63

F CP X x P X x

x

Page 67: trabajo estadistica III toñito.pdf

Frecuencias esperadas:

Género

Situación Laboral

Trabaja No trabaja Total

Masculino 16 8 24

Femenino 13 7 20

Total 29 15 44

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

0.08 0.20

0.12 0.17

Qo = 0.57

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q = 0.57 6.63

Page 68: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que la situación laboral de los alumnos en la base 09 y el género de éstos mismos son independientes.

- Prueba de Homogeneidad (no paramétrica).

En esta sección vamos a analizar si los alumnos de la base 09, base 10 y de la base 11 son homogéneos con respecto a la situación laboral de los alumnos en estas 3 bases. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

Situación Laboral BASES

Base 09 Base 10 Base 11 Total

Trabaja 29 10 11 50

No Trabaja 15 37 57 109

Total 44 47 68 159

1) Planteamiento de la hipótesis:

H0 = las tres bases son homogéneas respecto a la situación laboral de los alumnos de cada base H1= las tres bases son heterogéneas respecto a la situación laboral de los alumnos de cada base

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

2 2

( 1)( 1) 25% 0.05

5.99

F CP X x P X x

x

Page 69: trabajo estadistica III toñito.pdf

Frecuencias esperadas:

Situación Laboral

BASES

Base 09 Base 10 Base 11 Total

Trabaja 13.84 14.78 21.38 50

No Trabaja

30.16 32.22 46.62 109

Total 44 47 68 159

Calculo de Q

:

2

1

( )ki i

i i

o eQ

e

16.62 1.55 5.04

7.62 0.71 2.31

Qo = 33.85

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

5.99 Qo = 33.85

5) Toma de decisiones:

Tenemos que . Por lo tanto, se rechaza la hipótesis nula. Entonces rechazamos que los alumnos de las tres bases son homogéneos con respecto a la situación laboral de los alumnos.

Page 70: trabajo estadistica III toñito.pdf

VARIABLES

- UN ANÁLISIS DE LA VARIABLE LUGAR DE RESIDENCIA - EDAD DE LA PERSONA ENCUESTADA

Page 71: trabajo estadistica III toñito.pdf

Análisis de la variable Lugar de Residencia de los Alumnos de la Facultad de Ciencias Administrativas

- Prueba de hipótesis para la proporción poblacional.

Analizando la población del estrato 1, es decir, los alumnos de la base 2009, tenemos este dato inicial, el cual representa la proporción muestral de alumnos que viven en un lugar de residencia populoso o residencial: ˆ 0.56p . Con esto, formularemos nuestra hipótesis que dice

que la proporción poblacional de alumnos que dicen que viven en distritos populosos es de 0.70 con un nivel de confianza del 95%.

1) Planteamiento de la hipótesis:

0

1

: 0.70

: 0.70

H p

H p

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.

0 0

0.56 0.701.76

0.56(1 0.56)

44

Z Z

3) Nivel de significación:

5% 1.65Z

Page 72: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -1.65 Z = -1.76

5) Toma de decisiones:

Tenemos que 0 01.65 1.76Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y

tenemos que la proporción poblacional de alumnos que viven en distritos residenciales es de 0.70

- Prueba de hipótesis para la diferencia de proporciones poblacionales.

Analizando los estratos 2 y 3, es decir, los alumnos de la base 2010 y de los de la base 2011, tenemos que la proporción de alumnos que viven en zonas residenciales es respectivamente 0.47 y 0.43. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la proporción poblacional que los alumnos de la base 2010 tiene mayor número de personas que viven en distritos residenciales que la base 2011.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H P P

H P P

2) Función Pivotal:

ˆ ˆ( ) ( )(0,1)

(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

Page 73: trabajo estadistica III toñito.pdf

0 0

(0.47 0.43)0.42

0.47(0.53) 0.43(0.57)

47 68

Z Z

3) Nivel de significación:

5% 1.65Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z=0.42 Z = 1.65

5) Toma de decisiones:

Tenemos que 0 00.42 1.65Z Z Z RA . Por lo tanto, se acepta la hipótesis nula, entonces,

aceptamos que la proporción poblacional de alumnos de la base 2010 que vive en distritos residenciales es igual que la de la base 2011.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si la opinión que tienen los alumnos de la facultad de Administración con respecto a que viven en un distrito residencial y el Ingreso disponible. Por lo tanto, nuestra hipótesis nula será que si la opinión que tienen los alumnos. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

Distrito Recidencial

Ingreso Personal Mensual

[ 0;200 > [ 200;300 > [ 300; 450> [ 450;600> Total

Si 3 4 6 2 15

No 5 9 13 2 29

Total 8 13 19 4 44

Page 74: trabajo estadistica III toñito.pdf

1) Planteamiento de la hipótesis:

0

1

: La opinión que tienen los alumnos respecto al lugar de residencia y su ingreso disponible

: Estan relacionados o son dependientes

H

H

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)

3) Nivel de significación:

2 2

( 1)( 1) 31% 0.01

11.3

F CP X x P X x

x

Frecuencias esperadas:

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2

0

2 2

(3 6) (5 2) (4 5) (9 8) (6 11) (13 8)

6 2 5 8 11 8

(2 3) (2 1)

3 1

Q

0 13.06Q

Distrito Recidencial

Ingreso Personal Mensual

[ 0;200 > [ 200;300 > [ 300; 450> [ 450;600> Total

Si 6 5 11 3 15

No 2 8 8 1 29

Total 8 13 19 4 44

Page 75: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

……….. 11.3 Q = 13.06

5) Toma de decisiones:

Tenemos que 0 013.06 11.3Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces el

ingreso personal disponible para cada alumno de la base 2010 es independiente de que sí viven en un distrito residencial.

Page 76: trabajo estadistica III toñito.pdf

Análisis de la variable Edad - Prueba de hipótesis para la media poblacional. Analizando la población del estrato 1, es decir, la base 2009, tenemos la siguiente información

para la variable número de escalas que deberían existir para el aporte: 20.18X

2 1.97S . Con esto, formularemos nuestra hipótesis que dice que media poblacional de los alumnos de la base 2009 es 20 años.

1) Planteamiento de la hipótesis:

0

1

: 20

: 20

H

H

2) Función Pivotal:

(0,1)X

Z NS n

0 0

20.18 200.85

1.97 44Z Z

3) Nivel de significación: 5% 1.65Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z =0.85 Z = 1.65

Page 77: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que 0 00.85 1.65Z Z Z RR . Por lo tanto, se acepta la hipótesis nula y tenemos

que la media poblacional de los alumnos de la base 2009 es igual a 20 años.

- Prueba de hipótesis para la diferencia de medias poblacionales.

Analizando los estratos 1 y 2, es decir, los alumnos de las facultades de Administración e Ingeniería Industrial, tenemos que la media muestral y la varianza muestral del número de

escalas que deberían existir para el aporte para las 2 facultades es respectivamente: 20.18X

2 1.97xS y 17.87Y

2 0.54yS

Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la media poblacional de alumnos de Administración que tiene esta opinión es mayor que la de Ingenierita Industrial.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H

H

2) Función Pivotal:

2 2

0 0

( ) ( )(0,1)

( 1) ( 1) 1 1

2

20.18 17.879.93

(44 1)1.97 (47 1)0.54 1 1

44 47 2 44 47

x y

x x y y

x y x y

X YZ N

n S n S

n n n n

Z Z

3) Nivel de significación:

5% 1.65Z

Page 78: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = 1.65 Z = 9.93

5) Toma de decisiones:

Tenemos que 0 09.93 1.65Z Z Z RR . Por lo tanto, se rechaza la hipótesis nula,

entonces, no aceptamos que las medias poblaciones de las edades en las base 2009 y 2010 sean iguales.

- Prueba de hipótesis para la varianza poblacional.

De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral de las edades

de los estudiantes de la base 2009 es 2 1.97xS , entonces planteamos la hipótesis nula que la

varianza poblacional de las edades de los estudiantes de la base 2009 es igual a 2, y como hipótesis alternativa, que ésta es diferente de 2. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

2

0

2

1

: 2

: 2

H

H

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

2

0 0 02

0

( 1) (44 1)1.9721.015

2

n SV V V

3) Nivel de significación: 5%

Page 79: trabajo estadistica III toñito.pdf

2 2

/2,( 1) 1 /2,( 1)

2 2

0.025,44 0.975,44

0.95

27.6 60.5

n nP X V X

X X

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V=21.015 60.5

5) Toma de decisiones:

Tenemos que 0 021.015 60.5V V RA . Por lo tanto, se aprueba la hipótesis nula, entonces,

aceptamos que la varianza poblacional de número de escalas que deberían haber para el aporte es igual a 2. - La varianza muestral de las edades de los estudiantes en la facultad de Administración de la

base 2010 es 2 0.54S , entonces planteamos la hipótesis nula que la varianza poblacional de

número de escalas que deberían haber para el aporte es igual a 1, y como hipótesis alternativa, que ésta es diferente de 8. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

2

0

2

1

: 1

: 1

H

H

2) Función Pivotal:

Page 80: trabajo estadistica III toñito.pdf

22

( 1)2

( 1)n

n SV X

2

0 0 02

0

( 1) (47 1)0.5424.84

1

n SV V V

3) Nivel de significación: 5%

2 2

/2,( 1) 1 /2,( 1)

2 2

0.025,46 0.975,46

0.95

29.2 66.6

n nP X V X

X X

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V = 24.84 29.2

5) Toma de decisiones:

Tenemos que 0 024.84 29.2V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,

aceptamos que la varianza poblacional de las edades de los estudiantes de alumnos de la base 2010 es de 2. - La varianza muestral del número de escalas que deberían haber para el aporte en la facultad

de Administración de la base 2011 es 2 1.53S , entonces planteamos la hipótesis nula que la varianza poblacional de número de escalas que deberían haber para el aporte es igual a 2, y como hipótesis alternativa, que ésta es diferente de 2. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

Page 81: trabajo estadistica III toñito.pdf

2

0

2

1

: 2

: 2

H

H

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

2

0 0 02

0

( 1) (68 1)1.5321.255

2

n SV V V

3) Nivel de significación: 5%

2 2

/2,( 1) 1 /2,( 1)

2 2

0.025,67 0.975,67

0.95

46.3 91.5

n nP X V X

X X

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V=21.255 46.3

5) Toma de decisiones:

Tenemos que 0 021.255 46.3V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,

aceptamos que la varianza poblacional de número de escalas que debería haber para el aporte es igual a 2. Finalmente, tenemos que la varianza poblacional de esta variable sería igual para la los alumnos de la base 2009 y la 2011.

Page 82: trabajo estadistica III toñito.pdf

- Prueba de la bondad de ajuste (no paramétrica).

En esta sección verificaremos si la variable edad en la base 2011 de la facultad de Administración sigue una distribución de tipo Normal con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:

Edades Número de alumnos

[ 16,17 > 1

[ 17,18 > 13

[ 18,19 > 24

[ 19,20 > 9

Total 46

Además, tenemos que: 17.9X

2 0.54xS

1) Planteamiento de la hipótesis:

0

1

: El número de rango de edades sigue una distribucion de probabilidad de tipo Normal

: El número de rango de edades no sigue una distribucion de probabilidad de tipo Normal

H

H

2)

Función Pivotal:

22

( 1)

1

( )ki i

k m

i i

o eQ X

e

3) Nivel de significación:

2 2

( 1) 15% 0.05

3.84

k mP X x P X x

x

Frecuencias esperadas:

[ , XA LX [ Z , ZA L iP 46i ie P io 2( )i i

i

o e

e

[ 16,17 > [ -2.59 ,-1.22 > 0.10546 4.8512 1 3.0573

[ 17,18 > [ -1.22 , 0.14 > 0.45262 20.8205 13 2.9375

[ 18,19 > [ 0.14 , 1.50 > 0.37752 17.3659 24 2.5343

[ 19,20 > [ 1.50 , 2.86 > 0.0644 2.9624 9 12.3051

Total 1 46 20.8342Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 83: trabajo estadistica III toñito.pdf

3.84 Q = 20.8342

5) Toma de decisiones:

Tenemos que 0 020.8342 3.84Q V RR . Por lo tanto, se rechaza la hipótesis nula,

entonces, aceptamos que la edad no sigue una distribución de probabilidad de tipo Normal, lo cual se podía ver a simple vista ya que no existía simetría en las frecuencias de los datos.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si existe interdependencia entre las escalas de edades de la base 2009 y si viven en un distrito residencial el cual está dividido en: SI y NO, este análisis se llevara con una confianza del 99% de significación:

Distrito Residencial

Edad

[ 16,17 > [ 17,18 > [ 18,19 > [ 19,20 > Total

Si 3 4 6 2 15

No 5 9 13 2 29

Total 8 13 19 4 44

1) Planteamiento de la hipótesis:

0

1

: La edad de los estudiantes de la base 2010 y el lugar

de residencia de los mismos son independientes

: Estan relacionados o son dependientes

H

H

2) Función Pivotal:

Page 84: trabajo estadistica III toñito.pdf

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)

3) Nivel de significación:

2 2

( 1)( 1) 31% 0.01

11.3

F CP X x P X x

x

Frecuencias esperadas:

Distrito Residencial

Edad

[ 17,19 > [ 19,21 > [ 21,23 > [ 23,25 > Total

Si 1 5 4 3 15

No 0 8 20 6 32

Total 1 13 24 9 47

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2 2

0

(0 1) (7 5) (6 8) (3 4) (21 20) (5 3) (4 6)

1 5 8 4 20 3 6Q

0 4.6Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q = 4.6 11.3

Page 85: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que 0 04.6 11.2Q Q RA . Por lo tanto, se acepta la hipótesis nula. Entonces

aceptamos que la edad de los estudiantes y sí viven en un distrito residencia son independientes.

- Análisis de Varianza (ANAVA).

En esta sección analizaremos si el promedio de la edad de los estudiantes en las 3 bases de la

facultad de Administración es mismo o si es diferente en por lo menos 1 facultad. Para esto

usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos

que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras

palabras, que las varianzas poblacionales para las 3 bases son iguales.

1) Planteamiento de la hipótesis:

0 1 2 3

1 1

:

: No todos los son iguales

H

H

2) Determinación del nivel de confianza.

1 (2,156)5% 3.0017F

3) Formulación de la función pivotal.

2

( 1)

( 1, )2

( )

( 1)

( )

k

k n k

n k

X k CMCF F

X n k CME

1

SCCCMC

k

Cuadrado medio entre tratamientos (columnas)

SCE

CMEn k

Cuadrado medio dentro de los tratamientos (error)

4) Construcción de la tabla de análisis de varianza (ANAVA).

Page 86: trabajo estadistica III toñito.pdf

M1 M2 M3 Total

Total 192 95 73 1206

in 44 47 68 159

iX 20.18 17.9 16.76 54.84

2

i in X 17918.226 15059.27 19101.037 52078.532

2 2159(54.84) 478180.6704nX

Suma de cuadrados:

2 2

1 1

2 2

1

24336 478180.67 453844.67

52078.53 478180.67 426102.138

ink

ij

i j

k

i i

i

SCT X nX

SCC n X nX

Con estos datos, realizamos nuestra tabla de análisis de varianza:

Fuente de variación

Suma de cuadrados Grados

de libertad

Cuadrado medio

Razón 0H

Entre tratamientos (columnas)

2 2

1

426102.138

k

i i

i

SCC n X nX

SCC

1

2

g k

g

1

179.76

SCCCMC

k

CMC

0

0 31

CMCF

CME

F

i

Dentro de los

tratamientos (error)

4560.92 359.51

27742.532

SCE SCT SCC

SCE

SCE

156

g n k

g

5.80

SCECME

n k

CME

Total

2 2

1 1

311698 307137.08

4560.92

ink

ij

i j

SCT X nX

SCT

SCT

727g

5) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 87: trabajo estadistica III toñito.pdf

3.0017 F = 31

6) Toma de decisiones:

Tenemos que 0 031 3.0017F F RR . Por lo tanto rechazamos la hipótesis nula. Concluimos

que en las bases, el promedio de edades es significativamente diferente.

Page 88: trabajo estadistica III toñito.pdf

FASANANDO CHÁVEZ REITER ANTONIO

VARIABLES: -NÚMERO DE CURSOS QUE LLEVAN -SERVICIOS CON LOS QUE CUENTA EN SU VIVIENDA

Page 89: trabajo estadistica III toñito.pdf

Análisis de la variable servicios con los que cuenta en casa

- Prueba de hipótesis para la proporción poblacional.

Analizando la población del estrato 2, es decir, la base 11, tenemos este dato inicial, el cual

representa la proporción muestral de alumnos que cuenta con todos los servicios en casa: pˆ=

0.9371 Con esto, formularemos nuestra hipótesis que dice que la proporción poblacional de

alumnos que cuenta con todos los servicios en casa es igual a 0.9633 con un nivel de

confianza del 95%.

1) Planteamiento de la hipótesis:

Ho: p= 0.9633

H1: p<0.9633

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.

= -0.9685

3) Nivel de significación:

α= 5%, entonces

α

Page 90: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -1.65 Z = -0.9685

5) Toma de decisiones:

Tenemos que Zo= -0.9685 >Z= -1.65, entonces Zo RA. Por lo tanto, se acepta la hipótesis nula y tenemos que la proporción poblacional de alumnos que cuenta con todos los servicios en su casa es igual a 0.9633.

- Prueba de hipótesis para la diferencia de proporciones poblacionales.

Analizando los estratos 1 y 3, es decir, los alumnos de las bases 09 y 11, tenemos que la

proporción de alumnos que cuenta con todos los servicios en casa es , respectivamente. Con esto planteamos nuestra hipótesis que las proporciones poblaciones de ambas bases son iguales, así como también la hipótesis alternativa, que la proporción poblacional de alumnos de la base 09 que tiene esta opinión es mayor que la de la base 11.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H P P

H P P

2) Función Pivotal:

ˆ ˆ( ) ( )

(0,1)(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

Page 91: trabajo estadistica III toñito.pdf

= 0.3156

3) Nivel de significación:

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = 0.3159 Z = 1.65

5) Toma de decisiones:

Tenemos que . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la proporción poblacional de alumnos de la base 10 que cuenta con todos los servicios en casa es la misma que la proporción de los alumnos de la base12.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si existe dependencia entre la variable servicios de casa con el ingreso en el estrato 3, es decir la base 12; o bien también demostrar si existe independencia. Todo esto con un nivel de significación del 1%.

Page 92: trabajo estadistica III toñito.pdf

INGRESOS

SERVICIOS QUE TIENE EN CASA

TODOS PRINCIPALES TOTAL

ALTOS 42 1 45

BAJOS 20 3 23

TOTAL 62 4 68

1) Planteamiento de la hipótesis:

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que:

F = 2 (número de filas) C= 2(número de columnas)

3) Nivel de significación:

( ) (

)

X= 6.63

Frecuencias esperadas: INGRESOS

SERVICIOS QUE TIENE EN CASA

TODOS PRINCIPALES TOTAL

ALTOS 41 3 45

BAJOS 21 1 23

TOTAL 62 4 68

Nota: aproximaremos los resultados para evitar los decimales.

Page 93: trabajo estadistica III toñito.pdf

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q = 5.405 6.63

5) Toma de decisiones:

Tenemos que . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que la no existe relación entre el nivel de ingresos y los servicios con los que cuenta en casa.

- Prueba de Homogeneidad (no paramétrica).

En esta sección analizaremos si los alumnos de las base 2010, 2011 y 2012, son homogéneos con respecto a los servicios con los que cuenta un estudiante en su casa. Todo esto con un nivel de significación del 5%.

Page 94: trabajo estadistica III toñito.pdf

SERVICIOS CON LOS QUE CUENTA EL ESTUDIANTE EN CASA

BASES

BASE 09 BASE10 BASE11 TOTAL

TODOS 42 43 64 149

PRINCIPALES 2 4 4 10

TOTAL 44 47 68 159

1) Planteamiento de la hipótesis:

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

(

)

X=5.99

Frecuencias esperadas: SERVICIOS CON LOS QUE CUENTA EL ESTUDIANTE EN CASA

BASES

BASE 09 BASE10 BASE11 TOTAL

TODOS 41 44 64 149

PRINCIPALES 3 3 4 10

TOTAL 44 47 68 159

Nota: redondeamos los resultados para evitar los decimales.

Page 95: trabajo estadistica III toñito.pdf

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

Q= 0.71378

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q = 0.71378 5.99

5) Toma de decisiones:

Tenemos que . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que los alumnos de las bases 2012, 2011 y 2012 con respecto a los servicios con los que cuenta un estudiante en su casa.

Page 96: trabajo estadistica III toñito.pdf

Análisis de la variable Número de cursos que levan los estudiantes de las base 2009, 2010 y 2011.

- Prueba de hipótesis para la media poblacional.

Analizando la población del estrato 1, es decir, la base 10, tenemos la siguiente información

para la variable número de cursos que llevan los estudiantes de estas 3 bases: Con esto, formularemos nuestra hipótesis que dice que media poblacional del número de cursos que llevan los estudiantes es 6, frente a la alternativa de que sean menos que 6.

1) Planteamiento de la hipótesis

2) Función Pivotal:

(0,1)X

Z NS n

Z=-4.24 3) Nivel de significación:

5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z=-4.24 Z=-1.64

Page 97: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que . Por lo tanto, se rechaza la hipótesis nula y tenemos que la media poblacional del número de cursos que llevan los estudiantes de la base 10 es menor que 6

- Prueba de hipótesis para la diferencia de medias poblacionales.

Analizando los estratos 1 y 2, es decir, los alumnos de las bases 2009 y 2010, tenemos que la media muestral y la varianza muestral del número de cursos que llevan los alumnos de dichas

bases son: y

, respectivamente.

Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas bases son iguales y como hipótesis alternativa, que la media poblacional de alumnos de la base 09 es mayor que la media de los de la base 10.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H

H

2) Función Pivotal:

3) Nivel de significación:

5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 98: trabajo estadistica III toñito.pdf

Z = -8.13 Z = 1.64

5) Toma de decisiones:

Tenemos que . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que las medias poblaciones del número de cursos que llevan los estudiantes de las bases 2009 y 2010 son iguales.

- Prueba de hipótesis para la varianza poblacional.

- La varianza muestral del número de cursos que llevan los alumnos de la base 11 es

, entonces planteamos la hipótesis nula que la varianza poblacional del número de cursos es igual a 6, y como hipótesis alternativa, que ésta es diferente de 6. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

2)

Función Pivotal: 2

2

( 1)2

( 1)n

n SV X

V= 45.33

3) Nivel de significación: 5%

X

Page 99: trabajo estadistica III toñito.pdf

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V=45.33 66.6

5) Toma de decisiones:

Tenemos que . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional de número de cursos que llevan los alumnos de la base 11 es igual a 4.

- Prueba de la bondad de ajuste (no paramétrica).

En esta sección verificaremos si el número de cursos que llevan los alumnos de la base 10 sigue una distribución de tipo Normal con un nivel de significación del 5%. Número de cursos que lleva Alumnos

3 3

4 4

5 9

6 28

Además, tenemos que:

1) Planteamiento de la hipótesis:

Page 100: trabajo estadistica III toñito.pdf

2)

Función Pivotal: 2

2

( 1)

1

( )ki i

k m

i i

o eQ X

e

3) Nivel de significación:

( )

X= 3.84

4) Frecuencias esperadas:

Número de cursos

FRECUENCIAS Z P

3 3 -2.64 0.00415 0.1826 43.471

4 4 -1.55 0.05057 2.22508 1.416

5 9 -0.45 0.30313 13.33772 1.411

6 28 0.65 0.64215 28.2546 0.002

TOTAL 44 1 44 46.3

3.84 Q = 46.3

5) Toma de decisiones:

Tenemos que . Por lo tanto, se rechaza la hipótesis nula, entonces, aceptamos que el número de cursos que llevan los alumnos de la base 10 no tienen una distribución normal.

Page 101: trabajo estadistica III toñito.pdf

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si existe interdependencia entre el número de cursos que llevan los estudiantes y si desempeñan alguna actividad laboral en la base 10. Con un nivel de significación del 1%. TRABAJO

NÚMERO DE CURSOS QUE LLEVA

3 4 5 6 TOTAL

SÍ 3 3 4 8 18

NO 0 1 5 20 26

TOTAL 3 4 9 28 44

1) Planteamiento de la hipótesis:

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)

3) Nivel de significación:

( )

X=11.3

Page 102: trabajo estadistica III toñito.pdf

Frecuencias esperadas: TRABAJO

NÚMERO DE CURSOS QUE LLEVA

3 4 5 6 TOTAL

SÍ 1 2 4 11 18

NO 2 2 5 17 26

TOTAL 3 4 9 28 44

Calculo de Q: 2

1

( )ki i

i i

o eQ

e

ó

Q=8.347593583 APROXIMANDO:

Q=8.35

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q=8.35 11.3

Page 103: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que Q=8.35 . Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que el número de cursos que llevan los estudiantes de la base 2010 y la actividad laboral son independientes.

- Análisis de Varianza (ANAVA).

En esta sección analizaremos si el promedio del número cursos que llevan los estudiantes de las 3 bases es mismo o si es diferente en por lo menos 1 base. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 facultades son iguales.

1) Planteamiento de la hipótesis:

0 1 2 3

1 1

:

: No todos los son iguales

H

H

2) Determinación del nivel de confianza

3) Formulación de la función Pivotal

2

( 1)

( 1, )2

( )

( 1)

( )

k

k n k

n k

X k CMCF F

X n k CME

1

SCCCMC

k

Cuadrado medio entre tratamientos (columnas)

SCE

CMEn k

Cuadrado medio dentro de los tratamientos (error)

Page 104: trabajo estadistica III toñito.pdf

4) Construcción de la tabla de análisis de varianza (ANAVA).

M1 M2 M3 Total

Total 232 268 405 905

in 44 47 68 159

iX 5.41 5.70 6 5.703

2

i in X 1287.8 1527.03 2448 5262.83

∑∑

Suma de cuadrados

∑∑

SCE=47.17

Con estos datos, realizamos nuestra tabla de análisis de varianza:

Fuente de variación

Suma de cuadrados Grados

de libertad

Cuadrado medio

Razón 0H

Entre tratamientos (columnas)

SCC=91.48 1

2

g k

g

CMC=45.74

i

Dentro de los tratamientos

(error) SCE=47.17

CME=0.3024

Page 105: trabajo estadistica III toñito.pdf

Total SCT=138.65 g=158

5) Determinación de la región crítica (RR) y la región de aceptación (RA):

3 F = 151.26

6) Toma de decisiones:

Tenemos que . Concluimos que en las 3

bases, el número promedio de cursos que llevan los estudiantes de las 3 bases es significativamente diferente.

Page 106: trabajo estadistica III toñito.pdf

VARIABLES -LUGAR DE ORIGEN -SITUACION LABORAL ACTUAL

Page 107: trabajo estadistica III toñito.pdf

- Prueba de hipótesis para la proporción poblacional.

Analizando la población del estrato 1, es decir, los alumnos de la base 10 de la facultad de economía, tenemos este dato inicial, el cual representa la proporción muestral de alumnos que tienen su lugar de origen en una provincia del país: ˆ 0.57p .Con esto, formularemos nuestra

hipótesis que dice que la proporción poblacional de alumnos que son de un lugar de origen, provincia, es igual a 0.5 con un nivel de confianza del 95%.

1) Planteamiento de la hipótesis:

0

1

: 0.5

: 0.5

H p

H p

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.

3) Nivel de significación:

α = 5%; Z = 1.64

4) Determinación de la región crítica y la región de aceptación

Z = 0.938 Z = 1.64

Page 108: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que Z₀=0.938<Z=1.96 →Z₀ є RA, por lo tanto, se acepta la hipótesis nula y tenemos que más del 50% de los alumnos tienen como lugar de origen una provincia del país.

- Prueba de hipótesis para la diferencia de proporciones poblacionales.

Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y 10 de la facultad de economía; tenemos que la proporción de alumnos que tienen como lugar de origen provincia son 0.57 y 0.4 respectivamente. Con esto formulamos nuestra hipótesis, que las proporciones poblacionales de ambas bases son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 09 que poseen como lugar de origen provincia, es mayor que la de la base 10.

1) Planteamiento de hipótesis

0

1

:

:

x y

x y

H P P

H P P

2) Función Pivotal

ˆ ˆ( ) ( )(0,1)

(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

3) Nivel de significación

5% 1.64Z

4) Determinación de la región critica(RR) y la región de aceptación (RA)

Page 109: trabajo estadistica III toñito.pdf

Z = 1.64 Z = 1.605

5) Toma de decisiones

Tenemos que Z₀=1.605< Z=1.64 → Z₀ є RA. Por lo tanto, se rechaza la hipótesis nula, entonces, aceptamos que la proporción de alumnos que

Tienen como lugar de origen provincia es mayor en la base 09 respecto a la base 10.

- Prueba de Independencia (no paramétrica).

En esta sección analizaremos si la situación laboral (trabajan o no) de los alumnos de las diferentes bases depende del lugar de origen (provincia o capital).siendo una hipótesis valida analizaremos la relación entre estas 2 variables. Por lo tanto, nuestra hipótesis nula será que la situación laboral actual de los alumnos de la base 10 depende de su lugar del lugar de origen todo esto con un nivel de significación del 1%.

lugar de origen

Horas de trabajo capital provincia Total

si trabaja 17 22 39

no trabaja 70 50 120

total 87 72 159

1) Planteamiento de hipótesis

H : la situación laboral (trabajan o no) de los alumnos de las diferentes bases de la facultad de economía y el lugar de origen de los mismos son independientes.

H₁: las variables antes mencionadas están relacionadas o son dependientes.

2) Función Pivotal

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Page 110: trabajo estadistica III toñito.pdf

3) Nivel de significación

α = 1% → [ ] [

] ]

lugar de origen

Horas de trabajo capital Provincia Total

si trabaja 21 18 39

no trabaja 66 54 120

total 87 72 159

Q = 2.1895

4) Determinación de la región critica (RR) y la región de aceptación (RA):

Q = 2.1895 9.21

5) Toma de decisiones:

Tenemos que Q = 2.1895 < 9.21 → Q є RA. Por lo tanto se acepta la hipótesis. Entonces aceptamos que existe una relación entre la situación laboral y el lugar de origen, es decir, son independientes.

Page 111: trabajo estadistica III toñito.pdf

- Prueba de Homogeneidad (no paramétrica).

En esta sección vamos a analizar si los alumnos de las diferentes bases (09, 10 y 11) son homogéneos con respecto al lugar de origen. Todo con un nivel de significación del 1%.

Lugar de origen BASE 09 BASE10 BASE11 TOTAL

capital 19 28 40 87

provincia 25 19 28 72

TOTAL 44 47 68 159

1) Planteamiento de la hipótesis:

H : las tres bases son homogéneas respecto al lugar de origen

: las tres bases son heterogéneas respecto al lugar de origen

2) Función Pivotal:

2

2

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

α = 1% → [ ] [

]

X = 9.21 Frecuencias esperadas Lugar de origen BASE 09 BASE10 BASE11 TOTAL

capital 24 26 37 87

provincia 20 21 31 72

TOTAL 44 47 68 159

Page 112: trabajo estadistica III toñito.pdf

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

Q = 2.9196

1) Determinación del área critica (RR) y la región de aceptación (RA):

Q = 2.9196 9.21

4) Toma de decisiones:

Tenemos que Q = 2.9196 > 9.21 → Q є RR. Por lo tanto, se acepta la hipótesis nula. Entonces aceptamos que los alumnos de las bases 09, 10 y 11 son homogéneos con respecto a su lugar de origen.

Page 113: trabajo estadistica III toñito.pdf

ANALISIS DE LA VARIABLE SITUACION LABORAL ACTUAL (TRABAJA O NO) - Prueba de hipótesis para la media poblacional

Analizando la población de alumnos de la facultad de economía (de las bases 10, 11 y 12) tenemos la siguiente información para la variable número de horas que trabajan los alumnos:

= 4.67, S2 = 2.068. Con esto formularemos nuestra hipótesis que dice que la media poblacional del número de horas de trabajo que debe ser es 4.

1) Planteamiento de hipótesis:

0

1

: 4

: 4

H

H

2) Función pivotal

(0,1)X

Z NS n

Utilizamos esa función pivotal dado que:

√ √

3) Nivel de significación:

5% 1.64Z

4) Determinación de la región critica (RR)Y la región de aceptación (RA):

Z=1.64 Z =2.9096

Page 114: trabajo estadistica III toñito.pdf

5) Toma de decisión

Tenemos que Z =-2.9096 > Z = 1.64 → Z є RR. Por lo tanto, se rechazara la hipótesis nula y tenemos que la media poblacional del número de horas que deberían de trabajares mayor a 4 horas diarias

- Prueba de hipótesis para la diferencia de medias poblacionales.

Analizando los estratos 1 y 2 es decir, los alumnos de las bases 09 y 10 de la facultad de Administración, tenemos que la media muestral y la varianza muestral del número de horas de los alumnos de economía que trabajan de ambas bases son respectivamente:

= 4.39, S²x = 1.02 y = 5.20, S²y = 1.76. Con esto formulamos nuestra hipótesis que las medias poblacionales de ambas bases son iguales y como hipótesis alternativa que la media poblacional de alumnos de la base 10 es mayor que el de la base 09. 1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H

H

2) Función pivotal:

Z =-1.679

3) Nivel de significación:

α = 5% → Zα = 1.64

4) Determinación de la región critica (RR) y la región de aceptación (RA)

Z =-1.679 Z=1.64

Page 115: trabajo estadistica III toñito.pdf

5) Toma de decisiones

Tenemos que = -1.679 → є RA. Por lo tanto, se acepta la hipótesis nula, entonces aceptamos que las medias poblacionales respecto al número de horas que trabajan los alumnos que labora actualmente de las bases 09 y 10 son iguales.

- Prueba de hipótesis para la varianza poblacional.

De los datos que obtuvimos en la encuesta, tenemos que (para cada una de las 3 bases involucradas en nuestro estudio): - La varianza muestral del número de horas de trabajo por parte de los alumnos de la base 09 que actualmente laboran es S²x = 1.02, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas que deberían de realizar es igual a 1, y como hipótesis alternativa, que ésta es diferente de 1. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

2

0

2

1

: 1

: 1

H

H

2)

Función Pivotal:

22

( 1)2

( 1)n

n SV X

3) Nivel de significación: 5%

P [V ≥ 0.05, 17] = 0.95

0.05, 17

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 116: trabajo estadistica III toñito.pdf

V = 17.34

5) Toma de decisiones:

Tenemos que V = 17.34 al estar en la RR Por lo tanto, se rechaza la hipótesis nula, entonces, aceptamos que la varianza poblacional de número de horas de trabajo que deberían darse para el trabajo es mayor de 1.

Page 117: trabajo estadistica III toñito.pdf

VARIABLES:

-NÚMERO DE HORAS DEDICADAS AL OCIO (SEMANAL) - GÉNERO

Page 118: trabajo estadistica III toñito.pdf

Análisis de la variable Número de horas dedicadas al ocio (semanal).

- Prueba de hipótesis para la media poblacional.

Analizando la población del estrato 1, es decir, la base 09, tenemos la siguiente información para la variable número de horas (por semana) dedicadas al ocio: media 7.64 y varianza 4.84. Con esto, formularemos nuestra hipótesis que dice: ¿Qué media poblacional del número de horas (por semana) dedicadas a estudiar es igual a 8.

1) Planteamiento de la hipótesis:

H0: µ = 7 horas

H1: µ >7 horas prueba unilateral derecha.

2) Función Pivotal:

(0,1)X

Z NS n

Z0 =

√ √

⁄=

Z0 = 2.050277143 2.05 Z0 = 2.05

3) Nivel de significación:

= 0.05 Z95% = 1.65

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = 2.05 Z0 = 1.65

Page 119: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Como Z = 2.05 < Z0 = 1.65 Z0 RA Entonces se acepta la hipótesis nula y se rechaza la hipótesis alternativa, es decir, de lo cual concluyo que los alumnos de la base 09 tienen 7 horas de ocio a la semana.

- Prueba de hipótesis para la diferencia de medias poblacionales.

Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y de la base 10, tenemos que la media muestral y la varianza muestral de la variable número de horas (por semana) dedicadas al Ocio para las 2 bases es respectivamente: (media 7.64 y varianza 4.84) base 09 y (media 8.06 y varianza 5.54) base 10 Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas bases son iguales y como hipótesis alternativa, que la media poblacional de la variable número de horas (por semana) dedicadas al Ocio es mayor en la base 10.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H

H

2) Función Pivotal:

Z0 =

Z0 = -0.8798395576 -0.88

Page 120: trabajo estadistica III toñito.pdf

Z0 = -0.88

3) Nivel de significación:

= 0.05 Z95% = 1.65

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -1.65 Z0 = -0.88

5.) Toma de decisiones:

Tenemos que Z0 = -0.88 > Z 95%= -1.65 Z0 RA. Por lo tanto, aceptamos la hipótesis nula, de que el número de horas (por semana) promedio dedicadas al Ocio de los alumnos de la base 09 es igual al promedio de horas de Ocio de los alumnos de la Base 10.

- Prueba de hipótesis para la varianza poblacional.

De los datos que obtuvimos en la encuesta, tenemos que (para cada una de las 3 bases involucradas en nuestro estudio): - La varianza muestral del promedio de horas de horas de ocio de la base 10 es 4.84 entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas al Ocio es igual a 5, y como hipótesis alternativa, que ésta sea diferente de 5. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

H0:

H1:

Page 121: trabajo estadistica III toñito.pdf

2) Función Pivotal: 2

2

( 1)2

( 1)n

n SV X

V0 =

X2

(43)

V0 =41.624

3) Nivel de significación:

= 5% X2(

= X2

(0.025)(43) = 24.43

X2(

= X2 = (0.975)(43) = 59.34

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

24.43 V0 =41.64 59.34

5) Toma de decisiones:

Tenemos que 24.43 < V0 = 41.64 < 59.34 V0 RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas promedio (por semana) dedicadas al Ocio de los alumnos de la Base 09 es igual a 5. - La varianza muestral del número de horas (por semana) dedicadas al Ocio en la base 11 es 5.54, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas al ocio es igual a 6, y como hipótesis alternativa, que ésta sea diferente a 6. Todo esto con un nivel de significación del 5%. 1) Planteamiento de la hipótesis:

H0: µ = 6

H1: µ 6

Page 122: trabajo estadistica III toñito.pdf

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

V0 =

X2

(46)

V0 =42.4733

3) Nivel de significación: 5%

= 5% X2(

= X2

(0.025)(46) = 32.36

X2(

= X2 = (0.975)(46) = 71.42

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

32.36 V = 42.47 71.42

5) Toma de decisiones:

Tenemos que 32.36 < V0 = 42.47 < 71.42 V0 RA. Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas al Ocio es igual a 6.

Page 123: trabajo estadistica III toñito.pdf

- La varianza muestral del número de horas (por semana) dedicadas al Ocio en la base 12 es 7.93, entonces planteamos la hipótesis nula que la varianza poblacional del número de horas (por semana) dedicadas al Ocio es igual a 8, y como hipótesis alternativa, que ésta sea diferente a 8. Todo esto con un nivel de significación del 5%. 1) Planteamiento de la hipótesis:

H0: µ = 8

H1: µ 8

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

V0 =

X2

(67)

V0 = 48.58

3) Nivel de significación:

= 5% X2(

= X2

(0.025)(67) = 48.76

X2(

= X2 = (0.975)(67) = 95.02

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V0 = 48.58 48.76 95.02

5) Toma de decisiones:

Tenemos que 48.76 < V0 = 48.58 < 95.02 V0 RA . Por lo tanto, se acepta la hipótesis nula, entonces, aceptamos que la varianza poblacional del número de horas (por semana) dedicadas al Ocio 8.

Page 124: trabajo estadistica III toñito.pdf

Análisis de la variable Opinión acerca de la procedencia del aporte

- Prueba de hipótesis para la proporción poblacional.

Analizando la población del estrato 2, es decir, la base 10 de la facultad de ciencias económicas, tenemos este dato inicial, el cual representa la proporción muestral de alumnos que piensa que el aporte debería ser completamente voluntario: ˆ 0.36p .Con esto,

formularemos nuestra hipótesis que dice que la proporción poblacional de alumnos que piensa que el aporte debería ser completamente voluntario es igual a 0.40 con un nivel de confianza del 95%.

1) Planteamiento de la hipótesis:

0

1

: 0.40

: 0.40

H p

H p

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.

0 0

0.36 0.401.39

0.36(1 0.36)

278

Z Z

3) Nivel de significación:

5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -1.64Z = -1.39

Page 125: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que 0 01.39 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y

tenemos que la proporción poblacional de alumnos que piensa que el aporte debería destinarse a la mejora de la calidad educativaes igual a 0.40

- Prueba de hipótesis para la diferencia de proporciones poblacionales.

Analizando los estratos 1 y 2, es decir, los alumnos de la base 09 y base 10 de la facultad de ciencias económicas, tenemos que la proporción de alumnos que piensa que el aporte debería ser voluntario es respectivamente 0.47 y 0.43. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 10, que tiene esta opinión es mayor que los de la base 10.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H P P

H P P

2) Función Pivotal:

ˆ ˆ( ) ( )(0,1)

(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

0 0

(0.47 0.43)0.95

0.47(0.53) 0.43(0.57)

284 278

Z Z

3) Nivel de significación:

5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 126: trabajo estadistica III toñito.pdf

Z=0.95Z = 1.64

5) Toma de decisiones:

Tenemos que 0 00.95 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula, entonces,

aceptamos que la proporción poblacional de alumnos de la facultad de Administración que piensa que el aporte debería ser completamente voluntario es igual que la de la base 10.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si la opinión que tienen los alumnos de la base 10 de Ciencias Administrativas respecto a qué debería destinarse el aporte depende de su opinión respecto a la calidad educativa de su respectiva facultad. Por lo tanto, nuestra hipótesis nula será que si la opinión que tienen los alumnos respecto a qué debería destinarse el aporte depende de su opinión acerca de la disponibilidad de invertir en la mejora de su facultad. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

Opinión sobre la calidad

educativa

Opinión sobre el origen de dicho aporte

Porcentaje

de mensualidad

en secundaria

Porcentaje del ingreso

actual

Completamente Voluntario

Otros Total

Si 36 54 53 19 162

No 24 24 43 25 116

Total 60 78 96 44 278

Page 127: trabajo estadistica III toñito.pdf

1) Planteamiento de la hipótesis:

0

1

: La opinión que tienen los alumnos respecto a si desean invertir o no y el origen de dicho aporte

: Estan relacionados o son dependientes

H

H

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 2 (número de filas) C= 4 (número de columnas)

3) Nivel de significación:

2 2

( 1)( 1) 41% 0.01

13.3

F CP X x P X x

x

Frecuencias esperadas:

Calculo de Q: 2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2

0

2 2

(36 35) (54 45) (53 56) (19 26) (24 25) (24 33)

35 45 56 26 25 33

(43 40) (25 18)

40 18

Q

Opinión sobre la calidad

educativa

Opinión sobre el origen de dicho aporte

Porcentaje

de mensualidad

en secundaria

Porcentaje del ingreso

actual

Completamente Voluntario

Otros Total

Si 35 45 56 26 162

No 25 33 40 18 116

Total 60 78 96 44 278

Page 128: trabajo estadistica III toñito.pdf

0 17.18Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

………..Q =13.3 17.8

5) Toma de decisiones:

Tenemos que 0 017.18 13.3Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces

aceptamos que la opinión que tienen los alumnos respecto a qué debería destinarse el aporte y la opinión respecto a la calidad educativa de su respectiva base no son independientes.

Page 129: trabajo estadistica III toñito.pdf

- Prueba de Homogeneidad (no paramétrica).

En esta sección vamos a analizar si los alumnos de las facultades de la base10, base 11 y base 12 son homogéneos con respecto a su la opinión que tienen los alumnos respecto al origen del aporte a invertir. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación: Opinión sobre el destino de dicho

aporte

Facultades

Administración Sociales Industrial Total

Porcentaje de la mensualidad en secundaria

69 63 39 171

Porcentaje del ingreso actual

85 71 37 193

Completamente voluntario

104 100 78 282

Otros 25 44 13 82

Total 283 278 167 728

1) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

2) Nivel de significación:

2 2

( 1)( 1) 65% 0.05

12.6

F CP X x P X x

x

Page 130: trabajo estadistica III toñito.pdf

Frecuencias esperadas: Opinión sobre el destino de dicho

aporte

Facultades

Administración Sociales Industrial Total

Porcentaje de la mensualidad en secundaria

66 65 39 171

Porcentaje del ingreso actual

75 74 44 193

Completamente voluntario

110 108 65 282

Otros 32 31 19 82

Total 283 278 167 728

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2

0

2 2 2 2 2 2

(69 66) (63 65) (39 39) (85 75) (71 74) (37 44)

66 65 39 75 74 44

(105 110) (100 108) (78 65) (25 32) (44 31) (13 19)

110 108 65 32 31 19

Q

0 15.02Q

3) Determinación de la región crítica (RR) y la región de aceptación (RA):

12.6Q =41.28

Page 131: trabajo estadistica III toñito.pdf

4) Toma de decisiones:

Tenemos que 0 015.02 12.6Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces

aceptamos que los alumnos de las facultades de la base 09, base 10 y base 11 son heterogéneos con respecto a su la opinión respecto a la procedencia de dicho aporte.

Análisis de la variable porcentaje del ingreso mensual que se debería aportar

- Prueba de hipótesis para la media poblacional.

Analizando la población del estrato 2, es decir, la facultad de base 10, tenemos la siguiente información para la variable porcentaje del ingreso mensual que s deberían existir para el

aporte: 8.79X 2 18.67S . Con esto, formularemos nuestra hipótesis que dice que media poblacional del porcentaje del ingreso mensual que deberían existir para el aporte es igual a 09.

1) Planteamiento de la hipótesis:

0

1

: 10

: 10

H

H

2) Función Pivotal:

(0,1)X

Z NS n

0 0

8.79 101.49

18.67 278Z Z

3) Nivel de significación: 5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 132: trabajo estadistica III toñito.pdf

Z = -1.49 Z = 1.64

5) Toma de decisiones:

Tenemos que 0 01.49 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y

tenemos que la media poblacional del porcentaje del ingreso mensual que se debería aportar es 10.

- Prueba de hipótesis para la diferencia de medias poblacionales.

Analizando los estratos 1 y 3, es decir, los alumnos de la base 10 y base 12 , tenemos que la media muestral y la varianza muestral del porcentaje del ingreso mensual que se debería

aportar para las 2 bases es respectivamente: 9.26X 2 21.26xS y 9.61Y 2 20.42yS

Con esto formulamos nuestra hipótesis que las medias poblaciones de ambas facultades son iguales y como hipótesis alternativa, que la media poblacional de alumnos de base 10 que tiene esta opinión es mayor que la de la base 12.

1) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H

H

2) Función Pivotal:

Page 133: trabajo estadistica III toñito.pdf

22

0 0

( ) ( )(0,1)

9.26 9.610.55

21.26 20.42

144 79

x y

yx

x y

X YZ N

n n

Z Z

3) Nivel de significación:

5% 1.64Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -0.55 Z = 1.64

5) Toma de decisiones:

Tenemos que 0 00.55 1.64Z Z Z RA . Por lo tanto, se acepta la hipótesis nula,

entonces, aceptamos que las medias poblaciones del porcentaje del ingreso mensual que se debería aportar en las facultades de Administración e Ingeniería Industrial son iguales.

- Prueba de hipótesis para la varianza poblacional.

De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del porcentaje

del ingreso mensual que se debería aportar en base 09 es 2 21.26xS , entonces planteamos la

hipótesis nula que la varianza poblacional del porcentaje del ingreso mensual para el aporte es igual a 1, y como hipótesis alternativa, que ésta es diferente de 1. Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

Page 134: trabajo estadistica III toñito.pdf

2

0

2

1

: 20

: 20

H

H

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

2

0 0 02

0

( 1) (284 1)21.26300.83

20

n SV V V

3) Nivel de significación: 5%

2 2

/2,( 1) 1 /2,( 1)

2 2

0.025,284 0.975,284

0.95

247.98 328

n nP X V X

X X

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V = 300.83 328

5) Toma de decisiones:

Tenemos que 0 0300.83 328V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,

aceptamos que la varianza poblacional porcentaje del ingreso mensual que se debería aportar es 20. De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del porcentaje

del ingreso mensual que se debería aportar en la base 10 es 2 18.67xS , entonces planteamos

la hipótesis nula que la varianza poblacional del porcentaje del ingreso mensual para el aporte es igual a 20, y como hipótesis alternativa, que ésta es menor que 20. Todo esto con un nivel de significación del 5%.

Page 135: trabajo estadistica III toñito.pdf

1) Planteamiento de la hipótesis:

0 0

1 1

: 20

: 20

H H

H H

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

2

0 0 02

0

( 1) (278 1)18.67258.58

20

n SV V V

3) Nivel de significación: 5%

2 2

/2,( 1) 1 /2,( 1)

2 2

0.025,278 0.975,138

0.95

237.46 321.96

n nP X V X

X X

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

237.46V = 258.58

5) Toma de decisiones:

Tenemos que 0 0258.58 237.45Q Q RR . Por lo tanto, se acepta la hipótesis nula,

entonces, aceptamos que la varianza poblacional porcentaje del ingreso mensual que se debería aportar es 20.

Page 136: trabajo estadistica III toñito.pdf

De los datos que obtuvimos en la encuesta, tenemos que la varianza muestral del porcentaje

del ingreso mensual que se debería aportar en la base 12 es 2 22.42xS , entonces planteamos

la hipótesis nula que la varianza poblacional del porcentaje del ingreso mensual para el aporte es igual a 20, y como hipótesis alternativa, que ésta es mayor que 20 . Todo esto con un nivel de significación del 5%.

1) Planteamiento de la hipótesis:

2

0

2

1

: 20

: 20

H

H

2) Función Pivotal:

22

( 1)2

( 1)n

n SV X

2

0 0 02

0

( 1) (167 1)22.42186.09

20

n SV V V

3) Nivel de significación: 5%

2 2

/2,( 1) 1 /2,( 1)

2 2

0.025,167 0.975,167

0.95

137.34 198.20

n nP X V X

X X

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

V = 186.09 198.20

5) Toma de decisiones:

Page 137: trabajo estadistica III toñito.pdf

Tenemos que 0 0186.09 198.20V V RA . Por lo tanto, se acepta la hipótesis nula, entonces,

aceptamos que la varianza poblacional porcentaje del ingreso mensual que se debería aportar es 20.

Finalmente tenemos que la varianza de esta variable es igual en todos los estratos.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si existe interdependencia entre el porcentaje del ingreso mensual para aportar y el nivel del ingreso personal disponible de los encuestados en la base 11. Para esto se hizo una re categorización en ésta última variable de la siguiente manera: porcentaje bajo (de 0 5), Ingresos medios (de 6a 10) e Ingresos altos (de 11 a más). Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

1) Planteamiento de la hipótesis:

0

1

: El número de escalas que debería haber para el aporte y el nivel del ingreso

personal disponible de los encuestados son independientes

: Estan relacionados o son dependientes

H

H

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

Donde tenemos que: F = 3 (número de filas) C= 5 (número de columnas)

3) Nivel de significación:

Ingresos

Porcentaje del ingreso mensual que se debería aportar

Bajos Medios Altos Total

Bajos 21 25 7 53

Medios 19 15 9 43

Altos 23 29 18 70

Total 63 69 34 166

Page 138: trabajo estadistica III toñito.pdf

2 2

( 1)( 1) 41% 0.01

13.3

F CP X x P X x

x

Frecuencias esperadas:

Ingresos

Porcentaje del ingreso mensual que se debería aportar

Bajos Medios Altos Total

Bajos 20 22 11 53

Medios 16 18 9 43

Altos 27 29 14 70

Total 63 69 34 166

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2

0

2 2 2

(21 20) (25 22) (7 11) (19 16) (18 15) (9 9)

20 22 11 16 15 9

(23 27) (29 29) (18 14)

27 29 14

Q

0 4.81Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

4.81 Q = 13.3

Page 139: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que 0 04.81 13.3X X Z RA . Por lo tanto, se acepta la hipótesis nula. Entonces

aceptamos que el promedio del ingreso mensual que se destina al aporte y el nivel del ingreso personal disponible de los encuestados en la base 12 son independientes.

- Prueba de Homogeneidad (no paramétrica).

En esta sección vamos a analizar si los alumnos de las bases 09, base 10 y base 11 son homogéneos con respecto a su la opinión que tienen los alumnos respecto al origen del aporte a invertir. Todo esto con un nivel de significación del 5%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

1) Planteamiento de la hipótesis:

Ho: las 3 bases son homogéneas respecto al porcentaje del ingreso mensual del aporte a invertir H1: las tres bases son heterogéneas respecto al porcentaje del ingreso mensual del aporte a invertir

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

Porcentaje del ingreso mensual que se debería destinar para el

aporte

Bases

Base 10 Base 11 Base 12 Total

Bajo porcentaje 113 97 63 273

Mediano porcentaje

126 71 69 266

Alto porcentaje 44 110 34 188

Total 283 278 166 727

Page 140: trabajo estadistica III toñito.pdf

2 2

( 1)( 1) 45% 0.05

9.49

F CP X x P X x

x

Frecuencias esperadas:

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2

0

2 2 2

(113 106) (97 104) (63 62) (126 104) (71 102) (69 61)

106 104 62 104 102 61

(44 73) (110 72) (34 43)

73 72 43

Q

0 49.53Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Porcentaje del ingreso mensual que se debería destinar para el

aporte

Bases

Base 09 Base 10 Base 11 Total

Bajo porcentaje 106 104 62 273

Mediano porcentaje

104 102 61 266

Alto porcentaje 73 72 43 188

Total 283 278 166 727

Page 141: trabajo estadistica III toñito.pdf

Q =9.49 49.53

5) Toma de decisiones:

Tenemos que 0 049.53 9.49Q Q RR . Por lo tanto, se rechaza la hipótesis nula. Entonces

aceptamos que los alumnos de la base 09, base 10 y base 11 son homogéneos con respecto al porcentaje del ingreso mensual que se debería aportar.

- Análisis de Varianza (ANAVA).

En esta sección analizaremos si el porcentaje del ingreso que debería haber para el aporte en las tres bases es mismo o si es diferente en por lo menos 1 facultad. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales.

1) Planteamiento de la hipótesis:

0 1 2 3

1 1

:

: No todos los son iguales

H

H

2) Determinación del nivel de confianza.

1 (2,725)5% 3.02F

3) Formulación de la función pivotal.

Page 142: trabajo estadistica III toñito.pdf

2

( 1)

( 1, )2

( )

( 1)

( )

k

k n k

n k

X k CMCF F

X n k CME

1

SCCCMC

k

Cuadrado medio entre tratamientos (columnas)

SCECME

n k

Cuadrado medio dentro de los tratamientos (error)

4) Construcción de la tabla de análisis de varianza (ANAVA).

M1 M2 M3 Total

Total 2629.84 2443.62 1595.26 6667.72

in 284 278 166 728

iX 9.26 8.79 9.61 9.16

2

i in X 24352.32 21479.42 15330.45 61162.19

2 2728(9.16) 61083.28nX

Suma de cuadrados:

2 2

1 1

2 2

1

75950 61083.28 14866.72

61162.19 61083.28 78.91

ink

ij

i j

k

i i

i

SCT X nX

SCC n X nX

Con estos datos, realizamos nuestra tabla de análisis de varianza:

Fuente de variación

Suma de cuadrados Grados

de libertad

Cuadrado medio

Razón 0H

Page 143: trabajo estadistica III toñito.pdf

Entre tratamientos (columnas)

2 2

1

3755.56 3521.40

78.91

k

i i

i

SCC n X nX

SCC

SCC

1

2

g k

g

1

39.46

SCCCMC

k

CMC

0

0 1.93

CMCF

CME

F

i

Dentro de los

tratamientos (error)

14866.72 78.91

14787.81

SCE SCT SCC

SCE

SCE

725

g n k

g

20.4

SCECME

n k

CME

Total

2 2

1 1

75950 61083.28

14866.72

ink

ij

i j

SCT X nX

SCT

SCT

727g

5) Determinación de la región crítica (RR) y la región de aceptación (RA):

1.93 F =3.02

6) Toma de decisiones:

Tenemos que 0 01.93 3.02X X Z RA . Por lo tanto aceptamos la hipótesis nula.

Concluimos que en las 3 bases, el número promedio de escalas que deberían existir para dicho pago son iguales.

Page 144: trabajo estadistica III toñito.pdf

- Prueba de la bondad de ajuste (no paramétrica).

En esta sección verificaremos si pago porcentual del ingreso que debería haber para el aporte en la base 11 sigue una distribución de tipo Chi-Cuadrado con un nivel de significación del 5%. Para esto usaremos los datos que obtuvimos en la encuesta, los cuales se presentan a continuación:

Número de Escalas

Número de alumnos

5 129

10 103

15 30

20 16

Total 278

Además, tenemos que: 8.8X 2 18.67xS

1) Planteamiento de la hipótesis:

0

1

: El número de escalas que debería haber para el aporte

sigue una distribucion de probabilidad de tipo normal

: El número de escalas que debería haber para el aporte

no sigue una distribu

H

H

cion de probabilidad de tipo normal

2) Función Pivotal:2

2

( 1)

1

( )ki i

k m

i i

o eQ X

e

3) Nivel de significación:

2 2

( 1) 35% 0.05

7.81

k mP X x P X x

x

Frecuencias esperadas:

X

x

iP 278i ie P io 2( )i i

i

o e

e

5 -0.88 0.18943 52.66 129 110.67

10 0.28 0.32083 89.19 103 2.14

15 1.43 0.31338 87.12 30 36.58

20 2.59 0.17636 49.03 16 12.23

1 79 24.5557Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Page 145: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que 0 0161.62 7.81Q V RR . Por lo tanto, se rechaza la hipótesis nula, entonces,

aceptamos que el porcentaje del presupuesto mensual que deberían haber para el aporte no sigue una distribución de probabilidad de tipo Normal, lo cual se podía ver a simple vista ya que no existía simetría en las frecuencias de los datos. 8.1. Estimación y Prueba de Hipótesis de la media Ejercicio 1: Una encuesta por muestreo aplicada a 44 alumnos de la facultad de Ciencias Económicas de la base 2010 de la UNMSM, revela que el gasto personal mensual es de S/. 264.25, con una desviación estándar de S/.91.80.Docimar la hipótesis de que el verdadero gasto personal medio de los estudiantes de la UNMSM, es de S/.200, frente a la alternativa de que fue mayor que S/.200. Utilizar un nivel de significación del 1%.Solución:

1) PLANTEAMOS LA HIPÓTESIS

2) FORMULAMOS LA FUNCIÓN PIVOTAL

No se conoce la varianza poblacional

Muestra grande

Z = -

⁄ N (0,1)

VALOR CALCULADO:

Ho: µ=200 H1: µ>200

Page 146: trabajo estadistica III toñito.pdf

Zo = -

⁄ =

√ ⁄

= 8.83

3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:

α= 1% Z (0.99)= 2.58

4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA REGIÓN DE

ACEPTACIÓN (RA)

RA RR

2.58

5) TOMA DE DECISIONES

Tenemos que: Zo = 8.83 2.58; Zo Є RR luego, rechazamos la hipótesis Ho, por lo tanto, la media poblacional es mayor a S/.200.

Ejercicio 2: Una encuesta por muestreo aplicada a 159 alumnos de la facultad de Ciencias Económicas de la UNMSM, revela que el gasto personal mensual es de S/.251.24, con una desviación estándar de S/.105.43.Docimar la hipótesis de que el verdadero gasto personal medio de los estudiantes de la UNMSM, es de S/.200, frente a la alternativa de que fue mayor que S/.200. Utilizar un nivel de significación del 1%. Solución:

1) PLANTEAMOS LA HIPÓTESIS

2) FORMULAMOS LA FUNCIÓN PIVOTAL

No se conoce la varianza poblacional

Ho: µ=200 H1: µ>200

Page 147: trabajo estadistica III toñito.pdf

Muestra grande

Z = -

⁄ N (0,1)

VALOR CALCULADO: Zo = -

⁄ =

√ ⁄

= 6.13

3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:

α= 1% Z 0.99=2.58

4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA REGIÓN DE

ACEPTACIÓN (RA)

RA

RR

2.58

5) TOMA DE DECISIONES

Tenemos que: Zo = 6.13 >2.58 Zo Є RR luego, rechazamos la hipótesis Ho, por lo tanto, la media poblacional es mayor que S/.200. 8.2. Estimación y Prueba de Hipótesis de la diferencia de medias Ejercicio 1: Se propone estudiar una nueva base la 2011 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2011 realizamos una encuesta a 47

alumnos, y los resultados fueron X=248.51, Y=264.25, 8426.75 ¿Diría Ud. que la base 2011 tiene un gasto más significativo o mayor?

Page 148: trabajo estadistica III toñito.pdf

Solución: 1. PLANTEAMOS LA HIPÓTESIS

Ho: µx =µy H1: µx <µy

2. FORMULAMOS LA FUNCIÓN PIVOTAL

No se conocen las varianzas poblacionales

Muestras grandes

Se supone Poblaciones Normales Homocedásticas

FP =

N (0, 1)

Valor calculado:

Zo=

= =

= -0.77

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA RR

-2.58

5. TOMA DE DECISIONES

Page 149: trabajo estadistica III toñito.pdf

Tenemos que: Zo = -0.77> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2011 no tiene un mayor gasto respecto a la base 2010.

Ejercicio 2: Se propone estudiar una nueva base la 2012 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2012 realizamos

una encuesta a 69 alumnos, y los resultados fueron X=244.71, Y=264.25, 8426.75 ¿Diría Ud. que la base 2012 tiene un gasto más significativo o mayor? Solución:

6. PLANTEAMOS LA HIPÓTESIS

Ho: µx =µy H1: µx <µy

7. FORMULAMOS LA FUNCIÓN PIVOTAL

No se conocen las varianzas poblacionales

Muestras grandes

Se supone Poblaciones Normales Homocedásticas

FP =

N (0, 1)

Valor calculado:

Zo=

= =

= -0.99

8. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

Page 150: trabajo estadistica III toñito.pdf

9. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA RR

-2.58

10. TOMA DE DECISIONES

Tenemos que: Zo = -0.99> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2012 no tiene un gasto más significativo respecto a la base 2010.

8.3. Estimación y Prueba de Hipótesis de la proporción Ejercicio 1: La fracción de respuestas sobre el tipo de vivienda “propia” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM fue de 0.90. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 137estudiantes cuentan con vivienda “propia” de un total de 159 encuestados. Contrastar si la nueva encuesta es segura o no, con un 1% de significación.

Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: p =0.9 H1: p <0.90

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Page 151: trabajo estadistica III toñito.pdf

Z =

N (0, 1)

Si se supone verdadera la hipótesis nula Ho: p=po

Zo=

=

= -1.67

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -1.67>-2.58 Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, la nueva encuesta no tiene respuestas confiables respecto si los estudiantes cuentan con vivienda “propia”.

Ejercicio 2: La fracción de respuestas sobre el tipo de vivienda “alquilado” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM fue de 0.20. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 22estudiantes cuentan con vivienda “alquilada” de un total de 159 encuestados. Contrastar si la nueva encuesta es segura o no, con un 1% de significación.

Page 152: trabajo estadistica III toñito.pdf

. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: p =0.20 H1: p <0.20

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Si se supone verdadera la hipótesis nula Ho: p=po

Zo=

= =

= -0.86

2. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= % Z0.01= -2.5

3. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -0.86<-2.58 Zo Є RR. Por lo tanto rechazamos el Ho.

Page 153: trabajo estadistica III toñito.pdf

Por lo tanto, la nueva encuesta no tiene respuestas confiables respecto si los estudiantes cuentan con vivienda “alquilada”.

8.4. Estimación y Prueba de Hipótesis de la diferencia de proporciones Ejercicio 1: Se realizó una encuesta a los estudiantes de la base 2010 sobre el tipo de vivienda, en una muestra de 44 se obtuvo que el 84% cuentan con vivienda “propia”, también se realizó la misma encuesta a la base 2012 con una muestra de 68 y se obtuvo que el 88% cuentan con vivienda “propia”. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca del tipo de vivienda que presentan los estudiantes de dicha facultad? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: PX = Py H1: Px<Py Px: respuestas “propia” de la base 2010 Py: respuestas “propia” de la base 2011

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Zo=

= -0.57

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

Page 154: trabajo estadistica III toñito.pdf

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -0.57> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no es significativamente buena ya que no se acerca a la realidad.

Ejercicio 2: Se realizó una encuesta a los estudiantes de la base 2011 sobre el tipo de vivienda, en una muestra de 47 se obtuvo que el 85% cuentan con vivienda “propia”, también se realizó la misma encuesta a la base 2010 con una muestra de 44 y se obtuvo que el 84% cuentan con vivienda “propia”. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca del tipo de vivienda que presentan los estudiantes de dicha facultad? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: PX = Py H1: Px>Py Px: respuestas “propia” de la base 2011 Py: respuestas “propia” de la base 2010

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Zo=

= 0.13

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

Page 155: trabajo estadistica III toñito.pdf

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -0.13> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no es significativamente buena ya que no se acerca a la realidad.

8.5. Estimación y Prueba de Hipótesis de la Varianza Ejercicio 1: En la facultad de Ciencias Económicas de la UNMSM, se plantea la hipótesis de que la desviación estándar de los gastos personales mensuales es de S/.100. En una muestra de 159 alumnos elegidos al azar, con una varianza de S/.11115.78. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es S/.100? Use el nivel de significación del 1%, y suponga que la distribución de la actitud en un simulacro de sismo es normal. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: = S/.10000

H1: ≠ S/.10000

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Page 156: trabajo estadistica III toñito.pdf

V =

Vo=

= 175.63

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

67.3 140.2

5. TOMA DE DECISIONES

Tenemos que: [67.3- 140.2]; Vo=175.63;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.10000.

Ejercicio 2:

En la facultad de Ciencias Económicas de la UNMSM de la base 2011, se plantea la hipótesis de que la desviación estándar es de S/.100. En una muestra de 47 alumnos elegidos al azar, con una varianza de S/.10686.34. Con estos datos, ¿Se justifica la suposición que la desviación estándar verdadera es de S/.900? Use el nivel de significación del 1%, y suponga que la distribución de los ingresos mensuales familiares es normal.

1. PLANTEAMOS LA HIPÓTESIS

Ho: = S/.10000

H1: ≠ S/.10000

Page 157: trabajo estadistica III toñito.pdf

2. FORMULAMOS LA FUNCIÓN PIVOTAL

V =

Vo=

= 49.16

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

74.2 129.6

5. TOMA DE DECISIONES

Tenemos que: [74.2- 129]; Vo=49.16;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.10000.

8.7. Prueba de Independencia Ejercicio 1: Se seleccionan aleatoriamente 44 estudiantes de la base 2010de la facultad de Ciencias Económicas de la UNMSM, y se les aplica una encuesta, para verificar si existe razón, al creer que los estudiantes que incurren en altos gastos por lo general cuentan con vivienda propia, y que los estudiantes que incurren en bajos gastos a menudo cuentan con vivienda alquilada. Los resultados obtenidos de la encuesta se muestran en el siguiente cuadro: (altos: mayor a 200; bajos: menor igual a 200)

Page 158: trabajo estadistica III toñito.pdf

GASTOS Rendimiento académico

PROPIA ALQUILADO TOTAL

ALTOS 26 3 29

BAJOS 13 2 15

TOTAL 39 5 44

Utilice un nivel de significación del 1%

1. PLANTEAMOS LA HIPÓTESIS

Ho: el gasto y tipo de viviendason independientes. H1: Están relacionados o son dependientes.

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas

3. NIVEL DE SIGNIFICACIÓN

α =1% ; P ( (

)

X= 6.63

Las frecuencias esperadas:

INGRESOS Rendimiento académico

BUENO REGULAR TOTAL

ALTOS 26 3 29

BAJOS 13 2 15

TOTAL 39 5 44

P=

{proporción de estudiantes con buenos rendimientos}

26(

= 8.32 {número de estudiantes con altos ingresos que presentan

buenos rendimientos}

Page 159: trabajo estadistica III toñito.pdf

CÁLCULO DE Q:

Q=∑

Q=

Q= 0.434

4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

RA

6.63

5. DESICIÓN:

Puesto que Q= 0.0< 6.63 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, el gasto personal y tipo de vivienda son independientes.

8.8. Prueba de Homogeneidad

Ejercicio 1: Se efectuó un estudio a tres bases de la Facultad de Ciencias Económicas de la UNMSM: Base 2009, Base 2010 y Base 2011, para determinar el tipo de vivienda de los alumnos, como “propia” o “alquilada”. Una muestra aleatoria de 159 alumnos ha dado los resultados de la siguiente tabla. A partir de estos datos, determinar si las tres bases son homogéneas con respecto a su tipo de vivienda. Utilice el nivel de significación del 1%.

RENDIMIENTO ACADEMICO

BASES TOTAL

BASE 09 BASE 10 BASE 11

PROPIA 37 40 60 137

ALQUILADA 7 7 8 22

TOTAL 44 47 68 159

Page 160: trabajo estadistica III toñito.pdf

1. PLANTEAMOS LA HIPÓTESIS

Ho: Las tres bases son homogéneas con respecto al tipo de vivienda con el que disponen. H1: Las tres bases no son homogéneas con respecto al tipo de vivienda con el que disponen.

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas

3. NIVEL DE SIGNIFICACIÓN

α =1% ; P ( (

)

X= 9.21

Las frecuencias esperadas:

RENDIMIENTO ACADEMICO

BASES TOTAL

BASE 09 BASE 10 BASE 11

PROPIA 38 40 59 137

ALQUILADA 6 7 9 22

TOTAL 44 47 68 159

P=

{Proporción de alumnos que presentan vivienda “propia”}

44(

12.32{Número de alumnos de la Base 10 que presentan vivienda

“propia”}

CÁLCULO DE Q:

Q=∑

Q=

Q= 0.32

Page 161: trabajo estadistica III toñito.pdf

4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

RA

9.21

5. DESICIÓN:

Puesto que Q= 0.32< 9.21 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, las tres bases son homogéneas con respecto al tipo de vivienda que el que disponen.

8.9. Análisis de Varianza

En esta sección analizaremos si el promedio del gasto personal mensual en la Facultad de Ciencias Económicas de la UNMSM es el mismo o si es diferente en por lo menos en 1 de las 3 bases encuestadas. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales.

1) Planteamiento de la hipótesis:

0 1 2 3

1 1

:

: No todos los son iguales

H

H

2) Determinación del nivel de confianza.

1 (2,725)5% 3.0016 F

3) Formulación de la función pivotal.

Page 162: trabajo estadistica III toñito.pdf

2

( 1)

( 1, )2

( )

( 1)

( )

k

k n k

n k

X k CMCF F

X n k CME

1

SCCCMC

k

Cuadrado medio entre tratamientos (columnas)

SCECME

n k

Cuadrado medio dentro de los tratamientos (error)

4.) Construcción de la tabla de análisis de varianza (ANAVA).

Base 2009 Base 2010 Base 2011 Total

Total 11627 11680 14572 37879

in 44 47 58 159

iX 264.25 248.51 251.24 764

2

i in X 3072434.8 2902589.35 3661049.18 9636073.33

8.1. Estimación y Prueba de Hipótesis de la media Ejercicio 1: Una encuesta por muestreo aplicada a 159 alumnos de la facultad de Ciencias Económicas de la UNMSM, revela que el ingreso promedio familiar es de S/. 1724.72, con una desviación estándar de S/.954.12.Docimar la hipótesis de que el verdadero ingreso familiar medio de los estudiantes de la UNMSM, es de S/.1500, frente a la alternativa de que fue mayor que S/.1500. Utilizar un nivel de significación del 1%. Solución:

6) PLANTEAMOS LA HIPÓTESIS

7) FORMULAMOS LA FUNCIÓN PIVOTAL

No se conoce la varianza poblacional

Muestra grande

Ho: µ=1500 H1: µ>1500

Page 163: trabajo estadistica III toñito.pdf

Z = -

⁄ N (0,1)

VALOR CALCULADO: Zo = -

⁄ =

√ ⁄

= 2.96

8) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:

α= 1% Z 0.99=2.58

9) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

10)

RA

RR

2.58

11) TOMA DE DECISIONES

Tenemos que: Zo = 2.96> 2.58Zo Є RR luego, rechazamos la hipótesis Ho, por lo tanto, la media poblacional es mayor que S/.1500. Ejercicio 2: Una encuesta por muestreo aplicada a 68 alumnos de la facultad de Ciencias Económicas de la base 2012 de la UNMSM, revela que el ingreso promedio familiar es de S/. 1655.74, con una desviación estándar de S/.1082.74.Docimar la hipótesis de que el verdadero ingreso familiar medio de los estudiantes de la UNMSM, es de S/.1500, frente a la alternativa de que fue mayor que S/.1500. Utilizar un nivel de significación del 1%. Solución:

Page 164: trabajo estadistica III toñito.pdf

1) PLANTEAMOS LA HIPÓTESIS

2) FORMULAMOS LA FUNCIÓN PIVOTAL

No se conoce la varianza poblacional

Muestra grande

Z = -

⁄ N (0,1)

VALOR CALCULADO:

Zo = -

⁄ =

√ ⁄

= 0.65

3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:

α= 1% Z (0.99)= 2.58

4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA RR 2.58

5) TOMA DE DECISIONES

Tenemos que: Zo = 0.65<2.58; Zo Є RA luego, aceptamos la hipótesis Ho, por lo tanto, la media poblacional es igual a 1500 grados.

Ho: µ=1600 H1: µ>1600

Page 165: trabajo estadistica III toñito.pdf

8.2. Estimación y Prueba de Hipótesis de la diferencia de medias Ejercicio 1: Se propone estudiar una nueva base la 2012 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2012 realizamos

una encuesta a 69 alumnos, y los resultados fueron X=1655.74, Y=1760, 540986.05 ¿Diría Ud. que la base 2012 tiene un mejor ingreso? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: µx =µy H1: µx <µy

2. FORMULAMOS LA FUNCIÓN PIVOTAL

No se conocen las varianzas poblacionales

Muestras grandes

Se supone Poblaciones Normales Homocedásticas

FP =

N (0, 1)

Valor calculado:

Zo=

= =

= -0.61

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

Page 166: trabajo estadistica III toñito.pdf

RA RR

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -0.61> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2012 no tiene un mejor ingreso respecto a la base 2010.

Ejercicio 2: Se propone estudiar una nueva base la 2011 para saber cuál es el ingreso familiar mensual, respecto a la base 2010. Para estudiar la nueva base 2011 realizamos

una encuesta a 47 alumnos, y los resultados fueron X=1791.49, Y=1760, 540986.05 ¿Diría Ud. que la base 2011 tiene un mejor ingreso? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: µx =µy H1: µx <µy

2. FORMULAMOS LA FUNCIÓN PIVOTAL

No se conocen las varianzas poblacionales

Muestras grandes

Se supone Poblaciones Normales Homocedásticas

FP =

N (0, 1)

Page 167: trabajo estadistica III toñito.pdf

Valor calculado:

Zo=

= =

= 0.18

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA RR

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = 0.18> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 2011 no tiene un mejor ingreso respecto a la base 2010.

8.3. Estimación y Prueba de Hipótesis de la proporción Ejercicio 1: La fracción de respuestas sobre el estado civil “soltero” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM fue de 0.993. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 157estudiantes presentanun estado civil de “soltero” de un total de 159 encuestados. Contrastar si la nueva encuesta es segura o no con el estado civil de los estudiantes de dicha facultad con un 1% de significación.

Page 168: trabajo estadistica III toñito.pdf

Solución: 6. PLANTEAMOS LA HIPÓTESIS

Ho: p =0.993 H1: p <0.993

7. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N(0, 1)

Si se supone verdadera la hipótesis nula Ho: p=po

Zo=

=

= -0.91

8. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

9. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

Page 169: trabajo estadistica III toñito.pdf

10. TOMA DE DECISIONES

Tenemos que: Zo = -0.91>-2.58 Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, la nueva encuesta no tiene respuestas confiables respectoal estado civil que presentan los estudiantes.

Ejercicio 2: La fracción de respuestas sobre el estado civil “soltero” de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM de la Base 2010 fue de 0.99. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene que 42estudiantes presentan un estado civil de “soltero” de un total de 44 encuestados. Contrastar si la nueva encuesta es segura o no con el estado civil de los estudiantes de dicha facultad con un 1% de significación. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: p =0.99 H1: p <0.99

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Si se supone verdadera la hipótesis nula Ho: p=po

Zo=

= =

= -2.67

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= % Z0.01= -2.58

Page 170: trabajo estadistica III toñito.pdf

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -2.67<-2.58 Zo Є RR. Por lo tanto rechazamos el Ho. Por lo tanto, la nueva encuesta si tiene respuestas confiables respecto al estado civil que presentan los estudiantes.

8.4. Estimación y Prueba de Hipótesis de la diferencia de proporciones Ejercicio 1: Se realizó una encuesta a los estudiantes de la base 2010 sobre su estado civil, en una muestra de 44 se obtuvo que el 95% presenta un estado civil de “soltero”, también se realizó la misma encuesta a la base 2012 con una muestra de 68 y se obtuvo que el 100% presentan un estado civil de “soltero”. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca del estado civil que presentan los estudiantes de dicha facultad? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: PX = Py H1: Px<Py Px: respuestas “soltero” de la base 2010 Py: respuestas “soltero” de la base 2011

Page 171: trabajo estadistica III toñito.pdf

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Zo=

= -1.47

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -1.47> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no es significativamente buena se ya que no se acerca a la realidad.

Page 172: trabajo estadistica III toñito.pdf

Ejercicio 2: Se realizó una encuesta a los estudiantes de la base 2010 sobre su estado, en una muestra de 44 se obtuvo que el 95% presenta un estado civil de “soltero”, también se realizó la misma encuesta a la base 2011 con una muestra de 47 y se obtuvo que el 100% presentan un estado civil de “soltero” realizada la encuesta en el 2012. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca de que la edad tiene relación respectoal estado civil que presentan los estudiantes de dicha facultad? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: PX = Py H1: Px<Py Px: respuestas “soltero” de la base 2010 Py: respuestas “soltero” de la base 2011

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Zo=

= -1.47

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z0.01= -2.58

Page 173: trabajo estadistica III toñito.pdf

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -1.47> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la edad no influye en el estado civil de los estudiantes de dicha facultad.

8.5. Estimación y Prueba de Hipótesis de la Varianza Ejercicio 1: En la facultad de Ciencias Económicas de la UNMSM, se plantea la hipótesis de que la desviación estándar de los ingresos familiares mensuales de los estudiantes es de S/.900. En una muestra de 159alumnos elegidos al azar, con una varianza de 910350.39. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es S/.900? Use el nivel de significación del 1%, y suponga que la distribución de la actitud en un simulacro de sismo es normal. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: = S/.810000

H1: ≠ S/.810000

2. FORMULAMOS LA FUNCIÓN PIVOTAL

V =

Vo=

=177.57

Page 174: trabajo estadistica III toñito.pdf

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

67.3 140.2

5. TOMA DE DECISIONES

Tenemos que: [67.3- 140.2]; Vo=177.57;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.810000.

Ejercicio 2:

En la facultad de Ciencias Económicas de la UNMSM de la base 2011, se plantea la hipótesis de que la desviación estándar es de S/.900. En una muestra de 47 alumnos elegidos al azar, con una varianza de S/.856736.08. Con estos datos, ¿Se justifica la suposición que la desviación estándar verdadera es de S/.900? Use el nivel de significación del 1%, y suponga que la distribución de los ingresos mensuales familiares es normal.

1. PLANTEAMOS LA HIPÓTESIS

Ho: = S/.810000

H1: ≠ S/.810000

Page 175: trabajo estadistica III toñito.pdf

2. FORMULAMOS LA FUNCIÓN PIVOTAL

V =

Vo=

=48.65

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

74.2 129.6

5. TOMA DE DECISIONES

Tenemos que: [74.2- 129]; Vo=48.65;Zo Є RR. Por lo tanto rechazamos el Ho, la varianza poblacional es ≠ S/.810000.

Page 176: trabajo estadistica III toñito.pdf

Ejercicio 1:

Se seleccionan aleatoriamente 44 estudiantes de la base 2010de la facultad de Ciencias Económicas de la UNMSM, y se les aplica una encuesta, para verificar si existe razón, al creer que los estudiantes de altos ingresos por lo general tienen un rendimiento académico bueno, y que los estudiantes de bajos ingresos a menudo tienen un rendimiento académico regular. Los resultados obtenidos de la encuesta se muestra Utilice un nivel de significación del 1%

1. PLANTEAMOS LA HIPÓTESIS

Ho: el ingreso y el rendimiento son independientes. H1: Están relacionados o son dependientes.

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Dónde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas

En el siguiente cuadro:

Utilice un nivel de significación del 1%

3. PLANTEAMOS LA HIPÓTESIS

Ho: el ingreso y el rendimiento son independientes. H1: Están relacionados o son dependientes.

4. FORMULAMOS LA FUNCIÓN PIVOTAL

INGRESOS Rendimiento académico

BUENO REGULAR TOTAL

ALTOS 7 19 26

BAJOS 7 11 18

TOTAL 14 30 44

Page 177: trabajo estadistica III toñito.pdf

Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas

5. NIVEL DE SIGNIFICACIÓN

α =1% ; P ( (

)

X= 6.63

Las frecuencias esperadas:

INGRESOS Rendimiento académico

BUENO REGULAR TOTAL

ALTOS 8 18 26

BAJOS 6 12 18

TOTAL 14 30 44

P=

{proporción de estudiantes con buenos rendimientos}

26(

= 8.32 {número de estudiantes con altos ingresos que presentan

buenos rendimientos}

CÁLCULO DE Q:

Q=∑

Q=

Q= 0.434

Page 178: trabajo estadistica III toñito.pdf

6. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

RA

6.63

7. DESICIÓN:

Puesto que Q= 0.434< 6.63 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, el ingreso familiar mensual de los estudiantes y el rendimiento académico son independientes.

8.8. PRUEBA DE HOMOGENEIDAD Ejercicio 1: Se efectuó un estudio a tres bases de la Facultad de Ciencias Económicas de la UNMSM: Base 2010, Base 2011 y Base 2012, para determinar el rendimiento académico de los alumnos, como “bueno” o “regular”. Una muestra aleatoria de 160 alumnos ha dado los resultados de la siguiente tabla. A partir de estos datos, determinar si las tres bases son homogéneas con respecto a su rendimiento académico. Utilice el nivel de significación del 1%.

RENDIMIENTO ACADEMICO

BASES TOTAL

BASE 10 BASE 11 BASE 12

BUENO 14 13 18 45

REGULAR 30 34 51 115

TOTAL 44 47 69 160

1. PLANTEAMOS LA HIPÓTESIS

Ho: Las tres bases son homogéneas con respecto su rendimiento académico. H1: Las tres bases no son homogéneas con respecto su rendimiento académico

Page 179: trabajo estadistica III toñito.pdf

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas

3. NIVEL DE SIGNIFICACIÓN

α =1% ; P ( (

)

X= 9.21

Las frecuencias esperadas:

RENDIMIENTO ACADEMICO

BASES TOTAL

BASE 10 BASE 11 BASE 12

BUENO 12 13 19 44

REGULAR 32 34 50 116

TOTAL 44 47 69 160

P=

{Proporción de alumnos que presentan rendimiento bueno}

44(

12.1 {Número de alumnos de la Base 10 que presentan

rendimiento bueno}

CÁLCULO DE Q:

Q=∑

Q=

Q= 0.525

4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

Page 180: trabajo estadistica III toñito.pdf

RA

9.21

5. DESICIÓN:

Puesto que Q= 0.525 < 9.21 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, las tres bases son homogéneas con respecto a su rendimiento académico.

8.9. Análisis de Varianza Ejercicio 1: Se propone analizar tres bases diferentes, y se desea determinar si el ingreso promedio de los estudiantes es el mismo o si es diferente en por lo menos en 1 de las 3 bases encuestadas. Se observa aleatoriamente las respuestas de cada base. Para esto usaremos el análisis de varianza, y todo esto con un nivel de significación del 5%. Suponemos que estamos en un caso en que las poblaciones son normales homoscedásticas, en otras palabras, que las varianzas poblacionales para las 3 bases son iguales. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: µ1=µ2=µ3 H1: No todos los µ1 son iguales

2. ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN

α = 5%

Page 181: trabajo estadistica III toñito.pdf

Base 2010 Base 2011 Base 2012 Total

Total 77440 84200.03 96032.92 257672.95

in 44 47 58 159

iX 1760 925.6 1655.74 4341.34

2

i in X 136294400 40266561.9 159005547 335566508.9

Page 182: trabajo estadistica III toñito.pdf

8.1. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA MEDIA Ejercicio 1: Se realizo una encuesta a 159 alumnos de la facultad de Ciencias Económicas de la UNMSM, la cual revela que en promedio del ingreso personal mensual es de s/. 313.648, con una desviación estándar de 132.237. Docimar la hipótesis de que el verdadero promedio de ingreso personal mensual fue de s/. 300, frente a la alternativa de que fue mayor que s/. 300. Utilizar un nivel de significación del 1%. Solución:

1) PLANTEAMOS LA HIPÓTESIS

2) FORMULAMOS LA FUNCIÓN PIVOTAL

No se conoce la varianza poblacional

Muestra grande

Z = -

⁄ N (0,1)

VALOR CALCULADO: Zo = -

⁄ =

√ ⁄

= 1.301

3) ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:

α= 1% Z (0.99) = 2.58

4) DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

RR

2.58

Ho: µ=300

H1: µ>300

Page 183: trabajo estadistica III toñito.pdf

5) TOMA DE DECISIONES

Tenemos que: Zo = 1.301 < 2.58 Zo Є RA luego, aceptamos la hipótesis Ho, por lo tanto, la media poblacional es igual a s/. 300.

Ejercicio 2: Se realiza una encuesta a 44 alumnos de la facultad de Ciencias Económicas de la base 10 de la UNMSM, revela que en promedio del ingreso personal mensual de los alumnos es de s/. 329.773, con una desviación estándar de 115.386. Docimar la hipótesis de que el verdadero ingreso personal mensual de los estudiantes de la UNMSM es de s/. 300, frente a la alternativa de que fue mayor que s/. 300. Utilizar un nivel de significación del 1%. Solución:

1. PLANTEAMOS LA HIPÓTESIS

2. FORMULAMOS LA FUNCIÓN PIVOTAL

No se conoce la varianza poblacional

Muestra grande

Z = -

⁄ N (0,1)

VALOR CALCULADO: Zo = -

⁄ =

√ ⁄

= 1.712

3. ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN:

α= 1% Z (0.99)= 2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

Ho: µ=300

H1: µ>300

Page 184: trabajo estadistica III toñito.pdf

RA RR

2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = 1.712 < 2.58; Zo Є RA luego, aceptamos la hipótesis Ho, por lo tanto, la media poblacional es igual a s/. 300.

8.2. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE MEDIAS Ejercicio 1: Se propone estudiar una nueva base 12 para saber cuál es su ingreso personal mensual de ellos respecto a la base 10. Para estudiar la nueva base 12 realizamos una encuesta a

68 alumnos, y los resultados fueron X=329.773, Y=310.638, ¿Diría Ud. que la base 12 tiene un mejor ingreso personal mensualmente? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: µx =µy

H1: µx <µy

2. FORMULAMOS LA FUNCIÓN PIVOTAL

No se conocen las varianzas poblacionales

Muestras grandes

Se supone Poblaciones Normales Homocedásticas

FP =

N (0, 1)

Page 185: trabajo estadistica III toñito.pdf

Valor calculado:

Zo=

= =

= 0.746

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z(0.01)= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA RR

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = 0.746 >- 2.58; Zo Є RR. Por lo tanto rechazamos el Ho. Existe diferencia significativa entre ambas bases. La base 11 ha mejorado su ingreso personal mensual respecto a la base 10.

Ejercicio 2: Se propone estudiar una nueva base la 11 para saber cuál es la actitud de ellos ante un simulacro de sismo respecto a la base 10. Para estudiar la nueva base 12 realizamos una

encuesta a 68 alumnos, y los resultados fueron X=329.773, Y=305.294,

¿Diría Ud. que la base 11 tiene un mejor ingreso personal mensual? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: µx =µy

H1: µx <µy

Page 186: trabajo estadistica III toñito.pdf

2. FORMULAMOS LA FUNCIÓN PIVOTAL

No se conocen las varianzas poblacionales

Muestras grandes

Se supone Poblaciones Normales Homocedásticas

FP =

N (0, 1)

Valor calculado:

Zo=

= =

= 0.99

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE

SIGNIFICACIÓN DEL 1%

α= 1% Z(0.01)= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = 0.99 > -2.58 Zo Є RA. Por lo tanto aceptamos el Ho. No existe diferencia significativa entre ambas bases. La base 12 no ha mejorado su ingreso personal mensual respecto a la base 10.

Page 187: trabajo estadistica III toñito.pdf

8.3. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN Ejercicio 1: La fracción de respuestas negativas de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM de la base 11 respecto a que si estudia actualmente una carrera paralelamente fue de 0.38. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene un resultado de 18 respuestas negativas de un total de 47 encuestas. Contrastar si la nueva encuesta es segura o no con razón a que si estudia una carrera paralelamente con un 1% de significación. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: p =0.38

H1: p <0.38

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Si se supone verdadera la hipótesis nula Ho: p=po

Zo=

= =

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z(0.01)= -2.58

Page 188: trabajo estadistica III toñito.pdf

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -0.14 > -2.58 Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, la nueva encuesta a la base 11 no tiene respuestas confiables en cuanto a que si estudia una carrera paralelamente respecto a su carrera actual que es economía.

Ejercicio 2: La fracción de respuestas negativas de cierta encuesta realizada en la facultad de Ciencias Económicas de la UNMSM de la base 12 respecto a que si estudia actualmente una carrera paralelamente fue de 0.46. Una nueva encuesta asegura que los resultados son menores. Con la muestra que se proporciona se hace la encuesta y se obtiene un resultado de 31 respuestas negativas de un total de 68 encuestas. Contrastar si la nueva encuesta es segura o no con razón a que si estudia una carrera paralelamente con un 1% de significación. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: p =0.46

H1: p <0.46

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Si se supone verdadera la hipótesis nula Ho: p=po

Page 189: trabajo estadistica III toñito.pdf

Zo=

= =

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z(0.01)= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RR RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -0.46> -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto. La nueva encuesta a la base 12 no tiene respuestas confiables en cuanto a que si estudia una carrera paralelamente respecto a su carrera actual que es economía.

Page 190: trabajo estadistica III toñito.pdf

8.4. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE PROPORCIONES

Ejercicio 1: Se realizo una encuesta a la base 10 sobre si estudian una carrera paralela a la de economía con una muestra de 44 se obtuvo que el 66% son respuestas positivas, también se realizó la misma encuesta a la base 11 con una muestra de 47 y se obtuvo que el 62% son respuestas positivas. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca de que si estudian otra carrera paralelamente a la de economía? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: PX = Py

H1: Px < Py

Px: respuestas positivas de la base 10 Py: respuestas positivas de la base 11

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Zo==

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z(0.01)= -2.58

Page 191: trabajo estadistica III toñito.pdf

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = -1.094 > -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no fue muy buena ya que estaba un poco lejos de la realidad.

Ejercicio 2: Se realizo una encuesta a la base 10 sobre si estudian una carrera paralela a la de economía con una muestra de 44 se obtuvo que el 66% son respuestas positivas, también se realizó la misma encuesta a la base 12 con una muestra de 68 y se obtuvo que el 54% son respuestas positivas. De acuerdo con estas respuestas y con un nivel de significación del 1%, ¿podría rechazarse la hipótesis acerca de que si estudian otra carrera paralelamente a la de economía? Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: Px = Py

H1: Px < Py

Px: respuestas positivas de la base 2010 Py: respuestas positivas de la base 2012

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Z =

N (0, 1)

Page 192: trabajo estadistica III toñito.pdf

Zo==

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

α= 1% Z(0.01)= -2.58

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

-2.58

5. TOMA DE DECISIONES

Tenemos que: Zo = 0.491 > -2.58; Zo Є RA. Por lo tanto aceptamos el Ho. Por lo tanto, puede afirmarse que al nivel del 1%, la encuesta no fue muy buena ya que estaba un poco lejos de la realidad.

8.5. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA VARIANZA Ejercicio 1: En la facultad de Ciencias Económicas de la UNMSM de la base 10, se plantea la hipótesis de que la desviación estándar 114.067. En una muestra de 44 alumnos elegidos al azar, con una varianza de 13011.312. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es 114.067? Use el nivel de significación del 1%, y suponga que la distribución de que si estudia alguna carrera paralela a la de economía. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: = 13000

H1: ≠ 13000

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Page 193: trabajo estadistica III toñito.pdf

V =

Vo==

= 43.037

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN

DEL 1%

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA

REGIÓN DE ACEPTACIÓN (RA)

RA

22.9 70.6

5. TOMA DE DECISIONES

Tenemos que: [22.9- 70.6]; Vo=43.037; Zo Є RA. Por lo tanto aceptamos el Ho, la varianza poblacional es = 13000.

Ejercicio 2: En la facultad de Ciencias Económicas de la UNMSM de la base 11, se plantea la hipótesis de que la desviación estándar 127.836. En una muestra de 47 alumnos elegidos al azar, con una varianza de 16342.146. Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es 127.836? Use el nivel de significación del 1%, y suponga que la distribución de que si estudia alguna carrera paralela a la de economía. Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: = 16000

H1: ≠ 16000

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Page 194: trabajo estadistica III toñito.pdf

V =

Vo==

= 46.984

3. NIVEL DE SIGNIFICACIÓN:SE SUPONE UN NIVEL DE SIGNIFICACIÓN DEL 1%

4. DETERMINAMOS LA REGIÓN CRITICA O DE RECHAZO (RR) Y LA REGIÓN DE

ACEPTACIÓN (RA)

RA

25 74.4

5. TOMA DE DECISIONES

Tenemos que: [25 - 74.4]; Vo=46.984. ; Zo Є RA. Por lo tanto aceptamos el Ho, la varianza poblacional es = 16000.

Page 195: trabajo estadistica III toñito.pdf

8.6. PRUEBA JI-CUADRADO DE LA BONDAD DE AJUSTE Ejercicio 1: La siguiente información corresponde al ingreso personal mensual de los alumnos la Facultad de Ciencias Económicas de la UNMSM, donde: 1: [100 -200>; 2: [200 -350>; 3: [350 - 500>; 4: [500 - a mas> Probar la hipótesis de que la actitud de los alumnos sigue una distribución de Poisson al nivel de significación del 1%.

variable(actitud) 1 2 3 4 frecuencia(número de alumnos) 29 71 39 20

1. PLANTEAMOS LA HIPÓTESIS

Ho: El ingreso personal mensual sigue una distribución Poisson. H1: El ingreso personal mensual no sigue una distribución Poisson.

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Donde: Oi = Frecuencias observadas ℮i = Frecuencias esperadas K = Número de clases m = Número de parámetros a estimar

CÁLCULO DE Q: Para calcular Q, debemos obtener primero las frecuencias esperadas (℮i).

=

Pero = 2.32 P(x, ) =

Las frecuencias esperadas: ℮i=159[p(x, )

Número de clientes

Oi P(x,λ) ℮i= 159[ p(x,λ)]

(Oi-℮i)^2/℮i

1 29 0.3 47.7 7.33

2 71 0.3 47.7 11.38

3 39 0.2 31.8 1.63

4 20 0.2 31.8 4.38

Total 159 1 159 24.72

Page 196: trabajo estadistica III toñito.pdf

Q= ∑

3. NIVEL DE SIGNIFICACIÓN

α =5%

P ( (

)

X= 5.99

4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

RA

RR

5.99 24.72

5. DESICIÓN:

Puesto que Q= 24.72 > 5.99 → Q Є RR Rechazamos la hipótesis Ho. Por lo tanto, los datos no se ajustan a una distribución de Poisson.

Ejercicio 2: La siguiente información corresponde al ingreso personal mensual de la Facultad de Ciencias Económicas de la UNMSM de la base 11, donde: 1: [100 -200>; 2: [200 -350>; 3: [350 - 500>; 4: [500 - a mas> Probar la hipótesis de que la actitud de los alumnos sigue una distribución de Poisson al nivel de significación del 1%.

variable(actitud) 1 2 3 4 frecuencia(número de alumnos) 10 20 12 5

1. PLANTEAMOS LA HIPÓTESIS

Ho: El ingreso personal mensual sigue una distribución Poisson. H1: El ingreso personal mensual sigue no sigue una distribución Poisson.

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Page 197: trabajo estadistica III toñito.pdf

Donde: Oi = Frecuencias observadas ℮i = Frecuencias esperadas K = Número de clases m = Número de parámetros a estimar

CÁLCULO DE Q: Para calcular Q, debemos obtener primero las frecuencias esperadas (℮i).

=

Pero = 2.26 P(x, ) =

Las frecuencias esperadas: ℮i= 164[p(x, )]

Número de clientes

Oi P(x,λ) ℮i=47[p(x,λ)]

(Oi-℮i)^2/℮i

1 10 0.3 14.1 1.19

2 20 0.3 14.1 2.47

3 12 0.2 9.4 0.72

4 5 0.2 9.4 2.06

Total 47 1 47 6.44

Q= ∑

3. NIVEL DE SIGNIFICACIÓN

α =5%

P ( (

)

X= 5.99

4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

RA

RR

5.99 6.44

Page 198: trabajo estadistica III toñito.pdf

5. DESICIÓN:

Puesto que Q= 6.44 > 5.99 → Q Є RR Rechazamos la hipótesis Ho. Por lo tanto, los datos no se ajustan a una distribución de Poisson.

8.7. PRUEBA DE INDEPENDENCIA Ejercicio 1: Se seleccionan aleatoriamente 159 estudiantes de la facultad de ciencias económicas de la UNMSM, se les hizo una encuesta, para verificar si existe razón, al creer que existe una relación entre si estudia una carrera paralela y el género a los alumnos de la Facultad de Ciencias Económicas.de la UNMSM. Los resultados obtenidos de la encuesta se muestran en el siguiente cuadro:

GENERO OTRA CARRERA

TOTAL SI NO

MASCULINO 45 32 77

FEMENINO 50 32 82

TOTAL 95 64 159

Utilice un nivel de significación del 1%

1. PLANTEAMOS LA HIPÓTESIS

Ho: Si estudia una carrera paralela y el género a los alumnos de la Facultad de Ciencias Económicas. H1: Están relacionados o son independientes.

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas

3. NIVEL DE SIGNIFICACIÓN

α =1%

P ( (

)

X= 6.63

Las frecuencias esperadas:

Page 199: trabajo estadistica III toñito.pdf

GENERO OTRA CARRERA

TOTAL SI NO

MASCULINO 46 31 77

FEMENINO 49 33 82

TOTAL 95 64 159 CÁLCULO DE Q:

Q= ∑

Q=

Q= 0.105

4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

RA

RR

6.63

5. DESICIÓN:

Puesto que Q= 0.105 < 6.63 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, el género de los alumnos y el equipamiento de la facultad son independientes.

8.8. PRUEBA DE HOMOGENEIDAD Ejercicio 1: Se realizo un estudio a tres bases de la facultad de ciencias económicas de la UNMSM base 10, base 11 y base 12, para determinar el ingreso personal mensual y se tuvo k separa en rangos 1: [0 -200> 2: [200 -350> 3.[350 -500> 4: [500 -a mas>. A partir de estos 4 datos, determinar si las tres bases son homogéneas con respecto a su ingreso personal mensual. Utilice el nivel de significación del 5%.

Page 200: trabajo estadistica III toñito.pdf

INGRESO DE LOS ALUMNO

BASES TOTAL

BASE 10 BASE 11 BASE 12

[0 - 200> 4 10 15 29

[200 - 350> 21 20 30 71

[350 - 500> 13 12 14 39

[500 - a mas> 6 5 9 20

TOTAL 44 47 68 159

1. PLANTEAMOS LA HIPÓTESIS

Ho: Las tres bases son homogéneas con respecto al ingreso personal mensual. H1: Las tres bases no son homogéneas con respecto al ingreso personal mensual.

2. FORMULAMOS LA FUNCIÓN PIVOTAL

Donde: F = Número de filas C = Número de columnas Oi =Frecuencias observadas ℮i = Frecuencias esperadas

3. NIVEL DE SIGNIFICACIÓN

α =5%

P ( (

)

X= 12.6

Las frecuencias esperadas:

INGRESO DE LOS ALUMNO

BASES TOTAL

BASE 10 BASE 11 BASE 12

[0 - 200> 8.03 8.57 12.40 29

[200 - 350> 19.65 20.99 30.37 71

[350 - 500> 10.79 11.53 16.68 39

[500 - a mas> 5.54 5.91 8.55 20

TOTAL 44 47 68 159

P=

{proporción de alumnos que actúan como la opción 1}

Page 201: trabajo estadistica III toñito.pdf

CÁLCULO DE Q:

Q= ∑

Q=

Q= 4.16

4. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

RA

12.6

5. DESICIÓN:

Puesto que Q= 4.16 < 12.6 → Q Є RA Aceptamos la hipótesis Ho. Por lo tanto, las tres bases son homogéneas con respecto a su ingreso personal mensual.

8.9. ANÁLISIS DE VARIANZA Ejercicio 1: Se propone analizar tres bases diferentes, y se desea determinar si el ingreso personal mensual igual o diferente. Se observa aleatoriamente las respuestas de cada base. ¿Qué conclusiones se pueden extraer al nivel de significación del 5%?

BASES

BASE 10 BASE 11 BASE 12

4 10 15

21 20 30

13 12 14

6 5 9 Solución:

1. PLANTEAMOS LA HIPÓTESIS

Ho: µ1=µ2=µ3 H1: No todos los µ1 son iguales µi= ingreso personal mensual i

Page 202: trabajo estadistica III toñito.pdf

2. ESPECIFICAMOS EL NIVEL DE SIGNIFICACIÓN

α = 5%

BASES

BASE 10 BASE 11 BASE 12

4 10 15

21 20 30

13 12 14

6 12 9

TOTAL 44 47 68 159

ni 4 4 4 12

i 11 11.75 17 13.25

ni( i ^2) 484 552.25 1156 2192.25

∑ ∑

=39205 ∑ n

SCT= ∑ ∑

- 39205 - 2107 = 11464

Suma de SCC=∑ Cuadrados SCE=SCT-SCC= 2192.25 - 85.25 =

TABLA DE ANALISIS DE VARIANZA (ANAVA)

FUENTE DE VARIACIÓN SUMA DE

CUADRADOS

GRADOS DE

LIBERTAD

CUADRADO MEDIO

RAZON Ho

ENTRE TRATAMIENTOS(COLUMNAS)

85.25 2 46.625 Fo=0.26 µi=µ

DENTRO DE LOS TRATAMIENTOS(ERROR)

10834.5 9 1203.83

TOTAL 11464 11

3. REGIÓN CRITICA O RECHAZO(RR) Y REGIÓN DE ACEPTACIÓN (RA)

Page 203: trabajo estadistica III toñito.pdf

RA

4.26

4. DESICIÓN:

Puesto que Fo=0.26 <F (2,9) =4.26 → Q Є RA Aceptamos la hipótesis Ho. Concluimos que las tres bases son significativamente iguales en cuanto a la actitud que toman frente a un simulacro de sismo.

Page 204: trabajo estadistica III toñito.pdf

VARIABLES

- MEDIO DE TRANSPORTE QUE UTILIZA PARA VENIR A LA UNIVERSIDAD.

- NUMERO DE INTEGRANTES QUE CONFORMAN SU FAMILIA.

Page 205: trabajo estadistica III toñito.pdf

ANÁLISIS DE LA VARIABLE MEDIO DE TRANSPORTE QUE UTILIZA PARA VENIR A LA UNIVERSIDAD

- Prueba de hipótesis para la proporción poblacional.

Analizando la población del estrato 2, es decir, la base 2011, contamos con el dato inicial que, la proporción muestral de alumnos que utilizan transporte público es de ˆ 0.915p . Con ello,

formularemos nuestra hipótesis que afirma que la proporción poblacional de alumnos que utilizan trasporte público, es igual a 5%con un nivel de confianza del 97%.

1) Planteamiento de la hipótesis:

0

1

: 0.14

: 0.14

H p

H p

2) Función Pivotal:

ˆ(0,1)

ˆ ˆ(1 )

p pZ N

p p

n

Utilizamos esa función pivotal dado que no conocemos la proporción poblacional.

0 0

0.914 0.9151.333

0.915(1 0.915)

273

Z Z

3) Nivel de significación:

5% 1.88Z

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z=1.34 Z = 1.88

Page 206: trabajo estadistica III toñito.pdf

5) Toma de decisiones:

Tenemos que 0 01.33 1.88Z Z Z RA . Por lo tanto, se acepta la hipótesis nula y como

resultado se obtiene que la proporción poblacional de alumnos utiliza un medio de trasporte público es bueno, es de 0.5 al 97% de significación.

- Prueba de hipótesis para la diferencia de proporciones poblacionales.

Analizando los estratos 1 y 2, es decir, los alumnos de las bases 2009 y 2010, tenemos que la proporción de alumnos que utilizan medio de trasporte público es 0.909 y 0.914 respectivamente. Con esto formulamos nuestra hipótesis que las proporciones poblaciones de ambas bases son iguales y como hipótesis alternativa, que la proporción poblacional de alumnos de la base 2009 es mayor que el de la base 2010. 1.) Planteamiento de la hipótesis:

0

1

:

:

x y

x y

H P P

H P P

2.) Función Pivotal:

ˆ ˆ( ) ( )(0,1)

(1 )(1 )

x y x y

y yx x

x y

p p P PZ N

P PP P

n n

0 0

(0.909 0.914)1.25

0.909(0.091) 0.914(0.086)

265 273

Z Z

3.) Nivel de significación:

3% 1.88Z

4.) Determinación de la región crítica (RR) y la región de aceptación (RA):

Z = -1.24 Z = 1.88

Page 207: trabajo estadistica III toñito.pdf

5.) Toma de decisiones:

Tenemos que 0 01.25 1.64Z Z Z RR . Por lo tanto, se rechaza la hipótesis nula,

entonces se acepta la hipótesis alternativa. Podemos afirmar que la proporción poblacional de alumnos de la base 10 que utilizan un medio de trasporte público mayor que la de la base 11.

- Prueba de Independencia (no paramétrica).

En esta sección vamos a analizar si el uso de medio de trasporte público tiene relación con el número de horas que tardan en llegar a la universidad. Esta relación se establece, ya que se puede creer que el hecho de demorarse muchas horas de su hogar a la universidad haga que muchos opten por otro tipo de trasporte a usar el servicio público. Por lo tanto, nuestra hipótesis nula será que el uso de trasporte público esté relacionado con el número de horas que tardan en llegar a la universidad. Todo esto con un nivel de significación del 1%. La información de la encuesta con la que se trabajará en este problema se presenta a continuación:

MEDIO DE TRASPORTE QUE UTILIZA

NUMERO DE HORAS EN LLEGAR A LA UNIVERSIDAD

25 a 55 55 a 85 85 a mas Total

PUBLICO 48 57 29 134

PRIVADO 49 46 18 113

Total 97 103 47

1) Planteamiento de la hipótesis:

0

1

: alumnos que utlizan medio de trasporte publico esta relacionado

con el tiempor de horas que demoran en llegar a la facultad.

: Estan relacionados o son dependientes

H Los

H

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

2 2

( 1)( 1) 41% 0.01

13.3

F CP X x P X x

x

Frecuencias esperadas:

Page 208: trabajo estadistica III toñito.pdf

MEDIO DE TRASPORTE QUE UTILIZA

NUMERO DE HORAS EN LLEGAR A LA UNIVERSIDAD

25 a 55 55 a 85 85 a mas Total

publico 55 55 24 134

privado 46 47 20 113

Total 101 102 44

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2

0

2 2 2

(48 55) (49 46) (18 14) (57 55) (46 47) (14 15)

55 46 14 55 47 15

(29 24) (18 20) (4 7)

24 20 7

Q

0 4.92Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q =4.928 13.3

5) Toma de decisiones:

Tenemos que 0 04.928 13.3Q Q RA . Por lo tanto, se acepta la hipótesis nula, por lo que

validamos la hipótesis planteada.

- Prueba de Homogeneidad (no paramétrica).

En esta sección vamos a analizar si los alumnos de las bases 2009, 2010 y 2011 son homogéneos con respecto a su variable sexo. Todo esto con un nivel de significación del 5%. La información tabulada de la encuesta, a continuación:

Page 209: trabajo estadistica III toñito.pdf

Sexo de los estudiantes

BASES

2009 2010 2011 Total

Femenino 20 23 39 379

Masculino 24 24 29 349

TOTAL 44 47 68 728

1) Planteamiento de la hipótesis:

0

1

: Las tres bases son homogéneas respecto a la variable sexo

: Las tres bases son heterogéneas respecto a la variable sexo

H

H

2) Función Pivotal:

22

( 1)( 1)

1

( )ki i

F C

i i

o eQ X

e

3) Nivel de significación:

2 2

( 1)( 1) 25% 0.05

5.99

F CP X x P X x

x

Frecuencias esperadas:

Sexo de los estudiantes

Bases

2009 2010 2011 Total

Femenino 147 145 87 379

Masculino 136 133 80 349

TOTAL 283 278 167 728

Calculo de Q:

2

1

( )ki i

i i

o eQ

e

2 2 2 2 2 2

0

(143 147) (140 136) (139 145) (139 133) (97 87) (70 80)

147 136 145 133 87 80Q

Page 210: trabajo estadistica III toñito.pdf

0 3.144Q

4) Determinación de la región crítica (RR) y la región de aceptación (RA):

Q =3.144 5.99

5) Toma de decisiones:

Tenemos que 0 03.144 5.99Q Q RA . Por lo tanto, acepta la hipótesis de que las tres

bases: 2009, 2010 y2011 son homogéneas con respecto a su variable sexo.

Page 211: trabajo estadistica III toñito.pdf

BIBLIOGRAFÍA

- RICHARD I AUTOR LEVIN, DAVID S AUTOR RUBIN – 2004 Estadística para Administración

- MARK L. BERENSON, DAVID M. LEVINE, TIMOTHY C. KREHBIEL – 2006 Estadística para Administración y Economía

- Métodos Técnicos del Muestreo – COCHRAN

- Inferencia estadística – RUFINO MOYA Y GREGORIO SARAVIA - Muestreo estadístico, Diseño y aplicaciones – MANUEL VIVANCO - La Investigación Sobre Eficacia Escolar en Iberoamérica – MUÑOZ Y VARGAS -

1990

- Consecuencias de la Desnutrición en el escolar peruano – ERNESTO POLLIT - Presencia universitaria – Internet