trabajocolaborativo 2-inferencia estadistica 2014

17
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD) TRABAJO COLABORATIVO 2 INFERENCIA ESTADÍSTICA Presentado Por: Tutor: Ing. ÁLVARO ALFONSO BERNAL Grupo 100403 FACULTAD DE CIENCIAS BÁSICAS E INGENIERÍA PROGRAMA DE INGENIERÍA INDUSTRIAL 2014

Upload: armandoscrib

Post on 26-Dec-2015

41 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Trabajocolaborativo 2-Inferencia Estadistica 2014

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

TRABAJO COLABORATIVO 2

INFERENCIA ESTADÍSTICA

Presentado Por:

Tutor: Ing. ÁLVARO ALFONSO BERNAL

Grupo 100403

FACULTAD DE CIENCIAS BÁSICAS E INGENIERÍA

PROGRAMA DE INGENIERÍA INDUSTRIAL

2014

Page 2: Trabajocolaborativo 2-Inferencia Estadistica 2014

INTRODUCCION

Inferir es, en general, establecer un nuevo conocimiento partiendo de uno ya “dado”. La inferencia estadística va a ser una forma especial de realizar este proceso. Consiste, básicamente, en determinar algunas características desconocidas de una población partiendo de datos muéstrales conocidos. Estas características poblacionales serán “inferidas” utilizando los recursos de la TEORIA MATEMATICA DE LA PROBABILIDAD.

En el presente documento encontrara el desarrollo del trabajo colaborativo número dos en el cual se tratan temas tales como prueba de hipótesis, análisis de varianza y estadísticas no paramétricas a través del desarrollo de una guía la cual cuenta con una serie de ejercicios relacionados con los temas de este primer trabajo colaborativo, al realizar los ejercicios se busca hacerlo paso a paso con el fin de dar a conocer como se llega a dicho resultado de manera correcta. Así mismo lograr afianzar los conocimientos básicos en inferencia estadística y poderlos aplicar en los diferentes ámbitos laborales.

Page 3: Trabajocolaborativo 2-Inferencia Estadistica 2014

1. OBJETIVOS

1.1 OBJETIVOS GENERALES

Comprender, aplicar y desarrollar la teoría y las técnicas de la inferencia estadística en diversos campos de su saber formativo, y que dicha aplicación se convierta en una herramienta de uso matemático para la toma de decisiones sobre hipótesis cuantitativas de datos, basado en la información extraída de una muestra.

1.2 OBJETIVOS ESPECIFICOS

Conocer los criterios técnicos que hay que tener en cuenta antes de seleccionar un tamaño de muestra.

Identificar el tipo de muestreo de acuerdo a los objetivos del estudio. Diferenciar y analizar las ventajas y desventajas de la

estimación por intervalos de confianza y las pruebas de hipótesis. Determinar la prueba o técnica apropiada a aplicar en las diferentes

pruebas de hipótesis paramétricas y No paramétricas.

Page 4: Trabajocolaborativo 2-Inferencia Estadistica 2014

2. DESARROLLO DEL TRABAJO

1. Prueba de hipótesis

Fase 1:

Realicen un diagrama con un diseño llamativo en el que se puedan ver los pasos de una prueba de hipótesis. Este diagrama debe ser de su propia autoría y por lo tanto inédito, no puede ser posible que en otro grupo se encuentre un diseño igual al de ustedes.

Page 5: Trabajocolaborativo 2-Inferencia Estadistica 2014

.

Page 6: Trabajocolaborativo 2-Inferencia Estadistica 2014

Fase 2:

Sobre el diagrama anterior desarrollen del capítulo 4 de prueba de hipótesis realicen el siguiente ejercicio que esta propuesto en el módulo:

Un fabricante de pastas alimenticias sostiene que el contenido medio de proteínas del producto es de 10.7. Un análisis de una muestra de 8 paquetes dio como resultado un contenido medio de 10% con una desviación de 1. ¿Se puede aceptar como verdadera la afirmación del fabricante a un nivel de 0.01?

Sugerencia: utilizar el siguiente estadístico de prueba:

t= X−μS

√n

Un ensayo unilateral con cola a la izquierda con un nivel significativo de 0.01 el valor crítico con 7 grados de libertad es igual a –3.0

Respuesta:

Nombramos la hipótesis nula y alternativa:H 0 : μ=0.107H 1: μ<0.107Si se puede aceptar como verdadera la afirmación, porque es una muestra pequeña menor de 30 para ese nivel de significancia del 0.01.Para el estadístico de prueba tenemos:

(T= X−μS

√n )(T=10−10.7

1

√8 )T=−1.98

Page 7: Trabajocolaborativo 2-Inferencia Estadistica 2014

2. Realizar un ANOVA comparando los precios promedios de tres empresas del mismo sector, por ejemplo tres bancos en los periodos 10 Mayo al 30 Mayo de 2013.

Acá la variable independiente (cualitativa) es el tipo de Banco y la variable dependiente (cuantitativa) es el precio de cierre de las acciones.

Fase 1: Realizar un ANOVA

SOLUCION

ANALISIS ANOVA

1. Establecer la hipótesis nula y alternativa

H o : μ1=μ2=μ3

H 1:No todas lasmediasde la poblacion soniguales

2. Establecer el nivel de significancia α de 5%

3. Realizar ANOVA

Davivienda Bancolombia Banco occidente

TOTAL

Precio Cierre Precio Cierre Precio Cierre1 24.480,00 28.320,00 35.600,002 24.780,00 28.500,00 35.820,003 25.000,00 28.400,00 36.180,004 24.520,00 27.900,00 36.540,005 25.080,00 28.300,00 37.040,006 24.800,00 28.200,00 37.100,007 24.200,00 28.220,00 37.500,008 24.480,00 28.340,00 37.680,009 24.440,00 27.920,00 38.000,00

10 24.200,00 28.160,00 38.300,0011 24.300,00 28.480,00 38.560,0012 24.360,00 28.200,00 38.840,0013 24.200,00 27.900,00 39.100,0014 24.300,00 28.040,00 39.340,00

X J24.510,00 28.205,71 37.542,86 30.086,19

S2J 80.557,14 38.424,49 1.373.534,69

SJ283,83 196,02 1171,98

nJ14 14 14 42

∑J=1

n

X iJ

343.140,00 394.880,00 525.600,00 1.263.620,00

Page 8: Trabajocolaborativo 2-Inferencia Estadistica 2014

La media general es igual a:

X́=∑J=1

n

X iJ

nJ

=24.510+28.205,71+37.542,8642

=30.086,19

Para llevar a cabo la prueba de la igualdad de las medias de la población, se subdivide la variación total en dos mediciones:

a. Diferencia entre los grupos.

b. Diferencia dentro de los grupos.

La varianza de la muestra total se particiona en la varianza dentro de los bancos y la varianza entre los bancos, tal como se indica en el siguiente gráfico:

Variación total (VT)

VT=(24.480−30.086,19)2+…+(39.340−30.086,19 )2=1.284 .142 .790,48

Variación dentro del grupo (VDG)

VDG=(24.480−24.510)2+…+(28.320−28.205,71 )2+…+(35.600−37.542,86 )2=20.895 .228,57

Variación entre grupos (VEG)

Page 9: Trabajocolaborativo 2-Inferencia Estadistica 2014

VEG=14∗(24.510−30.086,19 )2+14∗(28.205,71−30.086,19 )2+14∗(37.542,86−30.086,19 )2=1.263 .247 .552,2

4. Calcular el valor F o el valor crítico correspondiente al nivel de confianza fijado con los grados de libertad.

Numerador K-1 = 2

Denominador n – K = 39

F0.05=3,238

5. Hallar el estadístico de prueba AB

Page 10: Trabajocolaborativo 2-Inferencia Estadistica 2014

Variación Suma cuadrados

Grados Libertad

Cuadrado medio

Distribución F

Entre Bancos

1.263.247.552,2 (k-1) = 2 631.623.776 1.178,89

Dentro o error

20.895.228,57 (n-k) = 39 535.775,09

Total 1.284.142.790,48 (n-1) = 41

Para el caso la relación es igual a 1.178,89, mayor que el valor crítico 3,238, entonces se tienen pruebas suficientes para rechazar la hipótesis nula consistente en que las medias de las tres poblaciones son iguales. En otras palabras el análisis de varianza apoya la conclusión que las medias para el precio de cierre de las acciones es diferente en los tres bancos.

Fase 2: Realizar prueba Tukey

Realicen una conclusión donde indique si hay diferencia significativas entre por los menos un par de los bancos y apoyados en la prueba de Tukey cual se espera que tenga los precios de cierre de las acciones más altos.

SOLUCION

DSM=qα, k , glerror=√ 2CM error

n

Page 11: Trabajocolaborativo 2-Inferencia Estadistica 2014

3. Dada la siguiente tabla en donde X es una variable aleatoria que representa el número de errores por caso al año, que se cometen al tramitar las pensiones en un fondo en Colombia. Además se tiene que en promedio (λ) se cometen 3 errores.

Realicen una prueba Ji cuadrado (prueba no paramétrica) para comprobar si el número de errores se distribuye como una Poisson.

Respuesta:

H 0: Los datos se distribuyen según el modelo de Poisson.

H 1: Los datos no están distribuidos según el modelo de Poisson.

Se realiza el estadístico de prueba

Numero de errores Frecuencias Observadas N° Errores*frecuencias0 18 01 53 532 103 2063 107 3214 82 3285 46 2306 18 1087 13 91

TOTAL 440 1337

Page 12: Trabajocolaborativo 2-Inferencia Estadistica 2014

λ=1337440

=3

Efectivamente el número de errores en promedio son 3. Se realiza la tabla de distribución de Poisson.

x i Oi f (x¿¿ i)¿ Ei Oi2

E i

0 18 0,0498 21,912 14,791 53 0,1494 65,736 42,732 103 0,2240 98,56 107,643 107 0,2240 98,56 116,164 82 0,1680 73,92 90,965 46 0,1008 44,352 47,716 18 0,0504 22,176 14,107 13 0,0216 9,504 17,78

TOTAL 440 0.988 434,72 0

∑i=1

n Oi2

Ei

−440=451,87−440=11,87

Valor Critico: El valor de la ji-cuadrada teórica para 6 (k-r=7-1) grados de libertad, a un nivel de significancia de 0.05 es 14,067.

El número de errores para tramitar las pensiones en un fondo en Colombia SÍ se distribuye como una Poisson.

CONCLUSIONES

Page 13: Trabajocolaborativo 2-Inferencia Estadistica 2014

Se logró dejar claro los conceptos básicos de inferencia estadística para esta unidad tales como prueba de hipótesis, análisis de varianza y pruebas no paramétricas para el desarrollo de las diferentes actividades.

El uso de las pruebas no paramétricas facilita y agiliza el cálculo de los diferentes parámetros pero con una gran margen de error, dado que se omiten cálculos.

El manejo de los principios del muestreo, las distribuciones muestrales, los intervalos de confianza, pruebas de hipótesis, análisis de varianza y pruebas no paramétricas son muy útiles en el desarrollo de nuestro futuro rol profesional.

La comprensión de la teoría de las dos colas y teorema del límite central, que en otras palabras no es más que la forma de asegurarse que la distribución de la muestra n datos se aproxima a la normal de la curva de la campana de gauss que en la teoría no es muy aplicable pero que cumple si un papel muy importante para tomar una decisión de una hipótesis siempre y cuando este sea al 30. Esto nos permite usar estadísticas de muestra para hacer deducciones con relación a los parámetros de población sin saber nada sobre la forma de la distribución de frecuencias de esa población más que lo que podamos obtener de la muestra.

Page 14: Trabajocolaborativo 2-Inferencia Estadistica 2014

BIBLIOGRAFIA

Sierra, J.J (2013). Módulo Inferencia Estadística. 1, (2). Universidad Nacional Abierta y a Distancia – UNAD-. Ibagué Aula virtual: Inferencia Estadística.

Inferencia Estadistica, Blog del curso: http://inferencia-e.blogspot.com/

Sierra, J.J. (2013). Inferencia Estadística [Recurso en línea, Blog], ubicado en: http://inferencia-e.blogspot.com/

Introducción a la inferencia estadística (Introducción – Muestreo – Distribuciones muéstrales). Consultado el 24, mayo, 2014 de: file:///C:/Users/FRANCO/Desktop/introinfer.pdf

Estadística descriptiva en los juegos de azar. Consultado el 24 de mayo de 2014 de: http://www.eyeintheskygroup.com/Azar-Ciencia/Analisis-Estadistico-Juegos-de-Azar/Estadistica-Descriptiva-Poblacion-y-Muestra.htm

Explorable. Muestreo aleatorio. Consultado el 24 de mayo de 2014 de: https://explorable.com/es/simple-random-sampling-es