estadística aplicada · 2017-05-01 · gráficas de control x-r y determinar si el proceso está...

27
Estadística Aplicada Ingeniería en Alimentos 2017 FACULTAD DE CIENCIAS AGRARIAS

Upload: others

Post on 03-May-2020

19 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

Estadística Aplicada

Ingeniería en Alimentos

2017

FACULTAD DE CIENCIAS AGRARIAS

Page 2: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

2

Docente responsable Profesor: Mag. Ing. Fernando Suárez Programa

1. Estadística Básica (Revisión). Estadística Descriptiva Univariada: Obtención de Gráficos y Estimados por Software. Usos e interpretación del

Histograma y de los gráficos Box Plot. Teorema Central del Límite. Estadística Inferencial: Intervalos de Confianza y Ensayos de Hipótesis; Ensayos Paramétricos para Diferencia de Medias Muestrales: Una muestra, dos muestras independientes y dos muestras dependientes (apareadas). El p-valor. Errores tipo I y II y Probabilidades Asociadas.

2. Introducción al Control Estadístico de Procesos (CEP). Histogramas: análisis de histogramas y relación con las especificaciones. Control Estadístico de Procesos

(CEP): Problemas de calidad esporádicos y crónicos. Variables y Atributos. Ventajas del CEP. Uso de CEP para el control y la mejora de la calidad. Gráficas de control para variables: X-R y X-s. Interpretación y análisis de las gráficas. Capacidad de Proceso: Indice de Capacidad (Cp) , Indice de Perfomance (Cpk). Relación con los Límites de Especificación. Otras gráficas de control (gráficas de valores individuales y rangos móviles (I-MR), gráficas CUSUM y EWMA. Gráficas de Control para Atributos: Fracción defectuosa (p), cantidad de productos defectuosos (np) y gráficas u y c. Análisis de Pareto.

3. Modelos Experimentales I. Diseño y Análisis de Experimentos de un solo Factor. El Experimento, el diseño y el análisis. Análisis de Varianza (ANOVA) para experimentos diseñados. Diseño

de un Factor Completamente Aleatorizado: ANOVA Paramétrico de Una Vía.; Consideraciones previas de validez del modelo. Ensayos para Igualdad de las varianzas: Bartlett y Levene. Ensayos para Normalidad. Transformaciones Normalizantes. Comparaciones múltiples o contrastes. ANOVA de Dos Vías: Diseño de Bloques Completos Aleatorizados. Diseño Cuadrado Latino.

4. Modelos Experimentales II. Diseño de Experimentos con Varios Factores. Experimentos Factoriales. Restricciones en la Aleatorización. Experimentos Factoriales de Dos Factores.

Interacción. Gráficas de Interacción. Gráficas de Efectos Principales. Análisis Estadístico del Modelo de Efectos Fijos. Verificación de la Suficiencia del Modelo.

5. Modelos Experimentales III. Diseño y Análisis de Modelos Regresivos Simples.

Construcción de Modelos Experimentales Regresivos. Regresión Lineal Simple: Condiciones Previas de

Validez del Modelo; Recta de Predicción; estimación de los Parámetros del Modelo; Pruebas de Hipótesis; ANOVA de la Regresión; Intervalos de Confianza para la Pendiente, el Intercepto y la Respuesta Media; Intervalos de Predicción. Correlación y Covariancia. Coeficiente de Correlación y Coeficiente de Determinación. Verificación de la Suficiencia del Modelo: Análisis de Residuos.

6. Estadística No Paramétrica. Ensayo del Signo para una muestra. Ensayo de Wilcoxon para una muestra. Ensayo de Mann-Whitney para

dos muestras. Ensayo de Kruskal-Wallis para el diseño de una vía. Ensayo de Friedman para el diseño en bloques aleatorizados.

Page 3: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

3

Bibliografía: • Kuehl, R. Diseño de Experimentos. Editorial Thomson International, 2001. • García, R. Inferencia Estadística y Diseño de Experimentos. Editorial Eudeba, 2004. • Montgomery, D. Diseño y Análisis de Experimentos. Grupo Editorial Iberoamérica, 1991. • Montgomery, D. Introduction to statistical quality control. Ed. Wiley, 2005 • Steel, R. y Torrie J. Bioestadística: Principios y procedimientos. Ed. Mc Graw Hill, 1990

• Walpole, R y Myers, R. Probabilidad y Estadística. Pearson Educación, 2007.

Sistema de Evaluación: Para aprobar los Trabajos Prácticos, el alumno deberá:

• aprobar un parcial teórico-práctico, con opción a un recuperatorio. La aprobación del parcial implicará desarrollar correctamente al menos el 60% del mismo.

• aprobar informes de los trabajos prácticos, a solicitud del docente • Asistencia de al menos el 75%

Page 4: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

4

TRABAJO PRACTICO Nº 1 CONTROL DE CALIDAD

Problema 1: Una empresa que se dedica a la producción de chicles en tabletas sabe que uno de los pasos críticos es la laminación. En una cocida, la goma de mascar es calentada y pasada por rodillos que le dan el espesor deseado, obteniéndose una lámina que es enfriada y almacenada en cámaras frigoríficas. Se controla el peso de la lámina al enfriarse. El rodillo trabaja a 50 rpm. Si el rodillo trabajara a mayor velocidad, la lámina sería de menor espesor. Si la temperatura aumentase, la densidad sería menor. Los datos corresponden al peso de 60 láminas (en gramos).

1- Construya una distribución de frecuencias y represente los datos mediante un histograma. 2- Calcule los estadísticos más usuales e interprete los resultados. 3- Determine si la variable puede ajustar a una distribución normal. Utilice herramientas gráficas y

analíticas. 4- Si por error el rodillo se setease a 49 rpm, ¿qué modificaciones esperaría observar en el proceso?

Esquematice el aspecto del histograma que esperaría observar. 5- Suponga que el termostato que regula la temperatura del proceso presenta una falla, que provoca que la

temperatura fluctúe en un rango mayor al especificado. ¿Qué modificaciones esperaría observar en el proceso? Esquematice el aspecto del histograma que esperaría observar.

6- La especificación del producto indica que el peso de las láminas debe encontrarse entre 710 y 790g. Calcule Cp y Cpk. ¿En que situación se encuentra el proceso? ¿Qué sugerencias efectuaría?

7- Calcule la cantidad de fallas esperadas (en defectos por millón, dpm)

773 735 750 755 754 751 749 763 783 727 762 765 738 758 774 720 751 762 743 706 781 750 722 760 762 733 737 773 743 732 797 756 733 741 738 727 765 733 763 759 742 756 740 734 740 744 745 734 730 774 729 769 766 776 762 755 758 748 761 750

Problema 2: La siguiente tabla contiene valores de humedad (expresados en %) determinados en muestras de diferentes partidas de budines de limón producidos por una empresa.

4,7 5,9 5,7 5,8 4,6 6,1 5,3 5,4 5,9 5,0 5,9 4,6 4,2 5,5 4,7 5,3 5,2 5,5 5,4 5,8 6,4 4,8 5,0 4,8 5,5 4,7 5,2 5,8 5,2 4,9 6,2 5,8 5,9 5,8 6,0 5,8 5,2 5,4 4,8 5,8 5,5 6,4 5,1 5,5 5,0 6,0 5,4 5,5 5,6 5,2 4,8 5,4 5,8 5,7 5,5 6,0

Page 5: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

5

6,2 4,8 5,5 5,8 5,1 5,7 6,6 6,1 4,9 4,9 4,7 5,5 5,4 5,3 6,6 6,0 5,6 5,3 5,5 4,6 5,3 5,2 5,4 5,4

1- Obtenga un histrograma y la estadística descriptiva. Comente los resultados. 2- Determine si la variable ajusta a una distribución normal. 3- La especificación del producto indica que el contenido de humedad debe encontrarse entre 3 y 7%.

Calcule Cp y Cpk. Concluya y efectúe recomendaciones. 4- Calcule la cantidad de fallas esperadas (en dpm)

Problema 3. Los datos de la tabla que sigue corresponden a valores de la altura en cm. de envases de hojalata que salen de una línea de producción. Las mediciones se realizaron sobre muestras extraídas de la línea cada cuatro horas durante una jornada de producción. Las mediciones corresponden a 25 jornadas. Construir las gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo que la especificación exige que la altura se encuentre entre 12 y 14 cm y efectúe recomendaciones. Calcule el porcentaje de envases defectuosos actual

Subgrupo Nº 6:00 10:00 14:00 18:00 22:00

1 14,0 12,6 13,2 13,1 12,1 2 13,2 13,3 12,7 13,4 12,1 3 13,5 12,8 13,0 12,8 12,4 4 13,9 12,4 13,3 13,1 13,2 5 13,0 13,0 12,1 12,2 13,3 6 13,7 12,0 12,5 12,4 12,4 7 13,9 12,1 12,7 13,4 13,0 8 13,4 13,6 13,0 12,4 13,5 9 14,4 12,4 12,2 12,4 12,5

10 13,3 12,4 12,6 12,9 12,8 11 13,3 12,8 13,0 13,0 13,1 12 13,6 12,5 13,3 13,5 12,8 13 13,4 13,3 12,0 13,0 13,1 14 13,9 13,1 13,5 12,6 12,8 15 14,2 12,7 12,9 12,9 12,5 16 13,6 12,6 12,4 12,5 12,2 17 14,0 13,2 12,4 13,0 13,0 18 13,1 12,9 13,5 12,3 12,8 19 14,6 13,7 13,4 12,2 12,5 20 13,9 13,0 13,0 13,2 12,6 21 13,3 12,7 12,6 12,8 12,7 22 13,9 12,4 12,7 12,4 12,8 23 13,2 12,3 12,6 13,1 12,7 24 13,2 12,8 12,8 12,3 12,6 25 13,3 12,8 12,0 12,3 12,2

Problema 4. Un proceso de envasado de frascos de granos de café descafeinado consta de seis líneas de llenado para frascos de 500 g. Se sabe que un espacio de cabeza insuficiente aplastaría el producto cuando se coloca la tapa y un espacio de cabeza excesivo produciría un efecto abrasivo sobre el producto durante el transporte. La especificación establece que el espacio de cabeza debe encontrarse entre 4 y 7/32 para que esto no ocurra. Sin embargo, la gente de planta no está segura cual de las líneas es capaz de lograrlo. Se elige la línea Nº 4 y, cuando ésta se encuentra trabajando satisfactoriamente, se sacan 80 frascos antes de que se les ponga la tapa. Todos los frascos se seleccionan en forma secuencial y se mantienen en orden hasta la medición. Se mide el espacio de cabeza en cada frasco, en orden, y se registran los valores obtenidos en grupos de a 5 frascos. Los valores se consignan en la Tabla que sigue. El frasco 1 tiene un espacio de 7/32 y se registra en la primera columna como 7. El segundo mide 10/32 y se registra en la segunda columna como 10, y así sucesivamente. a) Obtener un gráfico de control para medias y rangos y para medias y desvío estándar.

Page 6: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

6

Comparar y concluir. B) Calcular el porcentaje de frascos defectuosos. Expresarlo en dpm. c) Calcular Cp y Cpk, interpretar y efectuar recomendaciones.

Frasco Muestra 1 2 3 4 5

1 7 10 8 2 8 2 6 9 3 4 3 3 6 7 2 6 4 4 4 8 5 7 7 5 10 3 5 6 4 6 8 11 9 6 9 7 5 7 5 6 7 8 9 5 8 7 6 9 6 5 4 5 5

10 1 3 1 0 3 11 3 4 6 5 4 12 5 3 6 3 3 13 5 6 8 9 7 14 7 7 8 7 6 15 7 7 6 7 7 16 7 7 7 9 9

Problema 5. En una planta productora de pimientos envasados en frascos la producción diaria varía de 476 a 580 envases. En el transcurso de varios años los defectos más comunes han sido, pérdidas por defecto del cierre, contaminación, decoloración, etiquetas defectuosas, sobrepeso, falta de peso, etc. En total se han detectado 18 tipos diferentes de defectos. Al efectuar el control, si se encuentra cualquiera de los defectos mencionados en un frasco se computa como defectuoso. En la tabla se muestran los datos correspondientes a 30 días consecutivos de producción. Establecer las conclusiones a las que llegó el analista y las recomendaciones que pudo hacer. Estimar el porcentaje de envases defectuosos con un nivel de confianza del 95%

Muestra Nº Nº de envases Nº de defectuosos 1 502 18 2 530 13 3 480 13 4 510 15 5 540 21 6 520 17 7 580 28 8 475 10 9 570 23

10 520 16 11 510 15 12 536 22 13 515 18 14 480 12 15 548 24 16 500 11 17 515 19 18 520 16 19 485 13 20 520 14 21 515 12 22 545 25

Page 7: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

7

23 515 16 24 505 13 25 518 15 26 484 12 27 520 22 28 535 22 29 518 14 30 554 26

Problema 6. Una pequeña planta produce camarones congelados en diferentes tipos de envases. Uno de los primeros pasos en la línea es desenvainar el camarón y envasarlo en cajas intermedias para refrigerarlo y posteriormente procesarlo. En un esfuerzo por controlar este paso la gente de producción decidió usar una gráfica p de control por atributos, obteniéndose los datos de la Tabla que sigue. Construir una gráfica de control y analizarla.

Día Nº de

envases Nº de

Defectuosos 1 40 4 2 30 2 3 60 4 4 60 7 5 50 5 6 40 2 7 30 9 8 50 6 9 40 3

10 40 2 Problema 7. Se desea controlar la presión de contenedores presurizados en una línea de producción. Se tomaron 7 muestras aleatorias de 5 contenedores cada una. Se determinó la presión en kg/cm2 de cada contenedor. ¿Le parece que el sistema está fuera de control? Muestreo 1 Muestreo 2 Muestreo 3 Muestreo 4 Muestreo 5 Muestreo 6 Muestreo 7

2,5 3,5 2,2 2,4 2,7 2,1 3,1

2,9 3,1 2,9 3 1,9 2,3 3

2,7 2,9 2,7 3,1 1,8 2,2 2,1

3,1 2,7 2,4 2,1 2,7 2,5 2,2

2,7 2,5 2,0 2,6 2,0 3,5 3,1 Problema 8: Se desea controlar la calidad de las partidas de leche obtenidas luego de la pasteurización. Para ello se realizan 7 mediciones sobre muestras aleatorias de leche obtenidas de cada partida, registrándose la cantidad de bacterias en miles/ml. Una partida de leche es considerada aceptable si la cantidad de bacterias/ml en la leche es de a lo sumo 360.000 bacterias/ml en promedio. Se conoce que la variabilidad es de 20.000 bacterias/ml.

a) Postule las hipótesis adecuadas a esta situación e indique la regla de decisión si se admite una probabilidad máxima del 2% de rechazar partidas que cumplen con la especificación.

b) Detalle las instrucciones para el operario que efectúa el muestreo de aceptación de las partidas. c) Al controlar una partida se obtuvieron los siguientes resultados (en miles de bacterias/ml): 360 – 400 –

310 – 340 – 430 – 380 – 390. ¿Qué decisión debería tomarse? ¿Qué error se podría estar cometiendo?

Page 8: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

8

d) Determinar la probabilidad de aceptar una partida de leche con un contenido promedio de 370.000 bacterias/ml. ¿Cómo se denomina dicha probabilidad? ¿Es un error o una decisión correcta?

e) Determinar cuántas muestras más deberían tomarse si se desea disminuir la probabilidad anterior al 20%.

f) Grafique la curva característica operativa para ambos tamaños de muestra. Compare y concluya. Problema 9: Se espera que los rendimientos correspondientes a la producción de una sustancia tengan un valor medio de al menos 200 kg por partida con un desvío estándar de 10 kg.

a) Diseñar una regla de decisión para que un operario pueda rechazar la partida, al nivel de significación del 0,01, sabiendo que se desea tener una probabilidad del 80% de rechazar partidas con rendimientos inferiores a los 190 kg. Detalle las instrucciones para el operario que efectúa el control de las partidas.

b) Calcule la probabilidad de rechazar una partida cuyo rendimiento medio sea de 188 kg, asumiendo que el desvío estándar no se modifica. ¿Cómo se denomina dicha probabilidad? ¿Es un error o una decisión correcta?

c) Si al extraer una muestra de una partida se obtiene un rendimiento medio de 198 kg, ¿qué decisión debería tomarse con respecto a la partida? ¿Qué error se podría estar cometiendo?

d) Construir una curva de potencia considerando que no se modifica el desvío estándar al variar µ. Problema 10: Un producto es comercializado en lotes de 10000 unidades. Se admite como máximo un 4% de unidades defectuosas (AQL) y se desea rechazar sólo el 1% de los lotes que cumplen con dicho requerimiento. Por otro lado, se admite una probabilidad máxima del 5% de aceptar lotes con un porcentaje de defectuosos del 8% (LTOD).

a) Diseñe un plan de muestreo de aceptación de lotes, indicando tamaño de la muestra y cantidad máxima de defectuosos admitidos en la misma. Detalle las instrucciones para el operario que efectúa el control de los lotes.

b) Calcule la probabilidad de rechazar un lote con un porcentaje de defectuosos del 5,5%. ¿Cómo se denomina dicha probabilidad? ¿Es un error o una decisión correcta?

c) Se inspecciona un lote y se obtiene un 5% de unidades defectuosas en la muestra. ¿Qué decisión debería tomarse? ¿Qué error podría estar cometiendo?

d) Trace la curva OC para el tamaño de muestra obtenido en el ítem a). e) Trace la curva OC para un tamaño de muestra del doble del obtenido en el ítem a). Compare con la

curva anterior y concluya. Problema 11: Una empresa alimenticia compra rutinariamente partidas de huevos frescos como parte de la materia prima para la elaboración de sus productos. Los huevos rotos o cascados son descartados, por lo que se desea establecer un sistema de control de recepción de las partidas de huevos. Se admite, como máximo, un 5% de huevos con cáscara rota o cascada en la partida. Se desea que la probabilidad de cometer error tipo I sea del 1% y la de cometer error tipo II sea del 10% para partidas que posean un 10% de huevos rotos o cascados.

a) Plantee las hipótesis correspondientes, identifique en qué consiste el error tipo I y tipo II en este caso β y determine el tamaño de muestra adecuado. Detalle las instrucciones para el operario que efectúa el muestreo.

b) Grafique la curva característica de potencia, para el tamaño de muestra decidido en el punto anterior y para el doble de dicho tamaño. Compare ambas curvas y comente los resultados.

Page 9: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

9

TRABAJO PRACTICO Nº 2 DISEÑO COMPLETAMENTE ALEATORIZADO:

ANOVA DE UN FACTOR Problema 1. Un fabricante de envases para alimentos está intentando mejorar la resistencia a la tensión de las bolsas de papel que se usan como envase primario para galletitas. El departamento de ingeniería de productos considera que la resistencia a la tensión es una función de la concentración de madera dura en la pulpa usada para obtener el papel y donde el intervalo de concentraciones de interés práctico está entre 5 y 20 %. Se diseña un experimento en el que se consideran cuatro niveles de concentración de madera dura: 5, 10, 15 y 20 %. Se decide elaborar seis bolsas de prueba en cada nivel de concentración, utilizando para ello una planta piloto. Las 24 bolsas se prueban, en orden aleatorio, empleando un equipo de laboratorio que mide la resistencia a la tensión en psi. Los datos del experimento se muestran en la siguiente tabla:

Concentración de madera dura (%) Bolsa 5 10 15 20

1 7 12 14 19 2 8 17 18 25 3 15 13 19 22 4 11 18 17 23 5 9 19 16 18 6 10 15 18 20

1- Determinar: unidad experimental, variable respuesta, variable explicatoria, niveles y tratamientos. 2- Escribir el modelo adecuado. Plantear las hipótesis correspondientes. 3- Probar los supuestos del modelo. 4- Realizar el test de hipótesis. Concluir, efectuando comparaciones de ser necesario.

Problema 2: En un estudio efectuado a fin de caracterizar la calidad y producción de aceite de oliva en la provincia de Catamarca, se estudiaron algunas de las variedades más difundidas. Para ello se tomaron muestras de aceitunas de distintos ejemplares a una misma altura de copa (aproximadamente dos metros) y de todos los puntos cardinales de la misma, a efectos de evitar las variaciones debidas a la posición del fruto en la planta. Las aceitunas fueron secadas en estufa y se les determinó el contenido porcentual de aceite por extracción química, con los siguientes resultados:

Arauco Arbequina Carolea 10,5 24,5 16,4 12,2 20,1 14,8 13,1 21,8 17,8 12,5 18,2 12,3 11,1 19,5 11,9 10,5 20,2 15,5 10 22,5 13,4 7,5 23,9 16 12,6 22,1 15,8 13,4 24,2 16,2

¿Cuál de las variedades presenta mayor contenido de aceite? Problema 3. La contaminación de los mares con metales pesados, como el plomo y el cadmio, además de constituir un grave problema medioambiental, puede producir la bioacumulación en distintos tipos de organismos marinos, como los moluscos bivalvos e incidir en la seguridad alimentaria del hombre. En la costa patagónica argentina existe una gran variedad de moluscos bivalvos, entre ellos Mytilus edulis platensis (mejillón), que es recolectado como recurso alimentario.

Page 10: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

10

Se llevó a cabo un estudio con el objetivo de cuantificar los niveles de plomo y cadmio en este bivalvo en el golfo San Jorge, para establecer la seguridad alimentaria cuando son consumidos por los seres humanos y evaluar el posible impacto toxicológico. Los ejemplares fueron recolectados manualmente del infralitoral marítimo en tres zonas del Golfo San Jorge con distinto nivel de contaminación: a. Desembocadura del Arroyo La Mata, lugar elegido por su proximidad a la ciudad de Comodoro Rivadavia (Chubut) y por recibir deshechos de la actividad industrial y petrolera. b. Un sitio distante 15 km del anterior (Santa Cruz), con niveles intermedios de contaminación c. Punta Maqueda, ubicada a 30 km al sur de Comodoro Rivadavia (Santa Cruz). Esta zona está alejada de la actividad antropogénica. Los metales se cuantificaron por espectrofotometría de absorción atómica con horno de grafito y se expresan en µ g/g de peso seco.

Sitio Plomo Cadmio Arroyo La Mata 0,679 9,26

0,206 4,57 0,253 2,88 0,152 6,59 0,437 3,48 0,218 4,95 0,344 3,67 1,073 5,94 0,270 4,66 0,136 4,06 0,647 8,81 0,158 6,25 0,537 3,64 0,325 2,57 0,514 5,93

Intermedio 0,078 2,81 0,559 1,59 0,154 1,57 0,213 1,14 0,079 1,86 0,065 3,51 0,114 2,18 0,198 2,93 0,446 4,85 0,158 3,57 0,349 2,74 0,195 4,39 0,268 2,17 0,173 2,1 0,253 1,63

Punta Maqueda 0,259 2,14 0,103 1,63 0,246 1,2 0,049 2,21 0,133 0,66 0,164 1,28 0,080 1,45 0,495 0,72 0,222 1,89 0,024 1,67 0,382 0,94 0,101 1,42 0,425 0,72 0,088 1,94 0,156 2,43

Page 11: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

11

1- Identifique la unidad experimental, las variables respuesta, la variable explicatoria o factor y sus niveles,

la cantidad de tratamientos y la cantidad de réplicas. ¿Cuál es el modelo? 2- Describa gráfica y estadísticamente las tres muestras. 3- Pruebe los supuestos del modelo. Calcule el residuo para la segunda medición en Puerto Maqueda.

¿Cuáles son sus unidades? 4- Compare mediante pruebas de hipótesis las tres zonas en cuanto a los niveles de plomo y cadmio en

Mytilus edulis platenses. Grafique y arme una tabla con los resultados. 5- Estime con una confianza del 95% la magnitud de la diferencia en la concentración promedio de plomo

entre el sitio a y el c. Problema 4. Se estudió la capacidad del compuesto 4NP para efectuar cambios en la capacidad reproductiva de Salmonella sp. Para ello se contó el número de colonias visibles en placas tratadas con cuatro dosis de 4NP. Los resultados obtenidos utilizando 28 placas fueron:

Dosis (µg/placa) 0 0,3 1 3

11 39 88 222 14 43 92 251 15 46 104 259 17 50 113 283 18 52 119 299 21 61 120 312 16 67 130 337

1- Como los datos incluyen recuentos de colonias, ¿puede suponerse distribución normal? Observe la

relación entre el promedio y la varianza de los tratamientos. ¿Puede suponerse homocedasticidad? 2- Aplique una transformación a los datos de manera tal de satisfacer los supuestos del modelo de Anova.

Realice el análisis para los datos transformados. Problema 5: Se sabe que elevados niveles en sangre de colesterol LDL son perjudiciales para la salud. Se llevó a cabo un estudio a fin de determinar el impacto de una dieta rica en huevo sobre los niveles de colesterol LDL en 24 individuos sanos. Los pacientes fueron divididos al azar en tres grupos: I) dieta sin huevo, II) dieta con el equivalente a un huevo cada dos días, III) dieta con el equivalente a un huevo diario. Se midieron los valores de LDL luego de 30 días de tratamiento fueron (en unidades/ml):

Dieta I II III Media 12 14 22

1- Plantee las hipótesis correspondientes, complete la tabla de Anova (SC del error = 203) y concluya,

asumiendo un riesgo del 5%. 2- Los resultados de las comparaciones fueron:

Test:Tukey Alfa:=0.05 DMS:=3.3 dieta Medias n I 12 8 II 14 8 III 22 8 Letras distintas indican diferencias significativas(p<= 0.05)

Complete la significación de las comparaciones agregando las letras. Si le preguntan si es nociva la ingesta de huevo, ¿qué contestaría en base a este estudio? Confeccione un breve informe.

3- En la prueba de Levene se obtuvo p=0.46. ¿Qué hipótesis se puso a prueba, cómo y qué se concluye en términos del problema?

Page 12: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

12

TRABAJO PRACTICO Nº 3 ANOVA SIN REPETICIONES

Problema 1. Una cadena de restaurantes de comida rápida tiene 4 sucursales en un área geográfica determinada. El Departamento Administrativo de la empresa quiere evaluar el servicio de las cuatro sucursales y para ello contrata 24 expertos con experiencia variada en la evaluación de servicios de comidas rápidas. Después de realizar consultas preliminares el Director de Investigación clasifica a los 24 expertos en 6 grupos de 4, tomando como base la experiencia de los mismos en evaluar los servicios. Así, los cuatro expertos con mayor experiencia quedan asignados al primer grupo; los siguientes cuatro con mayor experiencia se asignan al grupo 2 y así sucesivamente. Dentro de cada uno de los seis grupos homogéneos, los cuatro expertos son asignados en forma aleatoria para realizar la evaluación del servicio de una sucursal en particular. Los expertos evalúan el servicio usando una escala de 0 (mal servicio) a 100 (servicio excelente). Los resultados se resumen en la siguiente tabla:

Sucursal

Grupo A B C D 1 70 61 82 74 2 77 75 88 76 3 76 67 90 80 4 80 63 96 76 5 84 66 92 84 6 78 68 98 86

Determinar si existe evidencia de diferencia significativa en el servicio entre las sucursales y, en caso afirmativo, establecer entre cuales de ellas hay diferencias significativas. Problema 2: En los alimentos pre-fritos que se comercializan congelados, la textura crocante en el producto final listo para su ingesta es altamente valorada por el consumidor y constituye uno de los atributos más críticos en la aceptación de estos productos, por el contraste con el interior blando. Se llevó a cabo un ensayo a fin de comparar 4 métodos de cocción de nuggets de pollo prefritas. Se usaron 8 paquetes de distintas marcas comerciales de nuggets de pollo congelados adquiridos en el supermercado. Se ensayaron 4 métodos de cocción: a) freído profundo (aceite a 180°C en freidora doméstica de 1 litro); b) horno convencional (10 min a 225°C), c) horno a microondas (potencia máxima, 2 min); d) microondas + Neocrisp (nuggets envueltas en una lámina comercial que supuestamente preserva la textura del alimento, igual cocción que c)). Se midió la textura del producto cocido mediante un Texture Analyser (Stable Micro Systems, UK). Este arroja valores en unidades arbitrarias: cuánto más alto, mas crocante, cuanto más bajo, más gomoso. Los resultados fueron:

Bolsa freído profundo horno convencional microondas microondas + Neocrisp 1 48 44 16 39 2 55 37 28 31 3 65 46 29 41 4 73 87 42 53 5 84 72 43 48 6 73 74 37 61 7 90 68 50 46 8 88 95 49 68

1- Identifique la unidad experimental, la variable respuesta, el o los factores y sus niveles, la cantidad de

réplicas y el diseño. Especifique el modelo en términos del problema. 2- ¿Se cumplen los supuestos del modelo? Fundamente. 3- Plantee la hipótesis de investigación y las hipótesis del Anova, arme la tabla y concluya en términos del

problema. Efectúe las comparaciones necesarias.

Page 13: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

13

4- Elabore el informe final, acompañado de un gráfico con las letras correspondientes. ¿Cuáles son las conclusiones del ensayo? Comente TODOS los resultados. ¿Qué recomendaciones efectuaría? Indique la magnitud del efecto para el/los tratamientos recomendados.

Problema 3. Tres diferentes soluciones para lavar están siendo comparadas con objeto de estudiar su efectividad en el retraso del crecimiento de bacterias en envases de leche de 2 litros. El análisis se realiza en laboratorio y sólo pueden efectuarse tres pruebas por día. Como el experimentador sospecha que los días pueden ser una fuente de variabilidad potencial, decide aplicar un diseño de bloques al azar. Las observaciones se recopilaron durante cuatro días y los datos aparecen a continuación (en UFC). Analice los datos y obtenga las conclusiones apropiadas.

Día Solución 1 2 3 4

A 3,7 3,8 4 4,3 B 5,3 5,4 6 6,2

C (estándar) 4,2 4,6 4,7 4,8

1- Indique cuál es la unidad experimental. Indique cuál es la variable respuesta y el o los factores. Exprese el modelo en términos del problema.

2- Estudie el paralelismo. 3- ¿Cuáles son las conclusiones de la experiencia? ¿Cuál solución recomendaría? Evalúe la magnitud del

efecto. 4- ¿Se confirmó la sospecha del investigador? Justifique.

Problema 4: Como consecuencia del proceso de fritura en la elaboración de alimentos, los aceites de cocción se oxidan, liberando dienos conjugados (DC). Los DC son productos primarios del proceso de oxidación formados por reordenamiento de los dobles enlaces de los ácidos grasos insaturados (a mayores niveles de DC mayor oxidación y menos saludable es el producto). Se llevó a cabo un estudio que tuvo como objeto estudiar la oxidación del aceite de girasol durante el proceso continuo de fritura de maní. Para ello se utilizaron 4 lotes de aceite de girasol. De cada lote se extrajeron 3 muestras de 100 ml, Una muestra fue dejada como control, en otra se frió maní durante 2,5 horas a 170° C y en la tercera, se frió maní durante 5 horas a 170° C. Las muestras de aceite fueron enviadas al laboratorio donde se determinó la concentración de DC, con los siguientes resultados:

Lote control 2,5 horas 5 horas 1 2,4 3,8 5,0 2 2,4 3,7 5,3 3 3,0 4,1 5,3 4 3,4 3,8 5,8 5 3,1 3,8 5,5

1. Identifique la unidad experimental, la variable respuesta, el o los factores y sus niveles, la cantidad de

réplicas y el diseño. Especifique el modelo en términos del problema. 2. Indique cómo se debió efectuar el ensayo a fin de verificar los principios de aleatoriedad y cómo se

controló del error. 3. ¿Se cumplen los supuestos del modelo? Fundamente. 4. Plantee la hipótesis de investigación y las hipótesis del Anova, arme la tabla y concluya con respecto a

las temperaturas y los lotes. Efectúe las comparaciones necesarias. 5. Elabore el informe final, acompañado de un gráfico con las letras correspondientes. ¿Cuáles son las

conclusiones del ensayo? Comente TODOS los resultados. ¿Qué recomendaciones efectuaría en la fritura de maní? Indique la magnitud del efecto para algún tratamiento.

Problema 5. El queso es un producto lácteo obtenido por coagulación de la leche y separación del suero, sometido o no a una maduración posterior. Para la coagulación es necesario acidificar la leche, añadiéndole algún tipo de fermento o cuajo (coagulación enzimática). Se efectúa un experimento con el fin de testear distintos

Page 14: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

14

acidificantes orgánicos que acelerarían el proceso de fabricación de queso tipo mozzarella de búfala. Un lote de leche de búfala fue dividido en 4 partes de 50 litros cada una. A cada una de estas partes se le aplicó un método de acidificación diferente: a) agregado de cuajo, b) agregado de cuajo + ácido láctico; c) agregado de cuajo + ácido acético; d) agregado de cuajo + ácido propiónico. Luego del cuajado, se elaboraron las 4 piezas de queso según la metodología tradicional y se las almacenó a 4°C. Este proceso fue repetido con 4 lotes más de leche. Para medir la calidad del queso se determinó el grado de proteólisis en cada pieza. Un aumento de la proteólisis coincide con cambios desfavorables en el sabor, la textura y calidad de la hebra en el queso mozzarella. El nivel de proteólisis se determinó a los 12 días de la fabricación como la cantidad de aminoácidos libres (milimoles/kg queso).

Lote Cuajo Ác.láctico Ác.acético Ác.propiónico 1 17,0 21,0 24,0 24,2 17,5 23,1 27,3 20,2 20,0 20,1 24,4 28,3 14,6 20,4 23,3 19,9 2 12,0 14,0 20,0 20,2 12,6 15,6 21,3 26,0 16,5 17,9 20,4 19,8 13,3 14,2 17,7 25,3 3 15,0 18,0 23,0 22,2 11,9 21,5 23,8 21,9 13,1 21,0 23,6 23,5 12,1 16,3 26,5 20,5 4 14,0 17,0 20,0 22,2 12,0 14,9 20,5 21,1 14,0 15,4 20,9 18,2 15,6 15,9 22,2 21,2 5 18,0 20,0 24,0 24,2 21,1 20,8 22,4 28,8 19,6 18,0 23,7 21,4 17,5 17,3 19,6 24,3

1- Identifique la unidad experimental, la variable respuesta, el o los factores y sus niveles, la cantidad de

réplicas y el diseño. Especifique el modelo en términos del problema. 2- Indique si se cumplieron los principios de diseño experimental. 3- Pruebe los supuestos del modelo. 4- Plantee la hipótesis de investigación y las hipótesis del Anova, arme la tabla y concluya en términos del

problema. 5- Efectúe las comparaciones necesarias. Complete el gráfico e indique las letras correspondientes.

¿Cuáles son las conclusiones del ensayo? Comente TODOS los resultados. ¿Qué recomendaciones efectuaría? Indique la magnitud del efecto para el/los tratamientos recomendados.

Page 15: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

15

TRABAJO PRACTICO Nº 4 DISEÑO FACTORIAL

Problema 1. Se realizó un experimento con el objetivo de evaluar los efectos de la suplementación con soja entera sin procesamiento (SEN), soja entera desactivada con vapor (SED) y soja extrusada (SEX) en recría de bovinos para carne. 40 vaquillonas cruza cebú fueron clasificadas por biotipo (predominio cebú o predominio británica) y asignadas al azar a cuatro tratamientos: sin suplementación (Control) o suplementación con SEN, SED o SEX. Al cabo de 6 meses se registró la ganancia en peso vivo (en g/día):

Control SED SEN SEX CEBÚ 183 353 364 521

266 466 400 531 154 440 320 515 141 430 422 464 209 468 354 416

BRITANICA 159 397 404 456 162 421 313 495 194 422 297 414 198 356 365 503 109 337 333 430

1- Identifique el modelo, la variable respuesta, los factores y sus niveles y los tratamientos. ¿Cuál es la unidad experimental? ¿Dónde interviene el azar?

2- Realice un gráfico de perfiles y comente los resultados. 3- Verifique los supuestos del modelo. 4- Plantee las hipótesis del anova, efectúe el análisis y concluya. 5- Plantee los contrastes que sean necesarios para poder resumir las conclusiones del experimento.

Problema 2. En un estudio se compararon dos cultivares de frutillas, Camarosa y Selva en cuanto a la respuesta a distintos factores que podrían afectar la calidad de la frutilla luego de su cosecha. Se cosecharon frutillas de las dos variedades que fueron transportadas refrigeradas a 4°C al laboratorio. Se eliminaron las frutas dañadas y se seleccionaron ejemplares de similar color y nivel de maduración. Se extrajeron muestras de 100 g de frutillas de cada variedad y en cada una de estas muestras se determinó el contenido de ácido ascórbico a las 48 y 72 hs post-cosecha. Algunas muestras fueron congeladas a –20°C y al cabo de 6 meses fueron descongeladas y se midió el ácido ascórbico. Además de su valor nutricional, el ácido ascórbico es importante porque posee propiedades antioxidantes que prolongan la vida útil de la fruta. Los resultados fueron (en mg/g de fruta):

Tiempo post-cosecha Variedad 48 hs 72 hs 6 meses

Camarosa 0.307 0.287 0.1 0.333 0.283 0.101 0.332 0.299 0.127 0.315 0.286 0.115 0.346 0.243 0.093 0.273 0.271 0.132 0.309 0.239 0.092 0.308 0.263 0.124 0.316 0.236 0.097 0.3 0.327 0.106

Selva 0.337 0.312 0.21 0.35 0.304 0.209 0.342 0.294 0.234 0.284 0.29 0.222 0.39 0.334 0.251 0.334 0.293 0.255

Page 16: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

16

0.312 0.24 0.231 0.33 0.302 0.261 0.387 0.338 0.251 0.31 0.289 0.242

¿Qué conclusiones pueden extraerse? Problema 3: En la preservación de los alimentos se ha empleado tradicionalmente el empaque plástico, pero en la actualidad se están desarrollando otras alternativas de empaque, más ecológicas. Una de ellas son los films basados en polímeros naturales, como la gelatina, que no solo son biodegradables sino además comestibles. La gelatina es un polímero proteico de origen animal (bovino, porcino o pescado) que al aplicarse sobre los alimentos evita la deshidratación. Adicionalmente en su fabricación pueden incorporarse extractos vegetales a fin de conferirle propiedades antioxidantes. En un laboratorio se llevó a cabo un ensayo a fin de determinar el efecto del agregado de extractos vegetales sobre las propiedades antioxidantes de films de gelatina. Para ello se prepararon láminas de gelatina de 12 cm x 12 cm de 100 µm de espesor. Se utilizaron dos tipos de gelatina: a partir de proteínas de vaca o a partir de proteínas de pescado. Por otro lado, en la fabricación de cada lámina se agregaron extractos de romero o de orégano o bien no se agregaron extractos vegetales (control). Para cada combinación de tipo de gelatina y extracto vegetal adicionado se fabricaron 5 láminas. En cada lámina se midió la capacidad antioxidante, expresada como mg de equivalentes de ácido ascórbico/ gr de film. Los resultados se muestran al final.

1- Identifique la unidad experimental, la variable respuesta, el o los factores y sus niveles, la cantidad de réplicas y el diseño. Especifique el modelo en términos del problema. Efectúe el gráfico de perfiles.

2- ¿Se cumplen los supuestos del modelo? Fundamente. 3- Efectúe el Anova y concluya en términos del problema. Explique qué significa interacción en este

ensayo. 4- Analice los efectos principales o simples según corresponda y efectúe las comparaciones que considere

necesarias. 5- Elabore el informe final, acompañado de un gráfico con las letras correspondientes (mayúsculas para

tipo de gelatina y minúsculas para extracto vegetal). En el mismo no olvide comentar todos los resultados y efectuar recomendaciones, indicando la magnitud del efecto para el/los tratamientos recomendados.

Lámina Gelatina Extracto Cap.antioxidante

1 vaca orégano 13,76 2 vaca orégano 16,19 3 vaca orégano 18,31 4 vaca orégano 14,73 5 vaca orégano 14,93 6 vaca romero 2,99 7 vaca romero 4,47 8 vaca romero 5,93 9 vaca romero 5,56

10 vaca romero 6,27 11 vaca control 2,51 12 vaca control 4,25 13 vaca control 1,44 14 vaca control 2,40 15 vaca control 1,60 16 pescado orégano 11,60 17 pescado orégano 15,08 18 pescado orégano 9,93 19 pescado orégano 11,54 20 pescado orégano 12,89 21 pescado romero 7,31 22 pescado romero 5,87 23 pescado romero 6,30

Page 17: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

17

24 pescado romero 7,87 25 pescado romero 5,75 26 pescado control 3,82 27 pescado control 1,49 28 pescado control 1,80 29 pescado control 2,08 30 pescado control 3,31

Problema 4. La oxidación lipídica es una de las principales causas del deterioro durante el almacenamiento de alimentos con contenido graso. A fin de prevenirla, se efectuó un estudio sobre los beneficios del tratamiento con fosfolipasa D (FLD) en carne de vaca. Para ello se homogeneizó carne picada y se armaron prociones de 250 g. Algunas muestras se dejaron como control mientras que otras fueron tratadas con 50 ppm de fosfolipasa D. Se analizó la oxidación mediante la cuantificación de TBARS (en µ M) (a mayor nivel de TBARS mayor oxidación) a los 2, 5 y 7 días. Se efectuaron 4 réplicas por tratamiento. Todos los procedimientos se efectuaron a 4°C. Los resultados fueron:

Tiempo de almacenamiento 2 d 5d 7d

Control 0.59 0.85 0.94 1.00 1.80 1.38

0.67 0.97 0.96 1.11 1.42 1.81

FDL

0.51 0.49 0.60 0.72 0.87 0.67

0.86 0.64 0.73 0.71 0.91 0.92

1- Identifique la unidad experimental, la variable respuesta, el o los factores y sus niveles. Especifique el modelo

en términos del problema. 2- Efectúe un gráfico de perfiles. Comente. 3- Pruebe los supuestos del modelo. 4- Efectué el Anova y comparaciones de ser necesario. ¿Cuáles son las conclusiones de la investigación? ¿Qué

condiciones de almacenamiento recomendaría?

Problema 5. El aumento del consumo de arándanos ha llevado a la agroindustria a aplicar métodos de conservación más económicos como la deshidratación. Ésta produce un producto tipo pasa, deshidratado y dulce a partir del fruto del arándano, con características nutritivas similares al fruto fresco. Se ha observado que la remoción química de la piel facilita la salida de agua durante la deshidratación entregando productos de mejor textura y aceptabilidad sensorial. El objetivo de este trabajo fue estudiar la remoción química de piel de arándano a diferentes concentraciones de NaOH y tiempos de inmersión. Se utilizaron 18 bandejas conteniendo 250 g de arándanos de similares características, que fueron asignadas en forma balanceada a dos concentraciones distintas de NaOH (1.5 y 4%) en tres distintos tiempos de inmersión (5, 10 y 15 seg). Se consideró la remoción, ya sea total o parcial, de piel de arándanos, la cual fue cuantificada como porcentaje removido de la superficie total.

Remoción (%) NaOH

Tiempo 1.5% 4% 1,3 10,8

5 s 3,4 12,3 2,8 14,5

3,5 30,2 10 s 3,9 34,2

6,3 35,6 7,8 31,5

15 s 5,8 36,6 7,1 35,0

Page 18: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

18

1- Identifique la unidad experimental, la variable respuesta, el o los factores y sus niveles y la cantidad de réplicas. Especifique el modelo en términos del problema.

2- ¿Se verifican en este ensayo los tres principios del diseño experimental? Fundamente su respuesta. 3- Efectúe un gráfico de perfiles. Comente. 4- Pruebe los supuestos del modelo. 5- Efectué el Anova y comparaciones de ser necesario.¿Cuáles son las conclusiones del ensayo?

Comente TODOS los resultados. ¿Qué recomendaciones efectuaría? Indique la magnitud del efecto para el/los tratamientos recomendados.

Problema 6. Numerosas evidencias indican que el tratamiento superficial con bactericidas de las reses de carne vacuna, inmediatamente después de su faenamiento, constituye una intervención potencialmente beneficiosa ya que no solo reduce la contaminación patógena, sino que aumenta la vida media de la carne. Un frigorífico decide estudiar el efecto sobre la contaminación bacteriana de las reses recién faenadas del tratamiento con ácido acético a dos concentraciones y a dos temperaturas. Para ello dispone de 40 reses, elegidas aleatoriamente. Luego del sacrificio, faenamiento y lavado con agua de las reses, estas fueron conducidas a las cabinas pulverizadoras, ubicadas inmediatamente antes del ingreso a la cámara frigorífica. Cada res ingresada a la cabina fue pulverizada con ácido acético al 0.1% o al 0.2% a dos temperaturas: ambiente o 50°C. Luego del tratamiento se tomaron muestras de carne en condiciones estériles que en laboratorio fueron homogeneizadas a fin de determinar el recuento de bacterias aeróbicas. Aplique la transformación log10 y analice la información.

AcH Temperatura BA 0.1% TA 15576 0.1% TA 5545 0.1% TA 2304 0.1% TA 4507 0.1% TA 5415 0.1% TA 3400 0.1% TA 5733 0.1% TA 3526 0.1% TA 7723 0.1% TA 11044 0.2% TA 2386 0.2% TA 4096 0.2% TA 5542 0.2% TA 2729 0.2% TA 2170 0.2% TA 2202 0.2% TA 13901 0.2% TA 2508 0.2% TA 5151 0.2% TA 10938 0.1% 50°C 3632 0.1% 50°C 3446 0.1% 50°C 4558 0.1% 50°C 6254 0.1% 50°C 6010 0.1% 50°C 2158 0.1% 50°C 3755 0.1% 50°C 6141 0.1% 50°C 6247 0.1% 50°C 5189 0.2% 50°C 715 0.2% 50°C 838 0.2% 50°C 873 0.2% 50°C 400

Page 19: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

19

0.2% 50°C 4072 0.2% 50°C 474 0.2% 50°C 1044 0.2% 50°C 2564 0.2% 50°C 492 0.2% 50°C 2552

Page 20: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

20

TRABAJO PRACTICO Nº 5 REGRESIÓN LINEAL SIMPLE

Problema 1: Un producto químico es elaborado mediante una reacción que es exotérmica. Se sospecha que el calor liberado en la reacción está relacionado con la cantidad de una sustancia (R) que se agrega en una etapa de la reacción. Para estudiar si existe una relación funcional entre la cantidad de calor liberado y el agregado de la sustancia R se produjeron 13 partidas del producto, variando en cada partida el porcentaje de R agregado y midiendo el calor liberado en cada caso. Los valores obtenidos se pueden ver en la tabla que sigue: Calor 78,5 73,4 104,3 87,6 95,9 109,2 102,7 72,5 93,1 115,9 83,8 113,3 109,4 % de R 60 52 20 47 33 22 6 44 22 26 34 12 12

1- Construir un diagrama de dispersión. 2- Estimar la ecuación de la recta e interpretar. 3- Establecer la validez de un modelo de regresión lineal simple para los datos. 4- Calcular el coeficiente de determinación. 5- Graficar la recta de predicción con su banda de confianza del 95 %. 6- Determinar el valor de predicción del calor para un valor de R de 33 % con su correspondiente intervalo

de confianza del 95 %. Problema 2: Gran parte de la frutilla cosechada es congelada, por lo que es necesario evaluar el efecto de este proceso sobre la calidad de la fruta. Para ello, en 20 muestras de 100g de frutillas congeladas a –20°C durante de 3 meses se midió el volumen de líquido perdido luego del descongelamiento (en ml/100 g de fruta). Este es un parámetro importante en el procesamiento industrial no solo porque permite evaluar la calidad del proceso de congelado-descongelado sino que además permite estudiar la pérdida de resistencia mecánica en el cambio de estado. Además se midió el contenido de lignina de la fruta (en mg/g de fruta), con el objetivo de estudiar la asociación con el volumen de líquido perdido. Se obtuvieron los siguientes resultados:

Contenido de lignina

Volumen perdido

8.01 12.46 7.85 11.91

12.56 9.71 13.33 8.15 8.22 10.99 9.53 10.27 9.63 9.84

12.48 9.19 9.50 10.51

12.47 8.49 10.22 9.84 8.53 10.69

15.40 7.57 7.88 11.55 9.36 10.96 9.35 10.69

10.74 10.03 6.62 13

11.90 8.85 12.30 9.78

1- Definir la unidad experimental, la variable respuesta o dependiente (y) y la variable explicatoria o

independiente (x). 2- Representar los datos mediante un diagrama de dispersión y analizar gráficamente la regresión.

Page 21: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

21

3- Establecer la relación funcional entre ambas variables (es decir estimar y = α +βx + ε). Interpretar en el contexto del problema los coeficientes de la recta.

4- Estudiar la significación de la regresión mediante ANOVA. Indicar las hipótesis, previa verificación de los supuestos del modelo. ¿Podría predecirse cuánto líquido perderá una partida de frutillas luego del congelamiento en función del contenido de lignina?

5- Calcular el coeficiente de determinación R2 ¿Qué indica en este caso? 6- Calcular un intervalo de confianza para la pendiente. Indicar cuál es el significado biológico de la

pendiente y de su intervalo de confianza. 7- Pronosticar con una confianza del 95% cuánto líquido perderá una partida de frutillas cuyo contenido de

lignina es de 10 mg/g de fruta. Idem para una partida con 20 mg/g de lignina. Problema 3. La reducción del pH previene el crecimiento de organismos patógenos en un amplio rango de alimentos. Sin embargo, este método parece no ser efectivo para E. coli entero hemorrágica. Es por ello que se están estudiando otros métodos para la eliminación de dicho patógeno, como la utilización de bajas dosis de radiación. Se obtienen los siguientes resultados:

Dosis (kGy) 0,1 0,2 0,3 0,4 0,5 0,6 Densidad del patógeno (log UFC/ml)

7,8 6 5,7 4 3,8 2,2

1- Estime la densidad promedio del patógeno si se aplica una dosis de 0,46 kGy., e interprete los términos

de la recta en función de las variables del problema. 2- Determine si la recta de mínimos cuadrados calculada representa un buen ajuste de los datos. 3- Estime la variación en la densidad del patógeno por cada unidad adicional de radiación aplicada, con un

95% de confianza. Problema 4. Se realiza una experiencia a fin de determinar la influencia del tiempo de tratamiento térmico sobre la supervivencia de esporas microbianas. Se sabe que la curva de supervivencia está dada por la ecuación:

Nt = N0 10-at donde Nt es el número de individuos en el tiempo t; N0 es el número inicial de individuos y a es el coeficiente de mortalidad. En el ensayo, cultivos de esporas son sometidos a una temperatura constante de 115°C; a distintos tiempos, se determina la cantidad de esporas viables sobrevivientes:

Tiempo (min) 5 10 15 20 25 Nt 450 65 30 3.8 1.8

1- Representar gráficamente. 2- Estimar el coeficiente de mortalidad aplicando un modelo de regresión lineal (utilizar log Nt = log N0 – at) 3- Estudiar la significación de la regresión. Calcular R2. Qué indica? 4- Estimar el tiempo de reducción decimal D115, es decir el tiempo necesario para destruir el 90% de los

individuos sometidos a 115°C (utilizar D115=1/b1) 5- Estimar el número de individuos sobrevivientes a los 20 min, con una confianza del 95%. Idem pero a

los 60 min.

Rta: a= 3.16 esporas; b= -0.12 esporas/min; R2= 0.98, D115= 8.29 min Problema 5: Una empresa que se dedica a la producción de chicles en tabletas sabe que uno de los pasos críticos es la laminación. En una cocida, la goma de mascar es calentada y pasada por rodillos que le dan el espesor deseado, obteniéndose una lámina que es enfriada y almacenada en cámaras frigoríficas. Sin embargo el peso de la lámina es muy variable, resultando en costos variables de goma de mascar, por lo que se desea saber si la velocidad a la que operan los rodillos tiene efecto sobre la misma. Para ello se diseño un experimento balanceado: se efectuaron en total 24 cocidas, pero a distintas velocidades de rodillo (49, 50, 51 y 52 rpm) y se midió el peso de las láminas obtenidas al enfriarse (en gramos). Analice los datos y concluya en términos del problema.

Page 22: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

22

52 51 50 49 812 817 864 876 817 838 844 901 819 825 814 899 818 825 868 900 832 820 875 941 816 837 871 897

Problema 6. Analizar mediante regresión los datos del problema 1 del TP2. ¿Qué ventaja ofrece este abordaje con respecto al análisis de la varianza? Problema 7. Analizar mediante regresión los datos del problema 6 del TP2. ¿Qué ventaja ofrece este abordaje con respecto al análisis de la varianza?

Page 23: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

23

TRABAJO PRACTICO Nº 6 REGRESIÓN LINEAL MULTIPLE

Problema 1. Al caracterizar los fideos de harina de trigo en relación a sus atributos sensoriales, los consumidores manifiestan que los prefieren firmes y elásticos, con una superficie suave. Se llevó a cabo un ensayo a fin de determinar cuáles son las variables más relevantes en la determinación de la firmeza de los fideos de harina de trigo. Para ello, 13 muestras de fideos tipo tallarín de distintas marcas, fueron analizados en laboratorio en cuanto a las siguientes propiedades de la pasta: contenido de proteína de la harina (% P/P), viscosidad (en unidades de Analizador Visco, UAV), volumen de sedimentación (en ml) y volumen de hinchamiento de la harina (ml/g). Por otro lado, para la evaluación sensorial de la firmeza de la pasta cocida, un panel entrenado de evaluadores fue sometido a tres sesiones. En cada sesión probaron muestras de referencia de pasta suave (0 de firmeza) y firme (15 de firmeza) y luego las 13 muestras a evaluar. A cada una le asignaron un puntaje entre 0 y 15. Los resultados del promedio de firmeza de los 3 ensayos para cada marca de fideo, así como las variables medidas en laboratorio, se muestran al final.

1- Identifique la unidad experimental, la variable respuesta y las explicatorias. Realice los gráficos de residuos parciales y comente brevemente.

2- Efectúe el análisis de multicolinealidad. Si descarta una o más variables, fundamente por qué lo hizo. 3- Estudie la significación del modelo propuesto. Si descarta una o más variables, fundamente por qué lo hizo. 4- Escriba la ecuación estimada del modelo final propuesto e interprete los coeficientes en el contexto del

problema. Interprete el R2 que considere más apropiado. 5- Elabore el informe final, indicando qué características deberán poseer los fideos de harina de trigo para ser

valorados como más firmes.

Marca proteína viscosidad volumen de sedimentación volumen de hinchamiento Firmeza 1 10,5 130 40 31,58 5,53 2 4,5 145 40 27,37 5,18 3 14,5 280 110 10,53 7,28 4 14,5 155 75 24,74 6,16 5 10,5 260 30 17,37 6,72 6 14,5 275 85 11,58 7,63 7 6,5 355 45 3,16 7,21 8 4,5 155 35 23,16 5,2 9 5,5 270 115 11,58 6,51

10 24,5 235 40 13,68 8,12 11 4,5 200 95 17,89 5,88 12 14,5 330 45 6,32 7,91 13 13,5 440 30 6,32 7,63

Problema 2: Un distribuidor de quesos Premium está analizando el sistema de entregas de su producto; en particular, está interesado en predecir el tiempo empleado para efectuar entregas a sus clientes. Se tomó una muestra de 15 pedidos y se registró la cantidad de cajas entregadas, la distancia recorrida (en km), la facturación (en $), la edad del conductor y el tiempo que demandó la entrega (en min). Los resultados fueron:

Pedido cajas distancia facturación edad tiempo 1 10 30 660 39 24 2 15 25 715 48 27 3 10 40 481 48 29 4 20 18 1103 36 31 5 25 22 1375 36 25 6 18 31 986 35 33 7 12 26 817 46 26 8 14 34 950 31 28 9 16 29 870 48 31

10 22 37 1242 32 39 11 24 20 1035 37 33 12 17 25 928 30 30

Page 24: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

24

13 13 27 687 36 25 14 30 23 1600 54 42 15 24 33 1444 46 40

1- Identifique la unidad experimental, la variable respuesta y las variables explicatorias. Escriba el modelo

saturado. 2- Determine si existe multicolinealidad y de ser así, determine cuáles variables explicatorias permanecen

en el modelo. 3- Pruebe los restantes supuestos del modelo propuesto según el punto anterior. 4- Analice la significación del modelo propuesto y de cada una de las variables explicatorias

seleccionadas. 5- Escriba la ecuación de la recta e interprete los coeficientes de regresión parcial en el contexto del

problema. 6- ¿Cuáles son las conclusiones del ensayo? ¡En qué condiciones espera menores tiempos de entrega? 7- Interprete el R2 que considere adecuado. 8- Estime el tiempo de entrega para un pedido de 15 cajas, a 30 km de distancia, por un monto de 1000 $

siendo el conductor José, de 42 años de edad.

Problema 3. En el archivo anexo se presentan datos de contaminación atmosférica en 41 ciudades. La variable de interés es el contenido de SO2 en el aire en microgramos por metro cúbico y se desea estudiar su relación con seis variables regresoras, dos relativas a ecología humana y cuatro al clima. Son la siguientes:

X1=temperatura media anual en grados celcius X2=número de fábricas con más de 20 empleados X3=número de habitantes, en miles X4=Velocidad media del viento al año en kilómetros por hora X5=precipitación media anual en mm de agua caída X6=número medio de días con lluvia al año

El objetivo del estudio es encontrar un modelo de regresión múltiple que explique adecuadamente el comportamiento de la variable de interés.

Page 25: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

25

Revisión conceptual

1. ¿Cuáles son las herramientas gráficas que se utilizan para el control de calidad? 2. ¿Qué graficas de control conoce y cuál es la variable aleatoria y la distribución de probabilidades

subyacente en cada una de ellas? 3. ¿Cuál es la diferencia entre Cp y Cpk? ¿Para qué se utilizan? 4. Indique cuál es el riesgo del comprador y el riesgo del vendedor en un control de recepción de materia

prima. 5. ¿Por qué es importante que la potencia sea alta? 6. Explique brevemente en qué consiste el análisis de la varianza. 7. ¿Qué es y qué mide la F muestral? ¿Cuál es su distribución de probabilidades? 8. ¿Qué miden los residuos? ¿Cómo se calculan? ¿Cuál es su vinculación con los CM error? ¿Por qué

interesa que sean bajos? 9. ¿Cuáles son los principios del diseño experimental? ¿Por qué son importantes? 10. ¿Qué mide el p de la prueba? 11. ¿Para qué se utilizan las pruebas de Levene, Shapiro Wilks y Tukey? 12. ¿Qué significa que exista interacción entre dos factores? 13. ¿Cómo cambia el análisis en un diseño factorial según si la interacción es significativa o no? 14. ¿Qué es la colinealidad y por qué debe evitarse? 15. ¿Cuál es la diferencia entre un modelo de regresión y uno de correlación? 16. ¿Qué miden los coeficientes de regresión y los coeficientes de regresión parciales? ¿Cuáles son sus

unidades? 17. ¿Cuál es la diferencia entre R2 y R2 ajustado? ¿Qué miden? 18. Para todos los diseños vistos indique: a) modelo; b) supuestos; c) un ejemplo 19. ¿Cómo se calculan los residuos en todos los modelos de anova y regresión vistos? 20. Indique ventajas y desventajas de los diseños vistos.

Práctica integratoria

Problema 1. Con el objetivo de reemplazar, debido a su costo, a la harina de pescado como fuente de proteínas en la elaboración de alimentos balanceados para peces, se quiere evaluar la digestibilidad de dietas para trucha arco iris (Oncorhynchus mykiss) con dos niveles de inclusión de harina de lupino blanco (Lupinus albus ), 10% (L-10), y 20% (L-20), además de una dieta control con 0% de lupino. La experiencia fue diseñada por un estadístico pero desafortunadamente falleció en un trágico accidente antes de analizar los datos.

1- ¿Cómo cree que el estadístico diseñó la experiencia, sabiendo que en el criadero hay truchas juveniles y adultas, y que trabajó con un total de 60 ejemplares? Identifique la unidad experimental, la variable respuesta, el o los factores y sus niveles. Especifique el modelo en términos del problema.

2- Los resultados fueron:

Tabla de medias (% de digestibilidad Tabla de Anova Juveniles Adultos F. de V. GL valor-p

Control 40.2 59.0 49.6 A Dietas 0.04 L-10 38.7 56.0 47.4 B Edad 0.06 L-20 22.8 34.2 28.5 A x B 0.01

33.9 49.7 41.8 Error

Page 26: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

26

01020304050607080

Control L-10 L-20

DietaD

iges

tibili

dad

(%)

Juveniles

Adultos

¿Cuáles son las hipótesis del Anova? Complete la tabla y concluya en términos del ensayo.

3- Sabiendo que DMS Tukey = 10, efectúe las comparaciones pertinentes y concluya. Complete el gráfico asignando las letras de significación.

4- ¿Cuáles son las conclusiones de la investigación? ¿Cuál o cuáles de estas dietas recomendaría utilizar? Indique la magnitud del efecto que considere relevante.

5- ¿Cómo hubiese continuado el análisis si los resultados de la tabla de anova hubiesen sido los siguientes?

F. de V. valor-p A Dietas 0.04 B Edad 0.06 A x B 0.11 Error

6- Indique cuáles son los principios de un buen diseño experimental y determine si se cumplen en el problema.

Problema 2. En un estudio sobre la influencia de la salinidad del suelo sobre la productividad de la papa variedad Spunta, se definieron 40 parcelas. A cada parcela se la regó con agua a distintas salinidades (desde 0 hasta 50 o/oo) y se registró la cosecha (en gramos/m2). El objetivo del estudio fue establecer cómo (si es que lo hace) la salinidad del suelo afecta la producción de papa.

Coeficientes de regresión y estadísticos asociados Coef Est. EE LI(95%) LS(95%) T p-valor const 2068,1 464,06 1127,85 3008,39 4,46 0,0001 Salinidad -38,3 15,43 -69,53 -7,02 -2,48 0,0178 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor

Explicada 727153 Error Total 1097953

1- Identifique la unidad experimental, la variable respuesta y la explicatoria. Escriba el modelo y la

ecuación de la recta estimada interpretando todos los términos en el contexto del problema. 2- Calcule e interprete el R2 en términos del problema. 3- Valide el modelo con un nivel de significación del 5%. Plantee las hipótesis en parámetros y en el

contexto del problema. Concluya. ¿Qué características del suelo favorecen la producción de papa? 4- Estime la producción que esperaría observar en promedio en parcelas con una salinidad de 30 y del

80º/oo. 5- Se cree que además de la salinidad, la producción de papa puede estar afectada por el contenido de

agua y el contenido de materia orgánica. Escriba el modelo. ¿Qué esperaría que ocurra con el R2 y el R2 ajustado de este modelo con respecto al modelo inicial?

Page 27: Estadística Aplicada · 2017-05-01 · gráficas de control X-R y determinar si el proceso está bajo control o si existen causas especiales. Si corresponde, calcule Cp y Cpk sabiendo

27

Presentación de informes de las guías de Trabajos Prácticos Los alumnos deberán confeccionar, a pedido del docente, informes grupales de determinados problemas de la guía de trabajos prácticos. A continuación se describen las partes constitutivas de dichos informes. Encabezado: UNIVERSIDAD CATÓLICA ARGENTINA Facultad de Ciencias Agrarias, Ingeniería en Producción Agropecuaria Métodos de Investigación Grupo N° X Integrantes:

TP N°X. Problema X Introducción y objetivos: Breve comentario introductorio y objetivos del ensayo Diseño experimental: identificar: unidad experimental, variable dependiente o respuesta con sus unidades, variable independiente o explicatorio o factor con sus niveles, cantidad de réplicas, tamaño total de la muestra, diseño y modelo en términos del problema

Estadística descriptiva: incluir una tabla con las medias, los desvíos y el número de observaciones de la variable

Supuestos del modelo: se deberá indicar qué supuestos se probaron, qué método se utilizó y qué se concluye. En caso de aplicarse transformaciones, especificar cuál se utilizó y volver a probar los supuestos.

Anova y comparaciones: Indicar hipótesis puestas a prueba. Incluir la tabla de Anova y de comparaciones.

Informe técnico: comentar globalmente los resultados del estudio, haciendo referencia a la población sobre la cual se aplican dichas conclusiones. Indicar la magnitud del efecto, en valores absolutos y porcentuales. Acompañar con un gráfico de barras o una tabla. Los gráficos deberán estar convenientemente rotulados, es decir deberán contar con un título, nombres en los ejes, referencias, unidades, etc. Incorporar las letras de significación que resultan del análisis estadístico.