resumen doe

25
1. Comentarios y Definiciones Experimento: serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida. Aplicación: diseño de nuevos productos, procesos y mejoramiento de procesos. La ventaja principal de los métodos estadísticos es que agregan objetividad al proceso de toma de decisiones. La ingeniería esta por todos lados y no es difícil, lo difícil es ver que tan fácil son las cosas. Con el diseño de experimentos se introducen cambios en los niveles de las variables (2^k) suficientemente pequeños para que no ocurran perturbaciones serias en el rendimiento, la calidad o la cantidad pero lo suficientemente grandes para descubrir las mejoras potenciales en el desempeño del proceso. (Realizarlo por periodos) Con frecuencia se usan experimentos diseñados estadísticamente para investigar las fuentes de variabilidad que afectan un sistema. (Ej: instrumento de medición 12.2) La “escalación” de una planta piloto al proceso de producción a gran escala da por lo general como resultado la distorsión de las condiciones optimas. Si la planta alcanza el optimo, con el tiempo se desvía de ese punto debido a las variaciones en las materias primas, los cambios ambientales, personal etc.

Upload: chesterxco123

Post on 02-Jan-2016

23 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Resumen DOE

1. Comentarios y Definiciones

Experimento: serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida.

Aplicación: diseño de nuevos productos, procesos y mejoramiento de procesos.

La ventaja principal de los métodos estadísticos es que agregan objetividad al proceso de toma de decisiones.

La ingeniería esta por todos lados y no es difícil, lo difícil es ver que tan fácil son las cosas.

Con el diseño de experimentos se introducen cambios en los niveles de las variables (2^k) suficientemente pequeños para que no ocurran perturbaciones serias en el rendimiento, la calidad o la cantidad pero lo suficientemente grandes para descubrir las mejoras potenciales en el desempeño del proceso. (Realizarlo por periodos)

Con frecuencia se usan experimentos diseñados estadísticamente para investigar las fuentes de variabilidad que afectan un sistema. (Ej: instrumento de medición 12.2)

La “escalación” de una planta piloto al proceso de producción a gran escala da por lo general como resultado la distorsión de las condiciones optimas.

Si la planta alcanza el optimo, con el tiempo se desvía de ese punto debido a las variaciones en las materias primas, los cambios ambientales, personal etc.

Es normal la resistencia al cambio por sentirnos cómodos en cierto punto pero debemos tener en cuenta que podemos estar mejor.

Detrás de cada inferencia estadística siempre hay una incertidumbre.

Diseño Robusto:

-Diseño de sistemas (productos o procesos) que no sean sensibles a factores externos (ambientales, variabilidad de los componentes del sistema) que puedan afectar su desempeño.

-Diseño de procesos para que el producto final este tan cerca como sea posible de las especificaciones nominales, aun cuando no sea posible controlar con toda precisión algunas variables (ej: temperatura) o las características de las materias primas.

Page 2: Resumen DOE

-Determinar las condiciones de operación que optimizan las condiciones del proceso, reducen costos y aumentan su confiabilidad y competitividad.

La clave de un diseño robusto es ajustar los factores controlables que minimicen la variabilidad transmitida por los factores de ruido.

Proceso robusto (objetivo): proceso que sea afectado en forma mínima por fuentes de variabilidad externa.

Producto robusto: selección de los parámetros de diseño para que el producto tenga un buen funcionamiento en una amplia variedad de condiciones.

Page 3: Resumen DOE

2. Pautas Generales para diseñar experimentos

-La fase de planeación es crítica para lograr el éxito de los objetivos.

-Saber que va a estudiarse.

-Qué tipo de diseño de experimento va a realizarse.

-Como van a colectarse los datos.

-Como se analizaran los datos.

1. Identificación del problema: enunciar específicamente el problema (con la que todos estén de acuerdo) [es conveniente hacer inicialmente una lista de problemas o preguntas] y establecer un objetivo global y específicos con un equipo de todas las áreas (ingeniería, control de calidad, manufactura, mercadotecnia, administración, clientes). Frecuentemente es necesario un enfoque secuencial con una serie de experimentos para responder las cuestiones clave.

Identificar: Sistema nuevo => caracterización o tamizado de los factores.

Sistema maduro => optimización, confirmación, descubrimiento y estabilidad

Confirmación: el sistema se comporta de la misma manera ahora que antes.Descubrimiento: que ocurre con nuevas condiciones de operación, materiales o variables. Estabilidad: bajo qué condiciones las variables de respuesta sufren una degradación seria.

2. Elección de los factores, los niveles y los rangos:

-Saber cómo van a controlarse y medirse los factores en los valores deseados.

Factores del diseño (por estudiar), factores que se mantienen constantes (mediante equipos ), factores que se les permite variar (pequeños compensados por aleatorización) y

Page 4: Resumen DOE

factores perturbadores controlables (bloques), no controlables (covarianza, ej: humedad) y de ruido.

-El rango seleccionado deberá ser relativamente grande (especialmente en tamizado y en las etapas iniciales que no se conocen los niveles con mejores resultados).

3. Selección de la variable de respuesta: debe proporcionar información útil acerca del proceso bajo estudio. La mayoría de las veces será el promedio o la desviación estándar (o ambos). Es importante la eficiencia de los instrumentos de medición (en caso de que los instrumentos de medición es pobre se deben medir varias veces la unidad experimental y usar el promedio)

4. Elección del diseño experimental: considerar la cantidad de replicas, selección del orden de corridas (aleatorización), formación de bloques.

5. Realización del experimento: se debe monitorear con atención el proceso para asegurarse que se está realizando conforme a la planeación. Se recomienda llevar a cabo corridas de prueba (para evaluar los equipos, sistema de medición, idea del error experimental, tiempo necesario, costos).

6. Análisis estadístico de los datos: aplicar los métodos estadísticos para obtener conclusiones objetivas. Los procedimientos de prueba de hipótesis e intervalos de confianza son muy útiles en el análisis de datos.

7. Conclusiones y recomendaciones: las graficas son útiles y es recomendable realizar corridas de confirmación y seguimiento.

Este es un proceso de aprendizaje ya que nadie sabe cuáles son los factores, niveles o rangos ideales a escoger. Se formulan nuevas hipótesis conforme se obtienen nuevos resultados. Tener presente que el proceso es gradual e iterativo y es recomendable no diseñar un experimento extenso al principio del estudio sino mejor aprender sobre la marcha con experimentos secuenciales.

Indagar en la teoría o experiencia práctica es fundamental para la planeación del experimento (factores, niveles, rangos, replicas, interpretar resultados).

Los métodos de diseño y análisis más simples son los más adecuados.

Se debe tener en cuenta que la significación estadística no siempre es práctica debido a restricciones como el costo.

Page 5: Resumen DOE

3. Verificación de supuestos

Normalidad

-Una gran causa de la falta de normalidad es el truncamiento de decimales.

-Si no se consideran algunos efectos principales o interacciones cambia la normalidad.

Statgraphics;

Metodo1: snapstats => análisis de una muestra => residuos => shapiro>0,05=> cumple

Método 2:describir=> ajuste de distribuciones=> ajuste de datos no censurados=> residuos=> shapiro>0,05=> cumple

Transformación de los datos: modelo de regresión multiple(con todos los factores, los no significativos también se incluyen solo para la transformación)=> opciones de análisis=> transformación de box cox=> optimizar

Homocedasticidad

Se debe cumplir Homocedasticidad en todos los factores (los no significativos también)

Statgraphics: anova simple=> dependiente residuos, independiente un factor a la vez=> tabla=> verificación de varianza=> levenes>0,05=> cumple

Independencia

El orden en cómo se corre el experimento influye en la independencia por lo tanto se debe aleatorizar antes de correr el programa.

Statgraphics:

Metodo 1: describir=> series de tiempo=> métodos descriptivos=> residuos=> tabla=> prueba de aleatoriedad.

Metodo 2: Snapstats=> Autocorrelacion<1/(n^0,5)=> cumple

Aleatorizar: clic derecho en los factores=> ordenar archivo =>aleatorizar

Page 6: Resumen DOE

4. Prueba de hipótesis

Hipótesis nula: Ho: media=valor

Hipotesis alternativa H1: media≠valor

-Compara el estadístico de prueba calculado contra su valor crítico.

-Ver los estadísticos de prueba en la tabla de comparación de medias y varianzas.

- La comparación de medias (LSD) no considera la interacción de factores, por lo tanto la grafica de las interacciones puede contradecir los resultados si se varian ambos factores (considera fijos los demas factores)

-Tener en cuenta si la campana de gauss es con respecto a una cola o de dos colas.

Replicas

-Si el experimentador tiene interés en detectar efectos pequeños, se necesitan más replicas.

-Entre mas variabilidad tenga el sistema deberán hacerse más replicas.

-Entre menos variabilidad tenga el sistema más pequeño puede ser el rango de los niveles.

-Es adecuado un intervalo de confianza del 95%

σ (varianza) = MSe (cuadrado medio del error)

Page 7: Resumen DOE

5. ANOVA

Los efectos que se saquen se envía al error (aumenta la varianza).

La opción optimizar de statgraphics solo cuando exista curvatura.

En caso de que solo falte un dato, se corre el anova normal sin ese dato (no se forman bloques).

Formación de Bloques (días, operarios, maquinaria, lotes de materia prima)

Procedimiento: Cada bloque contiene a todos los tratamientos. No se deben alinear los niveles de los bloques con los niveles del factor problema, por ejemplo no meter en un horno todas las de 500 C en el mismo horno, sino distribuidas.

Debe intentarse tener una unidad experimental más homogénea (Ej: la misma probeta para medir dureza).

La formación de bloques se realiza debido a las restricciones técnicas que se encuentran en cada experimento (diferente: tiempo, operarios, maquinaria, lotes de materia prima).

Si no se llevan a cabo, (no se elimina su efecto) aumentan el error experimental y camuflan la diferencia entre las medias de los tratamientos. Los resultados finales varían debido a que el efecto que no se elimina afecta los datos obtenidos.

Puede examinarse también (como indicio) el cociente MSbloque/MSerror; si el cociente es grande (mayor que 2 o 3) valió la pena la formación de bloques.

Aleatorización dentro de los bloques y de los bloques mismos para ver cual se lleva acabo de primero.

Si no alcanza todo el día para realizar todo el experimento, debe realizarse la misma cantidad de bloques diarios.

1 FACTOR

Diseño cuadrado latino: El mismo principio de formación de bloques pero en 2 direcciones. (2 factores problema)

Diseño Cuadrado grecolatino: 3 factores problema

Page 8: Resumen DOE

Kruskal wallis: (solo para casos de 1 factor) se realiza cuando no se cumple normalidad.

6. Diseño Factorial 2^k

Es un caso especial del diseño factorial, con k factores y 2 niveles en cada factor (1 replica=2^k observaciones)

Es recomendable para determinar los factores significativos. Entrega una respuesta lineal (debido a q solo hay dos puntos [niveles] evaluados de cada factor)

Cuando no hay replicas no hay grados de libertad para el error si se consideran todas las interacciones. Se utiliza el grafico de probabilidad normal de los efectos (se sacan los efectos sobre la recta normal) para despreciar alguna de las interacciones de más alto orden.

Procedimiento (1, 2, 6 no son necesarios, importante: 3 4 y 5):

1. Determinar los efectos e interacciones y evaluar sus s signos y magnitudes

2. Determinar los efectos que se consideraran y escribir la tabla A,B,C para (orden eestruc)a b ab c ac bc abc

3. Analisis de varianza con la tabla ANOVA

4. Eliminar las variables no significativas del modelo (grafico de probabilidad normal para los efectos)

5. Probar Normalidad, Independencia y Homocedasticidad (estructuración del modelo si no cumple los supuestos)

6. Análisis grafico con graficas de los efectos principales, interacciones, superficies de respuesta y grafica de contornos.

Page 9: Resumen DOE

Punto central

Los k factores deben ser cuantitativos para agregar puntos centrales (con 2 o mas factores cualitativos se descarta punto central)

Consiste en una prueba de hipótesis que determina si hay curvatura de segundo orden en la respuesta en la región de exploración. Compara yf_bar y yc_bar y determina si hay una diferencia significativa.

El diseño factorial 2^k es análogo a desbaste y punto central acabado.

Si por lo menos hay un par de variables con curvatura el punto central será significativo (menor que 0,05).

Usualmente se toman de 3 a 7 puntos centrales. Ver sugerencias en la aplicación de puntos centrales (archivo Excel multifactorial).

Statgraphics: clic derecho en la tabla de análisis de varianza, opciones de ventana, incluir prueba de falta de ajuste

Page 10: Resumen DOE

7. Confusión del diseño factorial 2^k

Técnica mediante la cual un experimento factorial 2^k se distribuye en bloques debido a que no pueda realizarse la totalidad del experimento y se confunde (suma de sus efectos) una interacción (la de mas alto orden) con los bloques.

Para confundir una interacción con los bloques, los signos positivos de sus coeficientes en un bloque y los negativos en otro.

Se deben confundir una interacción por cada 2 bloques y quedaran confudidos 2^p-1 interacciones mas por su multiplicación. (Ver figura).

Puede realizarse confusión parcial, confundiendo una interacción en cada replica.Es recomendado realizar confusion parcial (en vez de confusion de una sola interaccion) siempre que se cuente con recursos suficientes para hacer replicas.

Las conclusiones estadísticas solo para las replicas que no estén confundidas.

Al seleccionar los efectos que van a confundirse con los bloques, debe tenerse cuidado que no se confundan los efectos de interes (Ej: ABCDE y ABD confunde automáticamente CE que puede ser de interés; mejor ADE y BCE => ABCD)

Statgraphics: DDE

Page 11: Resumen DOE

8. DISEÑOS FACTORIALES FRACIONADOS 2^k

Es recomendable aplicar esta tecnica en etapas preliminares considerando numerosos factores (solo ejecuta algunas corridas con muchos factores y después analizar que hacer)

Técnica utilizada debido a que los experimentos 2^k con numerosos factores superan fácilmente los recursos para realizar replicas. Gran aplicación para determinar factores con grandes efectos

Fraccion un medio del diseño 2^(k-1) es realizar solo la mitad de las corridas (Ej: 2^3-1; solo 4 corridadas en un diseño 2^3)

Las corridas de un diseño fraccionado se seleccionan con el mismo signo de los coeficientes del generador (Generador con 3 factores: ABC). Fraccion principal I=+ABC, fraccion alterna I=-ABC

Cuando se estima A B y C en un diseño fraccionado de hecho se estimando A+AB, B+AC,C+AB, suma a la cual se le llama alias

Si se corren las dos fracciones un medio se analiza como un diseño completo en dos bloques con la interacción más alta confundida

Resolucion 3: ABC; Resolucion 4: ABCD; Resolucion 5; ABCDE; resolucion=numero de letrras

Resolucion recomendada de 4 en adelante debido a que la resolucion 3 los efectos de 2do orden son alias de los efectos principales

Si A C y D son significativos entonces lo mas probable es que de los alias AC+AD y AD+BC, AC y AD son probablemente las mas significativas => [Navaja de Ockham: cuando se confrontan varias interpretaciones de un fenomeno, la interpretacion mas simple suele ser la correcta] o también puede ser deducida por el conocimiento del proceso.

Tratar de escoger los generadores para que el diseño tenga la resolucion mas alta pero estar atentos de no escoger generadores con efectos importantes y sean alias entre si.

Dis. Factorial fraccionado 2^(k-p) : p generadores, relacion de definicion: p y 2^p-p-1 interacciones generalizadas; cada efecto tiene 2^p -1 alias

Diseño de aberración mínima: la resolucion maxima posible (resolucion 5 si es posible)

Page 12: Resumen DOE

Statgraphics: DDE

9. Modelos de Regresión

Procedimiento: las variables deben estar en variables codificadas. Se selecciona la variable dependiente (respuesta) y los factores significativos. Se verifica los supuestos (ver abajo).

Herramienta de predicción, control y optimización.

Para desarrollar el modelo de regresión, las variables deben estar siempre en variables codificadas (asi pueden modelarse fácilmente las variables cualitativas)

El interés se centra en modelar y explorar variables relacionadas y significativas con respecto a la variable de respuesta. (primero análisis de covarianza y anova)

Solo se ingresan las variables predictoras (x) con base en un análisis de covarianza.

Se utilizan con frecuencia para analizar datos de experimentos no planeados, como podría ser el caso de la observación de fenómenos no controlados, de registros históricos o en experimentos diseñados cuando algo salió mal.

El modelo se ajusta linealmente hasta que se encuentre curvatura (punto central), cerca de esta zona de curvatura está el optimo y se desarrolla un modelo cuadrático para observar donde está el optimo en esa zona.

Aumentar demasiado el orden exponencial de las variables predictoras solo sobre ajusta el modelo (no tienene en cuenta la variabilidad del modelo) y por lo tanto no tiene la capacidad de generalizar para todos los datos.

La componente con el parámetro beta más grande domina la respuesta de y (mas significativo, revisar su signo), esta será la variable escogida para determinar el paso de la ruta de ascenso más pronunciado.

Ejemplo 1, modelo de regresión lineal multiple

Y=b0+b1 x1+b2 x2+e

Relación entre: la viscosidad de un polímero y con la temperatura x1 y la velocidad de alimentación x2.

X: llamada variables predictoras, regresoras o de regresión.

B1, b2: coeficientes de regresión parical

Page 13: Resumen DOE

Los modelos de regresión con apariencia mas compleja que la lineal (cuadrática, logarítmica o con interacción de factores) puede analizarse como una regresión lineal múltiple.

Ej:

Y=b0+b1 x1+b2 x2+b12 x1 x2+e = b0+b1 x1+b2 x2+b3 x3+e

Y=b0+b1 x1+b2 x2+b11 x1^2 +e = b0+b1 x1+b2 x2+b3 x3+e

Ajuste del modelo: métodos para estimar los parámetros del modelo (b1,b2, ect)

Debe ajustarse el polinomio de orden menor que describa adecuadamente el proceso. (de orden mayor solo aumenta su complejidad sin mejorar significativamente el ajuste y demeritan su utilidad como predictor)

Verificación del modelo

1. La grafica de residuos contra x (factores e interacciones) no debe tener una tendencia (concentración en cierto punto no es una tendencia) (residuos no estudentizados)

2. Todos los parámetros deben ser significativos (menor que 0,05).3. El R2 ajustado no debe ser igual a 1 (no tiene en cuenta la variabilidad del proceso)

y tampoco debe ser tan pequeño (no se tuvieron en cuenta ciertos factores).

Statgraphics

Modelo de regresión: Relacionar - varios factores – regresión

Para realizar modelos cuadráticos (o de mayor orden) en la ventana que se seleccionan, se deben elevar al cuadrado.

En la ruta de máximo ascenso de statgraphics, el solo nos indica cómo mover los factores principales (no hay un botón para la mover la interacción, pero la tienen en cuenta si se introduce en el modelo de regresión).

Page 14: Resumen DOE

Superficie de Respuesta

Procedimiento: realizamos 2^k con puntos centrales (modelo lineal) y ruta de máximo ascenso hasta que encontremos curvatura (región de experimentación con el óptimo). En esta región (no nos movemos de esta) realizamos superficie de respuesta con puntos axiales (diseño central compuesto) y determinamos el optimo.

Determina las condiciones de operación óptimas del sistema o que se satisfagan los requerimientos de operación.

Depende del modelo de regresión planteado si se genera una acertada superficie de respuesta.

Inicialmente por lo general nos encontramos lejos del punto óptimo por lo tanto empezamos con un modelo de primer orden. Cuando nos encontraos cerca del optimo (cuando hay curvatura) se requiere un modelo que incorpore curvatura para aproximar la respuesta (de segundo orden).

Page 15: Resumen DOE

La trayectoria de ascenso más pronunciado es la derivada del modelo de regresión con respecto a cada una de las variables predictoras.

Para realizar optimización multivariada:

-Se le da peso en importancia a las variables y se verifica que las más importantes se puedan optimizar en cierta dirección.

-Se realiza una optimización restringida donde se optimiza lo máximo posible la(s) variable de interés hasta que alguna de las demás variables de respuesta llega a un límite de un rango establecido (restricción del proceso).

-Establecer rangos donde las variables de respuesta se consideren en condición deseable individual. Convertirlas en un rango de 0 a 1, con 1 mejor y 0 peor (pág. 452) y después determinar el arreglo con la condición de deseable global mas alta.

-Se superponen las graficas de contorno de las superficies de respuesta (máximo 3 variables de respuesta).

Para caracterizar (saber si es máximo, mínimo o punto silla) de un punto estacionario se utiliza el análisis canónico (ej: pág. 441) cuando intervienen muchas variables del proceso x. (o estudiar la sensibilidad relativa de la respuesta, cuando hay menos que 4 => grafica de contornos)

Pasos para seleccionar el ascenso más pronunciado (Ejemplo Pág. 436)

Tipo de diseño Para ajustar modelos: De primer orden utilizar un 2^k con puntos centrales. De segundo orden utilizar un DCC diseño central compuesto. Si se utiliza un

Page 16: Resumen DOE

diseño fraccionado preferiblemente los efectos principales no deben ser alias entre sí. (Pág. 455) (Existen también tipos de diseños irregulares

Formación de bloques: para superficies de respuesta de primer orden con diseños 2k o fraccionados, se utiliza las mismas técnicas (capt. 7) y para los de segundo orden, los bloques deben cumplir la condición de ortogonalidad ver en la pág. 464.

Operación Evolutiva: si un proceso fue previamente optimizado y se requiere saber si se necesita realizar nuevamente una optimización se utiliza la hoja de cálculo EVOP (pág. 486).

Statgraphics

DDE, Superficie de respuesta

Tablas, ruta de máximo ascenso

Experimentos con mezclas

cada factor se compone o ingredientes (x1, x2, x3) de una mezcla (de 0 a 1) y por lo tanto los niveles de los factores son dependientes de los niveles de otros factores.

Page 17: Resumen DOE

Diseño simplex: se usa para estudiar los efectos de los componentes de una mezcla sobre la variable de respuesta en un experimento con mezclas. (se encuentre el punto optimo para una mezcla de componentes determinada)

Se recomienda realizar los diseños simplex reticular aumentado con puntos axiales (explora el centro del triangulo).

Factores con efectos aleatorios

Utilizado cuando existe un gran número de niveles.

Factores con efectos fijos: los niveles de los factores usados por el experimentador son los de interés específico y la inferencia estadística es solo sobre ellos.

Factores con efectos aleatorios: los niveles se eligen al azar de una población más grande de niveles posibles y se desea inferir conclusiones sobre esa población completa de niveles.

La poblaciones de niveles del factor se considera infinita o lo suficientemente grande para considerarla infinita.

Modelo con efectos aleatorios

La prueba de hipótesis de los efectos ahora es sobre los componentes de la varianza de los tratamientos (no sobre los efectos de los tratamientos). La idea no saber la diferencia entre tratamientos, ahora la idea es conocer que tanto cambia la varianza

Page 18: Resumen DOE

Sus niveles se seleccionan al azar (Ej: de los 40 tornos y 30 operadores se seleccionan unos cuantos para hacer una inferencia sobre todos)

Tao se convierte en una variable aleatoria. Cambia como calculamos el fo observado, y los grados de libertad, pag 531

Se desea estimar tanto la prueba de hipótesis como los componentes de la varianza.

En caso de obtener una varianza negativa, se considera insignificante.

En interacciones con por lo menos un factor aleatorio, la interacción se considera aleatoria.

Ejemplos

Para investigar las fuentes de variabilidad de un sistema como el de un sistema de medición. Ej: medición de una pieza (efectos aleatorios: operadores y piezas)

Statgraphics

Page 19: Resumen DOE

Factores aleatorios: Comparar, análisis de varianza, modelos lineales generalizados.

Se deben seleccionar los factores aleatorios y las interacciones por evaluar.

Análisis Covarianza

Se utiliza principalmente para introducir las variables correctas al modelo de regresión si no se cuenta con el ANOVA. (no introducir variables correlacionadas)

Así como la prueba t pareada y formación de bloques, el análisis de covarianza puede utilizarse para eliminar el efecto de los factores perturbadores controlables y mejora la precisión del experimento.

El análisis de covarianza puede utilizarse para ajustar la variable de respuesta con el efecto de la variable no controlada x (pero observable) y eliminar su cuadrado medio del error.

Es una combinación del análisis de varianza y de regresión.