unidad 4 disenho de experimentos
TRANSCRIPT
-
Unidad 4: Diseno de Experimentos
Correlacion y Diseno de ExperimentosUnidad 4: Diseno de Experimentos
Yovaninna Alarcon [email protected]
Primer Semestre - 2014
Correlacion y Diseno de ExperimentosUniversidad San Sebastian
-
Unidad 4: Diseno de Experimentos
Indice
1 Nociones Basicas del Diseno de Experimentos
2 Disenos Completamente Aleatorizados: DCA
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Control de un fenomeno mediante su relacion con otrasvariables
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Donde usar un Diseno de Experimentos?
En el rendimiento de un determinado tipo de maquina (uni-dades producidas por da): se desea estudiar la influencia deltrabajador que la maneja y la marca de la maquina.
Se quiere estudiar la influencia de un tipo de pila electrica y dela marca, en la duracion de las pilas.
Una compana telefonica esta interesada en conocer la influen-cia de varios factores en la variable duracion de una llamadatelefonica (hora, da, zona, genero, tipo de telefono).
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Cual es su objetivo?
Objetivo
El objetivo del diseno de experimentos es estudiar si cuando se utilizaun determinado tratamiento se produce una mejora en el proceso ono. Para ello se debe experimentar aplicando el tratamiento y noaplicandolo.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Elementos del Diseno de Experimentos
Variable respuesta
Es la variable asociada al fenomeno que nos interesa estudiar.
Variables experimentales o factores
Conjunto de variables que influyen en la respuesta y que se fijan aciertos niveles antes del experimento.
Unidades experimentales
Individuos que intervienen en el experimento y que son observadosa un nivel determinado de cada uno de los factores.
Tamano del experimento
Numero total de unidades experimentales en el experimento
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Elementos del Diseno de Experimentos
Factores y sus niveles
Se denomina factor tratamiento a cualquier variable de interes parael experimentador cuyo posible efecto sobre la respuesta se quiereestudiar. Los niveles de un factor tratamiento son los tipos o gradosespecficos del factor que se tendran en cuenta en la realizaciondel experimento. Los factores tratamiento pueden ser cualitativos ocuantitivativos. Ejemplo:
Proveedor (diferentes proveedores de una materia prima)
Tipo de maquina (diferentes tipos o marcas de maquina).
El genero (mujer y hombre)
Temperatura (conjuntos de temperaturas seleccionadas en unosrangos de interes).
Por lo general, un factor no tiene mas de 4 niveles.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Elementos del Diseno de Experimentos
Unidad Experimental
Son el material donde evaluar la variable respuesta y al que se leaplican los distintos niveles de los factores tratamiento. Por ejemplo:
En informatica, computadores, paginas web, buscadores de in-ternet.
En agricultura, parcelas de tierra.
En medicina, individuos humanos o animales.
En industria, lotes de material, trabajadores, maquinas.
Ojo: Constituyen una sola replica.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Elementos del Diseno de Experimentos
Error Experimental
Variacion que presentan las unidades experimentales a las que se lehan aplicado el mismo tratamiento y en forma independiente.
Unidad Muestral
Unidad en la que se hacen las mediciones. Muchas veces coincidecon la unidad experimental, pero en otras no. Cuando se experimen-ta un metodo docente en distintas aulas de un colegio la unidadexperimental es el aula, mientras que la unidad observacional es elalumno. Lleva asociado un error muestral.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Elementos del Diseno de Experimentos
Replicas
Permiten un estimador independiente del error experimental ypermiten que el experimento tenga mas poder para detectardiferencias entre tratamientos.
Este error es basado en la desviacion estandar entre repeticionesy permite probar, desde el punto de vista estadstico formal, unahipotesis de igualdad o diferencia de medias de poblaciones.
Usualmente es mas barato repetir el experimento que tener mastratamientos.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Tipos de estudio
Podemos tener estudios experimentales y observacionales.
En los experimentos las variables independientes de interes soncontroladas por el investigador.
En los estudios observacionales las variables independientes noson controladas por el investigador, en estos casos los sujetoso unidades se autoseleccionan en grupos.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Aleatorizacion
Colocar al azar los tratamientos a las unidades experimentales:
Previene sesgos sistematicos debido a cambios no controlablesen las condiciones experimentales.
Minimiza la posibilidad que cambios sistematicos en condicionesambientales correspondan a patrones de respuesta del procesobajo estudio.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Diseno Equilibrado
Definicion
El diseno se dice que es equilibrado o balanceado cuando, para cadanivel del factor, se mide la variable respuesta en el mismo numerode individuos.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Etapas
Definir los objetivos del experimento. Identificar todas las po-sibles fuentes de variacion, incluyendo:
Factores tratamiento y sus niveles,Unidades experimentales,
Elegir una regla de asignacion de las unidades experimentalesa las condiciones de estudio (tratamientos).
Especificar las medidas con que se trabajara (la respuesta), elprocedimiento experimental y anticiparse a las posibles dificul-tades.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Etapas
Ejecutar un modelo piloto.
Especificar el modelo.
Esquematizar los pasos del analisis.
Determinar el tamano muestral.
Revisar las condiciones anteriores. Modificarlas si es necesario.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Modelos de Diseno de Experimentos
Modelo de efectos fijos (Asociado al Diseno Experimental)
Modelo de efectos aleatorios (Asociado al Diseno Observacio-nal)
Modelos mixtos
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Factor fijo o aleatorio?
Modelo de Efectos Fijos
Los t tratamientos o niveles pudieron ser elegidos expresamente porel experimentador:
Quieren probarse hipotesis acerca de las medias de los trata-mientos
Las conclusiones se aplicaran unicamente a los niveles del factorconsiderados en el analisis.
Las conclusiones no pueden extenderse a tratamientos similaresque no fueron considerados explcitamente.
Tambien podria tratar de estimarse los parametros del modelo(, i , varianza).
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Factor fijo o aleatorio?
Modelo de Efectos Aleatorios
Los t tratamientos podrian ser una muestra aleatoria de unapoblacion mas grande de tratamientos.
Sera deseable poder extender las conclusiones (se basan en lamuestra de los tratamientos) a la totalidad de los tratamientosde la poblacion.
Las i son variables aleatorias.
Lo que se obtiene sobre las i particulares que se investigarones relativamente inutil.
Se suelen probar hipotesis sobre la variabilidad de las i y seintenta estimar su variabilidad. A este modelo tambien se lellama modelo de los componentes de la varianza.
Este modelo no lo estudiaremos en este curso.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Ejemplo: Como distinguir?
Supongamos se esta estudiando si los profesores hombres o mujeresobtienen calificaciones mas altas, entonces el sexo sera un efecto fijo(porque siempre encuestaras a hombres y mujeres); pero el profesorpodra ser un efecto aleatorio porque si haces nuevamente el estudiopodras encuestar a profesores diferentes. Estos profesores son unamuestra aleatoria de todos los profesores y tu no estas interesado enestos profesores en particular. Por otro lado, si estuvieras estudiandoque profesores en tu universidad eran los lectores mas claros, enton-ces los profesores seran el efecto fijo, porque si hicieras nuevamenteel estudio, volveras a encuestar a los mismos profesores. Estos noson una muestra aleatoria, y tu estas interesado en estos profesoresen particular.
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Ejemplo: 16 plantas de pino, 4 contaminantes
Cuantos tratamientos hay?
Cuantas unidades experimentales?
Cuantas replicas hay?
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Ejemplo: 16 plantas de pino, 4 contaminantes
Cuantos tratamientos hay?
Cuantas unidades experimentales?
Cuantas replicas hay?
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Ejemplo: 16 plantas de pino, 4 contaminantes
Cuantos tratamientos hay?
Cuantas unidades experimentales?
Cuantas replicas hay?
-
Unidad 4: Diseno de Experimentos
Nociones Basicas del Diseno de Experimentos
Ejemplo: 16 plantas de pino, 4 contaminantes
Cuantos tratamientos hay?
Cuantas unidades experimentales?
Cuantas replicas hay?
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
DCA
El modelo estadstico para estudios comparativos supone que hayuna poblacion de referencia de u.e. En muchos casos la poblaciones conceptual.Cada unidad de la poblacion tiene un valor de la variable de respues-ta, y , la cual tiene media y varianza 2.Se supone una poblacion de referencia para cada tratamiento con-siderado en el estudio, y las variables en el experimento se suponenseleccionadas aleatoriamente de dicha poblacion de referencia, comoresultado de la aleatorizacion.Nota: Para estudios observacionales, suponemos que las unidadesobservadas se seleccionaron aleatoriamente de cada una de las po-blaciones.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Disenos con una fuente de variacion
O disenos de un factor, una va o one way.
Este modelo de diseno tiene un unico factor con t niveles (otratamientos). Las unidades experimentales se asignan al azara los tratamientos.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Disenos con una fuente de variacion
Nuestro interes es contrastar la igualdad de las medias de los tniveles de un factor, esto es, estudiar la influencia de un factorcon t niveles en la variable de interes.
Observar que al igual que en regresion la estimacion de parame-tros no se necesita de supuestos distribucionales y se realiza pormedio de mnimos cuadrados cuadrados.
Los supuestos distribucionales son necesarios a la hora de de-terminar si el modelo, o mejor dicho, los parametros estimadosson o no significativos.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Disenos con una fuente de variacion
Modelo
Modelo de medias de celda: Yij = i + ij , con i = 1, 2, . . . , t,j = 1, 2, . . . , ri
Modelo de efectos del factor: Yij = + i + ij , coni = 1, 2, . . . , t, j = 1, 2, . . . , ri . Este ultimo modelo asume quei = + i , con i = 1, . . . , r , donde es una constantecomun.
rii = 0
Los errores son variables aleatorias independientes identicamente dis-tribuidos, con distribucion normal N(0, 2). Esto es los niveles delos factores son fijos, la varianza de la respuesta es constante y lasobservaciones Yij son independientes.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Disenos con una fuente de variacion
Como en el caso de los modelos de regresion lineal, los modelos dediseno experimental, pertenecen a la familia de modelos lineales, losque tienen, por tanto, la misma forma basica que aquellos; es decir,podemos representar el modelo,
Yij = + i + ij con i = 1, . . . , t j = 1, . . . , r
Por su forma matricial equivalente:
Y = X +
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Tabla de ANOVA
F de V gl SC CM F valor-p
Tratamientos t 1 SCTrat CMTrat CMTratCMEError Exp. N t SCError CME
Total N 1 SCTotal
E (CME ) = 2
E (CMTrat) = 2 + 2i , donde 2i =
ti=1 ri
2i
t1
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Tabla de ANOVA
Descomposicion de la varianza
SCTrat =t
i=1
ri (yi . y..)2
SCError =t
i=1
rij=1
(yij yi .)2
SCTotal =t
i=1
rii=1
(yij y..)2
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Tabla de ANOVA
Yij =rendimiento de la j-esima unidad para el i-esimo trata-miento.
Yi . =
j Yij = total de los rendimientos para el i-esimo trata-miento.
Y.. =
i Yi =
i
j Yij = gran total de todos los rendimien-
tos.
Yi . =Yi.r
Y.. =Y..rt
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Tabla de ANOVA
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Tabla de ANOVA
Prueba de Hipotesis asociada al estadstico F
En un modelo de medias de celda:
H0 : 1 = 2 = . . . = r
H1 : no todas las medias i son iguales.
Prueba de Hipotesis asociada al estadstico F
En un modelo de efectos del factor:
H0 : i = 0,i = 0, . . . , rH1 : algun efecto i es distinto de cero.
Las hipotesis de los dos modelos son equivalentes, luego el test F esvalido bajo ambas formulaciones del problema.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Tabla de ANOVA
Si el test F resulta significativo (se rechaza H0, por tanto, el fac-tor es influyente) se debera estudiar entre que tratamientos existendiferencias significativas.Una medida relativa de la variabilidad explicada por el factor es elcoeficiente de determinacion, definido como:
R2 =SCTrat
SCTotal
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Ventajas y Desventajas
Ventajas
Flexibilidad, cualquier numero de tratamientos y replicas pue-den ser utilizados. Mas aun, el numero de replicas en cada tra-tamiento no necesariamente es el mismo, aunque las compara-ciones son mas precisas cuando los tratamientos son igualmentereplicados.
El analisis estadstico es simple aun con replicas desiguales, yno es complicado por perdida de los datos u observaciones.
Este diseno logra el maximo grados de libertad para el error.
Desventajas
Su precision es baja si las ue no son uniformes.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Ejemplo
Un investigador desea determinar la incidencia de la concentracionde Pb sobre un criadero de cierta especie. Para este efecto, disponede 20 estanques donde somete ensayo un numero fijo de individuosde esta especie, asignando cinco estanques por concentracion. Des-pues de un cierto periodo de prueba, se determino el numero deindividuos muertos por estanque, los que se muestran en la tablasiguiente.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Ejemplo
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Otros modelos de efectos fijos
Ejemplo 1. Una compana de arriendos de autos desea estimarel consumo de bencina promedio (en kilometros por litro) parasu flota de autos consistente en un 50 % de autos compactos,un 30 % de sedanes y un 20 % de station wagons.
Ejemplo 2. Se desea saber si los gastos medios en entretencionpor familia son los mismos en casas sin ninos, con un nino ocon mas de un nino. Para ello se toma una muestra de tamanont donde n1, n2 y n3 son los tamanos de muestra por estratos(conocidos), n1 + n2 + n3 = nt .
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Un ejemplo mas
Se tiene cuatro tratamientos. Ocho sujetos son asignados aleatoria-mente a cada tratamiento. Se mide el numero de errores cometidospor cada uno de ellos en una tarea de aprendizaje:
A1: grupo control
A2: droga 1
A3: droga 2
A4: ambas drogas
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Datos
Tratamiento 1 2 3 4 5 6 7 8
A1 1 8 9 9 7 7 4 9
A2 12 6 10 13 13 13 6 10
A3 12 4 11 7 10 10 12 5
A4 13 14 14 17 14 14 13 14
Construir un boxplot. Comentar si se cree que hay diferenciapromedio entre los tratamientos.
Escribir el modelo. Establecer los supuestos.
Obtener la tabla de ANOVA. Comentar acerca de la hipotesisasociada.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Un parentesis: Caso particular para dos medias
Prueba t para la diferencia de dos medias
La prueba t de Student para datos independientes se utiliza cuan-do deseamos comparar unica y exclusivamente las medias entre dosgrupos (por ejemplo, deseamos saber si la altura vara segun el gene-ro), mientras que el ANOVA resulta conveniente cuando deseamossaber si las cifras de tension alteriar sistolica difieren segun la edad,considerando a los sujetos en 3 grupos de edad: menores de 35 anos,entre 35 y 55 anos y mayores de 55 anos).
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Un parentesis: Caso particular para dos medias
Prueba t para la diferencia de dos medias
Es necesario recordar que primero observamos si las varianzas po-blacionales son iguales, y en funcion de eso existe un estadistico deprueba determinado.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Prueba de Hipotesis para el cociente de varianzas
Para la hipotesis nula: H0 : 2x =
2y se tiene:
Estadistico de Prueba
Fc =S2xS2y
Hipotesis alterna Criterios de rechazo
H1 : 2x 6= 2y Fc f/2,nx1,ny1 o Fc z1/2,nx1,ny1
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Prueba de Hipotesis respecto a la diferencia de mediaspoblacionales de poblaciones normales
Existen 3 casos:
Varianzas conocidas.
Varianzas desconocidas pero iguales.
Varianzas desconocidas y distintas.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Varianzas conocidas
Estadistico de Prueba
Zc =X Y2xnx
+2yny
Hipotesis alterna Criterios de rechazo
H1 : x 6= y Zc z/2 o Zc z1/2
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Varianzas desconocidas pero iguales
Estadistico de Prueba
Tc =X Y
S2p
(1nx
+ 1ny
)
Hipotesis alterna Criterios de rechazo
H1 : x 6= y Tc t/2,n o Tc t1/2,n
donde : n = nx + ny 2 y S2p =(nx 1)S2x + (ny 1)S2y
n
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Varianzas desconocidas y distintas
Estadstico de prueba
Tc =X Ys2xnx
+s2yny
El estadstico senalado tiene distribucion T-Student, con v gradosde libertad, donde:
v =
(s2xnx
+s2yny
)2[
(s2x /nx )2
(nx1)]
+[
(s2y /ny )2
(ny1)]
Como rara vez v es un numero entero, se trunca al entero.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Un parentesis: Caso particular para dos medias
Ejercicio 1
En un ensayo clnico para evaluar un hipotensor se compara un grupoplacebo con el grupo tratado. La variable medida es la disminucionde la presion sistolica y se obtiene: grupo placebo n = 35, x =3, 7mm de Hg y s2 = 33, 9; grupo tratado n = 40; x = 15, 1 mm deHg y s2 = 12, 8. Es eficaz el tratamiento?
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Un parentesis: Caso particular para dos medias
Ejercicio 2
Las universidades A y B se preguntan si el nivel formativo medioen estadstica de una y otra universidad es diferente. Para tratarde dar respuesta a esta pregunta, someten a 75 alumnos de cadauniversidad elegidos al azar a un mismo examen. Para la universidadA la media es 32,76; con varianza 85,6714. Para la universidad B lamedia es 31,21; con varianza 73,28.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Supuestos
Todo lo anterior funciona bien si los supuestos se cumplen, esto es,los errores:
Son independientes
Se distribuyen Normal
Tienen media cero (por construccion) y
Tienen varianza constante
Tenemos dos caminos si no se cumplen los supuestos:
Transformar
Test No Parametricos
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Normalidad
Prueba de hipotesis
H0 : ij N(0, 2) versusH1 : ij no tienen distribucion normal
Histograma, q-q plot, p-p plot.
Test de normalidad: Kolmogorov-Smirnov, Shapiro-Wilk, Anderson-Darling, Jarque-Bera, Cramer-von Mises, etc.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Homogeneidad de Varianza
Prueba de hipotesis
H0 : 2i =
2 para cada i , versus
H1 : 2i =
2, para algun i .
Graficos caja de los residuos por tratamiento, grafico de valoresajustados versus residuos.
Test para detectar homocedasticidad (varianza residuos cons-tante): Levene, Bartlett, Brown-Forsythe, OBrien y Romero-Zunica, Cochran, Hartley.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Independencia y Valores atpicos
Independencia
Este es el supuesto mas importante.
Grafico tiempo versus residuos.
Test de Durbin Watson
Valores extranos
Grafico valores predichos versus residuos estandarizados.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Observaciones
Para aumentar la precision del contraste se puede:
Reducir el error experimental introduciendo nuevos factores.
Aumentar el tamano muestral de cada grupo.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Test No Parametricos
Las tecnicas estadsticas de estimacion de parametros, interva-los de confianza y prueba de hipotesis son, en conjunto, deno-minadas estadstica parametrica y son aplicadas basicamente avariables continuas.
Estas tecnicas se basan en especificar una forma de distribucionde la variable aleatoria y de los estadsticos derivados de losdatos.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Test No Parametricos
En estadstica parametrica se asume que la poblacion de la cualla muestra es extrada es NORMAL o aproximadamente normal.Esta propiedad es necesaria para que la prueba de hipotesis seavalida.
Sin embargo, en un gran numero de casos no se puede determi-nar la distribucion original ni la distribucion de los estadsticospor lo que en realidad no tenemos parametros a estimar. Tene-mos solo distribuciones que comparar. Esto se llama estadsticanoparametrica.
-
Unidad 4: Diseno de Experimentos
Disenos Completamente Aleatorizados: DCA
Test No Parametricos
La mayor desventaja de la estadstica noparametrica es quecuando los supuestos se cumplen es mucho menos poderosaque la estadstica parametrica.
Nociones Bsicas del Diseo de ExperimentosDiseos Completamente Aleatorizados: DCA