estadistica aplicada a la educaciÓn superior.pdf

62
ESCUELA MILITAR DE INGENIERIA UNIDAD ACADÉMICA SANTA CRUZ UNIDAD DE POSTGRADO ESTADÍSTICA APLICADA A LA EDUCACIÓN SUPERIOR Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. En Educación Superior Santa Cruz, Mayo del 2013

Upload: martinezsolaris7160

Post on 03-Jan-2016

373 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

ESCUELA MILITAR DE INGENIERIA

UNIDAD ACADÉMICA SANTA CRUZ

UNIDAD DE POSTGRADO

ESTADÍSTICA APLICADA A LA EDUCACIÓN

SUPERIOR

Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. En Educación Superior

Santa Cruz, Mayo del 2013

Page 2: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

INTRODUCCION

La investigación sobre el aprendizaje y la enseñanza ha avanzada tremendamente, y los

investigadores buscan contribuir a la mejora de la educación. Sin embargo, continúan las quejas

sobre la brecha entre la teoría/investigación por un lado, y las prácticas educativas, por el otro.

Una manera potencial para remediar la brecha entre teoría y práctica es llevar a cabo

experimentos de diseño que:

- Buscan desarrollar una ciencia de diseño de la educación.

- Puedan guiar el desarrollo de ambientes de aprendizaje eficaces novedosos

La experimentación es instrumento de vital importancia para la investigación ya que por medio

de ella, el investigador es capaz de simular un fenómeno de interés, lo que conduce a una

investigación más rápida, efectiva, de menor riesgo y con un rigor científico, siempre y cuando

exista una previa planificación de la investigación.

Existen diferentes tipos de investigaciones que pueden generar conocimientos ya sean básicos o

bien aplicables. Independientemente del tipo de conocimiento que genere una investigación, éste

tiene que someterse a una valoración científica. Para esto la estadística ofrece herramientas

como los DISEÑOS EXPERIMENTALES de los cuales el investigador se vale para demostrar

sus conjeturas, aceptar o no una hipótesis, comparar resultados, emitir conclusiones, etc. acerca

del problema o fenómeno en estudio.

"Las teorías basadas en ideologías carecen de experimentación, y por ello, no son ciencia, lo

que no se demuestra con experimento es política. Lo que se demuestra con experimentación, es

ciencia (Robert Laughlin, Premio Nobel de Física 1998).

Ing. M.Sc. Francisco Martínez Solaris

Page 3: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

1. REGRESION Y CORRELACION LINEAL SIMPLE

1.1 Regresión Lineal Simple

En muchas áreas de la investigación científica, la variación en las mediciones de una

variable en estudio es causada preponderantemente por otras variables relacionadas cuyas

magnitudes cambian en el curso del experimento. La incorporación explícita de los datos de

estas variables que influyen en el análisis estadístico, permite conocer la naturaleza de las

relaciones y utilizar esta información para mejorar la descripción y las inferencias de las

variables de interés primario.

Al probar las relaciones entre variables es importante que el valor de la variable pueda ser

predicha de las observaciones de otra variable o aún controladas y optimizadas

manipulando los factores de influencia.

El análisis de regresión es un conjunto de métodos estadísticos, que tratan con la

formulación de modelos matemáticos que describen las relaciones entre variables y el uso

de estas relaciones modeladas con el propósito de predecir e inferir.

Supuestos del modelo de Regresión Lineal Simple

Al igual que en otros tipos de análisis estadísticos, el modelo de Regresión Lineal Simple

se basa en ciertos supuestos que a continuación se detallan.

Supuesto 1. "Y" es una variable aleatoria cuya distribución probabilística depende de

"X"

Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoria

con cierta distribución probabilística con media μy/x y σ²y/x. Note que esta suposición

solamente implica que "Y" es una variable aleatoria que depende de "X", y no toma en

cuenta la forma lineal. Por otra parte, significa que la variable X se mide sin error y fijada

por el investigador.

Supuesto 2. Modelo de la línea recta

Esta suposición requiere que la ecuación para μy/x sea una línea recta, es decir que μy/x = ß0

+ ß1Xi y, por lo tanto, que la ecuación de dependencia sea Y = ß0 + ß1Xi + ε. Con esta

Page 4: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

restricción, la línea que une a μy/x debe de ser una recta, por lo tanto se puede tener una de

las siguientes situaciones:

Puede ser que se tenga una relación positiva entre las variables X y Y, esto quiere decir que

a medida que aumenta X, Y también aumenta.

Otra situación que se puede dar es una relación inversa, es decir, que a medida que aumenta

X, Y disminuye.

En el último caso se recurre al hecho de que regresión también se entiende como la

tangente inversa del ángulo de inclinación de una recta. En los dos primeros casos las rectas

tienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresión

lineal entre ambas variables.

Supuesto 3. Homogeneidad de varianza

Esta suposición es muy importante en el análisis de regresión. La varianza de la

distribuciones de "Y" son idénticas para todos los valores de "X". En otras palabras, se

supone que σ²y/x1 = σ²y/x2 = σ²y/xn = σ², donde σ² es la varianza común (desconocida) para

todas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir,

que la media de "Y" se modifica con el valor de "X", pero la varianza se mantiene

constante.

Supuesto 4. Independencia

Los valores de "Y" deberán ser estadísticamente independiente. Un ejemplo donde se viola

este supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapso

menor a una hora.

Supuesto 5. Normalidad

La distribución de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer que

la variable aleatoria no observable ε es normal y su media es cero ya que "X" se toma

como variable no aleatoria susceptible a ser manipulada por el investigador.

Y

X

Page 5: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Todos los supuestos anteriores se pueden resumir en los siguientes:

1. "Y" es una variable aleatoria cuya distribución probabilística depende del valor de "X".

2. La ecuación de regresión es una línea recta.

3. Homogeneidad de varianza.

4. Independencia de las observaciones lo que implica que los errores son independientes.

5. Normalidad.

En la Figura 1 se muestran los supuestos de normalidad y homogeneidad de varianza.

1.2. Diagrama de Dispersión

Este diagrama tiene por objetivo dar una idea de la posible relación existente entre la

variable dependiente Y y la independiente X.

Para realizar un diagrama de dispersión se coloca en el eje de las abscisas los valores

correspondiente a la variable independiente X y en el eje de las ordenadas los valores de la

variable dependiente Y. Luego se colocan puntos en la intersección de los valores de ambas

variables. Un ejemplo de lo anterior se muestra en seguida.

Los datos que se muestran a continuación corresponden a la producción en miles de

millones de dólares de 10 empresas y sus costos de producción de las mismas en miles de

millones de dólares.

Page 6: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Para construir un diagrama de dispersión lo primero que se tiene que hacer es determinar

quién es la variable dependiente y quién es la variable independiente, es decir, establecer la

relación entre dichas variables. Esta relación debe ser lo más natural posible.

En el caso del problema, es de suponerse que a medida que aumenta la producción también

se incrementarán los costos de producción por todo lo concerniente a ello (materia prima,

horas hombres, gastos de energía, etc.). Entonces definimos a X, variable independiente, a

la Producción y a Y, variable dependiente, a los costos de producción. De acuerdo a esto se

tiene lo siguiente:

Producción (X)

(miles de millones de $us)

Costo (Y)

(miles de millones $u)

10 3

18 5

12 4

16 5

22 8

36 12

30 10

32 14

26 12

12 3

El diagrama de dispersión quedaría de la siguiente forma:

De acuerdo a la información que proporciona el diagrama de dispersión se puede observar

que a medida que aumenta la producción de las industrias, aumentan los costos de

0

2

4

6

8

10

12

14

16

0 5 10 15 20 25 30 35 40

Cost

o (

Mil

es d

e m

illo

nes

$u

s)

Producción (Miles de Millones $us)

Page 7: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

producción de las mismas, es decir, se concluir que existe una relación positiva entre estas

variables y además se puede ver que esta relación tiende a ser lineal.

1.3. Método de Mínimos Cuadrado

Como lo plantea el supuesto 2 del modelo de regresión lineal simple, "Modelo de la Línea

Recta", que de existir una relación entre X y Y, ésta debe ser una línea recta. Entonces a

partir de muestra (x1, y1), (x2, y2),..., (xn, yn), de las variables "X" y "Y", se trata de

obtener una ecuación que represente la relación entre dichas variables. El modelo del cual

se habla es de una ecuación punto pendiente como sigue:

El problema de esta modelo es que sus componentes son parámetros y por lo tanto, son

estados desconocidos de la naturaleza generalmente. Es por ello que es necesario obtener

estimadores de ß0 y ß1 para estimar adecuadamente la recta de regresión μy/xi. El

estimador de μy/xi se denota por:

Para llegar a obtener estos estimadores se hace uso de la técnica propuesta por Carl Gauss

(1777-1855). Este método se basa en la idea de obtener estimadores para los componentes

del modelo que minimicen la suma de cuadrados de las distancias entre los valores

observados (Yi) y los estimados ( ). Esto significa que se tiene que minimizar la suma de

cuadrados de las longitudes de los segmentos de las líneas verticales que unen los datos

observados con la recta estimada como se muestra en la Figura 3.

A la técnica antes mencionada se le denomina "Técnica de Mínimos Cuadrados". Usando

notación matemática, el método de mínimo cuadrados consiste en encontrar los estimadores

de ß0 y ß1.

Page 8: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Al aplicar la técnica de mínimos cuadrados se llegan a obtener las ecuaciones de trabajo de

y 1^ (en este caso se ha omitido los procesos de derivación mediante el cual se llega a

obtener las fórmulas de trabajo). Estas ecuaciones son las siguientes:

∑ ∑

∑ (∑ )

;

. Donde:

Coeficiente de Regresión

Intercepto de la recta de estimación

Ejemplo:

Retomando los datos que se utilizaron para construir el diagrama de dispersión y aclarando

que “X” es Producción (miles de millones de $us) y “Y” Costos (miles de millones de $us)

y haciendo uso de las ecuaciones derivadas a través de la técnica de mínimos cuadrados se

tiene lo siguiente:

X Y XY X2 Y

2

10 3 30 100 9

18 5 90 324 25

12 4 48 144 16

16 5 80 256 25

22 8 176 484 64

36 12 432 1296 144

30 10 300 900 100

32 14 448 1024 196

26 12 312 676 144

12 3 36 144 9

Totales 214 76 1952 5348 732

Promedio 21.4 7.6

∑ ∑

∑ (∑ )

;

( )

= 0.423738, Coeficiente de regresión

Page 9: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

; ( ) ; Intercepto, por lo tanto la

ecuación de estimación quedaría de la siguiente manera:

; o bien se puede decir que:

Costos = 0.423738 (Producción) – 1.46798

Un aspecto que no se debe olvidar es que el propósito de la Regresión Lineal Simple es el

de predecir el comportamiento de una variable dependiente a través del conocimiento de

una variable independiente, es por ello que se debe estar seguro que la ecuación de

estimación sirve para este propósito (que existe regresión lineal simple). Por esta razón es

que la ecuación de estimada debe ser sometida a un proceso de validación.

1.4. Validación de la Ecuación de Estimación

Este proceso se puede realizar de dos maneras a saber:

A través del Cálculo del Coeficiente de Determinación (R2)

Por medio del Análisis de Varianza de la Regresión (ANARE)

Coeficiente de Determinación (R2) o Variabilidad (varianza explicada)

El Coeficiente de Determinación, R2, indica el porcentaje de la variabilidad de “Y” que

puede ser explicada o debida a “X”, es por ello que mientras más cerca esté del 100% es

mucho mejor. Esto es debido a que se trata de predecir el comportamiento de “Y” a través

del conocimiento de “X”, es por ello que es deseable que el mayor porcentaje de la

variabilidad de la variable dependiente sea debida a “X”, a tal punto que hay autores que

consideran que la ecuación es buena o sirve para predecir si R2

≥ 70%.

El coeficiente de Determinación se calcula a través de la siguiente ecuación:

⌈⌈⌈⌈⌈

∑ (∑ ∑ )

√(∑ (∑ ) ) (∑

(∑ ) )

⌉⌉⌉⌉⌉

Para el caso del ejemplo anterior el R2 es el siguiente:

Page 10: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

⌈⌈⌈⌈⌈

( )

√( ( ) ) (

( ) )

⌉⌉⌉⌉⌉

Este dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X

(Producción), por lo tanto también se puede concluir que existe un 10.64% de variabilidad

de Y (Costos) que no es debida a X (Producción), a esto se le conoce como variabilidad no

explicada. En este caso se puede concluir también que la ecuación estimada sirve para

predecir (existe regresión lineal simple.

Análisis de Varianza de la Regresión Lineal Simple (ANARE)

De forma general se entienden por análisis de varianza a la partición de la variabilidad total

en fuentes de variación conocidas que en el caso de regresión lineal son las siguientes:

debida a la regresión

debida a otras causas (error)

Para tratar de ser un poco más explícito, estas dos fuentes de variación se derivan del

modelo aditivo lineal de la regresión línea simple el cual es:

Esto tiene correspondencia con una tabla de varianza o salida de

varianza que para regresión lineal simple es la siguiente:

FV gl SC CM Fc Ft

Regresión 1

SCRegresión

(α, glreg, glerr)

Error n-2

SCError

Total n-1 SCTotales

La primera columna encabezada por FV (Fuentes de variación) es donde se declara las

fuentes de variación en las que se está partiendo la variabilidad total. Nótese que en esta

tabla no se incluye el efecto de , ya que éste es una constante por lo tanto no es una

fuente de variación.

Page 11: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

La segunda columna encabeza por “gl” (Grados de Libertad). De forma general grados de

libertad es “n-1”, para el caso de la fuente de variación debida a regresión siempre es 1 ya

que son dos los parámetros que se estiman, β0 y β1, por lo tanto, 2-1 = 1. Es por ello que

para el ANARE de regresión lineal simple, esta fuente de variación siempre tiene 1 grado

de libertad y los grados de libertad del error, siempre en este caso, son n-2. Por “n” se

entiendo al conjunto de pares de datos “X” “Y”.

La tercera columna es la de Suma de Cuadrados (SC) que vienen a ser los componentes de

las varianza a estimar cuyas ecuaciones de trabajo son las siguientes:

(∑ )

(∑ ∑ ∑

)

La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimaciones

propiamente dichas de las varianza de cada una de las fuentes de variación. Estas resultan

de dividir las sumas de cuadrados de éstas entre sus grados de libertad.

La quinta columna denominada como “Fc” se refiere a los “F” calculados que resultan de

dividir el cuadrado medio de regresión entre el cuadrado medio del error, es decir, de la

variabilidad no debida a la regresión. Es por ello que el error se considera como un término

de comparación entre la variabilidad debida a regresión y el mismo. Si el cuadrado medio

del error es mayor que el cuadrado medio de regresión, el resultado que se obtendrá será

pequeño y posiblemente menor que el valor de la siguiente columna “Ft” o “F” de tabla,

valor que se extrae de una tabla de “F” con un nivel de significancia, grados de libertad de

regresión y los grados de libertad del error.

Para entender mejor lo anterior se debe de partir del juego de hipótesis que se prueba en un

ANARE. Este es:

Ho: β1 = 0

Ha: β1 0

La hipótesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hipótesis que se

somete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso indica

Page 12: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

que no existe regresión lineal simple, y asume que la relación entre X y Y es una línea recta

sin pendiente, es por ello que es igual a cero.

Por hipótesis alternativa se entiende aquella que contradice a la hipótesis nula y que es

aceptada una vez que se rechaza la hipótesis nula. Es por ello que está como β1 0 ya que

una igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente,

es decir, que existe regresión lineal simple.

Ahora bien, todo el ANARE se hace para realizar la prueba de hipótesis de que si existe o

no regresión lineal simple.

Se entiende como prueba de hipótesis al proceso a través del cual se prueba la plausibilidad

de una hipótesis.

Al realizar la prueba de hipótesis se debe llegar una decisión de aceptar o rechazar Ho.

¿Cuándo no se rechaza Ho?, cuando el Fc Ft y se rechaza cuando el Fc Ft. A lo anterior

se le llama Regla de Decisión la cual es la siguiente:

No Rechazo de Ho si Fc Ft

Rechazo de Ho si Fc Ft

Si la hipótesis nula no se rechaza significa que no existe regresión lineal simple, por lo

tanto la ecuación estimada no sirve para predecir, si se rechaza Ho, inmediatamente se

acepta la hipótesis alternativa la que indica que sí existe regresión lineal simple.

Un aspecto que todavía no se ha aclarado es “Nivel de Significancia, α, ” entendido como

la probabilidad de tomar una decisión equivocada (conocido también como Error Tipo I) es

por ello que los valores del α son pequeños 0.1.

Haciendo el ANARE a un α = 0.01 se tiene lo siguiente:

( )

= 154.4

(

)

Vaciando esta información en la tabla de ANARE se tiene lo siguiente y obteniendo el

valor de F de la tabla correspondiente a: 0.01, 1 y 8 se tiene que este es: 11.26

Page 13: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

FV gl SC CM Fc Ft

Regresión 1 137.6897 137.6897 67.0389 11.26

Error 8 16.4310 2.053875

Total 9 154.4

De los resultados de la tabla se puede observar que el “Fc” es mayor que el “Ft” lo cual

indica que existe suficiente evidencia para rechazar la hipótesis nula, es decir, que existe

regresión lineal simple y por lo tanto se dice que la ecuación estimada sirve para predecir el

comportamiento de Costos (Y) a través del conocimiento de Producción (X).

Cuando se realiza un análisis de varianza de la regresión se debe emitir una conclusión que

podría ser la siguiente:

“De acuerdo al análisis de varianza realizado se concluye con un 99% de confiabilidad, (1 –

0.01)*100, que existe regresión lineal simple.”

Una vez que se ha comprobado que la ecuación estimada es buena (hay regresión lineal) el

siguiente paso sería interpretar los componentes de la recta de estimación.

1.5. Interpretación de los Componentes de la Ecuación de Estimación

Cuando se hacer una interpretación, ésta debe ser aplicada al problema en cuestión. En el

caso del ejemplo que se ha venido desarrollando sería el siguiente:

1: Este es el coeficiente de regresión que indica la cantidad de cambios que experimenta

“Y” por un cambio en “X”. En este caso indica que por Un mil millones de dólares que

se incremente la producción, los costos se incrementarán en 0.423738 miles de

millones de dólares. Esto porque la pendiente encontrada fue positiva, si hubiera sido

negativa, se diría que disminuiría esa cantidad.

0: No siempre tienen interpretación aplicada al problema, es decir, una interpretación

lógica, es por ello que comúnmente se le interpreta desde el punto de vista matemático

como el punto donde la recta de estimación corta al eje de las ordenadas cuando “X”

toma el valor de cero. En el caso del ejemplo, 0 =-1.46798, esto estaría indicando que

cuando la producción es cero, los costos son de -1.46798 miles de millones de dólares.

Como se ve esta interpretación carece de lógica lo cual hace que se interprete como se

ha mencionado anteriormente.

Page 14: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Existen casos donde si existe interpretación lógica como lo muestra el trabajo de

investigación realizado por Martínez (1995) donde ajustó pesos de becerros al nacimiento.

1.6. Dibujo de la Recta de Estimación

Cualquier recta se define por dos puntos y en el caso de la recta de regresión lineal simple,

ésta pasa por dos puntos obligados cuyas coordenadas son: ( ) y ( 0). La recta de

estimación debe dibujarse dentro del área de exploración, es decir, el área determinada por

el diagrama de dispersión que donde se tiene información de ambas variables.

Para el caso del ejemplo que se ha venido tratando la gráfica de la recta de estimación sería

como se muestra a continuación.

1.7. Regresión no Lineal

Este tipo de regresión no es objeto de desarrollo del presente documento ya que se

consideran para cursos superiores de estadística lo que se trata es dejar plasmado que una

relación entre dos variables no siempre es una línea recta, ésta puede ser logarítmica,

exponencial o bien cuadrática o cúbica. Uno de los criterios para definir el ajuste de modelo

es el R² y además el Cuadrado Medio del Error del análisis de varianza. En estos casos el

diagrama de dispersión es importante para determinar esas posibles relaciones.

y = 0.4237x - 1.468 R² = 0.8936

0

2

4

6

8

10

12

14

16

0 5 10 15 20 25 30 35 40

Co

sto

(m

iles

de

mil

lon

es d

e $

us)

Producción (miles de millones de $us)

Page 15: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Regresión Múltiple

No siempre la dependencia en caso de existir se pueda deber a una sola variable, puede ser

que “Y” como variable dependiente se vea afectada por más de una variable independiente,

en este caso se habla de regresión lineal múltiple, aspecto que no se desarrolla en este

documento.

1.8. Correlación Lineal Simple

Así como existen técnicas que cuantifican los cambios de una variable dependiente por un

único cambio de la variable independiente, existen técnicas que cuantifican la asociación

lineal entre dos variables, esta técnica es llamada Correlación Lineal Simple que se exprese

como el coeficiente de correlación (r). Este coeficiente indica el sentido de la asociación

como también la magnitud de ésta, partiendo del hecho que el coeficiente de correlación

lineal simple toma valores en el rango de: r es 0≤ r ≤ 1. Entre más se acerca a 1 el valor de r

mayor es la asociación entre dichas variables.

De acuerdo a lo anterior algunos autores han determinado lo siguiente rangos:

-1 ≤ r < -0.8 Asociación fuerte y

negativa

0 ≤ r < 0.4 No hay asociación

-0.8 ≤ r < -

0.4

Asociación débil y

negativa

0.4 ≤ r <

0.8

Asociación débil y positiva

-0.4 ≤ r ≤ 0 No hay asociación 0.8 ≤ r ≤ 1 Asociación fuerte y

positiva

El coeficiente de Correlación Lineal Simple se determina a través de la siguiente ecuación:

⌈∑

(∑ ∑ )

√(∑ (∑ )

)(∑

(∑ )

)

⌉, que para el caso del ejemplo sería el siguiente:

√( ( )

)(

( )

)

⌉= 0.9452

Page 16: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Este valor indica que existe una asociación fuerte y positiva entre estas variables, es decir,

entre la producción y los costos de esas empresas.

Diferencias entre Regresión Lineal Simple y Correlación Lineal Simple

Se pueden llegar a establecer las siguientes diferencias:

Regresión Lineal Simple Correlación Lineal Simple

Mide la cantidad de cambios en “Y” por un

único cambio en “X”.

Mide asociación lineal entre dos

variables

Existe una variable dependiente y otra

independiente

Es indistinto x, y ó y, x

β1 puede tomar cualquier valor en la recta

numérica

El coeficiente de correlación

toma valores en el intervalo -1 ≤

r ≤ 1

Page 17: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

2. ASPECTOS GENERALES DE LA EXPERIMENTACIÓN

Antes de ingresar al análisis de los principales diseños experimentales, es necesario

establecer el acervo correspondiente en este campo de la Estadística llamado Diseños

Experimentales que facilite el proceso de aprendizaje que aunado a las bases estadísticas

anteriores conlleven al usuario a un mejor uso el presente material. Es por ello que a

continuación se detalla lo siguiente:

Experimento:

Es todo proceso que consiste en la ejecución de un acto o prueba una o más veces, cuyo

resultado en cada prueba depende del azar y que genera información tanto cualitativa como

cuantitativa según sea el caso. En sí viene a ser aquel proceso intencionado provocado por

el investigador con el fin de estudiar su origen, esencia e interrelación con otros procesos o

fenómenos.

Tratamiento:

Es todo elemento o sujeto sometido a estudio o ensayo de comparación. Viene a ser el

conjunto de condiciones experimentales que el investigador impone a las unidades

experimentales. Ejemplo: diferentes métodos de enseñanza de la matemática, etc.

Unidad Experimental:

Tamaño de la Unidad Experimental. Es el material o lugar sobre el cual se aplican los

tratamientos. Este término se utiliza para representar al conjunto de material experimental

al cual se le aplica un tratamiento. El tamaño de la unidad experimental depende mucho

del tipo de material experimental que se utilice y muchas veces de la esperanza de vida en

el caso de usar seres vivos. Cuando se experimenta con aves, la unidad experimental puede

estar constituida por un grupo de ellas; sin embargo, cuando se puede experimentar con

animales cuya esperanza de vida sea mayor, puede ser que uno solo de ellos pueda ser

considerado como una unidad experimental.

Factor:

Es un tratamiento que genera más tratamiento

Error Experimental:

Es la variación aleatoria (no explicada) ajena al control razonable del investigador. Este

término no es sinónimo de error, si no que forma parte de las características propias e

innatas de la unidad experimental. Este error no se puede evitar pero si se puede reducir

Page 18: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

usando las repeticiones necesarias, usando unidades experimentales los más

homogéneamente posible y manejándolas de manera uniforme.

Testigo

El testigo es el tratamiento de comparación adicional, que no debe faltar en un

experimento; la elección del tratamiento testigo es de gran importancia en cualquier

investigación, éste se constituye como referencial del experimento y sirve para la

comparación de los tratamientos en prueba.

Diseños Experimentales:

Es un método científico de investigación que consiste en hacer operaciones prácticas

destinadas a demostrar, comprobar o descubrir fenómenos o principios básicos. Tiene como

propósito proporcionar la máxima cantidad de información a un costo mínimo.

Diseñar un experimento es planificarlo, qué es lo que se pretende experimentar, es

planearlo de modo que se tenga la secuencia completa de pasos tomados de antemano para

asegurar que la información que se obtendrá permita un análisis objetivo que conduzca a

deducciones (demostración de hipótesis) válidas con respecto al problema de investigación

previamente establecido.

Principios Básicos de la Experimentación:

Los principios básicos de la experimentación son tres: Repetición, Azarización y Control

Local.

Repetición. Es la reproducción del experimento básico llamado también réplica y

solamente a través de ella se pueden obtener conclusiones de un fenómeno. Tiene dos

funciones: Proporcionar una estimación del error experimental y brindar una medición más

precisa de los efectos de los tratamientos, es decir, que hace posible la prueba de

significancia.

Azarización. Es la asignación de los tratamientos a las unidades experimentales de modo

que todas tengan la misma posibilidad de recibir un tratamiento. Tiene la como función

hacer válida la prueba de significancia.

Control Local. Es la cantidad de balanceo, bloqueo o agrupamiento de las unidades

experimentales que se emplean en el diseño adoptado. Tiene la función de hacer más

eficiente el diseño experimental, es decir, hacer más sensitiva la prueba de significancia

Page 19: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

reduciendo con ello la magnitud del error. Los criterios de agrupamiento van a depender del

tipo de ciencia donde se esté experimentando.

Exigencias de la Experimentación:

Las exigencias de la experimentación son: Tipicidad, Uniformidad, Grado de Precisión,

Control efectivo de las medidas y observaciones.

Tipicidad. Llamado también representatividad, hace mención que no se pueden extrapolar

resultados a condiciones diferentes a las que se originaron.

Uniformidad. Indica que todas las unidades experimentales deben ser tratadas

uniformemente y que la única diferencia entre ellos sea los tratamientos que se están

evaluando en ellas. Esto evita tener resultados enmascarados en los experimentos.

Grado de Precisión. Un experimento bien planeado debe permitir al investigador medir

diferencias en los tratamientos con el grado de precisión esperado evitando para ello

comete errores al montar el ensayo y en su misma ejecución. Esto debe ser una tarea de

primer orden por parte del investigador. Es por ello que se debe tener especial cuidado en la

conducción y manejo del experimento.

Control efectivo de las medidas y observaciones. Es necesario hacer anotaciones de las

manifestaciones de las unidades experimentales que permitan explicar ciertos aspectos del

experimento.

Los diseños experimentales como tal se dividen en dos grupos: diseños experimentales

simples y diseños experimentales complejos.

Entre los diseños experimentales simples se tiene al Diseño Completamente al Azar,

Diseño en Bloques Completamente al Azar, Diseño Cuadrado Latino principalmente.

3. DISEÑO COMPLETAMENTE AL AZAR (DCA) O DISEÑO CON UN SOLO

CRITERIO DE CLASIFICACIÓN

Este diseño es el más simple de todos; en él se asigna al azar los tratamientos a grupos de

unidades experimentales previamente determinadas. Asimismo, todas las variables, excepto

las que están en estudio se mantienen constantes.

Page 20: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

3.1. ¿Cuándo utilizar este Diseño?

Este diseño se utiliza cuando las unidades experimentales son homogéneas, o sea, que la

única diferencia que existe son los tratamientos que se aplican a las unidades

experimentales. Este diseño se usa cuando se estudia dos o más tratamientos bajo las

siguientes condiciones:

a.- Lugar y unidades experimentales muy uniformes (suelo homogéneo, en laboratorios,

invernaderos, galpones, aulas, etc.), donde no hay heterogeneidad necesaria de absorber.

b.- Cuando sea probable que una parte del experimento se pierda.

c.- Cuando se tiene un experimento pequeño y donde la mayor precisión de otras

distribuciones no compensan la pérdida de grados de libertad en el error.

Este tipo de diseño proporciona el máximo número de grados de libertad para la estimación

del error experimental; además, no requiere estimar datos faltantes, es decir, puede

analizarse con diferente número de repeticiones por tratamiento (diseño desbalanceado).

3.2. Modelo Aditivo Lineal

El concepto de modelo lineal es una réplica de algo; así como un edificio puede ser

representado en una maqueta. Debe evitarse el error de creer que el modelo lineal es el

mundo real; ya que sólo es una abstracción de una realidad que existe en la mente del

hombre con el objetivo de ayudarse en el análisis de los procesos naturales que afectan por

diversos factores a fuentes de variación y que dichos modelos son de naturaleza transitoria

y son susceptibles a mejorarse.

La consideración básica para un diseño Completamente al Azar es que las observaciones

pueden representarse por medio del modelo estadístico lineal que es el siguiente:

Donde:

Yij = Variable Respuesta

μ = Efecto común a todas las observaciones

Ti = Efecto del i-ésimo tratamiento

Eij = Erro experimental o error del modelo

Page 21: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

3.3. Supuesto del Análisis de Varianza

De forma general, los supuestos en los que se basa el análisis de varianza son:

Homogeneidad de Varianza, Normalidad, Aditividad y Linealidad del Modelo, e

Independencia.

3.3.1. Homogeneidad de Varianza:

Las varianzas de las diferentes medías deben ser homogéneas. Por lo general, en el análisis

de varianza, se utiliza un promedio de n varianza (CME) para obtener la mejor estimación

de la varianza común. Pero, si las varianzas dentro de los tratamientos fuesen de hecho

distintas, no se tendría justificación para combinarlas, ya que el promediar varianzas de

tratamientos mayores y menores podría proporcionar resultados engañosos. La diferencia

entre dos tratamientos con varianzas grandes puede ser considerada significativa cuando en

realidad ésta puede haber ocurrido por casualidad. Por otra parte, la diferencia entre dos

tratamientos con varianzas pequeñas puede ser declarada no significativa cuando en verdad

lo es.

Existen muchas técnicas para probar homogeneidad de varianza, como la prueba de

Bartlett, Prueba de F, propuesta por R.A. Fischer. Por la rapidez de esta última prueba se

propone la misma para efecto del curso, lo cual no desmerece en ninguna otra prueba.

La prueba de F propuesta por Fischer se basa en lo siguiente:

( )

( )

La prueba de hipótesis que se emplea es la siguiente:

Ho:

Ha:

La regla de decisión es la siguiente:

No Rechazo de Ho si Fc F (m-1, n-1)gl. Esto quiere decir que las varianzas son

homogéneas.

RHo si Fc > F (m-1, n-1)gl, lo cual indica que las varianza son homogéneas.

Box (S/F; citado por Calzada Benza, 1970) mencionó que si la razón entre la varianza

mayor y la varianza menor es menor de cuatro, se puede considerar que hay suficiente

homogeneidad de varianza, siendo éste posiblemente un criterio más rápido para probar

homogeneidad de varianza.

Page 22: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

3.3.2. Normalidad:

Los términos del error son aleatorios, independientes y normalmente distribuidos. Este

supuesto es de gran importancia ya que cuando los datos no se distribuyen normalmente los

coeficientes de variación son muy elevados. Cuando los datos de una variable no presentan

normalidad, existen algunas tipos de transformaciones en dependencia de la característica

de los datos de la variable en cuestión que la hacen normal.

Para probar normalidad también existen varias técnicas entre las que se pueden mencionar

la prueba de Shapiro-Wilk y la de Lilliefors. Si el lector está interesado en profundizar

sobre estas pruebas se le sugiere consultar a Ramírez y López (1993). (Métodos

Estadísticos no Paramétricos)

3.3.3. Aditividad y Linealidad del Modelo:

Lo anterior se cumple en el modelo aditivo lineal ya que todos los efectos se suman y son

lineales porque cada uno de sus elementos del modelo lineal, están a la potencia "1".

3.3.4. Independencia:

Este supuesto implica que los términos del error son aleatorios, no

correlacionados (independientes) normalmente distribuidos; además, de las varianzas y las

medias de las distintas muestras.

3.4. Análisis de varianza para este Diseño

El análisis de varianza consiste en la partición de la variación total en fuentes de variación

conocidas y la que no es conocida se atribuye al error. El análisis de varianza separa parte de

la varianza causada por efectos accidentales, no sistemáticos (error experimental o

simplemente error) de los causados por efectos sistemáticos conocidos (tratamientos).

Antes de mostrar la tabla de análisis de varianza para e s t e d i s eñ o s e m u es t r a a

co n t i n u ac i ó n u n cu ad r o d e concentración de información (Cuadro 1) y

posteriormente las ecuaciones trabajo para el mismo.

Page 23: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 1. Concentración de los datos para un Diseño Completamente al Azar con “i”

tratamiento y “j” repeticiones.

TRATAMIENTOS REPETICIONES

ΣYi. 1 2 3 … j

1 Y11 Y12 Y13 Y1j Y1.

2 Y21 Y22 Y23 Y2j Y2.

3 Y31 Y32 Y33 Y3j Y3.

…i Yi1 Yi2 Yi3 Yij Yi.

ΣY.j Y.1 Y.2 Y.3 Y.j Y..

El modelo lineal para este diseño tiene solo dos fuentes de variación y es el siguiente:

El modelo aditivo de un Diseño Completamente al Azar se corresponde con las

salidas de varianza que se muestran en los Cuadro 2 y 3.

Cuadro 2. Salida de varianza para un Diseño Completamente al Azar con igual

número de repeticiones (diseño balanceado).

F.V gl SC CM Fc Ft

Tratamiento t-1 SCTRAT.

( )

Error t(r-1) SCError

( )

Total tr-1 SCTotales

Donde:

F.V = Fuente de variación

gl = Grados de libertad

SC = Suma de Cuadrados

CM = Cuadrado Medio

Fc = “F” calculado

Ft = “F” tabulado que se encuentra en la tabla de “F” a un nivel de significancia “”

(probabilidad de error tipo I), grados de libertad de los tratamientos y grados de libertad del

error

En caso de que los tratamientos tengan diferentes número de repeticiones (diseño

desbalanceado) la salida de varianza es la siguiente:

Page 24: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 3. Salida de varianza para un Diseño Completamente al Azar con desigual

número de repeticiones (diseño desbalanceado).

FV gl SC CM Fc Ft

Tratamiento t-1 SCTRAT.

( )

Error n-t SCError

Total n-1 SCTotales

3.4.1. Ecuaciones de trabajo

; Factor de corrección si el experimento es balanceado

; Factor de corrección si el experimento es desbalanceado

∑ ; Suma de cuadrados totales

; Suma de cuadrado de tratamiento si el experimento es balanceado

; Suma de cuadrados si el experimento es desbalanceado

; Suma de cuadrados del error

3.4.2. Prueba de Hipótesis en el Análisis de Varianza de un Diseño Completamente al

Azar

En el análisis de varianza de este diseño se prueba el siguiente juego de hipótesis

estadísticas:

Ho: µ1 = µ2 = µ3 =… µi (T1 = T2 = T3 = …Ti). Esto es lo mismo que:

Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0).

Ha: µ1 - µ2 - µ3 -… µi 0 (T1 T2 T3 …Ti).

La hipótesis nula asume el efecto de igual, es decir, que los tratamiento ejercen el mismo

efecto sobre la variable respuesta. Esta es la hipótesis que se somete a prueba y, la hipótesis

alternativa, en su esencia, es la que contradice a la hipótesis nula.

Dado que la hipótesis nula es la que se somete a prueba, entonces puede ser aceptada ó

rechazada, si no es rechazada significa que no existe la suficiente evidencia experimental para

Page 25: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

hacerlo, en caso de rechazarse, de inmediato se acepta la hipótesis alternativa. Para saber

cuándo aceptar o rechazar la hipótesis nula se toma en cuenta la siguiente regla de decisión.

No Rechazo de Ho (NRHo) si Fc Ft (F de tablas)

Rechazo de Ho (Rho) si Fc > Ft (F de tablas)

3.5. Interpretación de Resultados

Para una mejor ilustración de la interpretación de los resultados de un análisis en este

diseño, se muestra a continuación el siguiente ejemplo:

En un estudio del efecto de la glucosa sobre la liberación de insulina, se trataron

especímenes de tejido pancreático de animales experimentales con cinco concentraciones

diferentes de glucosa. Posteriormente se hizo la determinación de la cantidad de insulina

liberada. Se pide realizar el análisis de varianza correspondiente usando una probabilidad

de error Tipo I de (0.01), es decir, = 0.01. Los datos obtenidos se muestran en el Cuadro

4.

Cuadro 4. Insulina liberada a diferentes concentraciones de glucosa en las unidades

experimentales.

Tratamiento Repeticiones

1 2 3 4 5 6 7 8

1 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59

2 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44

3 3.89 4.80 3.69 5.70 5.62 5.79 4.75 5.33

4 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.10

5 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98

Adaptado de Wyane (1970)

En el mismo cuadro de información se pueden incluir los totales de tratamiento como

también sus varianzas por cada uno de ellos como se muestra en el Cuadro 5.

Page 26: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 5. Insulina liberada a diferentes concentraciones de glucosa en las unidades

experimentales, totales y varianza por tratamiento.

Tratamiento Repeticiones

ΣYi. S² 1 2 3 4 5 6 7 8

1 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59 21.32 0.5791

2 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44 21.53 0.9702

3 3.89 4.8 3.69 5.7 5.62 5.79 4.75 5.33 39.57 0.6621

4 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.1 56.44 2.2212

5 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98 56.81 2.0718

ΣY.j 22.61 21.47 24.08 22.3 26.96 26.4 25.41 26.44 195.67 Y..

Revisando el supuesto de homogeneidad de varianza y tomando en cuenta lo propuesto por

Box (S/F; citado por Calzada Benza, 1970) se relacionará la varianza mayor con la varianza

menor, en este caso varianza del tratamiento 1 y la del tratamiento 4. Entonces:

= 3.8356

Como la relación entre la varianza mayor y la menor y tomando en cuenta lo propuesto por

Box (S/F) se puede concluir que existe homogeneidad de varianza.

Comenzando a realizar el análisis de varianza se tiene lo siguiente:

( )

( )

Analizando los resultados obtenidos al aplicar las ecuaciones de trabajo para este diseño es

importante señalar que ninguna de estas sumas de cuadrados puede ser negativa ya que son

componentes de varianza y la varianza nunca puede ser negativa. Por otra parte, se puede

observar que la Suma de Cuadrados Totales es la mayor, en verdad ésta es la variación

total y ninguna de las demás puede ser mayor que ésta. Además se puede observar que la

Suma de Cuadrados del Error se obtiene por diferencia entre la Suma de Cuadrados

Totales y la de Tratamiento. Esto es producto de la aplicación misma de lo que es análisis

de varianza.

Una vez obtenidas las sumas de cuadrados correspondientes, el siguiente paso es construir

Page 27: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

la tabla de análisis de varianza (salida de varianza) la cual queda como se muestra en el

Cuadro 6 y además es recomendable que esta tabla vaya acompañada del Coeficiente de

Variación (C.V) el cual se define como la relación entre la raíz cuadrada del Cuadrado

Medio del Error y el Promedio de la Variable respuesta o en estudio.

(√

)

(√

)

Cuadro 6. Salida de varianza para los datos del Cuadro 4.

F.V gl SC CM Fc F(0.01, 4, 35)

Tratamiento 4 154.921015 38.7302538 29.7714584 3.908

Error 35 45.5321625 1.30091893

Total 39 200.453178

C.V. = 23.32%

Si se toma en cuenta el juego de hipótesis de este diseño y la regla de decisión se puede

concluir que se rechaza la hipótesis ya que el “Fc” es mayor que el “Ft”. A manera de

conclusión se puede decir lo siguiente:

Con un 99% de confiabilidad se concluye que al menos unos de los tratamientos evaluados

ejercen un efecto distinto (P ˂ 0.01) sobre la liberación de insulina.

Ahora la pregunta es: ¿Cuál es ( o son) ese (esos) tratamiento (s) que hizo (hicieron)

rechazar la hipótesis nula?. Esta interrogante no la responde el análisis de varianza ya que

éste solo prueba si existe o no efecto de las variables dependientes sobre la dependiente. Es

por ello que se deben hacer otros análisis para responder esta interrogante.

Para responder a estas interrogantes existen dos técnicas principalmente que son las

pruebas a priori o Contrastes Ortogonales y las pruebas obligadas por los datos llamadas

también Pruebas de Rangos Múltiples o Separación de Medias. Estas últimas por el grado

de uso que tienen en las investigaciones de índole experimental son las que se desarrollan a

continuación.

3.6. Pruebas obligadas por los Datos o de Rangos Múltiples

Cuando el análisis de varianza de un experimento reporta diferencias significativas y son más

de dos tratamiento, es necesario saber quién “metió el ruido en la prueba de hipótesis” que

Page 28: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

provocó que la hipótesis nula sea rechazada. Para este fin, existen las llamadas pruebas de

Rangos Múltiples. Entre estas pruebas están:

Diferencia Mínima Significativa (DMS) (LSD)

Método de Duncan

Método de Student-Newman-Keuls (SNK)

Método de Tukey (Diferencia Significativa Honesta)

Método de Scheffé.

Cada uno de estos procedimientos de comparación de medias es tá basado en un

conjunto de suposiciones, y son usualmente efectivos para fines específicos.

En cualquiera de los casos la hipótesis nula supone la igualdad de las medias y la

alternativa lo contrario y se utilizan siempre y cuando en el análisis de varianza rechace la

hipótesis nula. Lo anterior indica que la prueba de hipótesis que se hace es la siguiente:

Ho: | |

Ha: | |

La hipótesis nula, que es la que se prueba, asume el efecto de igualdad de los promedios a

comparar es por ello que la diferencia es igual a cero y por lo tanto, la hipótesis alternativa

contradice la hipótesis nula con una desigualdad.

La regla de decisión es la siguiente:

NRHo = Valor crítico de la prueba está dentro de la diferencia:

| | | |

RHo: Si Valor Crítico de la prueba es | | o bien

Si el Valor Crítico ˂ | |

3.6.1. Diferencia Mínima Significativa (DMS)

Esta prueba solo debe usarse para comparar medias adyacentes en un arreglo ordenado,

medias por orden de magnitud. Cuando DMS se usa indiscriminadamente para probar todas

las diferencias posibles entre las diversas medias, ciertas diferencias serán significativas,

pero no al nivel de significancia que se ha elegido.

El número posible de comparaciones de medias tomadas de dos en dos a la vez es igual a

( )

. Los especialistas hacen mención que este método es adecuado para comparar un

tratamiento estándar (testigo) con otros tratamientos.

Page 29: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Esta prueba utiliza un solo comparador y su fórmula es la siguiente:

, donde:

DMS = Es el valor crítico de la prueba

t/2 = Valor tabular de “t” de student para los grados de libertad del error obtenido a un

/2.

r = número de repeticiones

3.6.2. Método de Duncan

Esta prueba es ampliamente utilizada entre las diversas pruebas de Rangos

Múltiples. Su método es de naturaleza secuencial, lo que quiere decir, que utiliza un

nuevo valor “estudentizado”, para cada una de las comparaciones de medias adyacentes

ordenadas por magnitud en orden descendente.

Esta prueba incluye el cálculo de las diferencias significativas mínima entre las medias de

tratamiento cuando éstas se encuentran dispuestas en orden de magnitud. La fórmula

es la siguiente:

Donde:

Es el valor extraído de una tabla especial de rango “estudentizado”, con los grados de

libertad del error y con la disposición relativa de las medias en el arreglo.

CMError = Cuadrado Medio del Error

r = Número de repeticiones.

3.6.3. Método de Student-Newman-Keuls (SNK)

Es una prueba de carácter secuencial, es decir, que utiliza un nuevo valor “estudentizado”

para cada comparación.

Para el cálculo de esta prueba se requiere determinar la diferencia mínima significativa

entre las medias del tratamiento cuando éstas se encuentran dispuestas en orden de

magnitud. Su fórmula es la siguiente:

Page 30: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

;

Donde:

q = Valor obtenido de tablas especiales de rango “estudentizado”, para los grados de

libertad del error y con la disposición relativa de las medias en el arreglo

CMError = Cuadrado medio del error

r = número de repeticiones

3.6.4. Método de Tukey

Este método es un procedimiento basado en el rango “estudentizado

”, pero no es secuencial, ya

que utiliza un sólo comparador de “q” ordinario. Sin embargo, el método de Tukey es útil en

situaciones en que se desea hacer un primer énfasis en el uso del experimento con un total para

determinar la significancia de los pares de medias. Esta prueba sólo es exacta cuando los

grupos tienen igual número de elementos y para medias que no han sido ajustadas por

covarianza. Esta prueba se define de la siguiente manera:

Donde:

q = Valor obtenido de tablas especiales de rango “estudentizados”, para los grados de

libertad del error y con la disposición relativa de las medias en el arreglo

CMError = Cuadrado medio del error

r = número de repeticiones

3.6.5. Método de Scheffé

Se considera un método bastante general que utiliza la distribución de “F” de Snedecor. El

método de Scheffé puede aplicarse para probar hipótesis generales de que una función

lineal de las medias poblacionales es igual a cero. En contraste con las comparaciones

múltiples basadas en rangos estudentizados, el método de Scheffé es un método exacto para

medias provenientes de medias de igual o desigual tamaño y para medias que han sido

ajustadas por covarianza. Para el cálculo se requiere determinar la mínima diferencia

significativa entre las medias de los tratamientos cuando éstos se encuentran ordenados en

Page 31: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

orden de magnitud. Su valor crítico se determina a través de la siguiente expresión:

√( ) (

)

Donde:

t = Número de tratamientos

F = Valor que se obtiene de la distribución de “F” de Snedecor con t-1 y los grados de

libertad del error.

CError = Cuadrado medio del error, y ri, rj representan el número de observaciones usadas

para calcular cada media muestra

Ejemplo.

A continuación se aplican todas las pruebas de rangos múltiples antes expuestas de manera

que se pueda realizar una comparación entre éstas. Los promedios por tratamiento son los

siguientes:

Cuadro 7. Medias por tratamientos y Medias ordenadas por magnitud descendente.

Tratamiento Promedio Tratamiento Promedios Ordenados

1 2.665 5 7.10125

2 2.69125 4 7.055

3 4.94625 3 4.94625

4 7.055 2 2.69125

5 7.10125 1 2.665

Aplicando DMS a un nivel de significancia = 0.01 que es el mismo nivel de significancia

que se utilizó para el análisis de varianza, además de la siguiente información:

CMError = 1.30091893

r = 8

t/2(35) = 2.7238

Por lo tanto el valor crítico de la prueba es de 1.5534.

A continuación se presentan en el Cuadro 7 las comparaciones a realizar, las diferencias

entre las medias y el resultado de comparar estas diferencias con el valor crítico de la

Page 32: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

prueba de DMS.

Cuadro 7. Resultado de la prueba de DMS para los tratamientos estudiados.

Comparación Diferencia de Medias Resultado de la

comparación

T5 versus T4 0.04625 ns

T5 versus T3 2.155 *

T5 versus T2 4.41 *

T5 versus T1 4.43625 *

T4 versus T3 2.10875 *

T4 versus T2 4.36375 *

T4 versus T1 4.39 *

T3 versus T2 2.255 *

T3 versus T1 2.28125 *

T2 versus T1 0.02625 ns

ns = No significativo * = significativo

Las comparaciones se pueden resumir de acuerdo al siguiente rango de mérito

Tratamiento Comparación

5 a

4 a

3 b

2 c

1 c Promedios con literales distintas son estadísticamente diferentes según el método de DMS (P ˂ 0.01).

Interpretando los resultados de la separación o comparación de medias según DMS se

puede decir que las concentraciones de glucosa 5 y 4 producen la misma cantidad de

insulina liberada (P 0.01), pero diferente (P ˂ 0.01) a las demás concentraciones de

glucosa experimentadas. Esto quiere decir que es indistinto utilizar la concentración 5 o 4.

Al comparar el tratamiento 4 (concentración 4) con las demás, ésta tuvo un comportamiento

diferente (P ˂ 0.01) a las demás concentraciones de glucosa, es decir, 3, 2 y 1. Igualmente

mostró la concentración 3 respecto a la 2 y 1, no así la concentración 2 que tuvo el mismo

comportamiento (P > 0.01) con la concentración 1.

Al aplicar el método de Duncan se obtuvo lo siguiente:

Page 33: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Para realizar la prueba de Duncan lo primero que se debe hacer es obtener los valores

estudentizados extraídos de la tabla de Duncan. En este caso se están utilizando valores

interpolados ya que no existen en la tabla grado de libertad igual a 35 solo hay entre 30 y

40 por lo tanto lo que se hizo fue promediar los dos valores. Estos son los siguientes:

Cuadro 8. Valores estudentizado extraído de la tabla de Duncan y valores críticos de

la prueba según el número de medias a comparar.

Medias a comparar 2 3 4 5

R(0.01, 35) 3.855 4.025 4.13 4.195

RMS 1.554549 1.623103 1.665445 1.691656

Aquí se puede ver el efecto secuencial de Duncan ya que utiliza un comparador distinto

según el número de medias a comparar.

Los resultados de aplicar la prueba son los siguientes:

Cuadro 9. Contrastación de las diferencias entre medias adyacentes con los valores

críticos de Duncan.

Promedios Promedios 7.10125 7.055 4.94625 2.69125 2.665

Tratamientos 5 4 3 2 1

7.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 *

7.055 4 0 2.10875* 4.36375* 4.39*

4.94625 3 0 2.255* 2.28125*

2.69125 2 0 0.02625 ns

2.665 1 0

RMS 1.69166 1.66544 1.62310 1.55455

ns = No significativo * = significativo

Page 34: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Lo anterior se resume en el siguiente rango de mérito:

Tratamiento Comparación

5 a

4 a

3 b

2 c

1 c Promedios con literales distintas son estadísticamente diferentes según el método de Duncan (P ˂ 0.01).

Como se puede observar, en este caso los resultados obtenidos son los mismos que en la

prueba de DMS, por lo tanto, la interpretación es la misma.

Aplicando SNK:

Al igual que la prueba de Duncan, SNK es una prueba secuencial lo que indica que utiliza

un valor diferente para cada comparación de acuerdo al número de medias a comparar. Los

valores q y valores críticos de SNK se muestran en el Cuadro 10.

Cuadro 10. Valores estudentizados de la prueba de SNK de acuerdo al número de

medias adyacentes a comparar y valores críticos de la misma.

Medias a comparar 2 3 4 5

q(0.01, 35) 3.855 4.41 4.75 4.99

SNK 1.55454932 1.778356 1.9154628 2.0122441

Page 35: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Los resultados al aplicar la prueba de rangos múltiples de SNK se resumen en el Cuadro 11.

Cuadro 11. Resultados de la comparación de medias según el método de SNK.

Promedios Promedios 7.10125 7.055 4.94625 2.69125 2.665

Tratamientos 5 4 3 2 1

7.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 *

7.055 4 0 2.10875* 4.36375* 4.39*

4.94625 3 0 2.255* 2.28125*

2.69125 2 0 0.02625 ns

2.665 1 0

SNK 2.0122441 1.9154628 1.778356 1.554549

ns = No significativo * = significativo

Lo anterior se resume en el siguiente rango de mérito.

Tratamiento Comparación

5 a

4 a

3 b

2 c

1 c Promedios con literales distintas son estadísticamente diferentes según el método de SNK (P ˂ 0.01)

En este caso, los resultados de aplicación del método de SNK coinciden con el anterior y

por ende, la interpretación es la misma.

Aplicando ahora el método de Tukey o Diferencia Honesta Mínima se tiene lo siguiente:

Tukey no es un método secuencial, es decir, que utiliza un solo valor estudentizado para

obtener el valor crítico de prueba, utiliza la misma tabla que SNK pero con el número

máximo de medias a comparar.

q(0,01, 5, 35) = 4.99

Los resultados de contrastar la diferencia de medias ordenadas con el valor crítico de la

prueba de Tukey se muestra en el Cuadro 12.

Page 36: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 12. Resultados de la aplicación de la prueba de Tukey a los promedios de los

tratamientos estudiados.

Comparación Diferencia de Medias Resultado de la

comparación

T5 versus T4 0.04625 ns

T5 versus T3 2.155 *

T5 versus T2 4.41 *

T5 versus T1 4.43625 *

T4 versus T3 2.10875 *

T4 versus T2 4.36375 *

T4 versus T1 4.39 *

T3 versus T2 2.255 *

T3 versus T1 2.28125 *

T2 versus T1 0.02625 ns

ns = No significativo * = significativo

Resumiendo los resultados del Cuadro 12 en un rango de mérito se tiene lo siguiente:

Tratamiento Comparación

5 a

4 a

3 b

2 c

1 c Promedios con literales distintas son estadísticamente diferentes según el método de Tukey (P ˂ 0.01).

Aplicando ahora la última prueba de separación de medias de las propuestas en este

documento se tiene lo siguiente:

Método de Scheffé

√( ) (

)

La prueba de Scheffé al igual que Tukey no es una prueba secuencial por lo tanto solo

utiliza un valor de “F” de Snedecor que se extrae un nivel de significancia “”, para el caso

del ejemplo = 0.01, con los grado de libertad de tratamientos y los del error experimental.

De acuerdo a esto se tiene lo siguiente:

Page 37: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

F(0.01, 4, 35) = 3.908

√( ) (

)

Cuadro 13. Resultados de la aplicación de la prueba de Scheffé a los promedios de los

tratamientos estudiados.

Comparación Diferencia de Medias Resultado de la

comparación

T5 versus T4 0.04625 ns

T5 versus T3 2.155 ns

T5 versus T2 4.41 *

T5 versus T1 4.43625 *

T4 versus T3 2.10875 ns

T4 versus T2 4.36375 *

T4 versus T1 4.39 *

T3 versus T2 2.255 *

T3 versus T1 2.28125 *

T2 versus T1 0.02625 ns

ns = No significativo * = significativo

Resumiendo los resultados del Cuadro 13 en un rango de mérito se tiene lo siguiente:

Tratamiento Comparación

5 a

4 a

3 a

2 b

1 b Promedios con literales distintas son estadísticamente diferentes según el método de Scheffé (P ˂ 0.01).

3.7. ¿Cuándo, Porqué y Cuál Prueba de Rangos Múltiples Utilizar?

Todas las pruebas de rangos múltiples o separación o comparación de medias se utilizan

siempre y cuando en el análisis de varianza se rechace la hipótesis ya este análisis solo

detecta si existe efecto o no de los tratamientos sometidos a consideración pero no indica

cuál o cuáles son los tratamientos responsables de este rechazo.

Page 38: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

En el Cuadro 14 se resumen los resultados obtenidos por cada una de las pruebas de

separación de medias aplicados.

Cuadro 14. Resumen de los resultados obtenidos al aplicar las pruebas de rangos

múltiples de DMS, Duncan, SNK, Tukey y Scheffé a un nivel de

significancia de = 0.05.

Tratamiento Promedio DMS Duncan SNK Tukey Scheffé

5 7.10125 a a a a a

4 7.055 a a a a a

3 4.94625 b b b b a

2 2.69125 c c c c b

1 2.665 c c c c b Promedios con literales distintas son estadísticamente diferentes (P ˂ 0.01).

Según Martínez Garza (1994) el método de Scheffé es más riguroso para detectar

diferencias significativas y esto se demuestra con los resultados expuestos en el Cuadro 14,

es por ello que se recomiendo usarlo a un = 0.1. Por otra parte se ha podido observar que

tanto SNK como Tukey tiende a no detectar diferencias estadística donde DMS y Duncan

lo han hecho con diferencias mayores.

Una discusión más fundamentada sobre las separaciones de medias puede encontrarse en

Steel y Torrie (1992) en su obra “Bioestadística: Principios y Procedimientos pero sí se

puede deducir que para experimentos en fases exploratorias es recomendable usar pruebas

que no sean tan rigurosas como es DMS, Duncan e inclusive SNK, sin embargo, si este no

es el caso y los promedios no han sido corregidos por efecto de covariable, es

recomendable Tukey y si se requiere una prueba más rigurosa sin importar si el

experimento es balanceado o no, si los promedios ha sido corregido o no por covariable, es

recomendable usar Scheffé.

Page 39: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

4. DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR (BCA) O CON DOS

CRITERIOS DE CLASIFICACIÓN

No siempre el material experimental es homogéneo limitando en este caso el uso del

Diseño Completamente al Azar (DCA). En estos casos es recomendable usar el Diseño en

Bloques Completamente al Azar.

4.1.¿Cuándo utilizar este diseño?

Este diseño se utiliza cuando el material experimental presenta un factor de “estorbo” que

no es de interés estudiar pero que sí puede afectar los resultados conllevando a conclusiones

erradas o bien los llamados efectos enmascarados. Tiene como principio maximizar la

variabilidad entre bloques y minimizar la variabilidad interbloque o variabilidad interna.

Esto se logra ya que las unidades experimentales dentro de cada bloque son homogéneas

pero son heterogéneas entre bloques.

Si se habla de un diseño en Bloques Completamente al Azar, deben existir tantas unidades

experimentales dentro de cada bloque como tratamientos se tenga, de manera que cada

tratamiento tenga una repetición en cada bloque. Esto al mismo tiempo se vuelve una

desventaja para este diseño ya que si se pierde una unidad experimental o más, se rompe el

principio de bloqueo ya que los tratamientos no tendrían el mismo número de repeticiones

dentro de cada bloque. Es por ello que en este caso para analizar este diseño se deben

estimar los datos perdidos conllevando a pérdidas de grados de libertad en el error y por

ende a un aumento del cuadrado medio del error.

El tema de estimación de datos perdidos no se desarrolla en este documento, pero se pueden

consultar las fuentes que citan al final del mismo.

4.2.Modelo Aditivo Lineal de un BCA

El modelo aditivo lineal para este diseño es el siguiente:

Donde:

Yij = Variable respuesta

= Efecto común a todas las observaciones

Bj = Efecto de la j-ésima repetición; j = 1, 2, 3,...r repeticiones

Ti = Efecto del j-ésimo tratamiento; i = 1, 2, 3, …i, tratamiento

Eij = Error experimental

Page 40: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

4.3. Análisis de Varianza para un BCA

Antes de exponer la salida de varianza y las ecuaciones de trabajo, se presenta un cuadro de

concentración o vaciamiento de información.

Cuadro 15. Concentración de los datos para un Diseño en Bloques Completamente al

Azar (BCA).

TRATAMIENTOS BLOQUES

ΣYi. 1 2 3 … j

1 Y11 Y12 Y13 Y1j Y1.

2 Y21 Y22 Y23 Y2j Y2.

3 Y31 Y32 Y33 Y3j Y3.

…i Yi1 Yi2 Yi3 Yij Yi.

ΣY.j Y.1 Y.2 Y.3 Y.j Y..

La salida de varianza de este diseño y de acuerdo a su modelo aditivo lineal es el siguiente:

Cuadro 15. Salida de varianza para un diseño en Bloques Completamente al Azar.

F.V gl SC CM Fc Ft

Bloque r-1 SCBloque CMBloque

( )

Tratamiento t-1 SCTRAT. CMTRAT.

( )

Error (t-1)(r-1) SCError CMError

Total tr-1 SCTotales

En este diseño se prueban dos juegos de hipótesis uno para bloques y otros para

tratamientos. Estas hipótesis son las siguientes:

Para tratamiento

Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0)

Ha: µ1 - µ2 - µ3 -… µi 0(T1 - T2 - T3 - …Ti 0).

Para Bloques

Ho: Bµ1 - Bµ2 - Bµ3 -… Bµj = 0 (B1 - B2 - B3 - …Bj = 0)

Ha: Bµ1 - Bµ2 - Bµ3 -… Bµj 0 (B1 - B2 - B3 …Bj 0).

Las ecuaciones de trabajo para realizar el análisis de varianza de este diseño son las

Page 41: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

siguientes:

; Factor de Corrección

( )

Ejemplo:

Un fisioterapeuta deseaba comparar tres métodos para enseñar a los pacientes el uso de

cierto aparato protético. Tenía la sensación de que la rapidez de aprendizaje sería diferente

para pacientes de diferentes edades y deseaba diseñar un experimento en el que pudiera

tomarse en consideración la influencia de la edad. Para ello selección tres pacientes en cada

uno de los cuatros grupos de edades para participar en el experimento y, en cada grupo de

edad se asignó un paciente aleatoriamente a cada uno de los métodos de enseñanza. Los

métodos de instrucción corresponden a los tratamientos y los cinco grupos de edades

corresponden a los bloques. La variable medida fue el tiempo (días) requerido para

aprender el uso de cierto aparato protético. Los datos son los siguientes:

Cuadro 16. Tiempo requerido para el manejo de un aparato protético bajo tres

modalidades de enseñanza en grupos de diferentes edades.

Método de

Enseñanza

Edades (años) ΣYi.

< a 20 20 a 29 30 a 39 40 a 49 50 y más

A 7 8 9 10 11 45

B 9 9 9 9 12 48

C 10 10 12 12 14 58

ΣY.j 26 27 30 31 37 151

Adaptado de Wyane (1970)

Realice el análisis de varianza correspondiente a un = 0.01.

Aplicando las ecuaciones de trabajo se tiene lo siguiente:

( )

Page 42: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

(7² + 8² +…14²)-1520.06667 = 46.93333

( )

( )

( )

Cuadro 17. Salida de varianza para el ejemplo de Diseños en Bloques Completamente

a Azar.

F.V gl SC CM Fc F(0.01)

Bloques 4 6.2333 14.38465 7.006

Tratamiento 2 9.26666 21.38458 8.649

Error 8 0.43333

Total 15 46.93333

Interpretación de Resultados

Es necesario recalcar que en un diseño de bloques completamente al azar la variable que se

está bloqueando no es de interés estudiar, en este caso, el fisioterapeuta está interesado en

el manejo del aparato protético sin embargo, el presume que la edad puede estar afectando

esta velocidad de aprendizaje en este tipo de pacientes y por ello que organiza el

experimento y agrupa las unidades experimentales de acuerdo a las edades de los paciente.

Cuando se establece un diseño en bloques completamente al azar, es necesario estar seguro

que en verdad el factor de estorbo existe, caso contrario se pierde grados de libertad en el

error, lo cual hace que las diferencias dentro de los tratamientos (error experimental) sean

mayores con las consecuencias que corresponden.

Para el caso del ejemplo, se puede verificar en la salida de varianza que existe diferencias

significativas (P 0.01) en bloques lo cual indica, que el investigador tenía razón en

realizar el bloqueo por edades de los pacientes. Esto indica también que la velocidad de

aprendizaje (vista como el manejo del aparato protético), se ve afectada por la edad.

Por otra parte, este mismo análisis indica que los métodos de enseñanza afectan o ejercen

efecto significativo en la velocidad de aprendizaje de los pacientes. Esto se puede concluir

a un 99% de confiabilidad.

Dado que el análisis de varianza reportó diferencias significativas en el tiempo de

Page 43: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

aprendizaje, se debe aplicar una prueba de rangos múltiples para verificar cuál de las

técnicas de enseñanza.

Para realizar lo antes expuesto lo primero que hay que hacer es ordenar las medias por

magnitud (descendente) como se muestra en el Cuadro 18.

Cuadro 18. Promedios por método de enseñanza utilizado.

Método de Enseñanza Promedios Método de Enseñanza Promedios Ordenados

A 9 C 11.6

B 9.6 B 9.6

C 11.6 A 9

Aplicando la prueba de Tukey a un = 0.01

1.65742075

Cuadro 19. Resultados de la aplicación de la prueba de Tukey a los promedios de los

Métodos de Enseñanza estudiados.

Comparaciones Diferencias de Medias Resultado de la Comparación

A versus B 2.0 *

A versus C 2.6 *

B versus C 0.6 ns Medias con literales distintas son diferentes estadísticamente (P 0.01).

Resumiendo los resultados de las comparaciones realizadas se puede resumir a través del

siguiente rango de mérito

Método de Enseñanza Comparación

C a

B b

A b

Page 44: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Lo anterior indica que el método donde los pacientes tardan menos son el A y el B, ambos

métodos son estadísticamente iguales, es decir, que ejercen el mismo efecto sobre el tiempo

que duran los pacientes para aprender el manejo de aparato protético y el método donde se

tarda más es el método C ya que aquí los pacientes tardan en promedio 11 días y que fue

diferente (P 0.01) a los demás métodos.

5. DISEÑO CUADRADO LATINO (DCL)

Anteriormente se han analizado los casos de los diseños Completamente al Azar

donde el material experimental tiene que ser homogéneo y Bloques al Azar, donde el

material experimental presenta un factor sistemático o de estorbo. Sin embargo, en la

investigación se presentan casos donde el material experimental presenta dos tipos de

efectos no sistemáticos o sea dos factores de estorbo, que no son de interés en la

investigación pero pueden afectar los resultados del experimento. Además, imposibilita el uso

de los diseños antes mencionados.

5.1. ¿Cuándo Utilizar este Diseño?

El diseño Cuadrado Latino, es considerado como una variante del diseño Bloques

al Azar. Este diseño es de gran utilidad cuando el material experimental presenta dos efectos

de estorbo. Permite controlar dos efectos sistemáticos que afectan al material experimental,

además del efecto de tratamiento que es el de interés estudiar. Tiene la característica de

controlar los efectos de estorbo a través de hileras y columna, o sea un doble bloqueo.

Para que los efectos de las hileras y las columnas no se confundan con el de los

tratamientos, éstos se ubican de tal forma que un tratamiento no se repite en la misma

columna y la misma hilera. Por esta razón, la cantidad de tratamiento coincide con el

mismo número de filas y columnas.

La principal restricción de este diseño es que el número de repeticiones es igual al número

de tratamiento, si este último es considerable el número de repeticiones requerido se vuelve

impracticable. Son pocos usados los Cuadros Latinos 12 x 12, mientras que el tamaño más

común es desde 5 x 5 hasta 8 X 8. Este diseño presenta hasta cier to punto la

misma desventa j a que los Bloques a l Azar de que, e l e r ro r experimental por

unidad, se aumente con el tamaño del cuadro.

Page 45: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

5.2. Modelo Aditivo Lineal de para un DCL

El modelo aditivo lineal para este diseño es el siguiente:

Yij(k) = µ + Hi + Cj + Tk(ij) + Eijk

Donde:

Yij (k) = Variable respuesta

µ = Efecto común a todas las observaciones

Hi = Efecto de la i - ésima hilera i = 1, 2, 3,... i hileras

Cj = Efecto de la j-ésima columna j = 1, 2, 3,… j columnas

Tk (ij) = Efecto del k-ésimo tratamiento en la i-ésima hilera y j-ésima columna k = 1, 2, 3,…

k tratamientos.

Ejk = Error del modelo

En este diseño se prueban hipótesis para columnas, hileras y tratamiento de la misma forma

que se ha hecho anteriormente, es decir, la hipótesis nula asume el efecto de igualdad en

caso y la alternativa su contradicción.

5.3. Análisis de Varianza para un diseño Cuadrado Latino DCL

Al igual que los casos anteriores, antes de exponer la salida de varianza, se muestra un

cuadro de concentración de información, que es de donde obtiene como tal al análisis de

varianza que se debe corresponder con el modelo aditivo lineal.

Cuadro 20. Cuadro de vaciamiento de información para un diseño Cuadrado Latino.

Hileras Columnas

ΣYi. C1 C2 C3 … Cj

H1 Y11 Y12 Y13 Y1j Y1.

H2 Y21 Y22 Y23 Y2j Y2.

H3 Y31 Y32 Y33 Y3j Y3.

… Hi Yi1 Yi2 Yi3 Yij Yi.

ΣY.j Y.1 Y.2 Y.3 Y.j Y..

Los tratamientos están entre las hileras y las columnas bajo las características que se han

mencionado anteriormente, es por ello que hay que hacer un resumen de los tratamientos en

otro cuadrado como se muestra a continuación.

Page 46: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 21. Resumen de la información de los tratamientos extraído de un diseño

Cuadrado Latino.

Tratamiento Repeticiones

ΣYi. R1 R2 R3 … Rj

T1 Y11 Y12 Y13 Y1j Y1.

T2 Y21 Y22 Y23 Y2j Y2.

T3 Y31 Y32 Y33 Y3j Y3.

… Tk Yi1 Yi2 Yi3 Yij Y..k

Y..1 Y..2 Y..3 Y..j Y…

La salida de varianza para un DCL es la siguiente:

Cuadro 22. Salida de varianza para un diseño Cuadrado Latino

FV gl SC CM Fc Ft

Hileras t-1 SCHileras CMHileras

( )

Columnas t-1 SCColumn CMColumn

( )

Tratamiento t-1 SCTRAT. CMTRAT.

( )

Error (t-1)(t-2) SCError CMError

Total t²-1 SCTotales

Las ecuaciones de trabajo para el análisis de varianza de este diseño son las siguientes:

(∑ )

( )

Ejemplo:

Page 47: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Se estudia la eficacia de cuatro fármacos diferentes (F1, F2, F3 y F4) en el tratamiento de

una enfermedad, para ello, se observa el número de días que tardan en curar los enfermos

tratados con estos fármacos. Se considera que el factor edad y el factor peso pueden influir

en el experimento, por ello, se controlan estos factores y se consideran cuatro niveles de

edad (E1, E2, E3 y E4) y cuatro de peso (P1, P2, P3 y P4). Los resultados del experimento

diseñado según la técnica del cuadrado latino se reportan en el Cuadro 23. ¿Qué

conclusiones se deducen del experimento a un nivel de significancia del 5%?”

Cuadro 23. Efecto de cuatro fármacos en los días para una curar una enfermedad en

pacientes de cuatro grupos etáreos y cuatro tipos de peso.

Peso Grupo Etáreo

E1 E2 E3 E4

P1 10.0 F1 9.5 F2 7.0 F4 11.5 F3

P2 8.0 F2 10.0 F1 8.5 F3 9.0 F4

P3 7.0 F3 6.5 F4 7.0 F1 8.0 F2

P4 6.0 F4 5.0 F3 6.0 F2 9.0 F1

Lo primero que se debe hacer es resumir la información para columnas e hileras. Esta es la

siguiente:

Peso Grupo Etáreo

ΣYi.. E1 E2 E3 E4

P1 10.0 9.5 7.0 11.5 38.0

P2 8.0 10.0 8.5 9.0 35.5

P3 7.0 6.5 7.0 8.0 28.5

P4 6.0 5.0 6.0 9.0 26.0

ΣY.j. 31.0 31.0 28.5 37.5 128.0

y la de tratamiento quedaría de la siguiente forma:

Fármaco

(Tratamiento) 1 2 3 4 ΣY..k

F1 10.0 10.0 7.0 9.0 36.0

F2 8.0 9.5 6.0 8.0 31.5

F3 7.0 5.0 8.5 11.5 32.0

F4 6.0 6.5 7.0 9.0 28.5

Page 48: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Con esta información se puede realizar el análisis de varianza

(∑ )

∑ ( )

( )

( )

( )

( )

( )

Resumiendo lo anterior en la salida de varianza correspondiente a este diseño se tiene lo

siguiente:

Cuadro 24. Salida de varianza para el diseño Cuadrado Latino del ejemplo.

F.V gl SC CM FC Ft (0.05)

Peso (Hileras) 3 24.125 8.0416667 10.432432 4.757

Grupo Etáreo (Columnas) 3 11.125 3.7083333 4.8108108 4.757

Fármaco (Tratamiento) 3 7.125 2.375 3.0810811 4.757

Error 6 4.625 0.7708333

Total 15 47.0

De acuerdo al análisis de varianza realizado se concluye al 95% de confiabilidad que existe

efecto significativo del peso en los días que tardan los enfermos en curarse, de igual manera

lo hicieron los grupos etáreos estudiados. Al revisar el efecto de los fármacos (tratamiento)

se observó que éstos ejercieron el mismo efecto en los días para curarse por lo tanto es

indistinto usar uno o el otro.

En este caso, al igual que en los bloques, si existe efecto de hileras o columnas se concluye

nada más que era necesario bloquear en ese sentido. Si se encuentra efecto de tratamiento,

se debe aplicar alguna prueba de rangos múltiples.

Page 49: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

6. DISEÑOS FACTORIALES

Como se mencionó en un principio, todos los diseños hasta ahora desarrollados son diseños

simples donde solo se ha analizado el efecto de tratamiento. Sin embargo, se presentan

situaciones donde la interrogante a investigar se encuentra supeditada por varios factores

controlables, por ejemplo:

El efecto de diferentes dosis de un desparasitante en niños de diferentes condiciones

sociales.

El efecto de diferentes productos para reducir triglicéridos en pacientes con distintas

condiciones corporales, etc.

En la parte introductoria de este documento se mencionó que un factor es un tratamiento

que genera más tratamiento (niveles de un factor). Puede ser que la reducción de los

triglicéridos pueda estar relacionada con tipo de producto y una condición corporal

determinada, es decir, puede ser que exista efecto de interacciones de los niveles de los

factores estudiados. Si bien es cierto que en algunos casos se pueden estudiar por separados

tales efectos, el tiempo que se requiere para obtener la repuesta es mayor y además muchas

veces se necesita aplicar ambos factores para ver el comportamiento de las interacciones de

los niveles de éstos.

Es por ello que una de las ventajas de este tipo de diseño es que además de estudiar los

efectos principales, se pueden estudiar las interacciones de los niveles de los factores

reduciendo el tiempo de experimentación y además proporcionando conclusiones más

concretas en el estudio.

Los diseños factoriales se dividen en diseños factoriales simples y diseños factoriales

complejo. Estos pueden ejecutarse en cualquiera de los diseños simples o clásicos hasta

ahora desarrollado, es decir, que se pueden tener diseños factoriales en un diseño

completamente al azar, en bloques completamente al azar y en cuadrado latino. De igual

forma se puede hacer en los diseños factoriales complejos, todo depende de las

características del material experimental que se utilice en el experimento.

A continuación se desarrollan diseños factoriales simples en arreglos completamente al azar

y en bloques completamente al azar.

Page 50: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

6.1. ¿Cuándo utilizar diseños factoriales simples en un arreglo completamente al

azar?

De cuando utilizar estos diseño se ha expuesto anteriormente por lo tanto solo se desarrolla

lo de completamente al azar. Los diseños factoriales simples en arreglo completamente al

azar su utilizan cuando se está interesado estudiar al mismo tiempo el efecto de dos o más

factores al mismo tiempo y el material experimental a usar es homogéneo, es decir, no

presenta factor de estorbo alguna que pueda afectar los resultados del experimento.

De forma general los diseños factoriales simples se puede clasificar de acuerdo al número

de factores que se estudien o bien de acuerdo a que si se estudian todos los niveles de los

factores (factoriales completos) o se estudian cierto niveles de éstos (factoriales

incompletos).

En función del número de factores que se estudien, los diseños factoriales pueden ser

bifactoriales, trifactoriales, etc. Generalmente es recomendable hasta tres por el efecto de

interpretación.

Para el análisis de experimentos factoriales se analizan primero los efectos principales

(factores individuales) y posteriormente las interacciones de los mismos. Hay autores que

mencionan que en caso de existir efecto de las interacciones no tiene sentido estudiar los

factores por separados ya que para ver el efecto en la variable respuesta se requiere de las

interacciones de los niveles de los factores en estudio.

6.2. Arreglo combinatorio

Como se ha mencionado anteriormente, un factor es una clase de tratamiento que genera

más tratamiento llamados niveles. Un nivel se refiere a los diferentes tratamientos dentro de

un factor y arreglo combinatorio se refiere a la combinación de los niveles de los factores

en estudio. Suponga que se tiene un factor A con tres niveles (a1, a2, a3) y un factor B con

cuatro niveles (b1, b2, b3, b4). En este caso se tiene un experimento bifactorial 3 x 4. El

arreglo combinatorio de estos dos factores sería el que se muestra en el Cuadro 25.

Cuadro 25. Arreglo combinatorio bifactorial 3 x 4.

Factor A Factor B

b1 b2 b3 b4

a1 a1b1 a1b2 a1b3 a1b4

a2 a2b1 a2b2 a2b3 a2b4

a3 a3b1 a3b2 a3b3 a3b4

Page 51: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

6.3.Modelo aditivo lineal

Para representar un experimento factorial se utiliza un modelo lineal que tome en

consideración la suma de una constante general común a todas las observaciones más los

efectos principales de los factores a estudiar así como los efectos secundarios

(interacciones) adicionándole finalmente un efecto aleatorio o error experimental. Además

se tiene que considerar en el modelo la forma de asignación de los tratamientos definidos

(interacciones) a las unidades experimentales. Esto quiere decir, que si el material

experimental es homogéneo, se hará en un arreglo completamente al azar, si hay un factor

de estorbo, entonces se hará en bloques completamente al azar, etc.

Es importante mencionar que en este tipo de experimentos factoriales, todos los factores se

estudian bajo un mismo rigor, cosa que no ocurres en los experimentos factoriales

complejos ya que en éstos se sacrifica precisión en uno para estudiar con mayor precisión el

otro.

Supóngase que en el ejemplo de arreglo combinatorio expuesto líneas arriba, se lleva a

cabo en un diseño o arreglo completamente al azar, entonces su modelo aditivo lineal sería

el siguiente:

( )

Yijk = Variable respuesta

µ = Efecto común a todas las observaciones

Ai = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor A

Bj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B

(A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor B

Eijk = Error del modelo

En este diseño se prueban hipótesis tanto para el factor A, factor B y para las interacciones,

bajo la misma tipología desarrollada en este documento (hipótesis nula e hipótesis

alternativa). En caso de rechazo de la hipótesis nula, se debe hacer prueba de rangos

múltiples según sea el caso

Un cuadro de vaciamiento de información para un diseño bifactorial un arreglo

completamente al azar se muestra a continuación.

Page 52: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 26. Cuadro de vaciamiento de información para un diseño bifactorial en un

arreglo completamente al azar.

Factor A Factor B Repeticiones

ΣYij. 1 2 3 …k

a1

b1 Y111 Y112 Y113 Y11k Y11.

b2 Y121 Y122 Y123 Y12k Y12.

b3 Y131 Y132 Y133 Y13k Y13.

bj Y1j1 Y1j2 Y1j3 Y1jk Y1j.

a2

b1 Y211 Y212 Y213 Y21k Y21.

b2 Y221 Y222 Y223 Y22k Y22.

b3 Y231 Y232 Y233 Y23k Y23.

bj Y2j1 Y2j2 Y2j3 Y2jk Y2i.

a3

b1 Y311 Y312 Y313 Y31k Y31.

b2 Y321 Y322 Y323 Y32k Y32.

b3 Y331 Y332 Y333 Y33k Y33.

bj Y3j1 Y3j2 Y3j3 Y3jk Y3j.

ai

b1 Yi11 Yi12 Yi13 Yi1k Yi1.

b2 Yi21 Yi22 Yi23 Yi2k Yi2.

b3 Yi31 Yi32 Yi33 Yi3k Yi3.

…bj Yij1 Yij2 Yij3 Yijk Yij.

De este cuadro se extrae la información de los efectos principales y secundarios

(interacciones) como se muestra en el Cuadro 27.

Cuadro 27. Información de los efectos principales y de las interacciones entre los

mismos.

Factor A Factor B

ΣYi.. b1 b2 b3 b4 …bj

a1 Y11. Y12. Y13. Y14. Y1j. Y1..

a2 Y21. Y22. Y23. Y24. Y2j. Y2..

a3 Y31. Y32. Y33. Y34. Y3j. Y3..

…ai Yi1. Yi2. Yi3. Yi4. Yij. Yi..

ΣY.j. Y.1. Y.2. Y.3. Y.4. Y.j. Y…

Las ecuaciones de trabajo son las siguientes:

(∑ )

Page 53: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

( )

( )

( )

( )

( )

La salida de varianza de acuerdo al modelo aditivo lineal sería la que se muestra en el

Cuadro 28.

Cuadro 28. Salida de varianza para un diseño bifactorial en un arreglo

completamente al azar.

F.V gl SC CM Fc Ft

Factor A a-1 SCA

F(,glA, gl Error)

Factor B b-1 SCB

F(,glB, gl Error)

A*B (a-1)(b-1) SCAB

( )( )

F(,glAB, gl Error)

Error ab(r-1) SCError

( )

Total abr-1 SCTotales

Si el diseño bifactorial se hubiera llevado a cabo en arreglo en bloques completamente al

azar el modelo aditivo lineal es el siguiente:

( )

Yijk = Variable respuesta

µ = Efecto común a todas las observaciones

Ai = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor A

Bj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B

(A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor B

αk = Efecto de k-ésimo bloque: k = 1, 2, 3,… bloques

Eijk = Error del modelo

Y la salida de varianza sería la que se muestra en el Cuadro 29.

Page 54: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 29. Salida de varianza para un diseño bifactorial en un arreglo de bloques

completamente al azar.

F.V gl SC CM Fc Ft

Bloque k-1 SCBloques

F(, glbloque, gl

Error

Factor A a-1 SCA

F(,glA, gl Error)

Factor B b-1 SCB

F(,glB, gl Error)

A*B (a-1)(b-1) SCAB

( )( )

F(,glAB, gl Error)

Error (ab-1)(r-1) SCError

( )

Total abr-1 SCTotales

En este caso se adicionaría una hipótesis más que sería la de bloque y si hubiera un rechazo

de Ho, la interpretación sería la misma que se ha mencionado anteriormente.

Ejemplo

Un médico está interesado en determinar si tanto el estado nutricional como la edad (grupo

etáreo) de la madre tiene efecto sobre el peso del recién nacido. Los estados nutricionales

de su interés fueron: Normal, Sobrepeso y Obesa, y los grupos etáreos fueron: menores a 15

años, 15 a 18 años, 19 a 30 años y mayores a 30 años. Seleccionó de forma aleatoria cuatro

madres para cada combinación de los niveles de los dos factores, estado nutricional y grupo

etáreo). Los pesos obtenidos en gramos fueron los que se reportan en el Cuadro 30.

En este caso se tiene un experimento bifactorial, Estado Nutricional y Grupo Etáreo, cada

uno con tres y cuatro niveles, respectivamente. Esto hace que se tenga un bifactorial 3 x 4

(esto vendría a ser un factorial completo asimétrico, asimétrico por no tienen el mismo

número de niveles y completo por se estudian todos los niveles que han sido propuestos por

el investigador. Por otra parte se tiene cuatro repeticiones por tratamiento (combinación),

entonces viene a ser un bifactorial 3 x 4 con 4 repeticiones, haciendo un total de 48

unidades experimentales como se muestra en el Cuadro 30.

Para los datos del Cuadro 30 realice lo siguiente:

a. Proponga y describa un modelo aditivo lineal para el experimento.

b. Proponga los juegos de hipótesis a probar.

c. Realice el análisis de varianza correspondiente de acuerdo al modelo aditivo lineal

Page 55: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

propuesto en el inciso a., a una significancia del 1%. Realice conclusiones.

d. Si existe rechazo de Ho en cualquiera de los factores como en las interacciones de

los mismos, realice la prueba de rangos múltiples de Tukey al 99% de confiabilidad.

Emita conclusiones

Cuadro 30. Pesos de los recién nacidos de acuerdo al estado nutricional de la madre y

al grupo etáreo de las mismas.

Estado Nutricional Grupo Etáreo Repeticiones

1 2 3 4

Normal

Menor de 15 1800 1900 1700 2000

15 a 18 2000 2400 2900 3000

19 a 30 3000 2800 2900 3200

Mayor a 30 3100 3300 2600 2800

Con sobrepeso

Menor de 15 2100 1800 1900 2200

15 a 18 2500 2900 3200 2900

19 a 30 2700 2900 3100 3500

Mayor a 30 2900 2600 3200 2700

Obesa

Menor de 15 3000 2800 2400 2500

15 a 18 3100 3300 2900 3400

19 a 30 2800 2500 3200 3100

Mayor a 30 2800 3100 3400 3500

Dado que este experimento fue realizado en un arreglo completamente al azar no es

necesario totalizar las columnas por lo tanto se procede a continuación a obtener la

información de las interacciones de los niveles de los factores estudiados. Para ello es

necesario totalizar en fila las interacciones como se muestra en el Cuadro 31 posteriormente

hacer en cuadro de las interacciones que conllevaran a los totales de los efectos principales

como se reporta en el Cuadro 32, estos totales se muestran tanto en la suma de las hileras

como de las columnas de acuerdo a como se dispongan los factores (totales marginales) y

los valores de las interacciones están dentro del cuadro.

Page 56: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 31. Datos del experimento con las interacciones totalizadas.

Estado

Nutricional

Grupo

Etáreo

Repeticiones ΣYij.

1 2 3 4

Normal

Menor de 15 1800 1900 1700 2000 7400

15 a 18 2000 2400 2900 3000 10300

19 a 30 3000 2800 2900 3200 11900

Mayor a 30 3100 3300 2600 2800 11800

Con sobrepeso

Menor de 15 2100 1800 1900 2200 8000

15 a 18 2500 2900 3200 2900 11500

19 a 30 2700 2900 3100 3500 12200

Mayor a 30 2900 2600 3200 2700 11400

Obesa

Menor de 15 3000 2800 2400 2500 10700

15 a 18 3100 3300 2900 3400 12700

19 a 30 2800 2500 3200 3100 11600

Mayor a 30 2800 3100 3400 3500 12800

Cuadro 32. Efectos principales e interacciones de los factores Estado Nutricional y

Grupo Etáreo.

Estado

Nutricional

Grupo Etáreo (años) ΣYi..

Menor de 15 15 a 18 19 a 30 Mayor a 30

Normal 7400 10300 11900 11800 41400

Con sobrepeso 8000 11500 12200 11400 43100

Obesa 10700 12700 11600 12800 47800

ΣY.j. 26100 34500 35700 36000 132300

Desarrollando las actividades solicitadas para el ejemplo se tiene lo siguiente:

a. Modelo aditivo lineal

( )

Yijk = Variable respuesta (peso de los recién nacidos)

µ = Efecto común a todas las observaciones

Ni = Efecto del i-ésimo estado nutricional; i = Normal, Con sobrepeso y Obesa

Gj = Efecto del j-ésimo grupo etáreo; menores de 15, 15 a 18, 19 a 30 y mayores a 30 años

(N*E)ij = Efecto de la interacción del i-ésimo nivel del factor Estado Nutricional con el j-

ésimo nivel del factor Grupo Etáreo

Eijk = Error del modelo

Page 57: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

b. Juego de Hipótesis

Como existen dos factores y sus interacciones, las hipótesis son las siguientes:

Para el factor Estado Nutricional:

Ho: µNormal- µSobre peso- µObesa = 0

Ha: µNormal- µSobre peso- µObesa 0

Para el factor Grupo Etáreo:

Ho: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años = 0

Ha: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años 0

Para las interacciones:

Ho: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4 = 0

Ha: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4 0

c. Análisis de varianza

(∑ )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

Con estos cálculos se construye la salida o tabla de varianza como se muestra en el Cuadro

33.

Page 58: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Cuadro 33. Salida de varianza para el diseño bifactorial en un DCA del ejemplo.

F.V gl SC CM Fc Ft (0.01)

Estado Nutricional 2 1373750 686875 8.3609467 5.248

Grupo Etáreo 3 5510625 1836875 22.359256 4.377

Interacción 6 1196250 199375 2.4268808 3.351

Error 36 2957500 82152.778

Total 47 11038125

De acuerdo a los resultados del análisis de varianza se puede concluir con 99% de

confiabilidad que el peso de los recién nacidos se ve afectado por el Estado Nutricional y

por el Grupo Etáreo de las madres, es decir, que ejercen efectos significativos (P < 0.01) en

el peso de los recién nacidos, no así las interacciones de los niveles estudiados ya que ésta

resultó ser no significativa. Esto indica que los factores estudiados ejercen efectos aditivos

o bien que actúan de forma independiente en la variable respuesta.

d. Separación de media de Tukey al 99% de confiabilidad

Cuando se dan este tipo de resultados hay que determinar el nivel o niveles de cada factor

que provocaron el rechazo de la hipótesis nula en el análisis de varianza. Para ello hay que

hacer los ajustes necesarios como se muestra en el Cuadro 34.

Cuadro 34. Ajuste de los efectos principales y secundarios para la separación de

medias.

Efecto Total Promedio Ajuste

A ΣYi..

B ΣY.j.

AB ΣYij.

Aplicando estos ajustes para los efectos principales se tiene lo siguiente:

Page 59: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Estado Nutricional Totales Promedio

Normal 41400 2587.5

Con sobrepeso 43100 2693.75

Obesa 47800 2987.5

Aplicando Tukey para el factor Estado Nutricional se tiene lo siguiente:

Ordenando los promedios de los niveles del factor Estado Nutricional y estableciendo las

comparaciones correspondiente se tiene lo siguiente:

Estado Nutricional Promedio Comparaciones Diferencias Resultado

Obesa 2987.5 Obesa-Sobrepeso 293.75 ns a

Con sobrepeso 2693.75 Obesa- Normal 400 * ab

Normal 2587.5 Sobrepeso - Normal 106.25 ns b

En este caso se puede decir que de los niveles del factor Estado Nutricional, solo el nivel

Obesa ejerció un efecto distinto (P <0.01) en el peso de los recién nacidos.

Los ajustes para los niveles del factor Grupo Etáreo se tiene lo siguiente:

Grupo Etáreo Totales Promedio

Menor de 15 26100 2175

15 a 18 34500 2875

19 a 30 35700 2975

Mayor a 30 36000 3000

Aplicando la Tukey para los niveles del factor Grupo Etáreo

Ordenando los promedios de los niveles del factor Grupo Etáreo y estableciendo las

comparaciones correspondiente se tiene lo siguiente:

Page 60: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

Comparaciones Diferencias

Mayor a 30 - 19 a 30 25 ns

Mayor a 30 - 15 a 18 125 ns

Mayor a 30 - Menor a 15 825*

19 a 30 - 15 a 18 100 ns

19 a 30 - Menor a 15 800 *

15 a 18 - Menor a 15 700 *

Grupo Etáreo Promedio Resultado

Mayor a 30 3000 a

19 a 30 2975 a

15 a 18 2875 a

Menor de 15 2175 b

De acuerdo a los resultados de Tukey se puede concluir que de los niveles del factor Grupo

Etáreo, solamente uno de éstos ejerció un efecto distinto el peso de los recién nacidos como

las madres menores de 15 años.

Page 61: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

BIBLIOGRAFIA CONSULTADA PARA ESTRUCTURAR EL DOCUMENTO

COCHRAN, W. y G.M. COX. 1991. Diseños Experimentales. 2da. Edic. Edit. Trillas.

México, D.F.

FREUD, R.J. and R.C. LITTELL. 1991. SAS System for Regression. SAS Institute Inc,

Cary. N.C. USA.

HERRERA HARO, J.G y G. LORENZANA. 1994. Aplicaciones del SAS (Statistical

Analysis System) a los Métodos Estadísticos. Instituto Tecnológico Agropecuario

de Oaxaca. Oaxaca, México.

HILDERBRAND, P.E. y F. POEY. 1989. Ensayos Agronómicos en Fincas según el

Enfoque de Sistemas Agropecuarios. Edit. Agropecuaria Latinoamericana, Inc.

Estados Unidos de Norteamérica.

INFANTE GIL, S. y G. ZARATE DE LARA. 1990. Métodos Estadísticos. Un enfoque

interdiciplinario. 2da. Edic. Edit. Trillas. México, D.F.

LITTLE, T. y F.J. HILLS. 1989. Métodos Estadísticos para la Investigación Agropecuaria.

2da. Edic. Edit. Trillas. México, D.F.

LOPEZ, P.F. 1989. Uso del SAS para análisis estadísticos de datos experimentales. Centro

Agronómico Tropical de Investigación y Enseñanza C.A.T.I.E. Turrialba, Costa

Rica.

MARTINEZ-GARZA, A. 1988. Diseños Experimentales. Métodos y Elementos de Teoría.

Edit. Trillas. México, D.F,

MARTINEZ-GARZA, A. 1994. Experimentación Agrícola. Métodos Estadísticos.

Universidad Autónoma Chapingo. Chapingo, México.

MARTINEZ SOLARIS, F. 2111.

http://cdn.slidesharecdn.com/ss_thumbnails/estadisticaydiseosexperimentales-

110925201348-phpapp02-thumbnail.jpg?1316999785

Page 62: ESTADISTICA APLICADA A LA EDUCACIÓN SUPERIOR.pdf

Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior

MONTGOMERY, D.C. 1991. Diseños y Análisis de Experimentos. Edit. Iberoaméria.

México, D.F.

STEEL, R.G.D. y J.H. TORRIE. 1992. Bioestadística. Principios y Procedimientos. 2da.

Edic. Edit. McGraw-Hill. México, D.F.

RAO, C.R. 1952. Advanced statistical methods in biometric reseach. John Wiley. New

York, USA.

RENDON, S.G. 1992. Métodos Estadísticos (Muestreo, Diseños Experimentales,

Estadística No Paramétrica). Universidad Autónoma de Chapingo. Chapingo,

México.

REYES, C.P. 1992. Diseño de Experimentos Aplicados: Agronomía, Biología, Química,

Industrias, Ciencias Sociales. 3era Edic. Edit. Trillas. México, D.F.

RODRIGUEZ del ANGEL, J.M. 1991. Métodos de Investigación Pecuaria. Edit. Trillas.

México, D.F.

WAYNE W. D. 1977. Estadística con Aplicaciones a las Ciencias Sociales y a la

Educación. Edit. McGraw-Hill. México.