modelos espaciales para experimentos de gran tamaño

PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE FACULTAD DE AGRONOMIA E INGENIERIA FORESTAL

DIRECCION DE INVESTIGACION Y POSTGRADO PROGRAMA DE POSTGRADO EN CIENCIAS DE LA AGRICULTURA

MAGISTER EN CIENCIAS VEGETALES TESIS DE GRADO

USO DE MODELOS ESPACIALES PARA EL ANALISIS ESTADISTICO DE EXPERIMENTOS AGRONOMICOS DE GRAN

TAMAÑO

GIOVANNI VERGES SAN MARTIN

SANTIAGO-CHILE 2004

USO DE MODELOS ESPACIALES PARA EL ANALISIS ESTADISTICO DE EXPERIMENTOS AGRONOMICOS DE GRAN TAMAÑO

Tesis presentada como requisito para optar al grado de

Magíster en Ciencias Vegetales

por:

Giovanni Vergés San Martín

Comité de Tesis Profesor Guía: Rodrigo Ortega, Ing. Agr., M. Sc., Ph. D.

Profesores Informantes: Hugo Campos, Ing. Agr., Ph. D.

Marcelo Kogan, Ing. Agr., M. Sc., Ph. D.

2004 Santiago-Chile

PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE FACULTAD DE AGRONOMIA E INGENIERIA FORESTAL

DIRECCION DE INVESTIGACION Y POSTGRADO PROGRAMA DE POSTGRADO EN CIENCIAS DE LA AGRICULTURA

MAGISTER EN CIENCIAS VEGETALES

AGRADECIMIENTOS A Semillas Pioneer Chile Limitada por el financiamiento que hizo posible la presente

investigación, así como al Sr. Miguel Ibáñez, ingeniero agrónomo, por la conducción de

los experimentos de campo.

Al Laboratorio de Servicios de la Pontificia Universidad Católica de Chile, en especial al

Sr. Ricardo Valdés y al Sr. Manuel Araya por su ayuda en el análisis químico de las

muestras de suelo.

Al Centro de Agricultura de Precisión de la Universidad Católica (CAPUC), en especial

a Andrés Esser por su ayuda y el facilitarme los software necesarios para el desarrollo

de esta tesis.

A mi profesor guía el Dr. Rodrigo Ortega por su amistad e inspirar y darme la confianza

de realizar esta tesis.

A mi profesor informante el Dr. Hugo Campos, por los acertados comentarios,

sugerencias y revisiones que proporcionó durante el transcurso de esta tesis .

A mi tío el Sr. Carlos Vergés por financiar y hacer posible la realización de mi

postgrado.

Y por último pero no menos importante al Dr. Patricio Parodi, por todo su infinita

preocupación que me brindó extra académicamente durante mi vida universitaria, como

también su incondicional amistad que lo ha llevado a que lo estime como alguien de mi

propia familia.

“…Un viaje de ilusiones y anhelos comencé a través de un difícil sendero me llevó

cansado y desalentado caminé mas al final del recorrido una luz resplandeció

un manantial de esperanza y energía fue de voluntad mi corazón se llenó

un sueño inalcanzable conquisté y una nueva vida comenzó…”

A mis padres

1

INDICE

RESUMEN.......................................................................................................................4

ABSTRACT......................................................................................................................5

1. INTRODUCCIÓN.........................................................................................................6

2. ANTECEDENTES GENERALES.................................................................................9

2.1 Variabilidad Espacial....................................................................................8

2.1.1 Formación de los suelos...............................................................9

2.1.1.1 Material de origen............................................................11

2.1.1.2 Relieve.............................................................................11

2.1.1.3 Clima................................................................................11

2.1.1.3.1 Temperatura......................................................12

2.1.1.3.2 Precipitación......................................................12

2.1.1.3.3 Viento................................................................12

2.1.1.4 Organismos.....................................................................13

2.1.1.5 Tiempo.............................................................................13

2.1.2 Factores antrópicos.....................................................................13

2.2 Diseño experimental...................................................................................15

2.2.1 Prueba de hipótesis.....................................................................15

2.2.2 Diseño experimental……….. ......................................................18

2.2.2.1 Error experimental...........................................................19

2.2.2.2 Repeticiones....................................................................20

2.2.2.3 Aleatorización..................................................................22

2.2.2.4 Diseños............................................................................22

2

2.2.3 Análisis de varianza……………...…….……………………………27

2.2.3.1 Prueba de F.....................................................................29

2.2.3.2 Supuestos del análisis de varianza…..............................31

2.3 Geoestadística............................................................................................32

2.3.1 Teoría de la variable aleatoria.....................................................33

2.3.1.1 Características de una función aleatoria.........................34

2.3.2 Análisis de dependencia espacial..............................................36

2.3.2.1 Autocorrelación................................................................37

2.3.2.2 Variograma......................................................................37

2.3.3 Interpolaciones.............................................................................40

2.3.4 Validación cruzada.......................................................................41

2.3.5 Geoestadística aplicada al diseño experimental......................42

2.4 Análisis estadístico espacial……..............................................................44

2.4.1 Variabilidad espacial y error experimental................................44

2.4.2 Violación de supuestos del análisis de varianza......................46

2.4.3 Remoción de la variabilidad espacial........................................48

2.4.3.1 Método de Papadakis......................................................50

2.4.3.2 Análisis de tendencia.......................................................51

2.4.3.3 Errores correlacionados...................................................53

2.4.3.4 Análisis de tendencia más Error correlacionado……......54

2.4.3.5 Estimación geoestadística...............................................55

3

3. MATERIALES Y MÉTODOS.....................................................................................57

3.1 Material experimental.................................................................................57

3.2 Caracterización y mapeo del sitio experimental......................................57

3.3 Análisis estadístico....................................................................................59

3.4 Análisis estadístico utilizando modelos espaciales...............................61

3.5 Análisis geoestadístico..............................................................................63

3.6 Análisis estadístico utilizando diseños experimentales asociados a

zonas…..............................................................................................................64

4. DISCUSION DE RESULTADOS................................................................................67

5. CONSIDERACIONES FINALES................................................................................99

6. BIBLIOGRAFÍA.......................................................................................................105

7. ANEXOS..................................................................................................................115

4

RESUMEN

Vergés, G. 2004. Uso de modelos espaciales para el análisis estadístico de

experimentos agronómicos de gran tamaño. Tesis, Magíster en Ciencias Vegetales,

Facultad de Agronomía e Ingeniería Forestal, Pontificia Universidad Católica de Chile.

Santiago, Chile. 141 pp.

En experimentos de gran tamaño, la variación en las propiedades del suelo puede

resultar en un efecto sobre el rendimiento, debido a una correlación positiva o negativa

entre estas y el rendimiento. Esta heterogeneidad puede incrementar el error

experimental produciendo una estimación insuficiente de los tratamientos. La precisión

de la estimación puede mejorarse empleando análisis estadísticos en los cuales la

variabilidad espacial puede ser removida para la estimación de los efectos de los

tratamientos. Algunos de estos análisis espaciales son el método de Papadakis,

análisis de tendencia y análisis basados en modelos con errores correlacionados, en

los cuales la variación espacial es medida por medio de la correlación entre

rendimientos de parcelas vecinas. Esta tesis presenta los resultados del uso de zonas

geográficas como modelo espacial para controlar la variabilidad espacial y mejorar la

interpretación del análisis de varianza. Se obtuvieron los datos de rendimiento de 360

híbridos de maíz bajo los tratamientos de estrés hídrico y riego normal en un diseño de

α - lattice. Basado en la teoría de la variable regionalizada y el uso del análisis de

agrupamiento, se construyeron zonas geográficas homogéneas, sobre las cuales se

sobrepusieron los rendimientos y se realizó el análisis de varianza de los híbridos

pertenecientes a cada zona. La eficiencia relativa fue utilizada para comparar las zonas

con los modelos espaciales y con los diseños experimentales α - lattice y bloques

completos al azar. Los resultados indican que frente a un alto coeficiente de variación

de los datos de rendimiento, el uso de zonas es mejor que los diseños experimentales

y los modelos espaciales. Sin embargo, frente a un bajo coeficiente de variación, la

utilización de diseño experimental adecuado es suficiente para controlar la variabilidad

espacial. No obstante, el uso de zonas asegura la independencia de los errores,

supuesto necesario del análisis de varianza para que los resultados sean válidos, el

cual no se cumple con el uso de diseños experimentales.

Palabras claves: zonas homogéneas, autocorrelación, dependencia espacial,

modelos espaciales

5

ABSTRACT

Vergés, G. 2004. Use spatial models in the statistic analysis of large field trials.

Tesis, Magíster en Ciencias Vegetales, Facultad de Agronomía e Ingeniería Forestal,

Pontificia Universidad Católica de Chile. Santiago, Chile. 141 pp.

In large yield trials, grain yield and other variables can be affected by variations in soil,

due to a positive or negative correlation between the variables under study and soil

properties. This heterogeneity increases experimental error, therefore decreases the

power to estimate treatments means. Precision can be improved using statistical

analyses that take into account spatial variability in the estimation of means. There are

several spatial models, such as trend analysis, Papadakis method, and models that

account for spatial variation through a correlation analysis between yields of adjacent

plots. This thesis implemented geographical zonification as a spatial model to account

for soil spatial heterogeneity and to improve the output from analyses of variance.

Three hundreds and sixty hybrids were field tested under water stress and normal

irrigation conditions using an α - lattice experimental design. Homogeneous zones were

constructed using the theory of regionalized variables and cluster analysis, and

analyses of variance were conducted on hybrid grain yield belonging to each zone.

Relative efficiency was used to compare zones with experimental design α - lattice,

random complete blocks and spatial models. Data suggests that zonification

outperformed the use of experimental design and spatial models when high coefficients

of variation are observed. On the other hand, when low coefficients of variation are

observed, the use of appropriate experimental design is enough to control the spatial

variability. The use of zonification ensures independency of errors, one of the

assumptions analyses of variance rely upon.

Key words: management zones, autocorrelation, spatial dependency, spatial

models.

6

1. INTRODUCCION

La variación espacial es producida por la combinación de distintos factores como el

material generador, relieve, clima, organismos y tiempo (Jenny, 1941), a lo que se

debe sumar la acción antrópica (Belobrov 1976; Jenny, 1941; Ortega y Flores, 1999).

Esto trae como consecuencia que la heterogeneidad del suelo varíe de localidad en

localidad, siendo específica a cada superficie ó, como es llamada, sitio específico.

Esta variación no es aleatoria, en otras palabras, no presenta cambios abruptos a lo

largo del campo, más bien es función de la distancia, valores cercanos tienden a ser

más parecidos de los más lejanos (Steel y Torrie, 1960).

Esta correlación espacial ó autocorrelación esta presente en todos los suelos, por lo

que al presentarse valores cercanos semejantes, estos presentan una varianza menor.

Variables que se comportan de esa manera se conocen como variables espacialmente

dependientes ó autocorrelacionadas.

La variabilidad espacial afecta los rendimientos de los cultivos, la cual a sido

reconocida por los agricultores (Gotway et al. 1997), ya que uno de los factores que

más afectan al rendimiento son las propiedades físico − químicas del suelo (Trangmar

et al., 1987; Camberdella et al., 1994; Ortega et al., 1999). Esta heterogeneidad

sistemática sigue un modelo o estructura espacial y los rendimientos tienden a seguir

el modelo de las variables del suelo que más lo afectan.

Pero no sólo el cultivo de una especie se ve afectada por la variabilidad espacial, los

experimentos de campo también son afectados, ya que al ensayar un tratamiento

sobre los cultivos, generalmente la variable medida es la del rendimiento.

Fisher (1925), al introducir el análisis de varianza para la cuantificación de la diferencia

en los tratamientos, implementó la aleatorización, la que no sólo evita el sesgo del

análisis, sino también produce la independencia de las muestras, supuesto necesario

para la validación del análisis. Este mismo autor, al reconocer la existencia de la

variabilidad espacial, incorporó el sistema de bloqueo con el fin de controlar la

heterogeneidad del suelo, maximizando la variabilidad entre bloques y minimizándola

dentro del bloque, ya que se asume que la desigualdad espacial dentro del bloque es

homogénea.

El inconveniente de la variación espacial, es que la incorporación de los bloques

homogéneos no es suficiente para controlar la variabilidad dentro del bloque (Bhatti et

7

al., 1991), lo que produce que los supuestos del análisis de varianza, como es el caso

de la independencia de los errores, fallen y aumente el error experimental, por lo que el

análisis estadístico no sería completamente válido.

Frente a este problema los estadísticos, ingenieros agrónomos y científicos del suelo,

en el transcurso de la historia, han tratado de sobrellevar este problema. Smith (1938),

propuso una ley empírica de la heterogeneidad de la fertilidad del suelo y como se

correlaciona con el rendimiento, estableciendo una relación inversa entre el tamaño de

la parcela y la varianza del rendimiento.

Para superar el problema de variación espacial y su consecuente autocorrelación

espacial, el ingeniero agrónomo griego Jean Papadakis (1937), propuso el uso de los

residuales de las parcelas vecinas como covariante para proveer un acercamiento

estadístico al uso de las parcelas controles, convirtiéndose en el trabajo de base para

el desarrollo de otros métodos estadísticos que utilizan las parcelas vecinas para

ajustar los rendimientos, conocidos actualmente como análisis del vecino más cercano.

También se han desarrollado otros métodos alternativos que incluyen la variación

sistemática, como el análisis de tendencia propuesto por Kirk et al. (1980), en el que se

describe la heterogeneidad espacial por medio de una función polinomial y la

aproximación de campo variable introducido por Zimmerman y Harville (1991), en la

que se ajusta la variación local, dividida en gran escala y pequeña escala, por medio

de la modelación de la pequeña escala a través de la estructura espacial de los

residuales.

El desarrollo de la geoestadística propuesta por Matheron (1962), para solucionar el

problema de la estimación minera, ha impulsado el uso de las herramientas como el

variograma y la interpolación al estudio agrícola. Este nuevo enfoque sumado al

desarrollo de los sistemas de posicionamiento global (GPS), ha desplegado nuevos

métodos para el estudio de la variación espacial, como es el caso de la estructuración

de las propiedades físico − químicas del suelo y la estimación de sus valores en

sectores que no se ha hecho un muestreo. Los diseños experimentales también se han

visto favorecidos por este nuevo enfoque, como el propuesto por van Es et al. (1989)

en la que utiliza la teoría de la variable aleatoria para la configuración espacial de un

diseño experimental y el propuesto por Fagroud y Van Meirvenne (2002), el que por

medio del uso de variogramas determinan el tamaño, forma, número de parcelas por

bloque y la orientación de los bloques. En cuanto a la remoción de la variabilidad

8

espacial para validar el análisis de varianza, Hernández y Mulla (2002), proponen la

incorporación de kriging al análisis del vecino más cercano para mejorar la

interpretación de los datos.

Estos son ejemplos del creciente interés de los científicos por enfrentar y solucionar el

inconveniente de la falta de ajuste de los tratamientos, en experimentos de campo, por

el efecto de la variabilidad espacial.

El objetivo principal de esta tesis es proponer la incorporación de las zonas geográficas

homogéneas como factor de control de la variabilidad espacial para mejorar la

interpretación del análisis de varianza, demostrando como objetivos secundarios, la

violación de supuestos del análisis de varianza, la variabilidad sitio específica de las

muestras de suelo, la correlación que existe entre las propiedades químicas del suelo y

el rendimiento, la utilidad de las herramientas geoestadísticas y, el beneficio y

conveniencia que presentan los métodos estadísticos no tradicionales para la remoción

de la variabilidad espacial, para la validación del análisis de varianza.

9

2. ANTECEDENTES GENERALES

2.1 VARIABILIDAD ESPACIAL

La variabilidad espacial de las propiedades del suelo ha sido reconocida desde los

inicios de la agricultura (Gotway et al., 1997; Wilding y Smeck, 1983), y una forma de

medir variabilidad es por medio de la desviación estándar, la que se calcula como la

raíz de la suma de las desviaciones al cuadrado dividido por sus grados de libertad

(Mendenhall y Ott, 1980), esto corresponde a la medición de la disparidad de las

observaciones medidas de una propiedad en el espacio.

La alta o baja variación espacial que presentan los suelos es atribuida a los factores de

su formación como también al manejo agronómico de los mismos (Belobrov 1976;

Jenny, 1941; Ortega y Flores, 1999).

2.1.1 Formación de los suelos

El suelo corresponde a un sistema de tres fases. La fase sólida se forma por el material

mineral y material orgánico, la fase gaseosa por la atmósfera del suelo, mientras que la

fase líquida se constituye por las soluciones del suelo. La proporción de agua y de aire

está sujeta a grandes fluctuaciones dentro de un mismo suelo por influencia del clima y

del manejo (Honorato, 1993). La porción de los constituyentes sólidos es igualmente

variable, el material orgánico esta formado por diversas fuentes orgánicas que se

encuentran en distintos grados de descomposición, y el material mineral corresponde a

una mezcla de varios componentes, con características y propiedades diversas.

Estos componentes se encuentran íntimamente interrelacionados (Hardy, 1970;

Honorato 1993) y provienen de un proceso dinámico y formativo del suelo

caracterizado por tres procesos distintos (Cobertera, 1993):

1. Un proceso de descomposición y de alteración del material originario, es decir la

roca madre, con la formación de un complejo de alteración que incluye procesos de

neoformación de minerales secundarios a partir de los primarios del material original.

2. Un proceso cíclico de formación y mineralización de humus a partir de restos

vegetales depositados sobre el suelo, alcanzando un equilibrio entre los depósitos

10

orgánicos, la humificación de los mismos, su mineralización y su retorno a formas

orgánicas a través de las plantas.

3. Un proceso de transporte de la materia soluble y coloidal del suelo a través de su

propio perfil, con la consiguiente formación de horizontes de lavado y acumulación

(eluviación e iluviación).

La superficie del planeta no es uniforme y varia en distintas regiones naturales. Cada

una de esas regiones, se distinguen unas de otras por las diferentes características

que presentan (De Oliveira, 1975), como:

a. Topografía

b. Cobertura vegetal

c. Suelo

d. Régimen climático

e. Altitud

f. Edad de las superficies

De esta manera, Jenny (1941), retomando conceptos inicialmente enunciados por

Dokuchaeiv en 1883, establece la siguiente fórmula:

[2.1] ( )toclrmgS ,,,,=

donde: S = Suelo

mg = material generador

r = relieve

cl = clima

o = organismos

t = tiempo

En consecuencia, el suelo es función de estos factores y su combinación genera los

diversos tipos de suelos (De Oliveira, 1975; Honorato 1993).

11

2.1.1.1 Material de origen

El material de origen no es necesariamente una roca consolidada, en especial en

zonas tropicales, De Oliveira (1975) señala cuatro principales grupos de material

original:

1. Rocas y sedimentos consolidados in situ: Afloraciones rocosas y los sedimentos no

consolidados, recientes, como rocas cristalinas y aluviales.

2. Productos de alteración de rocas in situ: Espesas capas formadas en zonas

tropicales húmedas, bajo cobertura vegetal protectora.

3. Productos de a alteración remanejados: Corresponden a evidencias debido a líneas

de piedras (stone-lines) o restos de protección laterítica. Las causa principales de la

alteración son la erosión, flora y fauna.

4. Productos de la pedogénesis anterior: Son el resultado del remanente y transporte

de capas alteradas en profundidad, provenientes sobre todo de materias superficiales

que ya tuvieron una alteración pedogénica. Esos materiales pudieron haber sido

transportado por erosión o remanejados in situ, bajo la influencia de la flora y fauna.

2.1.1.2 Relieve

Se refiera a la forma del terreno que compone un paisaje. Su acción se refleja

principalmente sobre la dinámica del agua, en el sentido vertical (infiltración) y

horizontal (run-off), así como indirectamente sobre la temperatura y radiación.

D’Hoore (1970), reconoce tres zonas del paisaje, que pueden adquirir grandes

individualidades: zonas de exportación, zonas de pasada y zonas de acumulación. Las

pendientes tienen una gran importancia en la formación del suelo, pero también en el

movimiento del agua sobre la superficie y en la infiltración al interior del suelo.

2.1.1.3 Clima

Corresponde a un conjunto de fenómenos metereológicos (temperatura,

precipitaciones, viento, entre otros), que caracterizan una localidad.

12

Los elementos del clima que poseen una mayor incidencia sobre la formación del suelo

son:

• Temperatura

• Precipitaciones

• Vientos

2.1.1.3.1 Temperatura

Este factor afecta principalmente las reacciones bioquímicas de la pedogénesis,

caracterizado en la proporción:

[2.2] aTemperatur

reaccióndeVelocidad

Los organismos poseen una temperatura óptima de funcionalidad, y en zonas

tropicales húmedas que poseen una cobertura vegetal que amortiza los efectos de la

temperatura, esta alcanza su máxima expresión.

2.1.1.3.2 Precipitación

Las aguas que llegan al suelo tienen dos papeles importantes:

a. Integran la mayoría de los constituyentes neos formados al suelo: materia

orgánica, óxidos hidratados, entre otros, transportados por drenaje y/o

percolación.

b. Mantienen el equilibrio de la temperatura en el perfil del suelo.

2.1.1.3.3 Viento

El viento tiene acción sobre el balance hídrico del suelo, al remover la capa superficial

húmeda permitiendo la capilaridad y el desecamiento de las capas superficiales del

suelo.

13

También posee una acción mecánica al contribuir a procesos de erosión, removiendo

cobertura vegetal y capas superficiales.

2.1.1.4 Organismos

Los organismos lo conforman la microflora, microfauna, macroflora, macrofauna y el

hombre, que en el transcurso de su vida actúan como agentes pedogénicos.

La flora actúa como protectora del suelo, reguladora de temperatura, incidencia de las

precipitaciones, entre otros, como también, fuente de materia orgánica.

La fauna ayuda en las reacciones bioquímicas, aportan materia orgánica, ayudan a la

subdivisión de las materias, mejoran la estructura, exportación de compuestos de

ciertos perfiles, entre otros.

2.1.1.5 Tiempo

Es uno de los factores pasivos de la pedogénesis, ya que no adiciona ni exporta

material, como tampoco aporta energía, pero el sistema formativo del suelo no es

estático, varía con el tiempo. Por lo tanto, para que se logre una adecuada evolución

del suelo, se necesita de un tiempo para lograr una diferenciación de sus horizontes.

Si nos situamos en un tiempo t, encontraremos un perfil de suelo distinto a un tiempo t

+1, lo que nos muestra la dinámica que ocurre en la interacción de los distintos factores

de formación del perfil.

La interacción de los distintos factores genera una gran variabilidad de suelos y de sus

propiedades, esta variabilidad se ve aumentada por el manejo agronómico que se

efectúa en dicho suelo.

2.1.2 Factores antrópicos

El hombre mediante distintos manejos agrícolas, proporciona las mejores condiciones

a la planta para un buen crecimiento y desarrollo, lo que provoca un cambio en el

ambiente natural donde se desarrolla el cultivo.

Diversos autores concuerdan con esta acción antrópica, Gaucher (1971) indica que la

influencia del hombre al intervenir el ritmo de erosión ejerce una influencia indirecta

14

sobre los procesos de descomposición de las materias minerales. Ortega y Flores

(1999), también reconocen la influencia antrópica al elegir la forma y tamaño de los

potreros, la intensidad del pastoreo, la aplicación de materiales orgánicos, entre otros.

Según Gil (2001) al construir la cama de raíces con un subsolador, se rompe la

estructura original del suelo, si pensamos que la estructura domina las propiedades

físicas del suelo, y por lo tanto su funcionalidad, con esta acción se estará cambiando

la funcionalidad del suelo. El mismo autor afirma que la porosidad es la variable más

fácil, frecuente y ampliamente alterada por las operaciones de labranza o manejo sin

laboreo. En el mismo sentido Gaucher (1971), afirma que es un hecho que en los

suelos compactados por el laboreo, del hombre o del ganado, la cohesión es mas

fuerte y la estabilidad estructural más grande, las partículas han sido acercadas unas a

otras artificialmente, la porosidad por el contrario es más débil y la humectación de los

agregados más lenta, lo que demuestra que la porosidad es una resultante que

depende de la textura, estructura y también de la actividad biológica, ya que esta

última, genera un gran número de canículos finos.

Según Jorge (1975), la materia orgánica es una fuente de nutrientes para las plantas.

Durante el proceso de descomposición varios elementos son liberados, principalmente

nitrógeno, con lo cual se mejoraría la fertilidad natural.

Con respecto a la fertilidad, Cobertera (1993) estima que en los suelos cultivados se

producen unos procesos biológicos distintos de los constatados en los mismos suelos

cuando éstos evolucionan sin la intervención antrópica. Esta intervención produce, en

términos generales, un aumento de la tasa de mineralización de la materia orgánica,

con lo cual se produce un aumento de las concentraciones de elementos nutritivos

asimilables en el suelo, aumentando la fertilidad del mismo. Sin embargo, esta

“mineralización forzada” provoca a mediano plazo, un empobrecimiento del humus con

la consiguiente pérdida del coloide orgánico, lo que determina una menor capacidad de

intercambio catiónico, y por lo tanto, una menor concentración de elementos nutricios

asimilables. Por el contrario, la mineralización excesiva puede provocar un

empeoramiento de las condiciones físicas, tanto de la estructura como de la textura, al

ser menor el número de partículas coloidales en el suelo.

El pH también puede variar por acción antrópica. Según Gaucher (1971), los trabajos

de cultivo se oponen al lavado del perfil, y por lo tanto conducen a la acidificación,

llevando periódicamente a la superficie los horizontes más profundos; los aportes de

15

estiércol sin encalado conducen progresivamente a una acidificación del suelo y

también al favorecer la permeabilidad se favorece el lavado eliminando las bases y

disminuyendo el pH.

2.2 DISEÑO EXPERIMENTAL

En el desarrollo de las ciencias en general y, en particular, el de las ciencias biológicas,

el conocimiento de la metodología estadística es una herramienta imprescindible para

la obtención, análisis e interpretación de todos los datos que proceden de las

observaciones sistemáticas o de experimentaciones proyectadas específicamente para

conocer los efectos de uno o varios factores que intervienen en los fenómenos bajo

estudio (Cochran y Cox, 1950).

La ciencia de la estadística es una rama de las matemáticas aplicadas, y corresponde

a las matemáticas aplicadas a los datos que pueden ser objeto de observación, por lo

que la estadística puede ser considerada como el estudio de las poblaciones, de la

variación y los métodos para sintetizar los datos (Fisher, 1925). Ella tiene como

objetivo extraer inferencias acerca de una población de interés basado en la

información contenida en una muestra (Mendenhall y Ott, 1980).

2.2.1 Prueba de hipótesis

Cuando una variable aparentemente tiene un efecto, es muy importante establecer con

cierta confianza que el efecto es realmente debido a dicha variable y no al azar. Para

esto, una herramienta del análisis estadístico es la prueba de hipótesis, o

alternativamente, la prueba de significancia (Snedecor y Cochran, 1980), la cual

permite conocer el efecto de la variable medida.

La hipótesis acerca de un parámetro de la población es llamada hipótesis nula, a la

cual se le asigna el símbolo H0 (Wonnacott y Wonnacott, 1972). En estadística el

término nulo es utilizado para indicar la hipótesis que se comienza por probar.

Típicamente se prueba que no existe diferencia, por eso el término nulo o sin diferencia

y se puede representar por el siguiente modelo:

H0: µ1 = µ2 ó

16

H0: µ1 - µ2 = 0

donde, H0 corresponde a la hipótesis nula, µ1 es la media del tratamiento 1 y µ2 es la

media del tratamiento 2.

Al no encontrarse evidencia suficiente para avalar esta hipótesis, se rechaza la

hipótesis nula y por consiguiente se acepta la hipótesis que existe diferencia entre la

media de los datos. Esta es llamada hipótesis alternativa, a la cual se le signa el

símbolo Ha y se puede representada por el modelo:

Ha: µ1 ≠ µ2 ó

Ha: µ1 - µ2 < ó > 0

donde, Ha es la hipótesis alternativa, µ1 es la media del tratamiento 1, µ2 es la media del

tratamiento 2.

En la decisión de aceptar o rechazar la hipótesis nula en favor de la hipótesis

alternativa existen errores asociados (Wonnacott y Wonnacott, 1972):

• Rechazar la hipótesis nula cuando esta es verdadera o error tipo I.

• Aceptar la hipótesis nula cuando esta es falsa o error tipo II.

Cuadro 2.1. Tipos de error.

Decisión estadística Verdadera Falsa

ErrorAceptar Correcto tipo II

p = �

ErrorRechazar tipo I Correcto

p = �

Hipótesis nula

La probabilidad de cometer el error tipo I, depende del valor exacto del parámetro p, al

cual se le asigna el símbolo α, este valor restringe el rango cubierto por H0. La

probabilidad de cometer un error tipo II se le asigna el símbolo β y es conocido como

17

poder de la hipótesis alternativa (Steel y Torrie, 1960). Estas probabilidades son

llamadas niveles de significancia o valor de p (Mendenhall y Ott, 1980).

Figura 2.4. Prueba de hipótesis con α igual a 5%.

La Figura 2.4 muestra una prueba de hipótesis donde el caso:

a) Si H0 es verdadera entonces α = probabilidad de rechazar la hipótesis H0

cuando es verdadera, error tipo I.

b) Si H0 es falsa (Ha verdadera) entonces β = probabilidad de aceptar la hipótesis

H0 cuando es falsa, error tipo II.

Un error tipo II es considerado como la pérdida de oportunidad de rechazo de la

hipótesis nula cuando la hipótesis alternativa es verdadera (Bhattacharyya y Johnson,

1977):

β = P [error tipo II] = P [falla de rechazar H0 cuando Ha es verdadera]

Idealmente se desea que α y β sean cero, sin embargo esto no es posible, por lo que

alternativamente se pretende que α y β sean lo más pequeñas posibles. Existe una

relación inversa entre estas dos probabilidades, tal como se muestra en la Figura 2.5

donde a =α y b =β, mientras α aumenta β disminuye (Mendenhall y Ott, 1980).

18

Figura 2.5. Relación inversa entre α y β.

El cálculo de α es simple, según la fórmula (Wonnacott y Wonnacott, 1972):

[2.3]

−

≥=

n

xzP

σ

µα 0

Donde z es la variable aleatoria distribuida normalmente, x es la media de la muestra,

µ0 es la media poblacional de la hipótesis nula, σ es la desviación estándar de la

población y n es el número de observaciones. Las pruebas de hipótesis generalmente

utilizan niveles de significancia de α igual a 0,1, 0,05 ó 0,01 para rechazar o aceptar la

hipótesis nula, por lo cual no se necesita calcular β.

2.2.2 Diseño experimental

La experimentación de campo es conducida para probar hipótesis o para determinar

las respuestas relativas a la aplicación de distintos tratamientos (Mulla et al., 1990), de

la manera más económica posible (Mendenhall y Ott, 1980). Esta verificación exige la

recolección de observaciones y el diseño del experimento corresponde esencialmente

al establecimiento del marco dentro del cual se colectarán las observaciones, por lo

que la consideración del diseño de un experimento al proveer evidencia para una

hipótesis, necesita considerable cuidado para así poder verificar o no la hipótesis

(Kempthorne, 1952).

Un diseño experimental involucra numerosos aspectos, siendo los principales

(Bhattacharyya y Johnson, 1977; Cochran y Cox, 1950):

19

• Seleccionar los factores a ser estudiados en un experimento y los niveles de

cada factor que son relevantes en la investigación. Esto determina el

tratamiento a utilizar.

• Considerar el alcance de la inferencia y elegir el tipo de unidad experimental

sobre los cuales serán aplicados los tratamientos.

• Desde la perspectiva de los costos y el deseo de la precisión de la inferencia,

decidir cuantas unidades serán incluidas en el experimento.

• Determinar la manera en cual tratamiento será aplicado la unidad experimental.

• Refinar la técnica a utilizar, con lo cual se asegura la uniformidad en la

aplicación del tratamiento, se ejerce un control sobre las influencias externas,

se hacen mediciones insesgadas de los efectos del tratamiento y se previenen

grandes errores.

Según Bhattacharyya y Johnson (1977), los distintos tipos de condiciones que son

utilizados sobre las unidades experimentales son llamados factores, los diferentes

modos de presencia de un factor son llamados niveles y la combinación específica de

los niveles de los diferentes factores es llamada tratamientos.

La unidad experimental se define como la unidad del material al cual es aplicado un

tratamiento y cuando el efecto de un tratamiento es medido sobre una unidad se

denomina unidad de muestreo (Steel y Torrie, 1960). En investigación con especies

vegetales, la unidad experimental es usualmente denominada parcela (Parodi y

Nebreda, 1997; Steel y Torrie, 1960).

2.2.2.1 Error experimental

La continua repetición de un experimento usando exactamente el mismo tratamiento

sobre las unidades experimentales resulta en diferentes respuestas; estas diferencias

son impredecibles y son llamadas error experimental (Wonnacott y Wonnacott, 1972).

Por lo tanto, los resultados de los experimentos son afectados no sólo, por la acción de

los tratamientos, sino también por variaciones que tienden a enmascarar los efectos de

los tratamientos. El término error experimental es aplicado a esta variación, sin

embargo el concepto de error no es sinónimo de equivocación, correspondiendo al

20

conjunto de la variación observada en un experimento que no es explicada

adecuadamente por el modelo estadístico en uso.

El error experimental puede provenir de dos tipos de fuentes (Steel y Torrie, 1960):

• La variabilidad inherente al material experimental al cual serán aplicados los

tratamientos.

• La falta de uniformidad en la conducción física del experimento, es decir

deficiencias en la estandarización de la técnica experimental.

En muchas investigaciones de campo, el resultado puede ser ampliamente influido por

el error experimental y sólo los tratamientos con una considerable diferencia pueden

ser detectados (Cochran y Cox, 1950), por lo que es esencial reducir el error

experimental para mejorar una prueba estadística y disminuir el intervalo de confianza

(Steel y Torrie, 1960).

Como consecuencia de la omnipresencia de esta variabilidad, se han utilizado métodos

que aumentan la precisión de los experimentos, los cuales pueden ser clasificados, de

manera general, dentro de tres tipos (Cochran y Cox, 1950):

• Incrementar el tamaño del experimento a través de la incorporación de un

mayor número de repeticiones o adicionando tratamientos.

• Refinando la técnica experimental.

• Selección cuidadosa del material experimental.

2.2.2.2 Repeticiones

Según Gotway et al. (1997), la repetición se refiere a la replicación independiente del

experimento básico y el propósito de la repetición es proveer una estimación del error

experimental, el cual es usado en la prueba de la hipótesis estadística para asegurar

que el efecto del tratamiento es real y no es debido sólo al azar. Es importante

diferenciar las repeticiones de la seudorepetición o submuestra, la que consiste en

múltiples mediciones de una sola repetición.

Cox (1958) indica que dos observaciones de un mismo tratamiento serán consideradas

que provienen de diferentes unidades experimentales sólo sí:

21

• El diseño experimental es tal que, el material experimental forzosamente tiene

que recibir los diferentes tratamientos.

• El material ha sido distribuido independientemente en todos los aspectos en la

cual la variación importante puede ocurrir.

El propósito más importante de la repetición es disminuir el error de las comparaciones

entre tratamientos, ya que la verdadera varianza de cualquier comparación entre la

media de los tratamientos es proporcional a:

[2.4] r

2σ

donde σ2 es la varianza por parcela (o unidad) y r el número de repeticiones. Esta

varianza decrece directamente con incrementos de r, aunque este resultado es válido

si el aumentar la repetición es al menos acompañado de usar material experimental

homogéneo o una cuidadosa técnica (Cochran y Cox, 1950).

Steel y Torrie (1960) entregan una lista de las funciones de la repetición:

• Proveer una estimación del error experimental.

• Mejorar la precisión del experimento, reduciendo la desviación estándar de la

media de tratamientos.

• Aumentar la magnitud de la inferencia del experimento por selección y

apropiado uso de las unidades experimentales.

• Controlar la varianza del error.

• Incrementar el rango de condiciones bajo los cuales los efectos de los

tratamientos son evaluados.

Estos mismos autores agregan que se requiere la estimación del error experimental

para pruebas de significación y para estimar los intervalos de confianza. Kempthorne

(1952) señala que en cualquier experimento es necesario tener al menos dos

repeticiones para obtener una estimación de la varianza del error.

22

2.2.2.3 Aleatorización

La aleatorización se refiere a que cada tratamiento tiene igual oportunidad de ser

asignado a cualquier unidad experimental de manera favorable o infavorable (Steel y

Torrie, 1960) y sólo bajo estas circunstancias el experimentador puede atribuir

cualquier efecto solamente al tratamiento y sus conclusiones serán confiables

(Kempthorne, 1952).

Fisher (1925), fue el primero en introducir la idea de aleatorización, ya que según este

autor, la ordenación sistemática de las parcelas puede tener características comunes

con la variación sistemática de la fertilidad.

Según Steel y Torrie (1960), la función de la aleatorización es:

• Obtener una estimación insesgada del error experimental.

• Obtener una estimación insesgada de la media de los tratamientos.

• Obtener una estimación insesgada de la diferencia entre tratamientos.

Por medio de esto, el tipo de inferencia estadística que puede ser realizada de los

datos, sólo dependa de la naturaleza de los datos (Cochran y Cox, 1950) y según

Snedecor y Cochran (1980), una de las grandes virtudes de la aleatorización es que

protege contra fuentes de sesgo insospechadas.

2.2.2.4 Diseños

En un sentido más restrictivo, el término diseño experimental consiste en un tipo

particular de plan de asignación de sujetos a condiciones experimentales y el análisis

estadístico asociado con ese plan.

El apropiado uso de la palabra experimento corresponde al de una prueba u

observación realizada para confirmar o rechazar algo dudoso o incierto, especialmente

bajo condiciones determinadas por el experimentador, como un acto u operación

tomada para descubrir algún principio desconocido, efecto o ensayo, estableciendo o

ilustrando alguna sugerencia o verdad (Kempthorne, 1952).

23

El objetivo de usar un diseño experimental en investigación científica es controlar parte

de la variabilidad o error experimental, que en forma natural existe en todos los

fenómenos biológicos (Steel y Torrie, 1960).

Uno de los primeros diseños experimentales utilizados fue el diseño sistemático

(Fisher, 1935). Bailey et al. (1995), afirman que el análisis de este tipo de diseño, al

cual llama diseño absurdo, no es válido por el análisis de varianza o los clásicos

métodos de vecindad, fundamentando su posición en los siguientes elementos:

• El análisis de vecindad entrega la misma estimación del efecto de los

tratamientos que el análisis de varianza.

• El análisis de varianza posee una validez cuestionable si las parcelas en

diferentes bloques no están correlacionadas, incluso si no están aleatorizadas.

Figura 2.6. Ejemplos de Diseños sistemáticos.

Como se aprecia en la Figura 2.6 A, B y C son los tratamientos, los cuales están

dispuestos sistemáticamente dentro de un bloque y las repeticiones no tienen

aleatorización (Bailey et al., 1995).

En los diseños con aleatorización, las unidades experimentales son aleatoriamente

asignadas a los tratamientos, con esto se puede estimar en forma válida la variabilidad

natural existente en las unidades de experimentación (Cochran y Cox, 1950).

Dentro de este diseño existen grupos con subdivisiones entre los cuales podemos

nombrar (Kempthorne, 1952; Steel y Torrie, 1960; Cochran y Cox, 1950; Patterson et

al., 1978):

a. Área experimental no subdividida con anterioridad a la aleatorización.

Por ejemplo:

• Diseño Completamente al Azar.

A B C

A B C

A B C

A A A

B B B

C C C

24

b. Área experimental subdividida con anterioridad a la aleatorización.

b.1. Bloques Completos

Por ejemplo:

• Diseño de Bloques Completos al Azar.

• Cuadrado Latino.

• Cuadrado Greco-latino.

b.2. Bloques Incompletos.

Por ejemplo:

• Diseños de Bloques Incompletos Balanceados.

• Diseños de Bloques Incompletos Parcialmente Balanceados.

• Lattices.

• α - lattice.

c. Experimentos Factoriales.

Por ejemplo:

• Diseño Factorial Completamente al Azar.

• Diseño Factorial en Bloques al Azar.

• Diseño Jerarquía en Completamente al Azar.

• Diseño de Parcelas Divididas.

• Diseño de Bloques Divididos.

d. Experimentos con Análisis de Covarianza.

Por ejemplo:

• Diseño Completamente al Azar con Covarianza.

• Diseño de Bloques al Azar con Covarianza.

• Diseño de Cuadrado Latino con Covarianza.

En el diseño de bloques completos al azar (BCA), el material experimental es dividido

dentro de grupos, el número de grupos debe ser igual al número de tratamientos o

algún múltiplo de este, a cada grupo se le llama bloque y corresponde a una repetición,

el material experimental esta distribuido aleatoriamente dentro del grupo (Steel y

Torrie, 1960).

25

Figura 2.7. Diseño de bloques completos al azar.

Donde A, B, C, D y E son los tratamientos dispuestos aleatoriamente dentro del bloque

con cuatro repeticiones.

Este diseño es apropiado para mantener el error experimental dentro del grupo lo más

pequeño posible (Cochran y Cox, 1950) y la fuente de variación es solamente atribuida

al efecto del tratamiento (Steel y Torrie, 1960).

El análisis de este diseño está representado por el siguiente modelo (Bhattacharyya y

Johnson, 1977):

[2.5] ijjiijy εβτµ +++=

donde ijy es el valor de la unidad experimental bajo el tratamiento i en el bloque j, µ

representa la media poblacional, τi es el efecto del tratamiento i, βj es el efecto del

bloque j y εij representa la desviación aleatoria de la unidad experimental j sometida al

tratamiento i.

Según Cochran y Cox (1950), las principales ventajas y desventajas de este diseño

son:

Ventajas:

• La eliminación de la suma de cuadrados de bloque desde la suma de

cuadrados del error resulta en un decrecimiento del cuadrado medio del error,

lo que aumenta la precisión del diseño comparado con el completamente al

azar.

• Cualquier número de tratamientos y cualquier número de replicaciones pueden

ser incluidos, por lo que le da más flexibilidad al diseño.

• Algunos tratamientos o grupos con problemas pueden ser eliminados y

proceder con el análisis sin introducir ninguna complicación.

Bloque 1 A D E C BBloque 2 B C A E DBloque 3 D A B E CBloque 4 E B D A C

26

Desventajas:

• La principal objeción de este diseño es que no es adecuado para un gran

número de tratamientos.

• No es adecuado para los casos en que cada bloque contenga una considerable

variabilidad, ya que produce un término del error muy alto.

El diseño de lattice fue introducido por Yates (1936), específicamente para evaluar

cultivares. Este diseño ha demostrado ser eficiente, fácil de construir y de analizar

(Cochran y Cox, 1950). Sin embargo, esta disponible sólo para un limitado número de

pruebas (Patterson et al., 1978; Bowman, 1990). De esta manera, un lattice simple o

cuadrático requieren que el número de tratamientos v, sea el cuadrado del número de

bloques s en cada replicación, el tamaño del bloque k es igual a s, estas condiciones

imposibilitan para v en cuádruplo o lattices de mayor orden (Patterson y Williams,

1976).

David (1967), en la construcción de diseños cíclicos es capaz de producir un gran

número de diseños con solución, pero con una nueva restricción, k debe ser igual al

número de repeticiones r o múltiplo de este.

Patterson y Williams (1976), introducen un nuevo diseño viable de bloques incompletos

para un gran número de tratamientos combinando los diseños cíclicos con los lattices

al que llaman diseño α ó α - lattice, el cual no tiene restricciones en el tamaño del

bloque, aún cuando inevitablemente k debe ser factor de v.

Para la construcción de este diseño se tiene que cumplir:

[2.6] skv ×=

donde v es el número de variedades, k es el tamaño del bloque y s es el número de

bloques por repetición.

El análisis de este diseño según Patterson et al. (1978) es complejo, pero para efectos

prácticos puede ser analizado como lattice rectangular, el cual esta dado por el

siguiente modelo:

[2.7] ijkkjiijk ry εβτµ ++++=

27

donde ijy es el valor de la unidad experimental bajo el tratamiento i en el bloque j en la

repetición k, µ representa la media poblacional, τi es el efecto del tratamiento i, βj es el

efecto del bloque j, rk es la repetición k y εij representa la desviación aleatoria de la

unidad experimental sometida al tratamiento i en el bloque j en la repetición k.

Ventajas

• Puede ser utilizado con un gran número de tratamientos, en donde otros

diseños no pueden ser utilizados.

Desventajas

• Tiene la restricción de skv ×=

2.2.3 Análisis de varianza

El método clásico para el análisis estadístico de los experimentos de campo es el

análisis de varianza (ANDEVA ó ANOVA, por sus siglas en inglés) (Mulla et al., 1990).

El análisis de varianza, o más apropiadamente el análisis de la variación alrededor de

la media (Bhattacharyya y Johnson, 1977), consiste en un proceso aritmético en que la

partición de la variación total presente en los datos es dividida en sus componentes de

variación conocidos (Steel y Torrie, 1960).

Cada componente representa la variación debido a factores incontrolables y errores

aleatorios asociado con la respuesta medida, específicamente, si los datos consisten n

medidas desde y1,....., yn y su media es designada por y , la variación total alrededor

de la media es incluida en la suma de desviaciones al cuadrado:

[2.8] ( )∑=

−n

ii yy

1

2

el cual es llamado la suma de cuadrados totales (Bhattacharyya y Johnson, 1977).

28

Figura 2.8. Descomposición de la suma de cuadrados totales con tres fuentes de

variación.

El número de las fuentes de variación no identificables y las fórmulas para la suma de

cuadrados de los componentes están intrínsicamente conectados al particular diseño

experimental empleado en la colección de datos y el modelo estadístico considerado

apropiado para el análisis (Steel y Torrie, 1960). Por ejemplo, para el diseño de BCA se

asume que la observación y es expresable como una función lineal conocida de

parámetros desconocidos más el error, en este caso, yi (i =1, 2,..., t) es el número de

tratamientos, yj (j =1, 2,..., r) correspondientes al número de bloques:

[2.9] ijjiijy εβτµ +++=

donde µ, τi y βj son los parámetros desconocidos y εij es el error. Cada parámetro

desconocido o fuente de variación esta asociado a ciertos grados de libertad (Cuadro

2) (Kempthorne, 1952).

Cuadro 2.2. Grados de libertad asociados a las fuentes de variación.

Fuente de Variación Grados de Libertad

Bloques (r -1)Tratamientos (t - 1)Error (r -1) (t - 1)

Total rt - 1

SC debido SC debido SC debido ErrorFuente Nº 1 Fuente Nº 2 Fuente Nº 3 Residual

Suma de cuadrados totales

( )21

∑=

−n

iyiy

29

El término grados de libertad (g.l.), puede ser explicado de la siguiente manera,

originalmente existen n grados de libertad en una muestra de n observaciones y si

calculamos x y s2, utilizamos un grado de libertad para el cálculo de x , dejando sólo n

– 1 grados de libertad el residual ( )2xx i − en el cálculo de s2 (Wonnacott y Wonnacott,

1972), por lo tanto, los grados de libertad asociados con cualquier componente es el

número de los parámetros independientes requeridos para describir ese componente

en el modelo (Cochran y Cox, 1950).

2.2.3.1 Prueba de F

El cuadrado medio es definido como la suma de cuadrados asociados a un

componente, dividido por sus respectivos grados de libertad (Steel y Torrie, 1960), la

cual puede ser descrita por la siguiente fórmula:

[2.10] libertaddeGrados

cuadradosdeSumamedioCuadrado =

El cuadrado medio del error es simbolizado por s2 y frecuentemente es referido como

un término de error generalizado, puesto que es un promedio de los componentes

contribuidos por las poblaciones o los tratamientos. Este es un estimador de un σ2

común, lo cual es un supuesto, y s2 es un estimador válido para s2 sólo si la suposición

es verdadera (Bhattacharyya y Johnson, 1977).

La hipótesis nula en que no existe diferencia entre k medias poblacionales puede ser

representada por:

H0: µ1 = µ2 =....= µk = 0

La hipótesis alternativa es la que alguna de los valores de µ es diferente de cero. Por

ejemplo para un diseño completamente al azar, cuando las medias de las poblaciones

son todas iguales, el cuadrado medio del tratamiento es de esperarse que sea

pequeño y es probable que sea mayor cuando las medias difieran marcadamente, por

otro lado, el cuadrado medio del error, puede ser usado como un regulador para

determinar como un gran valor del cuadrado medio del tratamiento, descrito

30

anteriormente, es un indicador de diferencia significativa (Bhattacharyya y Johnson,

1977). Esto sugiere que bajo H0 la relación,

[2.11] ( )

( )∑=

−

−==

k

jj kn

SCEk

otratamientdelSC

errordelmedioCuadradootratamientdelmedioCuadrado

F

1

1

tiene una distribución F con g.l. = (k−1, n−k), donde n = ∑=

k

j 1

nj y este sea un buen

criterio para probar la hipótesis nula que la media de las poblaciones es la misma para

todos los tratamientos (Snedecor y Cochran, 1980).

La distribución fue tabulada primero por Fisher y en honor a este autor, este criterio fue

llamado F (Snedecor, 1934), Fisher y Yates (1938) designaron a F como la relación de

la varianza.

En la tabla de F, si el cuadrado medio del tratamiento es menor que el error, el

resultado es declarado no significativo sin importar que tan pequeña sea la relación de

F. Un F significativo implica que la evidencia es suficientemente fuerte para indicar que

no todos los tratamientos pertenecen a una población con un µ común (Steel y Torrie,

1960). Sin embargo, esto no indica cuál diferencia debe ser considerada

estadísticamente significativa.

Según Mendenhall y Ott (1980) esta distribución posee las siguientes propiedades:

• La distribución de F no es simétrica (Figura 2.9).

• Existen muchas distribuciones y formas de F, de las cuales una puede ser

especificada por la designación de los grados de libertad (Figura 2.10).

• Los valores de los extremos de la distribución F están calculados en tablas.

31

Figura 2.9. Distribución de F.

Figura 2.10. Distintas distribuciones de F.

2.2.3.2 Supuestos del análisis de varianza

Cuando las fórmulas y el procedimiento del análisis de varianza son utilizadas para

resumir los datos, no es necesario ningún supuesto para validar los resultados, en

cambio, cuando el análisis de varianza es utilizado como método de inferencia

estadística, ciertos supuestos acerca de la población y el procedimiento de muestreo

son necesarios para validar las inferencias (Eisenhart, 1947):

• Las poblaciones de la cual se extraen las muestras poseen la misma varianza.

• Los efectos en el modelo matemático son aditivos. Por ejemplo, para los

efectos de bloques y tratamientos implica que la diferencia entre los efectos

32

verdaderos para dos tratamientos es la misma en todos los bloques (Cochran y

Cox, 1950).

• Los errores experimentales son independientes y normalmente distribuidos con

µ = 0 y varianza común σ2. Puede asumirse que los errores son independientes

si las unidades experimentales son aleatoriamente asignados a los tratamientos

y si las variables asociadas con la conducta del experimento son también

aleatorias (Steel y Torrie, 1960).

2.3 GEOESTADISTICA

“La geoestadística corresponde a la aplicación del formalismo de las funciones

aleatorias al reconocimiento y estimación del fenómeno natural”, con esta definición

Matheron introduce el término geoestadística en el año 1962, para describir una

aproximación científica al problema de evaluación geológica y minera (Journel y

Huijbregts, 1978).

La originalidad de la geoestadística con respecto a la estadística clásica radica en que

la primera toma en cuenta la dependencia entre las observaciones, considerando que

ellas están ubicadas en el espacio (Emery, 2000).

La estadística clásica asume que la media de una unidad de una muestra es el valor

esperado de cualquier unidad, con una estimación del error expresado por la varianza

de la unidad (Trangmar et al., 1985), es decir considera la magnitud de éstos como si

los puntos en que se realizan las observaciones, estuvieran ubicados completamente

al azar (Gurovich y Stern, 1983).

Distintos estudios muestran que este aspecto “aleatorio” de las observaciones

frecuentemente contiene componentes que son espacialmente dependientes

(Campbell, 1978; Burgess y Webster, 1980; Gajem et al., 1981; Vieira et al., 1981; Yost

et al., 1982; Trangmar et al., 1987; Cambardella et al., 1994; Ortega et al., 1999). Esto

implica que dada una distancia o rango de la diferencia de la dependencia espacial en

las propiedades del suelo pueden ser descritas como una función de la separación

espacial. Los métodos tradicionales en la clasificación del suelo y análisis estadístico

no consideran directamente este aspecto (Trangmar et al., 1985).

33

La geoestadística considera la estructura y las características aleatorias de la

distribución espacial de las variables, proporcionando herramientas cuantitativas para

su descripción y una estimación insesgada optima.

2.3.1 Teoría de la variable regionalizada

La geoestadística se define como el estudio de fenómenos regionalizados, es decir,

fenómenos que se extienden en el espacio y que presentan una organización o

estructura. Por espacio se entiende en general al espacio geográfico, puede tratarse

del eje temporal o de espacios más abstractos (Emery, 2000). Cuando una variable

está distribuida en el espacio, se dice que esta regionalizada (Journel y Huijbregts,

1978). Por lo tanto cuando una variable pertenece a un estudio de un fenómeno que se

extiende en el espacio se llama variable regionalizada.

Una definición de variable regionalizada dada por Journel y Huijbregts (1978),

corresponde a una variable distribuida en el espacio netamente descriptiva que no

implica ninguna interpretación estadística. Dado que una variable regionalizada no

posee una extensión infinita, esta pertenece a un dominio limitado D llamado campo y

la superficie o volumen de base sobre la cual se considera la variable regionalizada se

denomina soporte (Emery, 2000). Desde un punto matemático, una variable

regionalizada es una función determinista denotada tradicionalmente z. Según Journel

y Huijbregts (1978), en general esta función presenta dos características

aparentemente contradictorias (Figura 2.11):

• Localmente, a menudo es irregular, errática y no puede ser representada por

una función matemática determinista.

• General o global, presenta cierta organización o estructura en el espacio.

Una variable aleatoria es un valor numérico que varía de una manera impredecible

(Mendenhall y Ott, 1980). La variable aleatoria es caracterizada por los parámetros de

distribución, como por ejemplo la media y la varianza, sin embargo, cuando los datos

están ubicados en el espacio geográfico, las hipótesis de la estadística clásica son

raramente aceptables. Una variable regionalizada z(x) es una variable aleatoria que

34

toma diferentes valores z de acuerdo a su localización x dentro de una región (Journel

y Huijbregts, 1978).

Figura 2.11. Características de la variable aleatoria. (Adaptado de Emery, 2000)

Una variable regionalizada z(x) puede ser considerada como una realización particular

de una variable aleatoria Z para una localidad x dentro de una región. Cuando x recorre

un campo D, o región, se obtiene una familia de variables {Z(x), x ∈ D} que constituyen

una función aleatoria (Emery, 2000).

Así, según Journel y Huijbregts (1978), la definición de función aleatoria permite tomar

en cuenta los aspectos aleatorios y estructurados de la variable regionalizada:

• Localmente, en cada punto x, Z(x) es una variable aleatoria.

• Globalmente, para todo conjunto de puntos, las variables aleatorias están

ligadas por una correlación que cuantifica la semejanza entre los valores que

toman (de donde proviene el aspecto estructurado).

2.3.1.1 Características de una función aleatoria

Si se considera una función aleatoria Z(x), x ∈ D, y una serie de puntos {x1,.., xk}. El

grupo de valores aleatorios {Z(x1),.., Z(xk)} esta caracterizado por una función de

distribución que depende de k argumentos:

Fx1,..., xk (z1,..., zk) = P [Z(x1) < z1,..., Z(xk )< zk]

35

El conjunto de funciones de distribución, para todos los enteros k y todas las

elecciones posibles de {x1,.., xk} en D, constituyen la ley espacial de una función

aleatoria.

Para poner en marcha el formalismo probabilístico, es necesario determinar la ley de la

función aleatoria Z(x) a partir de los datos disponibles sobre la variable regionalizada

z(x), esta etapa se conoce bajo el nombre de inferencia estadística (Emery, 2000).

Dos razones dificultan la inferencia estadística en su forma más general, por una parte,

sólo se dispone de una única realización de la función aleatoria, la cual es la variable

regionalizada, y por otra parte, esta realización sólo se conoce de manera

fragmentaria, en algunos puntos de muestreo (Journel y Huijbregts, 1978).

Para superar esta situación según Emery (2000), se hace uso de la noción de

estacionaridad, que describe de alguna manera, una homogeneidad espacial de la

regionalización. El concepto es permitir la inferencia estadística, reemplazando la

repetición sobre las realizaciones de la función aleatorias (inaccesible) por una

repetición en el espacio. Los valores que se encuentran en las diferentes regiones del

campo presentan distintas características y pueden considerarse como distintas

realizaciones del mismo proceso aleatorio (Journel y Huijbregts, 1978).

Desde el punto de vista matemático, la hipótesis de estacionaridad consiste en suponer

que todo o parte de la ley espacial de la función aleatoria es invariante por traslación,

es decir, que las propiedades probabilísticas de un conjunto de valores no dependen

de la posición absoluta de los sitios asociados, sino sólo de sus separaciones (Emery,

2000).

∀ h ∈ Rd, ∀ k ∈ N*, ∀ x1,.., xk ∈ Rd, los vectores aleatorios (Z(x1),.., Z(xk)) y (Z(x1 + h),..,

Z(xk + h)), tienen igual ley de probabilidad conjunta.

donde Rd representa las dimensiones del espacio y N* el número de variables

regionalizadas reales.

Esta propiedad expresa la idea que todas las características de la regionalización son

invariables en el espacio, la cual es muy restrictiva, pues supone una identidad de

todas las leyes de probabilidad en el espacio. Sin embargo, esta propiedad se puede

restringir a los dos primeros momentos de la función aleatoria, ya que la ley espacial

entera nunca es requerida (Journel y Huijbregts, 1978).

36

Según Trangmar et al. (1985) los momentos son:

Una función aleatoria Z(x) es estacionaria de primer orden, si su valor esperado es la

misma en cualquier localidad de la región en estudio:

[2.12] ( )[ ] mxZ =Ε

donde m es la media de la estadística clásica, y

[2.13] ( ) ( )[ ] 0=+−Ε hxZxZ

donde h es el vector de separación entre las localidades de las muestras.

Una estacionaridad de segundo orden se aplica si la covarianza espacial C(h) de cada

par de Z(x) y Z(x + h) es la misma, independiente de la posición a través de la región y

depende de h:

[2.14] ( ) ( )[ ] ( )[ ]{ }mhxZmxZhC −+−Ε=

Según Trangmar et al. (1985), un estacionaridad de segundo orden no se aplica si una

varianza y covarianza finita no pueden ser definidas, por lo que una débil función de

estacionaridad llamada hipótesis intrínseca debe ser asumida.

Según Emery (2000) la hipótesis intrínseca requiere que para todos los vectores de h,

la varianza del incremento Z(x) − Z(x + h) es finita e independiente de la posición

dentro de la región:

[2.15] ( ) ( )[ ] ( ) ( )[ ]2hxZxZhxZxZVar +−Ε=+−=

2.3.2 Análisis de dependencia espacial

Los conceptos de variable regionalizada y estacionaridad, proveen la teoría básica

para el análisis de dependencia espacial usando la autocorrelación y el variograma

(Trangmar et al., 1985).

37

El conjunto de las correlaciones o dependencias que existen en la distribución espacial

de los valores constituyen la estructura del fenómeno regionalizado (Emery, 2000) y es

el primer e indispensable paso para cualquier estudio geoestadístico (Journel y

Huijbregts, 1978), ya que las técnicas de gráficos descriptivos como histogramas,

esquemas de torta y diagramas de dispersión entregan poca o ninguna información

sobre la distribución espacial de la variable de interés (Davis y Reich, 2000).

2.3.2.1 Autocorrelación

La función de autocorrelación expresa la correlación lineal entre series espaciales y la

misma serie en un intervalo de distancia (Vieira et al., 1981; Wu y Dutilleul, 1999). Esta

definición asume una estacionaridad de segundo orden, en el cual la autocorrelación

se expresa por:

[2.16] ( ) ( )2shC

hr =

donde r(h) es la autocorrelación entre muestras a cierta distancia de separación o lag y

C(h) es la covarianza espacial del par Z(x) y Z(x + h). Un grafico de los valores de

autocorrelación versus el lag es llamado autocorrelograma (Trangmar et al., 1985).

Los valores de la función de autocorrelación son normales en el rango de –1 y 1.

El autocorrelograma ha sido utilizado para expresar los cambios espaciales en las

propiedades medidas de un campo y el grado de dependencia entre observaciones

vecinas (Gajem et al., 1981; Gurovich y Stern, 1983; Sainato et al., 1996; Ortega et al.,

1999; Vieira et al., 1981), y en el diseño de experimentos (van Es y van Es, 1993).

2.3.2.2 Variograma

Si se considera dos valores numéricos z(x) y z(x + h), en dos puntos x y x + h

separados por un vector h. La variabilidad entre estas dos cantidades se caracteriza

por la función variograma 2γ(x, h), la cual es definida como la esperanza de la variable

aleatoria [Z(x) − Z(x + h)]2 (Journel y Huijbregts, 1978):

38

[2.17] ( ) ( ) ( )[ ]{ }2,2 hxZxZhx +−Ε=γ

Este variograma 2γ(x, h) es una función del punto x y del vector h. La estimación del

variograma requiere varias realizaciones [zk(x), zk(x + h)], [zk’(x), zk’(x + h)],..., [zk’’(x),

zk’’(x + h)], de pares de variables aleatorias [Z(x), Z(x + h)]. En la practica, sólo es

posible de efectuar una realización [z(x), z(x + h)]. Para solucionar este problema, es

necesario utilizar la hipótesis intrínseca (Journel y Huijbregts, 1978; Trangmar et al.,

1985). Con esta hipótesis la función variograma 2γ (x, h) depende sólo del vector de

separación h (modulo y dirección) y no de su localización x. Con esto es posible

estimar el variograma con los datos disponibles, el cual se define como la media

aritmética del cuadrado de la diferencia entre dos medidas experimentales [z(xi), z(xi +

h)] de cualquier par de puntos separados por el vector h (Journel y Huijbregts, 1978):

[2.18] ( ) ( ) ( ) ( )[ ]( )

2

1

12 ∑=

+−=hn

iii hxzxz

hNhγ

donde N(h) es el número de pares experimentales [z(xi), z(xi + h)] de datos separados

por el vector h.

El semi – variograma se define como la mitad del variograma (Isaaks y Srivastava,

1989):

[2.19] ( ) ( ) ( ) ( )[ ]( )

2

121 ∑

=

+−=hn

iii hxzxz

hNhγ

Para evitar confusiones se omitirá el prefijo “semi” al referirse al semi-variograma.

El variograma γ(h) es isótropo si depende sólo de la distancia de separación y no de la

dirección, en este caso, todos los variogramas direccionales serán los mismos, en caso

contrario, cuando depende de la distancia y de la dirección el variograma es

anisotrópico (Isaaks y Srivastava, 1989).

El variograma anteriormente descrito es llamado variograma experimental, este no es

una función propiamente tal, sino que una serie discreta de puntos pues sólo se puede

calcular para valores de h tal que N(h) no es vacío, por lo que es incompleto y es

necesario buscar un modelo teórico de variograma que sea parecido al variograma

experimental. Esta etapa de modelamiento, llamada análisis estructural o análisis

39

variográfico, es la fase esencial de un estudio geoestadístico, obteniéndose resultados

insatisfactorios en caso de realizar un mal modelamiento (Emery, 2000).

Los modelos de un variograma experimental pueden tomar muchas formas, los que

dependen de los datos y los intervalos de muestreo utilizados (Trangmar et al., 1985).

Idealmente, el variograma aumenta con la distancia entre la localización de las

muestras, elevándose hasta un valor más o menos constante llamado umbral o sill, el

cual está dado a una cierta distancia llamada rango de la dependencia espacial (Isaaks

y Srivastava, 1989). El rango del variograma depende de la escala de la observación y

de la interacción espacial de los procesos del suelo que afectan cada propiedad a la

escala de muestreo utilizada (Trangmar et al., 1985).

El umbral se aproxima a la varianza s2 para los datos estacionarios. Muestras

separadas bajo el rango están espacialmente relacionadas, o autocorrelacionadas, las

muestras que están por sobre el rango no están espacialmente relacionadas, lo que

implica una variación aleatoria o independiente (Trangmar et al., 1985).

Idealmente, el variograma experimental debe pasar por el origen cuando la distancia

de separación de las muestras es cero, pero muchas propiedades del suelo no

presentan un valor cero cuando la distancia es cero, esto es llamado efecto nugget

(Journel y Huijbregts, 1978) y el interceptor es llamado varianza de nugget (Burgess y

Webster, 1980; McBratney Webster, 1986). (Figura 2.12)

Esto representa un error de medición o microvariabilidad de la propiedad, la cual no

puede ser detectada a la escala del muestreo (Trangmar et al., 1985).

Figura 2.12. Parámetros del variograma

40

Los parámetros del variograma experimental son comúnmente estimados usando la

regresión de mínimos cuadrados, dándole “peso” al número de pares de muestras en

cada lag (Vieira et al., 1981; Yost et al., 1982; Trangmar et al., 1985; McBratney

Webster, 1986).

Es importante la elección de un adecuado modelo1 para estimar el variograma debido a

que, cada modelo de rendimiento entrega diferentes valores para el nugget, umbral y

rango, los cuales son importantes para la interpolación mediante kriging (Trangmar et

al., 1985).

2.3.3 Interpolaciones

La estimación global consiste en evaluar el promedio de la variable regionalizada en la

totalidad del campo, por lo que no representa el resto del área, y es raramente utilizado

como finalidad en un estudio geoestadístico (Isaaks y Srivastava, 1989), ya que la

estimación aritmética de la media es un pobre estimador de la media poblacional,

debido a que si las muestras están ubicadas en zonas similares (clustering), afectan la

estimación de la media (Davis y Reich, 2000).

Contrariamente, la estimación local sólo concierne a un sector del campo estudiado y

en general utiliza un número limitado de los datos disponibles (Emery, 2000).

La necesidad de estimar áreas pequeñas, comprende la necesidad de estimar valores

desconocidos de localidades específicas, las que dependen de los valores de las

muestras vecinas (Isaaks y Srivastava, 1989). Existen distintos métodos de estimación

puntual2, algunos utilizados en estimación global, de los cuales podemos mencionar:

− Estimación global:

• Disgregamiento poligonal.

• Celda disgregada.

− Estimación puntual:

• Polígonos de Thiessen.

• Triangulación. 1 Mayor detalle de distintos modelos de variograma se presenta en el anexo A. 2 Mayor detalle de la metodología de los interpoladores polígonos de Thiessen, triangulación, distancia inversa y Kriging se presenta en el anexo B.

41

• Distancia Inversa.

• Kriging.

El método kriging es asociado con la sigla en inglés “B.L.U.E.” (best linear unbiased

estimator), ya que, es lineal, por que los estimadores se forman por la combinación

lineal de los datos disponibles, es el mejor por que minimiza la varianza del error y es

insesgado, por que intenta que la media del error sea cercana a cero (Journel y

Huijbregts, 1978).

Los métodos polígonos de Thiessen, triangulación y distancia inversa también son

lineales y teóricamente insesgados, pero lo que distingue a kriging de los otros

métodos es que minimiza la media y la varianza del error (Isaaks y Srivastava, 1989).

2.3.4 Validación cruzada

La elección de uno u otro método lleva a la incertidumbre de saber si el modelo es el

correcto en la estimación del verdadero valor de la variable aleatoria. Una herramienta

útil es la validación cruzada, la cual es una técnica que permite comparar los valores

estimados y los verdaderos, utilizando sólo la información disponible de los datos de

una muestra, la cual ayuda en la elección entre diferentes procedimiento con “peso”,

estrategias de búsqueda o diferentes variogramas (Isaaks y Srivastava, 1989).

La forma más simple de calcular la validación cruzada, es comparando la distribución

de los residuales o errores de los diferentes procedimientos de estimación (Isaaks y

Srivastava, 1989).

Gotway et al. (1996), utilizaron la predicción del cuadrado medio del error (PCME ó

PMSE, por sus siglas en inglés), para la comparación entre kriging y distancia inversa,

el cual también es una forma de comparar los valores estimados y reales:

[2.20] ( ) ( )[ ]∑ −= 200 ˆ sysyPCME

donde ( )0sy es el valor real en la posición s0 y ( )0ˆ sy es el valor estimado. Los valores

de PCME serán pequeños para una adecuada estimación.

Agterberg (1984) (Citado por Gotway et al., 1996), también propone otro método:

42

[2.21] ( ) ( )[ ] %10012

00

×

−−=

∑ sysyPCME

G

donde PCME es el valor de los residuales al cuadrado, dividido por la desviación de las

observaciones ( )0sy , en el punto s0, menos el promedio ( )0sy , multiplicado por 100.

Los valores cercanos a 100%, son los modelos de mejor estimación.

2.3.5 Geoestadística aplicada al diseño experimental

La geoestadística ha sido empleada para cuantificar la heterogeneidad del suelo, por

medio de analizar la estructura de la variable regionalizada (Gajem et al., 1981;

Gurovich y Stern, 1983; Sainato et al., 1996; Ortega et al., 1999; Vieira et al., 1981;

Yost et al., 1982; Trangmar et al., 1987), pero sólo se han realizado unos pocos

estudios para aplicarla al diseño de experimentos (van Es et al., 1989; van Es y van Es,

1993; Gotway et al., 1997; Fagroud y Van Meirvenne, 2002).

Los autores van Es et al. (1989), y van Es y van Es (1993), indican que al analizar, por

ejemplo, un experimento diseñado como bloques completos al azar, la comparación

entre tratamientos mas cercanos entre si sobreestiman la varianza por lo que

incrementa la probabilidad de cometer un error del tipo II; la comparación de

tratamientos que están mas alejados subestiman la varianza, por lo que aumenta la

probabilidad de cometer un error del tipo I. Si bien la aleatorización evita este

problema, el análisis dificulta asegurar que todas las comparaciones entre tratamientos

son realizadas con igual precisión.

Estos autores proponen un diseño, basado en la teoría de la variable regionalizada, de

bloques incompletos con bloques de tamaño dos (por ejemplo, dos tratamientos por

bloque), en la cual el bloque es dividido en dos, una mitad pertenece a un tratamiento y

la otra mitad al otro tratamiento. Una vez efectuado lo anterior, en cada bloque

incompleto (par de tratamientos), se distinguen regiones, en la cual dos observaciones

existen en cada región, una por cada tratamiento (Figura 2.13). La distancia entre

observaciones es minimizada y es constante para todas las regiones. Este diseño

presenta la ventaja que mejora la comparación entre tratamientos a una distancia

breve y constante, sin embargo posee la desventaja que su análisis es complicado,

limita el número de tratamientos a estudiar o el número de comparaciones, si se utiliza

43

un gran número de tratamientos, para disminuir el tamaño del diseño y necesita que el

diseño sea balanceado.

Figura 2.13. Distribución de los bloques incompletos, ubicación de la región y las

observaciones. (Adaptado de van Es y van Es, 1993)

Fagroud y Van Meirvenne (2002), determinaron el diseño experimental óptimo

mediante el uso del variograma. Estos autores afirman que la capacidad de agua

disponible (CAD) es la principal fuente de variación de los rendimientos en los

experimentos de eficiencia del uso del agua. Mediante el uso de variogramas de CAD,

obtienen los valores de umbral y nugget, los cuales utilizan para calcular la proporción

nugget / umbral (PNS), con lo cual al graficar el largo versus PNS y el ancho versus

PNS de la parcela, pueden obtener los valores óptimos de largo y ancho de parcela en

la que los valores de CAD se consideran independientes o aleatorios, ya que un alto

valor de PNS representa que la variable medida, en este caso CAD, tiene efectos

aleatorios. Para determinar el número de parcelas (ó tratamientos) por bloque, se

obtienen los residuales del análisis de varianza restando el efecto del bloque al valor

de la parcela, utilizando el variograma sobre los residuales obtienen el valor de rango,

con el cual, calculan la proporción de PNS / rango y lo grafican versus el número de

parcelas por bloque. Un elevado valor de la proporción PNS / rango indica una débil

dependencia espacial de los residuales. El tipo de diseño se selecciona mediante la

comparación del modelo elegido versus el diseño de bloques completos al azar,

cuantificándolo con la eficiencia relativa del diseño seleccionado y el diseño de bloques

completos. La orientación de los bloques la determinan mediante la tendencia que

44

muestra CAD en el espacio, donde los bloques los ubican perpendiculares al sentido

de la mayor variación.

Gotway et al. (1997), indican que si la caracterización de un campo indica que las

áreas con similar variación espacial son suficientemente grandes para la incorporación

de bloques, estos pueden ser dispuesto de tal manera que la variación dentro del

bloque sea mínima. En el mismo sentido Mulla et al. (1990), asegura que si los efectos

de la variabilidad espacial pueden ser anticipados, el tamaño y ubicación de los

bloques pueden ser correctamente utilizados. (Figura 2.14)

Figura 2.14. Ubicación de los bloques según la variabilidad espacial conocida

2.4 ANALISIS ESTADISTICO ESPACIAL

2.4.1 Variabilidad espacial y error experimental

Una precisa evaluación de cultivares y la capacidad de diferenciar entre ellos es un

punto crítico para cualquier programa de mejoramiento. Estos programas se basan en

experimentos de campo con repeticiones y el uso de parcelas que pueden ser

estadísticamente analizadas, para de este modo seleccionar aquellos cultivares de

propiedades superiores (Stroup et al., 1994; Wu y Dutilleul, 1999).

Uno de los objetivos principales de los programas de mejoramiento genético es

incrementar el rendimiento y la estabilidad del mismo (Ball et al., 1993).

45

El rendimiento puede ser definido como una respuesta integral de un cultivo a un

ambiente específico de campo (Ball et al., 1993). Según Kirk et al. (1980), este

rendimiento puede ser afectado por numerosos factores, entre los cuales destacan:

• La presencia de variación sistemática de naturaleza desconocida, la cual se

refiere directamente a la posición de las parcelas en el campo.

• Efecto de factores aleatorios, el cual se refiere al error causado por los errores

medidos y la variación genética, sumado al gran número de pequeños efectos

aditivos.

Según Reich y Davis (2000), la variación sistemática desconocida es también conocida

como variación a gran escala, la cual se ve influenciada por el relieve, precipitación,

entre otros, mientras que la variación debida a factores aleatorios es conocida como

variación a pequeña escala, la cual también se ve influenciada por la permeabilidad del

suelo, nutrientes disponibles, pH, entre otros.

La magnitud del error experimental, el cual proviene de estas dos fuentes de variación,

es una interrogante de gran importancia para los programas de mejoramiento genético.

La heterogeneidad espacial, incluyendo la variabilidad del suelo, es una de las

mayores fuentes de variación que aumenta el error experimental (van Es y van Es,

1993; Mulla et al., 1990; Bhatti et al., 1991; van Es et al., 1989; Fagroud y Van

Meirvenne, 2002).

Smith (1938), fue el primero en modelar en forma empírica una ley de la variación de la

fertilidad del suelo y como se correlaciona con el rendimiento del cultivo, en la cual,

establece una relación lineal negativa entre la varianza del rendimiento y la superficie

del cultivo (tamaño de las parcelas), ambas expresadas en término de logaritmos. La

pendiente de esta relación es un indicador de la heterogeneidad del rendimiento, con lo

cual se puede establecer el tamaño de una parcela para la reducción de la

heterogeneidad del cultivo.

Se ha visto que en el procedimiento experimental se incluyen un número de

características que permiten medir y controlar el error experimental, entre ellas se

puede nombrar:

• Repetición.

46

• Bloqueo.

• Aleatorización.

Frente a esto, el diseño experimental más popular en investigaciones científicas es el

diseño de bloques completos al azar (Nelson y Rawlings, 1983; Eskridge, 2003; Ye et

al., 2001), seguramente por que alcanza un satisfactorio nivel de precisión (Cochran y

Cox, 1950).

2.4.2 Violación de supuestos

La violación de alguno de los supuestos del análisis de varianza puede afectar el nivel

de significancia y sensibilidad de la prueba de F, por lo que es una correspondiente

perdida en la precisión en la estimación obtenida para el efecto de los tratamientos

(Steel y Torrie, 1960).

El supuesto de normalidad no es necesario para la estimación de los componentes de

la varianza, pero afecta la prueba de significancia. Cuando la distribución es sesgada,

el componente del error de un tratamiento tiende a ser función de la media del

tratamiento. Esto resulta en una heterogeneidad del término del error, y para el análisis

de varianza es necesario que el error sea homogéneo (Steel y Torrie, 1960).

La falla en el supuesto de una varianza común, constante a través de todas las

observaciones, es producida por que ciertos tratamientos son erráticos en sus efectos.

En este caso, el error utilizado para la comparación de un par de tratamientos puede

ser cuatro veces más grande que para otro par de tratamientos, siendo que se utiliza el

mismo error para la comparación, puede llevar a que la prueba utilizada, t o F, resulte

completamente errónea (Cochran y Cox, 1950).

Sin embargo, el supuesto de normalidad y varianza constante a menudo se aproximan

a la verdad (Grundy y Healy, 1950), como también, el procedimiento de análisis es

robusto en el caso de una pequeña o moderada falla de normalidad y varianza

constante, por lo que el desempeño del análisis no se ve seriamente afectado

(Bhattacharyya y Johnson, 1977).

Para el caso del supuesto en que los errores son independientes, es conocido por los

estadísticos que en experimentos de campo la respuesta de los cultivos de las parcelas

adyacentes tiende a ser parecido (Steel y Torrie, 1960; Cochran y Cox, 1950); el

47

resultado del análisis puede ser engañoso si no se toma en cuenta este inconveniente.

Para evitar este problema en la practica, los tratamientos son asignados

aleatoriamente a las unidades experimentales o el orden de las observaciones es

determinado aleatoriamente (Kempthorne, 1952).

Sin embargo, según Zimmerman y Harville (1991) una característica de la mayoría de

los experimentos es la presencia de heterogeneidad sistemática a través de las

unidades experimentales, y típicamente, la naturaleza de esta heterogeneidad es tal

que existe una apreciable correlación entre unidades vecinas, por lo que el supuesto

de errores independientes no se cumple (Fagroud y Van Meirvenne, 2002; Mulla et al.,

1990). Estas observaciones entregan menos información que una observación

independiente, por lo que el aumento en el número de puntos muestreados entregan

poca o ninguna información adicional en contraste con una observación independiente

(Davis y Reich, 2000).

La imposibilidad de controlar la heterogeneidad espacial, produce una variación entre

los rendimientos de las parcelas, lo que disminuye la estimación entre el efecto de los

tratamientos, ya que el error experimental es incrementado, lo que invalida el análisis

de varianza (Brownie et al., 1993; Wu y Dutilleul, 1999; van Es y van Es, 1993).

Si bien los sistemas de bloqueos son efectivos en el control de la variabilidad espacial,

estos no son efectivos si la variabilidad es sistemática o compleja a través del campo,

por lo que estos sistemas de bloqueos son ineficientes (Tamura et al., 1988; Amaro y

Cobo, 1994; Pearce, 1998). Warren y Mendez (1982), demostraron que cuando los

bloques no tienen éxito, el cuadrado medio del error del análisis del tratamiento puede

ser seriamente sobreestimado. Dentro de esta variación espacial, las propiedades

químicas y físicas del suelo son las fuentes más importantes de variación que afectan

el rendimiento de los cultivos (Trangmar et al., 1987; Camberdella et al., 1994; Ortega

et al., 1999) y para el caso de experimentos con variedades, la heterogeneidad nace

comúnmente por el gran número de genotipos que son probados (Ye et al., 2001).

Aún cuando Fisher (1935), demostró que el análisis de varianza para el diseño de

bloques completos al azar es válido sin importar si los datos están correlacionados,

esto sólo se cumple si la correlación es uniforme en la parcela y no aumenta con la

distancia, con lo cual el diseño y el análisis no son eficientes (Bailey et al., 1995).

48

2.4.3 Remoción de la variabilidad espacial

Un acercamiento histórico para el control local de la variabilidad de la fertilidad del

suelo, es mediante el método de parcelas controles (check plots), comúnmente

utilizado en la investigación agrícola entre 1900 y 1930 (Dagnelie, 1989), el cual

envuelve la interposición sistemática de parcelas que contienen un tratamiento

estándar entre las parcelas con tratamientos experimentales. (Figura 2.15)

Figura 2.15. Método de parcelas controles (Adaptado de Besag y Kempton, 1986).

En la Figura 2.15, se puede observar la disposición de las parcelas con tratamientos

experimentales (T) y las parcelas estándar (st). En su antiguo uso, los tratamientos

experimentales eran sin repetición y los rendimientos de las parcelas controles se

usaban para calcular un índice de fertilidad para cada parcela, ajustando los

rendimientos de los tratamientos experimentales como una diferencia o relación del

índice de fertilidad de la parcela. La información proveniente de los parcelas controles

en ensayos con repetición fue incluida en los análisis, sin embargo se demostró que

esto causaba un sobre ajuste de las parcelas experimentales (Richey, 1924;

McClelland, 1926, citados por Besag y Kempton, 1986).

Yates (1936), colocó énfasis en la aleatorización de los tratamientos experimentales

para una estimación válida del error experimental y demostró la menor eficiencia del

uso de parcelas controles en contraste con el uso de diseños de lattices.

Para aquellos experimentos con repeticiones que no implican parcelas controles, es

importante disminuir la heterogeneidad espacial, lo que ha sido logrado mediante

distintos sistemas de reducción de la variabilidad espacial, comúnmente llamados

análisis de modelos espaciales (Ye et al., 2001).

st T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T st

49

El primero fue Papadakis, quien percibió que el uso tradicional de los bloques ignoraba

la forma del verdadero modelo de fertilidad (Pearce, 1998), por lo que en 1937, y

siguiendo los pasos previos de Richey (1924) de ajustar el rendimiento de cada parcela

mediante un análisis de regresión, propuso el uso de los residuales de los rendimientos

de parcelas vecinas como covariables. Pero este método fue propuesto sólo como una

modificación del método de distribución sistemática de parcelas controles (Dagnelie,

1989).

Esta idea fue discutida y desarrollada por Bartlett (1938, 1978) y Wilkinson et al.

(1983). El trabajo de Papadakis (1937), forma substancialmente la base para otros

análisis estadísticos que utilizan las parcelas vecinas para ajustar los rendimientos

como por ejemplo Besag y Kempton (1986), Wilkinson et al. (1983), Bartlett (1978),

Williams (1986), Schwarzbach (1985); a este grupo de métodos se conoce con el

término de análisis del vecino más cercano (nearest neighbour analysis).

Un método alternativo al vecino más cercano, es el que incluye la variación sistemática

del suelo. Neyman et al. (1953) propuso utilizar una ecuación de regresión polinomial

para describir la variación de la fertilidad en los experimentos, en los cuales los

tratamientos son arreglados en el mismo orden en todos los bloques y los bloques son

dispuestos sucesivamente.

La existencia de tendencias locales en experimentos de campo implica que la similitud

existente entre parcelas cercanas es superior de las más distantes, lo cual implica una

correlación espacial de los residuales. Basados en este principio, Zimmerman y

Harville (1991) propusieron un modelo para ajustar tendencias locales llamado

aproximación al campo aleatorio (random field approach), en el cual la tendencia local

es modelada mediante la inclusión de una variación a gran escala y una variación a

pequeña escala.

Según Brownie et al. (1993), los análisis espaciales asumen un esquema rectangular a

x b de las parcelas, con una disposición en filas descritas por Ri, donde i = 1,..., a, y

una disposición en columnas descritas por Cj, donde j = 1,..., b. Cada uno de los t

tratamientos es replicado r veces, por lo que el número total de parcelas en el ensayo

es ab = rt. Para la parcela en la fila i y columna j, sea yij el que representa el

rendimiento observado, Ti j es el término de ajuste y τi el efecto del tratamiento asignado

a la parcela i. Por lo que el modelo que incorpora la variación espacial es:

50

[2.22] ijijiij Ty ετµ +++=

donde µ es la media poblacional y εij es el error aleatorio con ε ~ NID (0, σ2).

Los diferentes modelos espaciales difieren en el supuesto acerca de Tij y εij.

2.4.3.1 Método de Papadakis

El método de Papadakis consiste en obtener los residuales de cada tratamiento, bajo

un diseño completamente al azar, los cuales pueden ser positivos o negativos:

[2.23] iijij yyr −=

donde rij es el residual del rendimiento de la parcela i bajo el tratamiento j, yij es el

rendimiento observado de la parcela i, bajo el tratamiento j e iy es el promedio del

tratamiento asociado a la parcela i.

Posteriormente se calcula la covariante, también llamado índice de fertilidad por

parcela (Amaro y Cobo, 1994) ó variante concomitante (Pearce y Moore, 1976), que

corresponden a los residuales promedio de las parcelas vecinas del rendimiento que se

quiere ajustar, por ejemplo si tomamos dos parcelas sobre una misma línea para el

caso del análisis en una dimensión, ó cuatro parcelas vecinas dispuestas en filas

horizontales y columnas verticales, para el caso de dos dimensiones (Draper y Faraggi,

1985).

[2.24] ( )jijijijiij rrrrX ,1,11,1,41

+−+− +++=

donde Xij es el valor de la covariable en la fila i y en la columna j, 1,1 ±± jir son los

residuales de las parcelas vecinas.

Finalmente, los datos son examinados por el análisis de covarianza, aunque Xij no es

una verdadera covariable, ya que los rij son obtenidos de los valores de rendimientos

observados yij, bajo el siguiente modelo lineal:

51

[2.25] )()( ijkijkijk BXy ετµ +++=

donde µ es la media poblacional, ôk es el tratamiento k, Xij es el término de ajuste de Tij

y representa la covariable, B es el coeficiente de regresión asociado a la covariable y

εk(ij) son los efectos aleatorios con ε ~ NID (0, σ2) del modelo que incorpora la variación

espacial.

Según Brownie et al. (1993), los bloques son ignorados debido a que al incluir el efecto

de los bloques se puede introducir, aparentemente, una discontinuidad artificial en el

rendimiento potencial para las parcelas adyacentes que se encuentran en diferentes

bloques.

Este método puede variar, dependiendo de las parcelas utilizadas como residuales

para este análisis, así, pueden ser utilizadas parcelas de la misma fila, parcelas de la

misma columna, como también utilizar mas de una covariable en el modelo (Pearce y

Moore, 1976).

Un método iterativo del método de Papadakis es presentado por Bartlett (1978), bajo la

sospecha de que el método produce un sesgo en la estimación del contraste de los

tratamientos, aunque según Pearce (1998), la intención de la iteración es hacer el

procedimiento consistente y no para minimizar el residual del error estándar, ya que no

se ha probado nada sobre el cuestionamiento de sesgo por este método.

2.4.3.2 Análisis de tendencia

Neyman et al. (1953), fueron pioneros al sugerir un modelo que explique la variación

sistemática del suelo. Estos investigadores propusieron utilizar una ecuación de

regresión polinomial para describir la variación de la fertilidad en los experimentos,

donde los tratamientos son arreglados en el mismo orden en todos los bloques y los

bloques son dispuestos sucesivamente.

La variabilidad sistemática del experimento es removida por el ajuste de una ecuación

de regresión polinomial de la gradiente de fertilidad usando filas y columnas como

variables independientes en la función polinomial. La función resultante es conocida

como modelo de superficie de respuesta (Kirk et al., 1980).

52

Para la obtención de la regresión polinomial, primero se obtienen los residuales de

cada observación a partir de un diseño completamente al azar, los cuales son

identificados por su respectiva fila y columna (Fórmula [2.23]).

Luego se calculan todos los posibles modelos de superficie de respuesta de los valores

de los residuales y se seleccionan los p – modelos que producen la menor suma de

cuadrados del error. Estos p-modelos consisten en encontrar el mejor modelo de p –

términos expresados como suma de cuadrados del error. Como último paso se evalúan

los distintos p – modelos y se selecciona el mejor, el cual se utiliza como superficie de

respuesta. El procedimiento de selección envuelve una serie de pruebas de F de los

distintos modelos, utilizando un nivel de significancia de α = 0,01 (Kirk et al., 1980;

Tamura et al., 1988). Este procedimiento se realiza hasta que la introducción de un

término adicional no resulta en una reducción significativa de la suma de cuadrados del

error.

Según Brownie et al. (1993), los bloques son ignorados porque el límite entre bloques

contiguos es artificial y el rendimiento potencial no es probable que cambie

abruptamente a lo largo de la línea correspondiente a ese límite. Esto resulta en una

discontinuidad a lo largo de los límites del bloque, mientras que el análisis de tendencia

asume que el rendimiento potencial varía de una manera uniforme. En el análisis de

varianza, la suma de cuadrados asociado con el modelo de superficie seleccionado, es

substraída del total en lugar del asociado a los bloques y los grados de libertad de la

superficie de respuesta es equivalente al número de términos de la ecuación polinomial

seleccionado (Bowman, 1990).

Por lo que el modelo lineal que incorpora la superficie de respuesta es:

[2.26] ( ) ( ) ( )ijkjikijk CRfy ετµ +++= ,

donde yk(ij) es el rendimiento observado bajo el tratamiento k en la fila i y columna j, ì

es la media poblacional, f (Ri, Cj) es el termino de ajuste de Ti j y representa la superficie

de respuesta en función de las filas denominadas Ri, donde i = 1,..., a, de las columnas

descritas por Cj, donde j = 1,..., b (Ye et al., 2001) y εk(ij) son los efectos aleatorios con ε

~ NID (0, σ2) del modelo que incorpora la variación espacial.

La dificultad de este método es determinar correctamente la función polinomial (Ye et

al., 2001), ya que los problemas asociados a este modelo es la sobreestimación o el

53

ajuste de un modelo incorrecto. Según Brownie et al. (1993), la sobreestimación ocurre

si la verdadera función para Tij es un polinomio, sin embargo se ajusta un polinomio

con demasiados términos. Ajustar un modelo incorrecto ocurre si muy pocos términos

son ajustados ó si la verdadera función no puede ser modelada como un polinomio.

2.4.3.3 Errores correlacionados

Zimmerman y Harville (1991) propusieron modelos de campo aleatorio (random field

models) para calcular directamente la variabilidad espacial sistemática.

Este modelo se desarrolló al observar que la heterogeneidad espacial surge de dos

fuentes de dependencia espacial, una dependencia a gran escala o tendencia, la cual

es modelada por la estructura de la media y una dependencia a pequeña escala, la

cual es modelada por la estructura de la correlación espacial. El modelo se basa sobre

la teoría de ciertos procesos estocásticos conocidos como campos aleatorios, y en los

que se toma la estructura de la media como una función lineal de parámetros

desconocidos. En consecuencia, a este modelo se le denomina campo lineal aleatorio

(random fiel linear model), los cuales pueden ser aplicados a distintos fenómenos

espaciales como también a experimentos espaciales (Zimmerman y Harville, 1991). La

mayoría de los modelos espaciales solo incluyen la gran escala (random field) y los

que incluyen solo la pequeña escala se denominan modelo de error correlacionado

(correlated error model) (Ye et al., 2001). Claramente es preferible utilizar la variación a

gran y pequeña escala, para lo cual se puede utilizar una función para calcular la

variación a gran escala y la estructura espacial del error para la pequeña escala

(Brownie et al., 1993).

El modelo de error correlacionado asume que la correlación entre dos términos de error

es grande para las parcelas vecinas y disminuye cuando la distancia entre parcelas

aumenta, lo que implica que las parcelas cercanas son más parecidas a las más

lejanas.

Para estructurar la variación a pequeña escala, primero se obtienen los residuales

desde un diseño completamente al azar (Fórmula [2.23]).

Se asume que este residual posee una covarianza que puede ser modelada

(Zimmerman y Harville, 1991), por ejemplo para un modelo exponencial:

54

[2.27] ( ) ( ) ( )lmijdlmijlmij eCorrCov ,22 ,, θσεεσεε −==

donde d(ij, lm) es la distancia entre parcelas (i, j) y (l, m), y θ es el parámetro a estimar.

Una herramienta utilizada en geoestadística, conocida como semivariograma, es útil

para modelar la estructura de la correlación espacial de los residuales (Journel y

Huijbregts, 1978).

Una vez calculado el variograma experimental es necesaria la elección del mejor

modelo que se ajuste al variograma experimental.

Los parámetros del variograma son utilizados como covarianza para el análisis de la

covarianza (Ye et al., 2001).

Según Gotway et al., (1997) la desventaja de este método es el esfuerzo en el uso de

la computación para los cálculos, el cual no es fácil para experimentos con un gran

número de observaciones, por ejemplo superior a 2000 y según Brownie et al. (1993),

también tiene el inconveniente de elegir adecuadamente la covarianza del error.

2.4.3.4 Análisis de tendencia más error correlacionado

Este modelo surge de la necesidad de modelar la variación en sus dos formas a gran y

pequeña escala (Brownie et al., 1993), ya que la gran escala puede ser modelada por

la estructura de la media como una función polinomial al incorporar la tendencia sobre

el ensayo, y la pequeña escala puede ser modela por la estructura de la correlación

espacial del error (Zimmerman y Harville, 1991).

La variación de este modelo incluye la función polinomial para Ti j y la incorporación de

la covarianza para el término del error εij, este último incluye la correlación entre

parcelas adyacentes.

Para este análisis primero se obtiene los residuales desde un modelo completamente

al azar (Fórmula [2.23]).

Luego se modela el variograma del error, obteniéndose los parámetros de la

covarianza, posteriormente se obtiene la superficie de respuesta con los mismos

criterios utilizados en el análisis de tendencia (Fórmula [2.26]).

Los parámetros del variograma son utilizados como covarianza en el análisis de

covarianza que incluyen este modelo.

55

2.4.3.5 Estimación geoestadística

Hernández y Mulla (2002), propusieron un nuevo método para remover la variabilidad

espacial, mediante el uso de herramientas geoestadísticas como el variograma y el

interpolador kriging sumado al análisis del vecino más cercano (AVMC).

Este método estima la variación espacial mediante le estructura espacial de los

residuales y ajusta los rendimientos mediante la ecuación de kriging.

El uso de AVMC para ajustar los rendimientos por autocorrelación espacial a sido

descrito por varios autores (Wilkinson et al, 1983; Papadakis, 1988; Mulla et al, 1990;

Bhatti et al, 1991; Brownie et al, 1993).

Hernández y Mulla (2002), utilizan AVMC para calcular la verdadera media del

tratamiento mediante el iterativo ajuste de la desviación de las observaciones.

Primero se estandarizan los residuales de cada rendimiento observado sustrayendo la

media de los tratamientos a cada valor de rendimiento observado, este residual

representa una localizada medida de los efectos del espacio sobre el rendimiento:

[2.28] ( )

( )ijt

ijtijij

m

y

yyr

−=

donde ijm r es el residual normalizado en cada localidad, yij es el valor observado de

rendimiento en la posición i y j e ( )ijty es el rendimiento promedio para el tratamiento t.

Luego se obtiene el semivariograma de los residuales normalizados.

La ecuación del kriging ordinario es utilizado para estimar los nuevos residuales ( 0̂r ) de

las observaciones de las parcelas vecinas por medio de la validación cruzada. Este

procedimiento identifica la porción de los residuales debido a un uniforme efecto

espacial localizado. El modelo lineal de la ecuación de kriging es:

[2.29] ∑=

+ =n

hij

mh

m rr1

01 ˆ λ

donde 01r̂m + es el residual estimado para la iteración m + 1, λh es el vector de peso del

kriging ordinario basado en el modelo de variograma y ijm r es el residual normalizado.

56

Una nueva estimación para el rendimiento observado es utilizando la siguiente

ecuación, donde la constante b es típicamente un valor de 0,5, así el procedimiento de

ajuste por la remoción parcial de la tendencia y la oscilación en la media del

tratamiento es pesado (Bhatti et al, 1991).

[2.30] ( )011 ˆ1 rbyy m

ijm

ijm ++ ×−=

donde ijm y1+ es el valor del rendimiento actualizado para la iteración m + 1, ij

m y es el

rendimiento original en la posición i y j, b es una constante y 01r̂m + es el residual

estimado para la iteración m + 1.

Estos valores son utilizados en un proceso iterativo hasta que el umbral del

semivariograma de los rij indique que no existe estructura espacial (efecto nugget

puro).

Estos autores indican que al menos seis iteraciones son necesarias para la

convergencia.

Finalmente, se calcula un mapa de diferencia de rendimientos, por medio de la resta

del rendimiento actualizado con el rendimiento original.

57

3. MATERIALES Y METODOS

3.1 Material experimental

El experimento fue sembrado el 30 de Noviembre de 2001 y consistió en 360 híbridos

de maíz (Zea mays L.). El diseño experimental correspondió a bloques incompletos (α -

lattice), y consistió en 20 bloques incompletos y 18 híbridos por bloque en dos

repeticiones. Los genotipos fueron evaluados bajo condiciones de riego normal y bajo

estrés hídrico, y la unidad experimental correspondió a parcelas de 3,75 m de largo.

Cada parcela se constituyó por dos hileras separadas 0,75 m entre sí y sembradas a

0,12 m sobre la hilera. La superficie total del experimento alcanzó a 12.474 m2. La

fertilización a la siembra fue de 748 kg en una mezcla de 27,5 % N, 16,7 % P2O5 y 10,9

% K2O; en el resto de la temporada se realizó fertirrigación parcializada en 4 – 5

oportunidades hasta floración, aplicándose un total de 300 kg de Supernitro (36 % N).

El riego fue por goteo, frecuencia fija y cantidad variable de acuerdo a los

requerimientos de evapotranspiración del cultivo.

El experimento fue establecido en el Centro de Investigación Viluco (33º 47’ Lat. S., 70º

48’ Long. E., altitud 380 m), perteneciente a Semillas Pioneer Chile Limitada.

La variable a analizar correspondió a rendimiento de grano, la cual al momento de

cosecha, se midió el peso en libras (lb.) y se obtuvo la humedad de cosecha.

Finalmente el rendimiento es expresado en bushel · acre-1 a través de la siguiente

formula:

[3.1] ( ) ( )

××−

pulgadasenparceladeanchopiesenparceladelargo

factorlb.enorendimientcosechadehumedad

815109100

,

3.2 Caracterización y mapeo del sitio experimental

El suelo corresponde a un franco arcilloso de la serie Maipo, ubicado en el valle regado

de la zona central de Chile. El mapeo y muestreo de suelo se realizó el 11 de junio de

2002 una vez cosechado el experimento. Para ello se utilizó el software FarmGPS

(Red Hed Systems, 2000) unido al programa MapInfo (MapInfo Corporation, 1999), con

58

el cual se obtenían las coordenadas geográficas de las muestras y el perímetro. Estos

programas estaban unidos a un receptor GPS (Global Positioning System) con

diferencial (DGPS, modelo Trimble 114), por lo cual los datos se expresaron en el

sistema UTM (Universal Tranverse Mercator), en metros. De esta forma cada muestra

colectada y el perímetro contaban con sus correspondientes coordenadas cartesianas

X e Y, necesarias para el análisis espacial cuantitativo.

Una vez determinado el perímetro, se eligió el método de muestreo, optando por el

método sistemático no alineado proporcionado por el programa FarmGPS. Los puntos

muestreados se tomaron a 20 cm de profundidad y estaba constituido por cinco

submuestras.

Las muestras de suelo fueron extendidas y secadas al aire, posteriormente se realizó

el análisis de las propiedades químicas del suelo, los cuales están estandarizados por

el Servicio Agrícola y Ganadero (SAG) y son los comúnmente utilizados en la mayoría

de los laboratorios del país (Ortega y Flores, 1999):

• pH: al agua, en relación suelo: agua 1:2,5.

• CE: al agua, en relación suelo: agua 1:2,5.

• Materia Orgánica: Método de Walkley y Black o reducción del dicromato de

potasio (K2Cr2O7).

• Nitrógeno (N) disponible: Determinación de NO3 –N + NH4 –N. Suelos se

extraen con cloruro de potasio (KCl) 2M.

• Fósforo (P) Olsen: Suelos se extraen con bicarbonato de sodio (NaHCO3) 0,5

M, pH 8,5.

• Potasio (K) extractable: Extracción con acetato de amonio (NH4OAC) 1M, pH 7,

por 5 minutos.

• Calcio (Ca), magnesio (Mg) y sodio (Na) de intercambio: Extracción con acetato

de amonio (NH4OAC) 1M, pH 7, por 30 minutos.

Respecto de las unidades más comunes en que se expresa el análisis de suelo, tanto

N disponible, P Olsen y el K extractable se expresan en partes por millón (ppm) o mg ·

kg-1 de suelo. Los cationes de intercambio (Ca, Mg, Na y K) normalmente se expresan

en meq · 100g-1 suelo o más reciente en Cmol (+) · kg-1 de suelo, siendo estas

unidades equivalentes (Ortega y Flores, 1999).

59

La información generada fue sometida a distintos procedimientos analíticos, como se

describen a continuación.

3.3 Análisis estadístico

Los parámetros de los estadísticos descriptivos de las propiedades químicas del suelo

y del rendimiento de grano fueron calculados utilizando el procedimiento PROC

UNIVARIATE en SAS (SAS Institute, 2001).

El análisis de correlación fue utilizado para determinar la relación entre el rendimiento

de grano y las propiedades de suelo medidas, estas se calcularon utilizando el

procedimiento PROC CORR en SAS, con la información obtenida de la interpolación

de los mapas de las propiedades químicas del suelo con el mapa de rendimiento.

Para probar el supuesto de varianza homogénea se utilizó la prueba de F en la relación

de variación (variance ratio F test) la cual se describe como:

[3.2] ( )( )11.., minmax2min

2max −−== nnlg

S

SF

donde 2maxS corresponde a la varianza de mayor valor calculado de todas las muestras,

2minS Corresponde a la varianza de menor valor calculado de todas las muestras, maxn y

minn corresponde al número de observaciones asociado a cada varianza. La hipótesis

nula corresponde a que no existe diferencia entre las varianzas de las muestras.

La prueba de normalidad de los residuales se realizó con el estadístico W de la prueba

Shapiro – Wilk, propuesta por Shapiro y Wilk (1965), utilizada cuando el número de

observaciones es menor a 2000. La hipótesis nula corresponde a que los datos se

distribuyen normalmente. El cálculo se realizó en SAS con el procedimiento PROC

UNIVARIATE.

Para probar el supuesto de independencia de los residuales, se obtuvieron los

variogramas de los residuales con la sentencia VARIOGRM de la librería espacial

(Davis y Reich, 2000) en S-PLUS (Statistical Sciences, 1994), los cuales debieran

mostrar un efecto de nugget puro para demostrar que no son espacialmente

dependientes.

60

El análisis de varianza fue realizado para evaluar y modelar la respuesta de los

rendimientos con los distintos métodos de bloque o remoción de la autocorrelación en

SAS utilizando el procedimiento PROC GLM. Para los análisis de varianza de los

diseños bloques completos al azar y α - lattice se utilizó el software LATANOVA

(Barreto et al., 1997).

Para comparar la ganancia en la reducción del Cuadrado Medio del Error (CME) con

respecto a los diseños BCA y α - lattice, y también para determinar la selección de un

diseño, modelo o zona, se utilizó la eficiencia relativa (ER) propuesta por Fisher (1925)

y utilizada por Cochran y Cox (1950), y Kirk et al. (1980):

[3.3] ( ) ( )( )( )( ) 2

112

22212

221 31

31Snn

SnnSarespectoconSER

++++

=

donde 21S y 2

2S corresponden a los cuadrados medios del error de los dos diseños a

comparar, n1 y n2 son los grados de libertad asociados a 21S y 2

2S respectivamente.

Un segundo método para determinar la eficiencia o selección de un diseño, modelo o

zona, se utilizó la prueba de falta de ajuste (lack of fit test), para determinar la falta de

ajuste del uso del diseño experimental inicialmente utilizado con respecto al diseño o

modelo propuesto, esta prueba fue originalmente descrito para ajustar una regresión

lineal y consiste en dividir la suma de cuadrados del error en dos componentes, la

suma de cuadrados del error puro (SCep) y la suma de cuadrados del error asociados a

la falta de ajuste (SCfda) (Bhattacharyya y Johnson, 1977):

[3.4]

( )( )

( )

( )( )knklg

kn

SCk

SCSCE

CMCM

Fep

ep

ep

fda −−=

−

−

−

== 2..,2

donde CMfda corresponde el CME debido a la falta de ajuste, CMep es el cuadrado

medio del error debido al error puro, SCE es la suma de cuadrados del error, k − 2 son

los grados de libertad asociados a SCfda y n − k son los grados de libertad asociados a

SCep, donde n es el número total de observaciones y k son los distintos niveles de la

variable independiente incluida en el experimento.

61

Para ser utilizada en la comparación de diseños, métodos y zonas, bajo la hipótesis

nula que no existe diferencia entre el modelo originalmente descrito y el propuesto, la

SCE se asoció a la suma de cuadrados de un diseño bloques completos al azar, SCep

a la suma de cuadrados del diseño a ser comparado (SCdiseño), k − 2 a la diferencia de

los grados de libertad asociados a SCE y SCdiseño, y n − k a los grados de libertad

asociados al cuadrado medio del error del diseño a ser comparado:

[3.5]

( )( )( )comparadodiseñodelCMElgdediferencialg

CMElgdediferencia

SCSCE

Fdiseño

diseñoCA

....,.. =

−

=

3.4 Análisis estadístico utilizando modelos espaciales

Para los distintos análisis los rendimientos de grano fueron dispuestos en filas y

columnas, y los modelos asociados a un diseño experimental completamente al azar.

En el método de Papadakis, se obtuvieron los residuales del análisis de varianza

utilizando un diseño experimental completamente al azar, según la fórmula:

[3.6] iijij yyr −=

donde rij es el residual del rendimiento de la parcela i bajo el tratamiento j, yij es el

rendimiento observado de la parcela i, bajo el tratamiento j e iy es el promedio del

tratamiento asociado a la parcela i.

La covariable se obtuvo del promedio de los residuales de las cuatro parcelas vecinas

dispuestas horizontal y verticalmente, recomendado por Pearce y Moore (1976),

llamadas izquierda (left), derecha (right), arriba (top) y abajo (bott), con la siguiente

fórmula:

[3.7] ( )botttoprightleftCov +++=41

donde Cov es la covariable de los valores ubicado a la derecha, izquierda, arriba y

abajo del residual del rendimiento a ajustar.

62

Para el análisis de varianza se desarrollo una sentencia para ser calculada con el

procedimiento PROC GLM3 en SAS.

En el método de análisis de tendencia (AT) se eligió un polinomio que representa la

superficie de respuesta de los residuales obtenidos del análisis de varianza utilizando

un diseño experimental completamente al azar. Para el cálculo del polinomio se utilizó

la sentencia TRENDLS de la librería espacial en S-PLUS, seleccionándose aquel con

un valor inferior del Akaike Information Criteria (AIC) (Akaike, 1973), según la formula:

[3.8] ( ) ( )( )parámetrosdeNlikelihoodmaximumtudverosimili máximaA º2ln2 ×+−=

y es estimada por:

[3.9] ( ) pRnA 2lnˆ += ,

donde n es el número de observaciones, R es el residual y p es el número de

parámetros estimados. El modelo que presente menor AIC es el seleccionado.

El análisis de varianza se calculó usando PROC GLM en SAS.

Para el análisis de errores correlacionados (EC), se obtuvieron los residuales del

análisis de varianza utilizando un diseño experimental completamente al azar.

Se utilizó la sentencia VARIOGRM en S-PLUS para ajustar el variograma experimental

del error y obtener los valores de umbral, nugget y rango, los cuales son utilizados

como covarianza, el cálculo del análisis de varianza se realizó con el procedimiento

PROC MIXED en SAS.

Para el análisis de AT + EC, se utilizó el polinomio seleccionado para el método de AT

y los valores de umbral, nugget y rango del variograma de los residuales adoptado

para EC, bajo los mismos criterios anteriormente descritos.

Para el análisis de varianza se utilizó el procedimiento PROC MIXED en SAS.

3 Los procedimientos SAS de los distintos modelos se presentan en el anexo C, en el cual se incluyen los procedimientos SAS para el análisis de las zonas incorporadas al diseño experimental.

63

3.5 Análisis geoestadístico

Para mapear adecuadamente la variabilidad espacial de cualquier variable de interés,

es necesario que ésta exhiba dependencia espacial o autocorrelación, para su

posterior interpolación.

La teoría de la variable regionalizada asume estacionaridad de los datos, sin embargo,

tendencias a gran escala en la variable espacial pueden permitir que no se cumpla el

supuesto de estacionaridad. Para revelar y eliminar la tendencia se utilizó un modelo

lineal de análisis de tendencia de acuerdo a la siguiente formula:

[3.10] ( ) ii sCoordenaday εβα ++=

donde yi es la variable de interés en la posición i, á es el intercepto y â es la pendiente

del modelo de regresión de la variable de interés, los cuales son dependientes de las

coordenadas utilizadas, y åi es el residual de la variable en la posición i. Cuando la

tendencia lineal fue significativa (P � 0,05) los variogramas fueron calculados sobre los

residuales åi proveniente del análisis de tendencia; si no era significativa, los

variogramas fueron calculados directamente con los datos de la variable de interés.

La dependencia espacial de las propiedades químicas del suelo y los rendimientos se

evaluó por medio de variogramas con la sentencia VARIOGRM de la librería espacial

en S-PLUS.

Una vez calculado el variograma experimental es necesario la elección del mejor

modelo (Exponencial, Gausiano, Esférico, entre otros) que se ajuste al variograma

experimental, la elección se realizó por medio de comparación, seleccionando el

modelo que arrojara un menor valor de AIC, según lo sugerido por McBratney Webster

(1986).

Para la interpolación de las variables se evaluaron distintos métodos de interpolación,

eligiéndose el método que entregara un R2 mayor, los métodos utilizados fueron:

• Distancia inversa.

• Kriging puntual.

• Curvatura mínima.

• Método modificado de Shepard.

64

• Vecino natural.

• Regresión polinómica.

• Función de base radial.

• Triangulación con interpolación lineal.

Los cálculos de R2 se realizaron con los residuales entregados por SURFER y se

calculó con la siguiente fórmula:

[3.11] SCT

SCER

−= 12

[3.12] ( )∑ −= 2ˆ ii yySCE

[3.13] ( )

∑ ∑

−=

n

yySCT i

i

2

2

Donde SCE es la suma de cuadrados del error, SCT es la suma de cuadrados totales,

yi es el valor observado, �i es el estimado en el punto i y n es el número de

observaciones. Un valor cercano a 1, es el interpolador que mejor ajusta la estimación.

3.6 Análisis estadístico utilizando diseños experimentales asociados a zonas

La determinación de las zonas se realizó mediante el análisis de agrupamiento (cluster

analysis)4 en MapCalc (Red Hed Systems, 1999), en la cual se incorporaron nueve

variables a ser analizadas. Para evitar la diferencia en la magnitud de los valores de las

distintas propiedades, fue necesario estandarizar los valores interpolados por medio de

la fórmula:

[3.14] ( )

σ

µ−= iy

z

donde z es el valor de la variable estandarizada, yi es el valor observado, µ es la media

de la muestra y σ es la desviación estándar de la muestra.

4 Mayor detalle del procedimiento de análisis de cluster utilizado por MapCalc se presenta en el anexo D.

65

Los mapas de las zonas se exportaron como mapa de contorno (contour map) a

MapInfo, en el cual se interpolaron con los datos de rendimientos para obtener los

híbridos que integran una zona específica.

La selección del número óptimo de zonas se realizó mediante el siguiente

procedimiento5:

(1) Se comparó la eficiencia relativa de las zonas con respecto a los diseños

experimentales, eligiendo el número de zonas que presentara una eficiencia

relativa sobre uno y fuese mayor al de las otras zonas.

(2) Se observó la prueba de falta de ajuste para determinar bajo la hipótesis nula

de que no existe diferencia entre el diseño originalmente descrito y el

propuesto, la cual tiene que ser significativa.

(3) Si se cumplen estos requisitos se selecciona el correspondiente número de

zonas.

Para obtener los análisis de varianza utilizando los diseños experimentales bloques

completos al azar y á – lattice asociados a las zonas, se utilizó el procedimiento PROC

GLM en SAS, en el cual las zonas se ingresaron como variables clasificatorias según

los siguientes modelos:

Bloques completos al azar:

[3.15] ( ) ijkkijjiijk HZZHy εβµ +++++=

donde ijky es el valor de la unidad experimental del híbrido i en la zona j en el bloque k,

µ representa la media poblacional, iH es el efecto del nivel i del factor híbrido, jZ es el

efecto del nivel j del factor zona, ( )ijHZ es el efecto de la interacción entre los niveles i j

de los factores híbrido y zona, βk es el efecto del bloque k y ijkε representa la

5 Mayor detalle de las zonas seleccionadas y las tablas originales de eficiencia relativa y prueba de falta de ajuste, se presentan en el anexo E.

66

desviación aleatoria de la unidad experimental sometida al híbrido i en la zona j en el

bloque k, con ε ~ NID (0, σ2)

á – lattice:

[3.16] ( ) ijkllkijjiijkl rHZZHy εβµ ++++++=

donde ijkly es el valor de la unidad experimental del híbrido i en la zona j en el bloque k

en la repetición l, µ representa la media poblacional, iH es el efecto del nivel i del factor

híbrido, jZ es el efecto del nivel j del factor zona, ( )ijHZ es el efecto de la interacción

entre los niveles i j de los factores híbrido y zona, βk es el efecto del bloque k, rk es el

efecto de la repetición l y ijklε representa la desviación aleatoria de la unidad

experimental sometida al híbrido i en la zona j en el bloque k en la repetición l, con ε ~

NID (0, σ2)

67

4. DISCUSION DE RESULTADOS

Análisis estadístico

El Cuadro 4.1 presenta los parámetros de los estadísticos descriptivos de las distintas

propiedades químicas de las muestras de suelo y del rendimiento de grano de maíz,

ubicados en los experimentos de riego normal y estrés hídrico.

Cuadro 4.1. Estadísticas básicas de las distintas variables medidas bajo los distintos

experimentos.

Variable Estrés hídrico Riego normalMedia Desv. Est. CV Media Desv. Est. CV

CE (dS � cm-1) 158,10 21,92 13,87 158,39 25,51 16,11

Ca (meq � 100g-1) 3968,08 223,30 5,63 4044 199,42 4,93K (mg � kg-1) 192,73 38,80 20,13 202,17 25,07 12,40Mg (meq � 100g-1) 139,62 8,59 6,15 154,33 16,21 10,50MO (%) 1,54 0,15 9,59 1,60 0,28 17,70N (mg � kg -1) 18,42 23,25 126,21 12,35 3,22 26,07Na (meq � 100g-1) 91,25 25,05 27,45 73,69 12,53 17NH4

+ (mg � kg-1) 1,95 2,71 138,88 1,69 1,19 70,50

NO3- (mg � kg -1) 16,47 20,61 125,17 10,66 3,12 29,27

P (mg � kg-1) 10,83 3,84 35,43 16,42 6,91 42,08pH (1:2,5) 8,21 0,24 2,94 8,27 0,25 2,99Rendimiento (kg � ha-1) 132,57 45,90 34,62 226,17 19,09 8,44

Según el Cuadro 4.1, al comparar el coeficiente de variación (CV) de las diferentes

variables ubicadas en ambos experimentos, se observó que calcio (Ca), conductividad

eléctrica (CE), fósforo (P) y pH no presentaron diferencias en el CV, sin embargo bajo

el experimento de estrés hídrico la mayor parte de las variables estudiadas mostraron

un CV mayor, lo que implica que el sistema de riego afectó la variabilidad de las

propiedades químicas del suelo o redujo su impacto sobre la productividad del maíz.

El coeficiente de correlación de Pearson entre las propiedades del suelo y el

rendimiento de grano de maíz es presentado en el Cuadro 4.2.

68

Cuadro 4.2. Coeficiente de correlación de Pearson entre el rendimiento de granos de

maíz y las propiedades químicas del suelo.

Variable Estrés hídrico Riego normaln = 720 RendimientoP (mg � kg-1) 0,07 -0,07pH (1:2,5) 0,24** 0,16**CE (dS � cm-1) -0,05 -0,05MO (%) 0,01 -0,05NH4

+ (mg � kg-1) -0,11** -0,11**NO3

- (mg � kg-1) -0,10** -0,09*

N (mg � kg-1) -0,10** -0,13**K (mg � kg-1) 0,02 0,10**Na (meq � 100g-1) -0,11** -0,21**Ca (meq � 100g-1) 0,14** -0,03Mg (meq � 100g-1) 0,03 -0,10**

EXPERIMENTO

** P � 0,01, * P � 0,05

En el Cuadro 4.2, se puede observar que el rendimiento de grano de maíz tiene una

correlación positiva o negativa con la mayoría de las variables bajo los dos

experimentos, excepto P, CE y materia orgánica (MO) los cuales no mostraron

evidencia estadística significativa de correlación con el rendimiento. Estos resultados

demuestran que las propiedades químicas del suelo afectan al rendimiento, lo cual

también es afirmado por Trangmar et al., 1987; Camberdella et al., 1994 y Ortega et

al., 1999. Esta correlación significativa es importante para cualquier programa de

mejoramiento ya que según Ball et al., (1993), uno de los objetivos principales de los

programas de mejoramiento genético es incrementar el rendimiento y la estabilidad del

mismo. Por otra parte, de acuerdo a Stroup et al., (1994) y Wu y Dutilleul (1999), una

precisa evaluación de cultivares y la capacidad de diferenciar entre cultivares es un

punto crítico para cualquier programa de mejoramiento y como se ha visto, la

heterogeneidad espacial, incluyendo la variabilidad del suelo, es una de las mayores

fuentes de variación que aumenta el error experimental (van Es y van Es, 1993; Mulla

et al., 1990; Bhatti et al., 1991; van Es et al., 1989; Fagroud y Van Meirvenne, 2002).

Las Figuras 4.1 y 4.2 muestran la distribución espacial del rendimiento de grano de

maíz bajo el experimento de estrés hídrico y riego normal.

69

Figura 4.1. Distribución espacial de los rendimientos de grano de maíz bajo el

experimento de estrés hídrico.

En las Figuras 4.1 y 4.2, se puede apreciar que bajo el experimento de estrés hídrico la

respuesta del rendimiento tuvo mayor variabilidad espacial comparada con el

experimento bajo riego normal.

Figura 4.2. Distribución espacial de los rendimientos de grano de maíz bajo el

experimento de riego normal.

70

En la comprobación de supuestos del ANDEVA, para el caso en que los residuales se

distribuyen normalmente con µ igual a 0 y varianza igual a σ2, el Cuadro 4.3 muestra

que en los distintos diseños y bajo los distintos experimentos, la prueba de normalidad

Shapiro - Wilk no fue significativa al 5%, por lo que se acepta la hipótesis nula de

distribución normal de los residuales de los distintos diseños.

Cuadro 4.3. Probabilidad y valor del estadístico W de la prueba Shapiro - Wilk de los

residuales de los distintos diseños bajos los distintos experimentos.

Estadístico BCA � - lattice BCA � - latticeW 0,99 0,99 0,99 0,99Pr < W 0,56 0,29 0,71 0,19

Estrés hídrico Riego normal

En el caso del supuesto de varianza constante el Cuadro 4.4 muestra que el valor del

estadístico F es significativo al 0,1% y 1% en el experimento de estrés hídrico y riego

normal respectivamente, rechazando la hipótesis nula de igualdad de varianza, con lo

que el supuesto no se cumple; sin embargo, según Mitchell (1995), si el supuesto de

varianza constante no se cumple, no tiene mayor implicancia si las muestran poseen el

mismo número de observaciones. Sin embargo, el procedimiento del análisis es

robusto en el caso de una pequeña o moderada falla de normalidad y varianza

constante, por lo que el desempeño del análisis no se ve seriamente afectado

(Bhattacharyya y Johnson, 1977).

Cuadro 4.4. Prueba de F en la relación de variación, de los distintos experimentos

Experimento Valor de FEstrés hídrico 4068211,83***Riego normal 223998,88**

Significativo al nivel de *** α = 0,001 y ** 0,01

Para el caso del supuesto en que los errores son independientes, según Steel y Torrie

(1960) y, Cochran y Cox (1950), es conocido por los estadísticos que en los

experimentos de campo la respuesta de los cultivos de las parcelas adyacentes

tienden a ser similares entre sí, por lo que el resultado del análisis puede ser mal

interpretado. Kempthorne (1952), propuso que los tratamientos sean asignados

71

aleatoriamente a las unidades experimentales y que el orden de las observaciones sea

determinado de forma aleatoria, con lo cual se logra la independencia de los errores.

El Cuadro 4.5 muestra los parámetros de un modelo de variograma esférico de los

residuales de los distintos diseños en los distintos experimentos.

Cuadro 4.5. Parámetros de un variograma esférico de los residuales de los distintos

diseños y experimentos.

Al observar el Cuadro 4.5, los valores del umbral de los distintos variogramas son

cercanos al valor de la varianza de los residuales, lo que concuerda con Mcbratney y

Webster (1986), Trangmar et al. (1985), Trangmar et al. (1987) y Yost et al. (1982), los

que indican que el valor del umbral se aproxima al valor de la varianza de los datos.

Los valores de rango en el experimento de estrés hídrico para BCA (9,52 m), α - lattice

(6,17 m) y en el experimento de riego normal para BCA (8,75 m) y α - lattice (9,18 m),

sumado a las Figuras 4.3 y 4.4 de los variogramas de los residuales, indican que los

residuales presentan una dependencia espacial bajo un cierto rango, implicando que

los errores no son independientes; esto concuerda con Kirk et al. (1980), los que

afirman que la heterogeneidad del suelo no sólo incrementa el error experimental, si

no que además afecta la independencia de las observaciones, las cuales han sido

consideradas independientes. Esta dependencia espacial se puede explicar por la

heterogeneidad espacial presente y su correlación con el rendimiento, lo que coincide

con Fagroud y Van Meirvenne (2002) y Mulla et al. (1990), en que la naturaleza de esta

heterogeneidad es tal que existe una apreciable correlación entre unidades vecinas,

por lo que el supuesto de errores independientes no se cumple.

Varianza VarianzaDiseño Rango Nugget Umbral Residuales Rango Nugget Umbral ResidualesExperimental (m) (unidades)2 (unidades)2 (unidades)2 (m) (unidades)2 (unidades)2 (unidades)2

BCA 9,52 415,13 703,24 704 8,75 68,31 98,42 99,09� - Lattice 6,17 293,76 413,48 419,19 9,18 59,96 83,47 83,12

Parámetros del variogramaRiego Normal

Parámetros del variogramaEstrés Hídrico

72

Figura 4.3. Variograma de los residuales de los diseños BCA y α - lattice bajo el

experimento de estrés hídrico.

Figura 4.4. Variograma de los residuales de los diseños BCA y α - lattice bajo el

experimento de riego normal.

En un programa de mejoramiento genético, la violación de los supuestos del análisis de

varianza es importante, ya que según Steel y Torrie (1960), esto puede afectar el nivel

de significancia y sensibilidad de la prueba de F, por lo que es una correspondiente

perdida en la precisión en la estimación obtenida para el efecto de los tratamientos. Por

otra parte y desde el punto de vista de la información entregada por estos datos, según

Davis y Reich (2000), estas observaciones entregan menos información que una

observación independiente, por lo que el aumento en el número de puntos

73

muestreados entrega poca o ninguna información adicional en contraste con una

observación independiente.

Los Cuadros 4.6 y 4.7, presentan los análisis de varianza (ANDEVA) del rendimiento

de grano de maíz bajo condiciones de estrés hídrico utilizando los diseños bloques

completos al azar (BCA) y α - lattice.

Cuadro 4.6. ANDEVA del rendimiento de grano de maíz bajo el experimento de estrés

hídrico utilizando un diseño de BCA.

FV gl SC SCM F R²Modelo 360 1010720,66 2807,55 1,99*** 0,66Híbrido 359 837478,23 2332,81 1,65***Bloque 1 173242,43 173242,43 122,87***Error 359 506176,52 1409,96

Total 719 1516897,18 Significativo al nivel de *** α = 0,001

Cuadro 4.7. ANDEVA del rendimiento de grano de maíz bajo el experimento estrés

hídrico utilizando un diseño α - lattice.

FV gl SC SCM F R²Modelo 398 1215496,68 3054,01 3,25*** 0,8Híbrido 359 655886,90 1826,98 1,95***Súper bloque 1 173242,43 173242,43 184,51***Bloque Incompleto 38 204777,96 5388,89 5,74***Error 321 301398,64 938,94


El valor de R2 representa la proporción de la variabilidad explicada por las variables

independientes del modelo, por lo que se puede explicar la variación en el rendimiento

aproximadamente en un 66% para el diseño de BCA y un 80% para el diseño de α -

lattice, debido a la elección del respectivo diseño, es evidente que el diseño de α -

lattice explica en mayor proporción la variación del rendimiento.

74

El valor del estadístico F del modelo para BCA (1,99) y α - lattice (3,25), significativo al

0,01%, indican que el modelo asociado al diseño experimental, explica una proporción

significativa de la variación presente en la variable dependiente (Híbrido).

Al observar los valores del estadístico F de la variable híbrido para BCA (1,65) y α -

lattice (1,95), los cuales son significativos al 0,01%, indican que alguna diferencia entre

las medias de los híbridos es diferente de cero, pero no revela ninguna información

sobre la naturaleza de esta diferencia.

El valor del estadístico F significativo al 0,01%, de los bloques (122,87) para el diseño

BCA, súper bloque (184,51) y bloque incompleto (5,74) para el diseño de α - lattice,

demuestra que el sistema de bloqueo fue el adecuado para ambos diseños.

Debido al mayor valor de R2 y sumado a la ganancia del estadístico F de las variables

modelo, híbrido y sistema de bloqueo, revelan que el diseño de α - lattice controla de

mejor manera la variabilidad del rendimiento y explica de mejor manera la variación en

el rendimiento, además, este último diseño presento un SCM del Error inferior, lo que

sugiere que es más adecuado que el análisis BCA bajo las condiciones del

experimento, lo cual puede observarse en el valor de la ER mayor a uno del Cuadro

4.10 del diseño de α - lattice con respecto al diseño de BCA. Los Cuadros 4.8 y 4.9

muestran los ANDEVA del rendimiento de grano de maíz bajo el experimento de riego

normal utilizando los diseños BCA y α - lattice.

Cuadro 4.8. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego

normal utilizando un diseño BCA

FV gl SC SCM F R²Modelo 360 190792,02 529,98 2,67*** 0,73Híbrido 359 190642,78 531,04 2,68***Bloque 1 149,24 149,24 0,75Error 359 71243,19 198,45


75


normal utilizando un diseño α - lattice.

FV gl SC SCM F R²Modelo 398 202275,21 508,23 2,73*** 0,77Híbrido 359 180863,16 503,80 2,71***Súper bloque 1 149,26 149,26 0,8Bloque Incompleto 38 11483,43 302,20 1,62*Error 321 59760,40 186,17

Total 719 262035,61 Significativo al nivel de *** α = 0,001, * α = 0,05

El valor de R2 indica que aproximadamente en un 73%, para el diseño BCA y en un

77%, para el diseño de α - lattice, se explica la variación en el rendimiento debido a las

variables independientes del modelo.

El valor del estadístico F del modelo para BCA (2,67) y α - lattice (2,73), significativo al

0,01%, indican que el modelo asociado al diseño experimental, explica una proporción

significativa de la variación presente en la variable híbrido.

Al observar el valor del estadístico F de la variable híbrido para BCA (2,68) y α - lattice

(2,71), los que son significativos al 0,01%, indican que existe diferencia entre las

medias de los híbridos.

El valor del estadístico F no significativo de los bloques (0,75), para el diseño BCA,

sugiere que este diseño no es el adecuado para este experimento. Para el diseño de α

- lattice, el bloque incompleto (5,74) es significativo al 5%, lo que demuestra que el

sistema de bloqueo para este diseño fue apropiado y el uso del diseño α - lattice es

adecuado para el experimento de riego normal. Por otro lado, el valor del estadístico F

para el súper bloque (0,8) no fue significativo; este resultado era lo esperado, ya que el

súper bloque asemeja el sistema de bloques de un diseño de BCA, el cual demostró

ser ineficiente en controlar la variabilidad espacial.

La elección de un diseño de α - lattice fue la adecuada para los experimentos estrés

hídrico y riego normal debido a la alta proporción explicada en el valor de R2, como

también a la ganancia en términos de F y al eficiente sistema de bloqueo, comparado

con el diseño de BCA, esto confirma lo sostenido por Pearce (1998), en que el uso de

un adecuado diseño experimental tiene una marcada ganancia en el valor de F y es

suficiente para controlar la variabilidad espacial existente, lo cual puede observarse en

76

el valor de la ER mayor a uno del Cuadro 4.10 del diseño de α - lattice con respecto al

diseño de BCA.

Cuadro 4.10. Eficiencia relativa del diseño de α - lattice comparado con el diseño de

BCA bajo los distintos experimentos.

Estrés hídrico Riego normal

Diseño experimental BCA BCA� - lattice 1,50 1,07

Eficiencia relativa

La desigualdad en el CV bajo los distintos experimentos también implica que aún

cuando el sistema de bloqueo fue efectivo en el experimento bajo estrés hídrico, la

variabilidad sistemática presente en el campo impidió un adecuado control de la

variación de la variable de respuesta en el ANDEVA, lo cual también es afirmado por

Tamura et al. (1988) y Amaro y Cobo (1994), quienes aseveran que si bien los

sistemas de bloqueos son efectivos en el control de la variabilidad espacial, estos no

son efectivos si la variabilidad es sistemática a través del campo, por lo que estos

sistemas de bloqueos son ineficientes. Esta afirmación indica la presencia de una

correlación positiva o negativa de las propiedades del suelo con los rendimientos.

Para un programa de mejoramiento genético, los distintos cuadrados medio del error

(CME) del experimento de estrés hídrico poseen implicancias significativas al momento

de seleccionar individuos. En efecto, al ser superior el valor del estadístico F bajo el

experimento de riego normal, es posible que el uso de métodos de comparación

múltiple de medias detecten diferencias significativas entre la media de los híbridos. Al

respecto Brownie et al. (1993), Wu y Dutilleul (1999), y van Es y van Es (1993) indican

que la imposibilidad de controlar la heterogeneidad espacial, produce una variabilidad

indeseada entre los rendimientos de las parcelas, lo que disminuye la estimación de los

efectos de los distintos tratamientos, ya que el error experimental es incrementado

invalidando el análisis de varianza.

77

Análisis estadístico utilizando modelos espaciales

Previo a los resultados de este análisis, es importante indicar que los modelos

espaciales se calculan en base a los datos obtenidos del diseño utilizado en la

conducción del experimento, con lo cual el utilizar los modelos espaciales podría

aumentar la eficiencia del diseño. Sin embargo, no es posible utilizar los modelos

espaciales en ausencia de diseños experimentales.

Cuadro 4.11. Estadísticas descriptivas, estadístico W, modelo y parámetros del

variograma de los residuales de los distintos modelos espaciales, bajo el experimento

de estrés hídrico.

Varianza Media Prueba Modelo Modelo Rango Nugget Umbral Residuales Residuales NormalidadEspacial Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)Papadakis Esférico 8,71 313,54 395,97 402,08 0 0,99 nsAT Esférico 15,98 386,12 749,65 738,83 0 0,99 nsEC Esférico 12,05 430,16 764,21 944,95 0 0,99 nsAT + EC Esférico 11,06 433,23 740,95 733,78 0 0,99 ns

Parámetros del variograma

AT = análisis de tendencia, EC = error correlacionado, ns = no significativo


variograma de los residuales de los distintos modelos espaciales, bajo experimento de

riego normal.

Varianza Media Prueba Modelo Modelo Rango Nugget Umbral Residuales Residuales NormalidadEspacial Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)Papadakis Esférico 6,87 66,86 82,11 82,05 0 0,99 nsAT Esférico 8,52 67,03 94,96 94,57 0 0,99 nsEC Esférico 8,75 68,23 97,99 99,29 0 0,99 nsAT + EC Esférico 8,99 67,77 98,57 98,09 0 0,99 ns


AT = análisis de tendencia, EC = error correlacionado, ns = no significativo

De acuerdo a los Cuadros 4.11 y 4.12, los residuales de los modelos espaciales

cumplen con el supuesto de distribución con medio igual a cero y varianza ó². Los

valores de la prueba Shapiro – Wilk no son significativos al 5%, con lo cual no se

rechaza la hipótesis nula de normalidad, cumpliendo con el supuesto de distribución

normal. Sin embargo, los valores de rango varían entre 8,71 y 15,98 en el experimento

de estrés hídrico y entre 6,87 y 8,99, en el experimento de riego normal, lo que implica

78

dependencia espacial bajo el rango determinado, como se puede observar en las

Figuras 4.5 y 4.6, con lo cual el supuesto de independencia no se cumple.

Figura 4.5. Variogramas de los residuales después de remover la variabilidad espacial,

por medio del uso de modelos espaciales, en el experimento de estrés hídrico.

Figura 4.6. Variogramas de los residuales después de remover la variabilidad espacial,

por medio del uso de modelos espaciales, en el experimento de riego normal.

79

Los Cuadros 4.13 y 4.14, entregan la comparación de distintos diseños experimentales

y distintos modelos de remoción de la variabilidad espacial, comparándose el valor de

F y el CME. El Cuadro 4.15 muestra la ER de los modelos espaciales utilizando los

datos de un diseño α - lattice, comparado con los diseños experimentales BCA y α -

lattice, en los distintos experimentos.

Cuadro 4.13. ANDEVA del rendimiento de grano de maíz bajo el experimento de

estrés hídrico utilizando distintos diseños experimentales y modelos espaciales.

ANDEVA BCA � - lattice Papadakis AT EC AT + ECF Híbrido 1,65*** 1,95*** 2,04*** 1,61*** 3,05*** 3,10***CME 1409,96 938,94 805,28 1479,71 944,95 733,78

DISEÑO EXPERIMENTAL MODELO ESPACIAL

Significativo al nivel de *** α = 0,001, AT = análisis de tendencia, EC = error

correlacionado


normal utilizando distintos diseños experimentales y modelos espaciales.

ANDEVA BCA � - lattice Papadakis AT EC AT + ECF Híbrido 2,68*** 2,71*** 3,04*** 2,82*** 5,31*** 5,27***CME 198,45 186,17 164,32 189,40 99,29 98,09

MODELO ESPACIALDISEÑO EXPERIMENTAL

Significativo al nivel de *** α = 0,001, AT = análisis de tendencia, EC = error

correlacionado

Cuadro 4.15. Eficiencia relativa de los modelos espaciales con respectos a los diseños

experimentales y los distintos experimentos.

Modelo espacial BCA � - lattice Modelo espacial BCA � - latticePapadakis 1,75 1,17 Papadakis 1,21 1,13AT 0,95 0,63 AT 1,05 0,98EC 2,53 1,68 EC 2,11 1,98AT + EC 2,53 1,68 AT + EC 2,11 1,98

Estrés hídrico Riego normalDiseño experimental Diseño experimental

AT = análisis de tendencia, EC = error correlacionado

Como se aprecia en los Cuadros 4.13 y 4.14, para el experimento de estrés hídrico, la

utilización de modelos espaciales como el método de Papadakis, error correlacionado

80

(EC) y análisis de tendencia (AT) más EC con los datos de un diseño α - lattice,

tuvieron una significativa ganancia sobre el valor de F y una disminución del CME

comparado al de los diseños experimentales, no observándose ningún beneficio

derivado del uso del método AT.

Para el caso del experimento de riego normal, la utilización de los modelos espaciales

Papadakis, EC y AT más EC con los datos de un diseño α - lattice, tuvieron una

significativa ganancia sobre el valor de F y una disminución del CME comparado al de

los diseños experimentales. El método de AT alcanzó un valor de F mayor al de los

diseños experimentales, disminuyo el valor del CME comparado con el de BCA, pero

no se obtuvo una ganancia en la disminución del CME comparado con el diseño α -

lattice.

Según el Cuadro 4.15, bajo los experimentos de riego normal y estrés hídrico los

modelos espaciales utilizando los datos de un diseño α - lattice, presentaron una ER

superiores al de los diseños BCA y α - lattice. Sin embargo la diferencia en ER de los

modelos espaciales es superior en un diseño de BCA en contraste con un diseño de α

- lattice, debido a que el uso de bloques completos no es el adecuado para controlar la

variabilidad espacial en estos experimentos. El uso de AT, bajo el experimento de riego

normal no alcanzó una eficiencia superior a ningún diseño, y en estrés hídrico sólo

obtuvo una eficiencia mayor al diseño de BCA.

El uso del método de Papadakis, implica la determinación del número óptimo de

parcelas vecinas como covariables y el número de covariables. No obstante, un estudio

de Pearce y Moore (1976), en que probaron distintos números de parcelas vecinas y

número de covariables, concluyeron que con el uso de cuatro parcelas vecinas se

obtienen resultados superiores al uso de dos parcelas o dos covariables en el análisis.

Sin embargo, no es un objetivo de esta tesis determinar el número de covariables y

parcelas vecinas óptimas para el análisis, por lo que la obtención de un valor de F

significativo con el uso de cuatro parcelas vecinas fue suficiente para demostrar el uso

de este modelo espacial.

Si bien el método de EC obtuvo mayores valores de F y menores de CME, es

importante obtener los valores de la covarianza basado en las distancias originales de

las observaciones, ya que el comúnmente sistema de filas y columnas utilizado en los

otros modelos espaciales, las distancias son constantes por lo que los parámetros del

81

variograma serían sobrestimados y no reales, implicando que los resultados del

análisis de varianza no serán válidos.

Los autores Kirk et al. (1980), Tamura et al. (1988), Brownie (1993) y Bowman (1990)

utilizaron exitosamente el método AT, por lo que era de esperarse que el uso de este

modelo mejorara el análisis de varianza comparado con los diseños BCA y α - lattice,

lo cual no fue lo obtenido en este caso, quizás esto es debido a que la estructura

espacial del rendimiento es compleja, dificultando la acertada elección del modelo

polinomial, lo que puede traducirse en que el polinomio que realmente se ajuste al

modelo espacial de los rendimientos no puede ser determinado, esto coincide con van

Es et al. (1989), los que señalan que en el método AT, el problema es encontrar el

grado óptimo del polinomio a utilizar, como también el número de términos del

polinomio.

El uso de estos modelos fue diferente para cada experimento, lo que implica que la

obtención de un modelo no puede ser utilizado en otro experimento, demostrando que

es sitio específico, por otro lado la ganancia el valor del estadístico y F, y la

disminución del CME, favorecen la estimación entre los efectos de los tratamientos, ya

que con el uso de estos modelos se puede controlar la heterogeneidad espacial,

disminuyendo la variación entre los rendimientos y por lo tanto el cuadrado medio del

error, lo cual se puede observar en la Figura 4.7.

Figura 4.7. Disminución del CME de los distintos diseños y modelos, bajo el

experimento de estrés hídrico y riego normal

CME v/s Diseño Experimental y Modelo Espacial

0250500750

1000125015001750

BCA

Lattic

e

Papad

akis AT

EC

AT +

EC

Diseño Experimental y Modelo Espacial

CM

E Estrés HídricoRiego normal

82

En un programa de mejoramiento genético, el uso de los modelos espaciales tiene una

notable ganancia en el análisis de varianza en términos de reducción del CME y el

superior valor del estadístico F comparado con el uso de los diseños experimentales

sin un modelo de remoción de la variabilidad espacial, sin embargo estos no cumplen

el supuesto de residuales independientes por lo que los resultados obtenidos de estos

análisis pueden ser engañosos.

Análisis geoestadístico

A continuación se presentan los parámetros del variograma, modelo seleccionado y

varianza muestral para las propiedades del suelo bajo los distintos experimentos.

Cuadro 4.16. Parámetros del variograma, modelo seleccionado y varianza muestral

para las propiedades del suelo bajo el experimento de estrés hídrico.

ns = no significativo

VarianzaPropiedad Tendencia Modelo Rango Nugget Umbral Muestral

Lineal (m) (unidades)2 (unidades)2 (unidades) 2

pH (1:2,5) ns Esférico 26,25 0,00 0,05 0,06CE (dS • cm-1) ns Esférico 13,08 0,00 479,73 480,64MO (%) ns Esférico 15,98 0,00 0,02 0,02NH4

+ (mg • kg-1) ns Esférico 12,96 0,00 7,41 7,35NO3

- (mg • kg-1) ns Esférico 21,68 0,46 452,82 424,86N (mg • kg-1) ns Esférico 14,15 0,58 554,50 540,39P (mg • kg-1) ns Esférico 23,38 0,00 15,81 14,74K (mg • kg-1) ns Esférico 21,04 41,29 1579,39 1505,08Na (meq • 100g-1) ns Esférico 12,58 0,00 624,66 627,48Ca (meq • 100g-1) ns Esférico 13,33 0,00 50392,94 49863,70Mg (meq • 100g-1) ns Esférico 14,16 0,00 76,62 73,80


83

Cuadro 4.17. Parámetros del variograma, modelo seleccionado y varianza muestral

para las propiedades del suelo bajo el experimento de riego normal.

Significativo al nivel de * α = 0,05, ns = no significativo

De acuerdo con los Cuadros 4.16 y 4.17, la mayoría de las propiedades químicas del

suelo no presentaron tendencia lineal significativa, con lo cual el valor del umbral de los

modelos seleccionados fue cercano al valor de la varianza muestral. Para las

propiedades químicas del suelo que mostraron tendencia lineal significativa, como es el

caso de la MO y P bajo riego normal, el uso de los residuales de la regresión lineal

produjo que el valor del umbral fuera aproximadamente la mitad del valor de la

varianza muestral. La tendencia según Cressie (1993), afecta la estacionaridad de

segundo orden, debido a una correlación entre las observaciones, con lo cual se

aumenta el valor de la estimación de un variograma, por lo cual es necesario utilizar

algún procedimiento de remoción de la tendencia. Según Gotway y Hergert (1997) la

tendencia puede deberse a prácticas agrícolas como labranza, fertilización, riego, entre

otras.

El modelo esférico fue el adecuado para la mayoría de las propiedades químicas del

suelo, excepto para nitrato (NO3-) el que ajustó un modelo gausiano; esto concuerda

con lo afirmado por Trangmar et al. (1985), en que los modelos pueden tomar muchas

formas, dependiendo de los datos y los intervalos de muestreo utilizados. Los rangos

de dependencia espacial variaron entre 12 y 30 m; esto implica según Isaaks y

Srivastava (1989), que por sobre el rango del variograma la variable no está

espacialmente relacionada, implicando una variación aleatoria o independiente. El

conocimiento de la dependencia espacial es esencial en la construcción de mapas de

VarianzaPropiedad Tendencia Modelo Rango Nugget Umbral Muestral

Lineal (m) (unidades)2 (unidades)2 (unidades) 2

pH (1:2,5) ns Esférico 29,56 0,00 0,07 0,06CE (dS • cm-1) ns Esférico 15,70 0,01 641,01 650,89MO (%) * Esférico 18,04 0,02 0,04 0,08NH4

+ (mg • kg-1) ns Esférico 24,73 0,03 1,49 1,41NO3

- (mg • kg-1) ns Gausiano 19,32 0,00 10,35 9,73N (mg • kg-1) ns Esférico 18,33 0,00 10,48 10,37P (mg • kg-1) * Esférico 15,46 0,03 26,33 47,74K (mg • kg-1) ns Esférico 20,96 0,00 624,79 628,47Na (meq • 100g-1) ns Esférico 14,84 0,00 157,82 156,91Ca (meq • 100g-1) ns Esférico 17,44 0,00 39818,21 39768,57Mg (meq • 100g-1) ns Esférico 30,18 0,00 269,82 262,92


84

interpolación. El valor del efecto de nugget indica según Cambardella et al. (1994), una

variabilidad a nivel de campo y del experimento, o una variabilidad aleatoria, la cual es

indetectable a la escala de muestreo, según los Cuadro 4.16 y 4.17 el valor del efecto

nugget fue de baja magnitud en la mayoría de las propiedades químicas del suelo,

implicando una baja variabilidad a cortas distancias, como también que, la distancia de

muestreo fue adecuada.

Las Figuras 4.8 y 4.9, muestran los variogramas de algunas propiedades del suelo bajo

los distintos experimentos6.

Figura 4.8. Variogramas Materia orgánica y NO3-, bajo estrés hídrico.

Figura 4.9. Variogramas Calcio y pH, bajo riego normal.

La existencia de dependencia espacial de las variables estudiadas es importante en un

programa de mejoramiento genético debido a que el rendimiento se verá afectado por

6 Los variogramas de las restantes propiedades del suelo, se presentan en el anexo E.

85

la existencia de una correlación positiva o negativa de las propiedades del suelo,

implicando que si las variables son dependientes, el modelo de respuesta de los

valores del rendimiento también serán dependientes, con lo que el supuesto del

análisis de varianza en que los residuales son independientes fallaría para la obtención

de resultados válidos.

En este caso el tamaño del experimento es primordial para la independencia espacial,

dirigiendo el experimento a un tamaño considerable, lo que en la práctica puede no ser

viable, aun cuando las unidades experimentales sean aleatorizadas, no se logra la

completa independencia de las unidades, demostrando la necesidad de controlar la

heterogeneidad espacial en cualquier experimento de campo.

Los Cuadros 4.18 y 4.19, presentan los R2 de los distintos métodos de interpolación

estudiados de las distintas propiedades del suelo medidas, bajo los experimentos de

riego normal y estrés hídrico.

Cuadro 4.18. Métodos de interpolación y R2, para el experimento de estrés hídrico.

Cuadro 4.19. Métodos de interpolación y R2, para el experimento de riego normal.

Variable Distancia Kriging Curvatura Método Vecino Regresión Función Base TriangulaciónInversa Mínima Mod. Shepard's Natural Polinómica Radial Interpolación L.

pH (1:2,5) 1.000 0.999 0.999 1.000 0.999 0.281 0.883 0.999CE (dS • cm-1) 1.000 0.999 0.999 1.000 0.999 0.226 0.884 0.999MO (%) 1.000 0.999 0.999 1.000 0.999 0.025 0.855 0.999NH4

+ (mg • kg-1) 1.000 1.000 0.999 1.000 0.999 0.023 0.880 0.999NO3

- (mg • kg-1) 1.000 1.000 1.000 1.000 0.999 0.080 0.887 0.999N (mg • kg-1) 1.000 1.000 1.000 1.000 0.999 0.072 0.886 0.999P

(mg • kg

-1) 1.000 1.000 1.000 1.000 0.999 0.325 0.932 0.999

K (mg • kg-1) 1.000 0.999 1.000 1.000 0.999 0.146 0.887 0.999Ca (meq • 100g-1) 1.000 0.999 1.000 1.000 0.999 0.020 0.834 0.999Na (meq • 100g-1) 1.000 0.999 0.999 1.000 0.999 0.038 0.860 0.999Mg (meq • 100g-1) 1.000 1.000 0.999 1.000 0.999 0.271 0.915 0.999

Método de Interpolación

Variable Distancia Kriging Curvatura Método Vecino Regresión Función Base TriangulaciónInversa Mínima Mod. Shepard's Natural Polinómica Radial Interpolación L.

pH (1:2,5) 1.000 0.999 0.992 1.000 0.999 0.201 0.891 0.999CE (dS • cm-1) 1.000 0.999 1.000 1.000 0.999 0.133 0.887 1.000MO (%) 1.000 1.000 0.999 1.000 1.000 0.458 0.922 1.000NH4

+ (mg • kg-1) 1.000 0.999 0.998 1.000 1.000 0.110 0.869 1.000NO3

- (mg • kg-1) 1.000 0.999 0.999 1.000 1.000 0.041 0.870 1.000N (mg • kg-1) 1.000 0.999 0.999 1.000 1.000 0.087 0.843 1.000P (mg • kg-1) 1.000 1.000 0.999 1.000 1.000 0.463 0.949 1.000K (mg • kg-1) 1.000 0.999 0.999 1.000 0.999 0.008 0.835 0.999Ca (meq • 100g-1) 1.000 0.999 0.999 1.000 1.000 0.133 0.897 1.000Na (meq • 100g-1) 1.000 0.999 1.000 1.000 0.999 0.014 0.833 0.999Mg (meq • 100g

-1) 1.000 0.999 0.999 1.000 1.000 0.108 0.883 1.000

Método de Interpolación

86

Para los distintos métodos de interpolación se calculó el valor de R2, seleccionándose

aquel modelo que entregara un mayor valor en términos de R2. La regresión polinómica

resultó ser el de más baja precisión para las variables en ambos experimentos, lo cual

era lo esperado, puesto que el método de regresión polinómica no es considerado un

interpolador al no estimar valores en las áreas sin muestrear, más bien es utilizado

para definir superficies de respuesta. Para ambos experimentos, el método modificado

de Shepard’s (MMS) fue el interpolador que representó de mejor manera la distribución

de las distintas variables en la totalidad de la superficie, pero sus resultados mostraron

ser muy similares al utilizar el método de distancia inversa (DI), esto es debido a que

MMS es similar a DI en su metodología, el primero utiliza el método de cuadrados

mínimos con peso y el segundo le da peso a los valores más cercanos. Los métodos

de vecino natural y triangulación con interpolación lineal (TIL) obtuvieron un valor de R2

muy cercano al de MMS, sin embargo estos métodos sólo generan un mapa entre el

área muestreada y no fuera de sus límites. El método de función de base radial bajo

los dos experimentos obtuvo valores cercanos a 0,9, ya que este interpolador genera

mapas de contornos más uniformes entre los valores estimados. Kriging obtuvo valores

cercanos a 1, no obstante Isaaks y Srivastava (1989), indican que kriging se distingue

de los otros métodos descritos al minimizar la media y la varianza del error, por lo que

puede generar mapas sin afectarse por las características de los datos, ya que

incorpora la estructura espacial de las variables por medio de su variograma. Gotway

et al. (1996) utilizaron el CV para explicar sus resultados en la comparación de kriging

y DI con poder (ID with power, p = 1, 2, 4). Al compara el CV de las propiedades del

suelo del Cuadro 4.1, con los métodos de interpolación DI, MMS, kriging, curvatura

mínima, vecino natural y TIL bajo los dos experimentos, los interpoladores en términos

de R2, reflejaron que no se ven afectados por el tipo de variación que puedan tener las

variables a la distancia muestreada. Aunque este estudio no tiene una implicancia

directa para un programa de mejoramiento genético, fue útil en la elección de un

método adecuado de interpolación, el cual es necesario para la creación de mapas

utilizados en la interpolación de las variables del suelo con el rendimiento para el uso

de zonas geográficas como método de control de la variabilidad espacial.

87

Análisis estadístico utilizando diseños experimentales asociados a zonas

Las Figuras 4.10 y 4.11, muestran los variogramas de los residuales de los diseños

asociados a las zonas bajo los distintos experimentos.

Figura 4.10. Variograma de los residuales de los diseños BCA y α - lattice asociado a

18 y 8 zonas respectivamente, bajo el experimento de estrés hídrico.

Figura 4.11. Variogramas de los residuales de los diseños BCA y α - lattice asociado a

10 y 12 zonas respectivamente, bajo el experimento de riego normal.

88


variograma de los residuales de los distintos diseños experimentales asociados a las

zonas, bajo el experimento de estrés hídrico. Varianza Media Prueba

Diseño Modelo Rango Nugget Umbral Residuales Residuales NormalidadZonas Experimental Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)18 Zonas BCA Gausiano 0,72 2,50 4,93 4,93 0 0,13***8 Zonas � - lattice Gausiano 0,73 0,05 0,09 0,09 0 0,16***


Significativo al nivel de ***á = 0,001


variograma de los residuales de los distintos diseños experimentales asociados a las

zonas, bajo el experimento de riego normal. Varianza Media Prueba

Diseño Modelo Rango Nugget Umbral Residuales Residuales NormalidadZonas Experimental Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)10 Zonas BCA Gausiano 1,90 2,85 5,96 5,96 0 0,39***12 Zonas � - lattice Gausiano 0,71 0,03 0,06 0,06 0 0,11***


Significativo al nivel de ***á = 0,001

Como se observa en las Figuras 4.10 y 4.11, y de acuerdo a los Cuadros 4.20 y 4.21,

los residuales de los diseños asociados a las zonas presentaron un valor de rango

cercano a 0,7 m, excepto el diseño experimental BCA asociado a 10 zonas, el cual

presentó un valor de 1,9 m, esto implica la independencia espacial de los residuales a

corta distancia. A pesar de esto, el supuesto de independencia estrictamente no se

cumple, sin embargo, la distancia exhibida resultó ser menor a la mostrada por los

diseños experimentales (Cuadro 4.5) y modelos espaciales (4.11 y 4.12), y

razonablemente pequeña para un experimento de gran tamaño, en que la distancia

entre híbridos a ser comparados es generalmente superior a 1 m, con lo que el

supuesto de independencia se cumple.

Según los Cuadros 4.20 y 4.21, la media de los residuales es igual a cero y la varianza

es igual a ó², con lo que el supuesto de distribución de los residuales con media igual a

cero y varianza igual a ó², se cumple. La prueba Shapiro – Wilk es significativa al 0,1%

por lo que se rechaza la hipótesis nula de normalidad, no obstante, según Cochran

(1947), la perdida en la eficiencia del análisis de varianza no es grande y la verdadera

probabilidad de un valor tabulado de un nivel de significancia al 5% varía entre 4% y

7%, y para el caso de un nivel de significancia al 1% varía entre 0,5% y 2%, esto

89

sumado a lo que indica Mitchell (1995), en que si las muestras poseen el mismo

número de observaciones, el nivel de significancia no es mayormente afectado. Por lo

tanto, los resultados obtenidos de los análisis de varianza del rendimiento de grano de

maíz bajo los distintos experimentos y utilizando un diseño experimental asociado a

zonas, son válidos.

Los Cuadros 4.22 y 4.23 muestran la ER y la prueba de falta de ajuste de las zonas

seleccionadas comparado con los respectivos diseños experimentales y experimentos.

Cuadro 4.22. Eficiencia relativa y prueba de falta de ajuste de las zonas seleccionadas

bajo el experimento de estrés hídrico.

Diseño experimental Nº de Zonas ER F Pr > FBCA 18 2,24 3,78 0,033

� - lattice 8 27,84 84,11 0,002

Prueba falta de ajuste

Cuadro 4.23. Eficiencia relativa y prueba de falta de ajuste de las zonas seleccionadas

bajo el experimento de riego normal.

El Cuadro 4.22 compara la ER del uso de diseños experimentales asociado a zonas

con respecto a los diseños BCA y α - lattice. El uso del diseño BCA asociado a 18

zonas presentó una ER de 2,24 por sobre el diseño BCA. El uso del diseño á – lattice

asociado a 8 zonas presentó una ER de 27,84 por sobre el diseño á – lattice.

Esto indica la eficiencia de estas zonas con respecto a los diseños experimentales en

la disminución del CME, ya que valores mayores a uno representan esta disminución.

Para el caso de la prueba de falta de ajuste los valores del estadístico F para 18 zonas

(3,78), el cual fue significativo al 5% y 8 zonas (84,11), significativo al 1%, implica que

existe evidencia estadística significativa para rechazar la hipótesis nula de que no

existe diferencia entre el uso del diseño originalmente descrito y el propuesto, esto

significa que la elección de este número de zonas es el adecuado bajo el respectivo

diseño experimental.

Diseño experimental Nº de Zonas ER F Pr > FBCA 10 1,59 1,74 0,023

� - lattice 12 4,82 8,54 0,110

Prueba falta de ajuste

90

Según el Cuadro 4.23, el uso del diseño BCA asociado a 10 zonas presentó una ER de

1,59 respecto a un diseño de BCA, y un valor del estadístico F (1,74), significativo al

5%, indicando que el uso de este número de zonas bajo un diseño de BCA, presenta

una ganancia en la reducción del CME y es el modelo adecuado para este diseño. El

uso del diseño á – lattice asociado a 12 zonas presentó una ER de 4,82 respecto a un

diseño á – lattice, pero el valor de F (8,54) no fue significativo, indicando que no existe

diferencia al utilizar el diseño originalmente descrito con el propuesto, sin embargo este

número de zonas fue utilizado por que presentó un valor de F significativo en los

tratamientos (híbridos), lo cual se puede apreciar en las tablas de ANDEVA de los

diseños y experimentos en los Cuadros 4.24, 4.25, 4.26 y 4.27.


estrés hídrico utilizando un diseño BCA asociado a 18 zonas.

FV gl SC SCM F R²Modelo 712 1513352,82 2125,496 4.2* 0,99Bloque 1 3067,7822 3067,7822 6.06*Híbrido 359 745117,49 2075,54 4.1*Zona 17 67777,84 3986,93 7.87**H*Z 335 431674,07 1288,58 2.54Error 7 3544,36 506,34

Total 719 1516897,18 Significativo al nivel de ** α = 0,01 y * α = 0,05, H*Z interacción híbrido * zona

De acuerdo al Cuadro 4.24, la fuente de variación “modelo” presentó un valor F de 4,2,

significativo al 5%, por lo que este modelo es el adecuado para este experimento y

explicó en términos de R2 un 99% la variabilidad presente en la variable de respuesta

híbrido. El efecto bloque fue significativo al 5%, indicando que el uso de bloques es

adecuado para controlar la variabilidad espacial. La variable híbrido fue significativa al

5%, implicando que existe diferencia estadística entre la media de los híbridos. El uso

de 18 zonas tuvo un valor de F significativo al 1%, lo que indica que las zonas explican

en una gran proporción la variabilidad presente en la variable híbrido y la interacción

H*Z no fue significativa, implicando que la respuesta de la variable híbrido no depende

de los niveles de la variable zona.

91


estrés hídrico utilizando un diseño α - lattice asociado a 8 zonas.

FV gl SC SCM F R²Modelo 716 1516829,30 2118,48 93.63** 0,99Súper Bloque 1 173242,43 173242,43 7656.65***Bloque Incompleto 22 22851,29 1038,70 45.91**Híbrido 359 629198,92 1752,64 77.46**Zona 7 11986,36 1712,34 75.68**H*Z 311 274454,97 882,49 39**Error 3 67,88 22,63

Total 719 1516897,18 Significativo al nivel de *** α = 0,001 y ** α = 0,01, H*Z interacción híbrido * zona

Según el Cuadro 4.25, el valor de F del modelo significativo al 1% y un valor de 99% en

términos de R2, indican que el uso de este modelo es el adecuado para este

experimento. El uso de bloques incompletos fue significativo al 0,1% mientras que los

súper bloques lo fueron al 1%, indicando que este sistema de bloques fue el adecuado

para este experimento. El uso de 8 zonas y la interacción H*Z fueron significativos al

1%, indicando que el uso de zonas explicó en gran medida la variabilidad en el

tratamiento y que la respuesta de la variable híbrido depende de los niveles de las

zonas.


normal utilizando un diseño BCA asociado a 10 zonas.

FV gl SC SCM F R²Modelo 683 257752,33 377,38 3.17*** 0,98Bloque 1 356,08 356,08 2,99Híbrido 359 178661,41 497,66 4.18***Zona 9 6562,33 729,15 6.13***H*Z 314 59848,54 190,60 1.6*Error 36 4283,28 118,98

Total 719 262035,61 Significativo al nivel de *** α = 0,001 y * α = 0,05, H*Z interacción híbrido * zona

92

Según el Cuadro 4.26, el modelo presentó un valor de F de 3,17 significativo al 0,1%,

por lo que este modelo es el adecuado para este experimento y explicó en términos de

R2 en un 98% la variabilidad presente en la variable de respuesta híbrido. El efecto

bloque no fue significativo, indicando que este diseño no es adecuado para controlar la

variabilidad espacial. La variable híbrido fue significativa al 0,1%, implicando que

existió diferencia estadística entre la media de los híbridos. El uso de 10 zonas tuvo un

valor de F significativo al 0,1%, lo que indicó que las zonas explican en una gran

proporción la variabilidad presente en la variable híbrido y la interacción H*Z fue

significativa al 5%, implicando que la respuesta de la variable híbrido dependió de los

niveles de la variable zona.


normal utilizando un diseño α - lattice asociado a 12 zonas.

FV gl SC SCM F R²Modelo 717 261988,96 365,40 15,67 0,99Súper bloque 1 149,26 149,26 6,4Bloque Incompleto 30 7080,82 236,03 10,12Híbrido 359 166979,90 465,13 19,94*Zona 11 3117,45 283,40 12,15H*Z 308 56350,24 182,96 7,84Error 2 46,65 23,33

Total 719 262035,61 Significativo al nivel de *α = 0,05, H*Z interacción híbrido * zona

Según el Cuadro 4.27, el valor de F del modelo no fue significativo, como también el

uso de bloques incompletos y los súper bloques no fueron significativos. El uso de 8

zonas y la interacción H*Z no fueron significativos, indicando que el uso de zonas no

explicó en gran medida la variabilidad en el tratamiento y que la respuesta de la

variable híbrido no depende de los niveles de las zonas, a pesar de esto la variable

híbrido fue significativa al 5%, existiendo diferencia estadística entre la media de los

tratamientos.

De acuerdo a los resultados de los ANDEVA de los distintos diseños experimentales y

zonas en los diferentes experimentos, se pudo observar que bajo el experimento de

estrés hídrico, en el cual existió una mayor variabilidad espacial comparado con el

experimento de riego normal, el uso de zonas homogéneas sólo fue efectivo junto a un

93

diseño experimental α - lattice. Estos resultados no fueron los mismos frente a un

diseño experimental de BCA; una posible explicación a esto es que debido a la gran

cantidad de híbridos dentro de un mismo bloque producen que el espacio utilizado en

el experimento sea extenso, frente a esto y sumado a la compleja estructura espacial

de las propiedades del suelo debido a su alta variabilidad, las distintas zonas no fueron

suficientes para controlar toda la heterogeneidad, removiendo sólo una parte de ella;

por esta razón la interacción de la variable híbrido con la variable zona no fue

significativa; en cambio fue significativo el valor del estadístico F asociado a la variable

híbrido y este valor fue superior en el uso de zonas asociado al diseño de BCA

comparado al sólo uso de un diseño de BCA. De esta manera el uso del diseño α -

lattice bajo el experimento de estrés hídrico alcanzó valores del estadístico F

superiores a los del diseño BCA, el uso de bloques incompletos, los que comprenden

un menor tamaño espacial que los bloques completos, permiten que las zonas puedan

controlar eficientemente la heterogeneidad espacial. Esto es confirmado con el mayor

número de zonas utilizadas bajo el experimento de estrés hídrico comparado con el

número de zonas utilizadas bajo el experimento de riego normal, frente a una mayor

variabilidad, un mayor número de zonas son necesarias.

Para el caso del experimento de riego normal, debido al razonamiento anteriormente

expuesto, era de esperarse que solamente frente a un diseño de BCA asociado a

zonas los resultados fueran significativos, ya que la variabilidad espacial presente bajo

este experimento era menor al observado bajo el experimento de estrés hídrico, con lo

cual las zonas geográficas lograron representar adecuadamente la heterogeneidad

espacial. Con esto, al utilizar bloques completos que abarcan una mayor proporción de

terreno, el valor del estadístico F para la zona e interacción mostró ser significativo, en

cambio entre bloques no hubo diferencia, ya que la respuesta fue muy similar debido a

la baja heterogeneidad espacial. De esta manera al utilizar un diseño de α - lattice con

bloques incompletos, no es necesario la utilización de zonas, debido a que la

variabilidad espacial es baja, implicando que la variabilidad entre zonas sea baja y no

significativa, por esta razón las zonas y la interacción de la variable híbrido con la

variable zona no son significativas.

Las Figuras 4.12 y 4.13, muestran las zonas seleccionadas para ser asociadas al

diseño α - lattice, bajo los experimentos de estrés hídrico y riego normal.

94

Figura 4.12. Análisis de cluster con 8 zonas seleccionadas, bajo el experimento de

estrés hídrico.

Figura 4.13. Análisis de cluster con 12 zonas seleccionadas, bajo el experimento de

riego normal.

95

Los Cuadro 4.28 y 4.29, comparan los diseños experimentales con los diseños

experimentales asociado a las zonas.


estrés hídrico utilizando distintos diseños experimentales y diseños experimentales

asociado a zonas.

ZONASANDEVA BCA �-lattice BCA + 18 Z �-lattice + 8 ZF Híbrido 1,65** 1,95** 4,1* 77,46**CME 1409,96 938,94 506,34 22,63

DISEÑO EXPERIMENTAL

Significativo al nivel de ** α = 0,01 y * α = 0,05


normal utilizando distintos diseños experimentales y diseños experimentales asociado

a zonas.

ZONASANDEVA BCA �-Lattice BCA + 10 Z �-Lattice + 12 ZF Híbrido 2,68** 2,71** 4,18*** 19,94*CME 198,45 186,17 118,98 23,33

DISEÑO EXPERIMENTAL

Significativo al nivel de *** α = 0,001, ** α = 0,01 y * α = 0,05

De acuerdo al Cuadro 4.28, bajo el experimento de estrés hídrico la utilización de

zonas homogéneas tuvo una ganancia significativa, al 1% y 5%, para el diseño BCA y

α - lattice respectivamente, en el valor del estadístico F comparado con el valor del

estadístico F de los diseños experimentales, el uso de un adecuado diseño de acuerdo

al experimento reflejo tener una mayor ganancia en términos de F, en este caso el uso

de un diseño de α - lattice. Con respecto al CME el utilizar zonas tuvo una ganancia en

la disminución del CME comparado con los diseños experimentales, con el uso del

diseño α - lattice asociado a zonas fue mayor al uso de un diseño BCA asociado a

zonas, debido a la envergadura del bloque en la cual las zonas no pueden explicar

adecuadamente la totalidad de la heterogeneidad espacial en comparación del uso de

bloques incompletos de menor tamaño.

96

En el experimento con riego normal, según el Cuadro 4.29, el utilizar zonas asociado a

los diseños experimentales obtuvo una ganancia significativa del valor del estadístico F

comparado con el valor del estadístico F de los diseños experimentales, en cuanto al

CME se obtuvo una disminución de este, mayor a la obtenida por los diseños

experimentales, en el caso del uso del diseño de α - lattice asociado a zonas se

alcanzó una mayor disminución compara al diseño de BCA asociado a zonas.

Los Cuadros 4.30 y 4.31, muestran la comparación entre los modelos espaciales y el

uso de diseños experimentales asociado a zonas homogéneas.


estrés hídrico utilizando distintos modelos espaciales y diseños experimentales

asociado a zonas.

AT = análisis de tendencia, EC = error correlacionado, significativo al nivel de *** α =

0,001, ** α = 0,01 y * α = 0.05


normal utilizando distintos modelos espaciales y diseños experimentales asociado a

zonas.

AT = análisis de tendencia, EC = error correlacionado, significativo al nivel de *** α =

0,001, ** α = 0,01 y * α = 0.05

Según el Cuadro 4.30, el uso de zonas bajo el experimento de estrés hídrico, se

observó una ganancia en el valor del estadístico F superior a los modelos espaciales.

Con respecto al CME se obtuvo una disminución superior al de los modelos espaciales,

siendo el del diseño α - lattice asociado a zonas, mayor al del diseño de BCA asociado

a zonas.

De acuerdo con el Cuadro 4.31, bajo el experimento con riego normal, el valor del

estadístico F con el uso de 12 zonas asociado al diseño α - lattice fue superior al de los

ANDEVA Papadakis AT EC AT + EC BCA + 18 Z �-Lattice + 8 ZF Híbrido 2,04** 1,61** 3,05*** 3,10*** 4,1* 77,46**CME 805,28 1479,71 944,95 733,78 506,34 22,63

MODELO ESPACIAL ZONAS

ZONASANDEVA Papadakis AT EC AT + EC BCA + 10 Z �-Lattice + 12 ZF Híbrido 3,04** 2,82** 5,31*** 5,27*** 4,18*** 19,94*CME 164,32 189,40 99,29 98,09 118,98 23,33

MODELO ESPACIAL

97

modelos espaciales. El uso de 10 zonas asociado al diseño de BCA tuvo un valor de F

superior a los modelos Papadakis y análisis de tendencia, no obstante, no fue superior

a los modelos error correlacionado y análisis de tendencia más error correlacionado.

En cuanto al CME, el diseño α - lattice asociado a 12 zonas obtuvo una reducción

superior del CME comparado con los modelos espaciales. El diseño de BCA asociado

a 10 zonas alcanzó una reducción del CME superior a los modelos Papadakis y

análisis de tendencia, sin embargo, no fue superior a la reducción del CME de los

modelos error correlacionado y análisis de tendencia más error correlacionado.

Según los resultados observados, el uso de zonas geográficas homogéneas

incorporado al diseño experimental alcanza una reducción del CME superior al sólo

uso de diseños experimentales ó modelos espaciales (Figuras 4.14 y 4.15), esto

permite obtener valores del estadístico F mayores que el obtenido al utilizar un diseño

experimental, estos resultados eran los esperado basado en los objetivos planteados,

no obstante la disminución del CME y la ganancia del valor de F dependen de la

variabilidad espacial presente sumado a una adecuada selección del diseño

experimental, ya que frente a una alta variabilidad espacial es necesario utilizar un

adecuado diseño experimental para que las zonas geográficas puedan explicar la

variabilidad existente, por el contrario si existe una baja variabilidad espacial el uso de

un diseño experimental adecuado permite controlar esta variabilidad y el uso de zonas

no es necesario por que la variación entre zonas es mínima, implicando que no es

estadísticamente significativa.

Figura 4.14. Disminución del CME de los distintos diseños, modelos y zonas

incorporado a los diseños, bajo el experimento de estrés hídrico.

CME v/s Modelo

0

300

600

900

1200

1500

BCA

Lattice

Papad

akis

AT EC

AT +

EC

BCA + 18 Z

Lattic

e +

8 Z

Modelo

CME

98

Figura 4.15. Disminución del CME de los distintos diseños, modelos y zonas

incorporado a los diseños, bajo el experimento de riego normal.

Al utilizar las zonas geográficas homogéneas en un programa de mejoramiento

genético, se puede lograr una notable disminución del CME, aumentando el valor del

estadístico F, lo que implica una probable estimación de la diferencia de la media de

los tratamientos superior al alcanzado por el uso tradicional de diseños experimentales.

Por otra parte, permite cumplir con los supuestos necesarios para utilizar el análisis de

varianza, con lo cual se logran obtener resultados estadísticamente válidos. Si bien la

implementación de estas metodologías es compleja, ellas pueden ser utilizadas en

cualquier experimento en el cual no se tenga certeza o pleno conocimiento de la

variabilidad espacial existente, o de la influencia de esta sobre las variables a analizar.

Además, puede ser empleada como una técnica alternativa al uso de modelos

espaciales estadísticos, los que para algunos investigadores pueden estar en duda de

algún tipo de sesgo o implementación, ya que esta metodología se realiza bajo el

diseño experimental originalmente planeado y no depende de otros resultados

estadísticos para ser agregada al análisis de varianza.

CME v/s Modelo

0

300

600

900

1200

1500

BCA

Lattice

Papad

akis AT EC

AT + E

C

BCA + 10 Z

Lattice

+ 12 Z

Modelo

CME

99

5. CONSIDERACIONES FINALES

En esta investigación se analizó la utilización de zonas geográfica homogéneas como

un modelo de interpretación de la heterogeneidad espacial, lo cual permite reducir la

influencia de la variabilidad espacial sobre la variable rendimiento de grano, lográndose

así una mejor estimación de las diferencias existentes entre híbridos de maíz.

De los resultados obtenidos para demostrar este objetivo se puede concluir y

considerar lo siguiente:

Variabilidad espacial

Existe una correlación positiva o negativa significativa de las propiedades químicas del

suelo con el rendimiento, las cuales afectan su respuesta a través del campo. Sin

embargo, es poco probable que estas variables sean las únicas que afectan la

respuesta del rendimiento o incorporar todas las variables potenciales existentes que

afectan un experimento. No obstante, es interesante notar que no todas las variables

perturban la expresión del rendimiento, y en consecuencia sería interesante identificar

aquellas que ejerzan mayor influencia sobre el rendimiento de grano u otra variable en

estudio, como también si estas varían geográficamente o son de naturaleza sitio

específico.

La variabilidad espacial se ve afectada por la acción antrópica. En este caso el

experimento de estrés hídrico provocó una mayor heterogeneidad espacial, la cual

afectó la respuesta de los híbridos; por esta razón el coeficiente de variación de los

rendimientos fue más alto en el experimento de estrés hídrico comparado con el de

riego normal. Esta observación es importante, porque en el planteamiento de un

experimento de campo donde la variable de respuesta sea el rendimiento de grano, la

acción antrópica afecta indirectamente la respuesta de la variable bajo un determinado

tratamiento, ya que si el cuadrado medio del error es seriamente inflado no se lograría

adecuadas estimaciones de la diferencia de los tratamientos o genotipos bajo estudio.

100

Diseño experimental

La elección de un adecuado diseño experimental permite obtener resultados

estadísticamente significativos. Sin embargo, los diseños experimentales pueden omitir

el control de la variabilidad espacial si la disposición u orientación espacial de los

bloques no es la correcta con respecto a la dirección de la variabilidad, produciendo

una alta variabilidad dentro del bloque y reduciendo la efectividad del análisis de

varianza. Al observar las figuras de distribución espacial de los rendimientos, se puede

predecir anticipadamente el modelo de variabilidad espacial, ubicando adecuadamente

los bloques, lo que resulta en un mejor control de la variabilidad dentro del bloque,

aunque esto sólo se lograría de realizar si se conociera anticipadamente la estructura

de la heterogeneidad espacial.

Dado esto, se puede concluir que si se conoce previamente el modelo de variación

espacial, la elección de un adecuado diseño es suficiente; de otro modo resulta útil la

incorporación de algún modelo de remoción de la heterogeneidad espacial.

El tamaño de los experimentos se puede ver influido por la correlación significativa

entre las propiedades del suelo y el rendimiento. Esto es debido a que el patrón de la

estructura espacial de las variables que influyen al rendimiento, determina en cierta

medida la estructura espacial de este último. Como se observó en los variogramas de

las propiedades del suelo, algunas presentaban dependencia espacial, con lo cual si

estas influyen en la respuesta del modelo espacial del rendimiento, estas

observaciones serían dependientes bajo un cierto rango, con lo cual el supuesto de

observaciones independientes del análisis de varianza no se cumple, aun cuando los

tratamientos estén aleatorizados dentro del bloque, implicando que para cumplir con

este supuesto se debería obtener observaciones sobre el rango determinado, lo que

aumentaría el tamaño del experimento. Esta solución puede no ser viable de

implementar en la práctica, por lo que es necesario incluir algún método de remoción

de la autocorrelación en el análisis final.

Supuestos del análisis de varianza

El supuesto de varianza constante no se cumple en ningún experimento, a pesar de

esto, existen autores que indican que si las muestras comparadas poseen el mismo

101

número de observaciones y este supuesto no se cumple, el nivel de significancia no es

mayormente afectado. La implicancia de no cumplirse este supuesto no está dentro de

los objetivos de esta tesis.

El supuesto de normalidad de los residuales de los distintos diseños experimentales,

bajo la prueba de normalidad Shapiro – Wilk, se cumple en todos los casos analizados.

En el caso del supuesto de errores independientes, la aleatorización dentro de los

diseños experimentales para obtener observaciones independientes, no es

completamente efectiva, ya que al observar los parámetros de los variograma indican

que existe dependencia espacial de los residuales, implicando que los resultados

obtenidos del análisis de varianza no sean válidos.

Variogramas e interpoladores

Si bien la elección entre modelos de variogramas no es compleja, el análisis

variográfico (estimación del variograma experimental) de los datos puede presentar

dificultades, debido a que la obtención del modelo de variograma depende del software

utilizado, la distancia máxima utilizada en el variograma, el número de pares de datos

utilizados, entre otros; estos factores determinan que esta etapa sea esencial en un

estudio geoestadístico, pudiendo obtenerse malos resultados en caso de realizar un

mal modelamiento. La solución y como se enfrenta este problema no esta dentro de los

objetivos de esta tesis, por lo que sería interesante considerarlo para un estudio futuro.

Los interpoladores, a excepción de la regresión polinomial, demostraron ser buenos

estimadores de la continuidad espacial de las variables estudiadas. Estos también

demostraron que no se afectan principalmente por la alta o baja variación de las

muestras, lo que implica que en la utilización de cualquiera de estos métodos se

obtendrán resultados semejantes. Sin embargo, kriging es el único interpolador que

incorpora la estructura espacial de la variable en su estimación de las áreas no

muestreadas y minimiza la media y la varianza del error, lo que le confiere cierta

ventaja sobre los otros interpoladores, no obstante esta característica también es una

debilidad, por que si se realiza un mal análisis variográfico se pueden obtener

resultados erróneos. Por lo tanto, la utilización de un determinado interpolador puede

depender de factores como densidad de muestreo, información redundante y distancia

de muestreo, entre otros.

102

Modelos espaciales

Se observó que el uso de los diferentes métodos lleva a resultados distintos, y que el

modelo óptimo depende de la naturaleza del experimento y no puede ser utilizado

frente a un experimento similar en otra localidad, aun cuando se repitiera el mismo

experimento en el mismo lugar en temporadas distintas, lo que demuestra que son sitio

específicos.

El uso del método de análisis de tendencia es de difícil implementación, ya que la

elaboración de una adecuada superficie de respuesta es complejo, a esto se suma la

posibilidad que la variable no pueda ser modelada por una regresión polinomial.

La utilización de los análisis errores correlacionados y el análisis de tendencia más

error correlacionado disminuyen considerablemente el cuadrado medio del error y por

consiguiente se logra aumentar el valor del estadístico F. Sin embargo, estos métodos

presentan el inconveniente de depender de los valores obtenidos de un análisis

variográfico, el cual se encuentra sujeto a un adecuado modelamiento del variograma

experimental, obteniéndose resultados erróneos si el modelo seleccionado no es el

apropiado.

El método de Papadakis resulta en una disminución del cuadrado medio del error y es

independiente de la obtención de datos de otros análisis; sin embargo, depende de la

elección del número de parcelas vecinas involucradas en el cálculo de la covariable,

como también del número de covariables utilizadas en el modelo, lo que

probablemente puede llevar a la obtención de resultados con pobres estimaciones de

los tratamientos o un sobre ajuste de los rendimientos. Sin embargo, un estudio previo

determinando el número de parcelas vecinas antes del análisis final resultaría valioso.

No obstante lo anterior, los distintos modelos espaciales no cumplen con el supuesto

de errores independientes, con lo cual los resultados obtenidos pueden no ser válidos.

Definición de las zonas geográficas homogéneas

En la definición de zonas geográficas homogéneas existen diversos métodos de

clasificación, dentro de estos métodos están el análisis de componentes principales,

fuzzy k – means, análisis de cluster, entre otros, los cuales están incorporados a

algunos programas como por ejemplo S – Plus o SAS.

103

En este estudio se utilizó el análisis de cluster, en el cual se deben definir las variables

relevantes para la conformación de las zonas; en esta tesis se incluyeron nueve

variables de propiedades químicas del suelo. Las propiedades físicas del suelo

deberían ser incluidas

Uso de zonas geográficas homogéneas

Los supuestos de distribución de los residuales con media igual a cero y varianza igual

a ó², e independencia de los residuales del análisis de varianza de los rendimientos de

grano en los distintos experimentos utilizando zonas geográficas homogéneas se

cumple. El supuesto de normalidad no se cumple, sin embargo el nivel de significancia

no es mayormente afectado, por lo que los resultados del análisis de varianza son

válidos.

El uso de zonas homogéneas resultó en una disminución del cuadrado medio del error,

la cual fue superior a la observada con los diseños experimentales y los modelos de

remoción de la variabilidad, por lo cual el valor del estadístico F se vio aumentado,

implicando que se logre una mejor estimación de la diferencia de la media de los

genotipos en estudio.

Sin embargo, es importante destacar que el uso de este método no es un nuevo diseño

experimental, mas bien cae en la clasificación de un experimento factorial, ya que el

objetivo de este método es explicar la variabilidad espacial presente en el rendimiento

por medio de la incorporación de zonas con características similares como factor que

influye sobre la expresión de los híbridos. Por este motivo, la selección de un adecuado

diseño experimental es importante, ya que este método depende del diseño

experimental implementado.

No obstante, si la heterogeneidad espacial es reducida, la implementación de este

método es innecesaria, puesto que los diseños experimentales son adecuados para

controlar la heterogeneidad espacial. Si la variabilidad espacial es elevada y la

selección del diseño es la adecuada, este procedimiento puede presentar resultados

muy beneficiosos.

Este método depende de las características del lugar en donde se implementa, lo que

significa que es sitio específico.

104

Aun cuando la metodología utilizada es compleja, es la adecuada en la obtención del

número de zonas, debido a que cumple con un proceso estadísticamente válido.

Este método resulta conveniente en un programa de mejoramiento genético, por las

implicancias de obtener mejores estimaciones de la diferencia entre genotipos en

estudio. Además, esta metodología puede ser utilizada para todo experimento en que

la variable de respuesta sea el rendimiento y obtener resultados estadísticamente

válidos, por lo que su uso es recomendable en presencia de heterogeneidad espacial.

105

6. BIBLIOGRAFIA

Akaike, H. 1973. Information theory and an extension of maximum likelihood principle.

In B.N. Petrov & F. Csáki (Eds). Second International Symposium on Information

Theory. Akadémia Kiadó, Budapest, Hungría. p. 267 – 281.

Amaro, R. y Cobo, M. 1994. La investigación agrícola y la aplicación del método

Papadakis. Rev. Fac. Agron. Maracay. Venezuela. 20: 35 – 45

Bailey, R., Azais, J. y Monod, H. 1995. Are neighbour methods preferable to analysis of

variance for completely systematic designs? “Silly designs are Silly”. Biometrika 82: 655

– 659

Ball, S., Mulla, D. y Konzak, C. 1993. Spatial heterogeneity affects variety trial

interpretation. Crop Sci. 33: 931 – 935

Barreto, H., Edmeades, G., Chapman, S. y Crossa, J. 1997. The alpha lattice design

in plant breeding and agronomy: generation and analysis. In: G.O. Edmeades, M.

Banzinger, H.R. Mickelson y C.B. Peña-Valdivia (Eds). Developing drought and low N-

tolerant maize. Proceedings of a Symposium, Marzo 25 – 29, 1996, CIMMYT, El Batán,

México, DF, Mexico

Bartlett, M. 1938. The approximate recovery of information from field experiments with

large blocks. J. Agric. Sci. 28: 418 – 427

Bartlett, M. 1978. Nearest neighbour models in the analysis of field experiments (with

discussion). J. R. Statist. Soc. B 47: 147 – 174

Belobrov, V. 1976. Variation in some chemical and morphological properties of sod-

podzolic soils within the boundaries of elementary soil areas and taxonomic groups. In

Fridman V. (Ed), Soil combinations and their genesis. Amerind, Nueva Delphin. p. 147

– 158

106

Besag, J. y Kempton, R. 1986. Statistical analysis of field experiments using

neighbouring plots. Biometrics 42: 231 – 251

Bhattacharyya, G. y Johnson, R. 1977. Statistical concepts and methods. John Wiley &

Sons Inc., Nueva York, NY, EUA. 639 pp.

Bhatti, A., Mulla, D., Koehler, F. y Gurmani, A. 1991. Identifying and removing spatial

correlation from yield experiments. Soil Sci. Soc. Am. J. 55: 1523 – 1528

Bowman, D. 1990. Trend analysis to improve efficiency of agronomic trials in flue-cured

tobacco. Agron. J. 82: 499 – 501

Brownie, C., Bowman, D. y Burton, J. 1993. Estimating spatial variation in analysis of

data from yield trials: a comparison of methods. Agron. J. 85: 1244 – 1253

Burgess, T. y Webster, R. 1980. Optimal interpolation and isarithmic mapping soil

properties. I. The semi-variogram and punctual kriging. J. Soil Sci. 31: 315 – 331

Cambardella, C., Moorma, T., Novak, J., Parkin, T., Karlen, D., Turco R. y Konopka A.

1994. Field-scale variability of soil properties in central Iowa soils. Soil Sci. Soc. Am. J.

58: 1501 – 1511

Campbell, J. 1978. Spatial variation of sand content and pH within single contiguous

delineations of two soil mapping units. Soil Sci. Soc. Am. J. 42: 460 – 464

Cobertera, E. 1993. Edafología aplicada. Cátedra S.A., Madrid, España. 326 pp.

Cochran, W. 1947. Some consequences when the assumptions for the analysis of

variance are not satisfied. Biometrics 3: 22 – 38

Cochran, W. y Cox, G. 1950. Experimental designs. John Wiley & Sons Inc., Nueva

York, NY, EUA. 454 pp.

107

Cressie, N. 1993. Statistics for spatial data. John Wiley & Sons Inc., Nueva York, NY,

EUA. 900 pp.

Dagnelie, P. 1989. The method of Papadakis in agricultural experimentation: An

overview. Biuletyn Oceny Odmian. p. 111 – 122

David, H. 1967. Resolvable cyclic designs. Sankhyâ A 29: 191 – 208

Davis, R. y Reich, R. 2000. Quantitative spatial analysis. Course notes for NR/ST

523, Colorado State University, Fort Collins, Colorado 80523, EUA.

De Oliveira, J. 1975. Factores de formación. In Moniz A. (Ed). Elementos de pedología.

Río de Janeiro, Brasil. p. 275 – 288

D’Hoore, J. 1970. Cours de pédogenèse. Louvain. Universitè Catholique. 224 pp.

Draper, N. y Faraggi, D. 1985. Role of Papadakis estimator in one and two dimensional

field trials. Biometrika 72: 223 – 226

Eisenhart, C. 1947. The assumptions underlying the analysis of variance. Biometrics 3:

1 – 21.

Emery, X. 2000. Geoestadística lineal. Departamento de Ingeniería de Minas de la

Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, Santiago,

Chile. 411 pp.

Eskridge, K. 2003. Field design and the search for quantitative trait loci in plants.

Department of Biometry.

http://www.stat.colostate.edu/~hari/graybillconference/ talks/Eskridge.ppt

Fagroud, M. y Van Meirvenne, M. 2002. Accounting for soil autocorrelation in the

design of experimental trials. Soil Sci. Soc. Am. J. 66: 1134 – 1142

108

Fisher, R. A. 1925. Statistical methods for research workers. Oliver and Boyd,

Edimburgo, Escocia. 350 pp.

Fisher, R. A. 1935. The design of experiments. Oliver and Boyd, Edimburgo, Escocia.

236 pp.

Fisher, R. y Yates, F. 1938. Statistical tables. Oliver and Boyd, Edimburgo, Escocia.

126 pp.

Gajem, Y., Warrick, A. y Myers, D. 1981. Spatial dependence of physical properties of a

typic torrifluvent soil. Soil Sci. Soc. Am. J. 45: 709 – 715

Gaucher, G. 1971. El suelo y sus características agronómicas. Omega S.A., Barcelona,

España. 647 pp.

Gil, R. 2001. El comportamiento físico – funcional del suelo.

http://cirn.inta.gov.ar

Golden Software Inc. 2001. Surfer 7.05 User’s guide. Surface mapping system. Golden

Software Inc., Golden, Colorado, EUA.

Gotway, C., Ferguson, R., Hergert, G. y Peterson, T. 1996. Comparison of kriging and

inverse-distance methods for mapping soil parameters. Soil Sci. Soc. Am. J. 60: 1237 –

1247

Gotway, C., Bullock, D., Pierce, F., Stroup, W., Herget, G. y Eskridge, K. 1997.

Experimental design issues and statistical evaluation techniques for site – specific

management. ASA – CSSA – SSSA. p. 301 – 331

Gotway, C. y Hergert, G. 1997. Incorporating spatial trends and anisotropy in

geostatistical mapping of soil properties. Soil Sci. Soc. Am. J. 61: 298 – 309

109

Grundy, P. y Healy, M. 1950. Restricted randomization and quasi-latin square. J. R.

Statist. Soc. B 12: 286 – 295

Gurovich, L. y Stern, J. 1983. Variabilidad espacial de la velocidad de infiltración en el

suelo. II. Análisis geoestadístico y estructura espacial. Cienc. Inv. Agr. 10: 271 – 278

Hardy, F. 1970. Edafología tropical. Herrero Hnos. S. A., México. 416 pp.

Hernández, J. y Mulla, D. 2002. Comparing classical and spatial statistical analysis

methods for landscape scale experimental designs. In P.C. Robert, R.H. Rust, y W.E.

Larson (Eds), Proceedings of the 6th International Conference on Precision Agriculture.

ASA – CSSA – SSSA. Madison, WI, EUA.

Honorato, R. 1993. Manual de edafología. Pontificia Universidad Católica de Chile,

Santiago, Chile. 195 pp.

Isaaks, E. y Srivastava, R. 1989. Applied geostatistics. Oxford University Press., Nueva

York, NY, EUA. 561 pp.

Jenny, H. 1941. Factors of soil formation – a system of quantitative pedology. McGraw

– Hill , Nueva York, NY, EUA. 281 pp.

Jorge, J. 1975. Materia orgánica. In Moniz A. (Ed). Elementos de pedología. Río de

Janeiro, Brasil. p. 169 – 178

Journel, A. y Huijbregts, Ch. 1978. Mining geostatistics. Academic Press Limited.,

Londres, Inglaterra. 600 pp.

Kempthorne, O. 1952. The design and analysis of experiments. John Wiley & Sons,

Inc., Nueva York, NY, EUA. 631 pp.

Kirk, H., Haynes, F. y Monroe, R. 1980. Application of trend analysis to horticultural field

trials. J. Amer. Soc. Hort. Sci. 105: 189 – 193

110

MapInfo Corporation. 1999. User’s guide version 5.5. MapInfo Corporation, Troy, Nueva

York, EUA.

McBratney, A. y Webster, R. 1986. Choosing functions for semi-variograms of soil

properties and fitting them to sampling estimates. J. Soil Sci. 37: 617 – 639

Mendenhall, W. y Ott, L. 1980. Understanding statistic. 3ª ed. Duxbury Press.,

California, EUA. 459 pp.

Mitchell, M. 1995. Using XLISP-STAT to explore new and unusual statistical paradigms.

Perspective 1: 28 – 32

Mulla D., Bhatti, A. y Kunkel, R. 1990. Methods for removing spatial variability from field

research trials. Adv. Soil Sci. 13: 201 – 213

Nelson, L. y Rawlings, J. 1983. Ten common misuses of statistics in agronomic

research and reporting. J. Agron. Educ. 12: 100 – 105

Neyman, J., Iwaszkiewicz, K. y Kolodziejczyk, S. 1953. Statistical problems in

agricultural experiments. J. R. Stat. Soc. Suppl. 2: 114 – 136

Ortega R., Westfall D., Gangloff W. y Peterson G. 1999. Multivariate approach to N and

P recommendations in variable rate fertilizer applications. Precision Agriculture ‘99. Part

1. 2nd Precision European Conference on Precision Agriculture. p. 387 – 396

Ortega, R. y Flores, L. 1999. Agricultura de precisión, Introducción al manejo sitio –

específico. Editorial INIA. Chile. 146 pp.

Papadakis, J. 1937. Méthode statistique pour des expériences sur champ. Institut

D’amélioration des plantes a Salonique (Grecia) Bull. Sci. Nº 23 p. 11 – 30

111

Papadakis, J. 1988. Further advances in the use of adjustment (Papadakis method) in

the field experiments. Proceeding of the Academy of Athens. 36: 1 – 11

Parodi, P. C. y Nebreda, I. 1997. Efecto del número de repeticiones y el tipo de

parcelas sobre la eficiencia experimental en la determinación del comportamiento

agronómico del trigo candeal. Cien. Inv. Agr. 24: 46 – 58

Patterson, H. y Williams, E. 1976. A new class of resolvable incomplete block designs.

Biometrika 63: 83 – 92

Patterson, H., Williams, E. y Hunter, E. 1978. Block designs for variety trials. J. Agric.

Sci., Camb. 90: 395 – 400

Pearce, S. y Moore, C. 1976. Reduction of experimental error in perennial crops, using

adjustment by neighbouring plots. Expl. Agric. 12: 267 – 272

Pearce, S. 1998. Field experimentation on rough land: the method of Papadakis

reconsidered. J. Agric. Sci., Camb. 131: 1 – 11

Red Hed Systems Inc., 1999. MapCalc User’s guide version 2.0. Red Hed Systems

Inc., Fort Collins Colorado, EUA.

Red Hed Systems Inc., 2000. FarmGPS User’s guide version 1.5. Red Hed Systems

Inc., Fort Collins Colorado, EUA.

Richey, F. 1924. Adjusting yields to their regression on a moving average, as a means

of correcting for soil heterogeneity. J. Agric. Res. 27: 79 − 90

SAS Institute Inc. 2001. SAS user’s guide. Version 8.02 ed. SAS Inst., Cary, NC, EUA

Sainato, C., Arrigo, N., Giuffré, L., Svidovsky, B., Orden, S. y Palma, M. 1996. Sistema

de labranza: Análisis geoestadístico de propiedades de un suelo. Agric. Tec. 56: 49 –

56

112

Schwarzbach, E. 1985. Weighted nearest-neighbour analysis. Biometrics 41: 1088

Shapiro, S. y Wilk, M. 1965. An Analysis of Variance Test for Normality (complete

samples). Biometrika 52: 591 – 611

Smith, F. 1938. An empirical law describing heterogeneity in the yields of agricultural

crops. J. Agric. Sci. 28: 1 – 23

Snedecor G. 1934. Analysis of variance and covariance. Editorial Ames, IA, EUA.

Snedecor, G. y Cochran, W. 1980. Statistical methods. The Iowa State University

Press. IA, EUA. 507 pp.

Statistical Sciences, 1994. S-Plus for windows version 4.5 supplement. Seattle,

Washington, EUA.

Steel, R. y Torrie, J. 1960. Principles and procedures of statistics. McGraw − Hill Book

Company, Inc. Nueva York, NY, EUA. 481 pp.

Stroup, W., Baenzinger, P. y Mulitze, D. 1994. Removing spatial variation from wheat

yield trials: A comparison of methods. Crop Sci. 86: 62 – 66

Tamura, R., Nelson, L. y Naderman, G. 1988. An investigation of validity and

usefulness of trend analysis for field plot data. Agron. J. 80: 712 – 718

Trangmar, B., Yost, R. y Uehara, G. 1985. Application of geostatistics to spatial studies

of soil properties. Adv. Agron. 38: 45 – 94

Trangmar, B., Yost, R., Wade, M., Uehara, G. y Sudjadi, M. 1987. Spatial variation of

soil properties and rice on recently cleared land. Soil Sci. Soc. Am. J. 51: 668 – 674

van Es, H., van Es, C. y Cassel, D. 1989. Application of regionalized variable theory to

large-plot field experiments. Soil Sci. Soc. Am. J. 53: 1178 – 1183

113

van Es, H. y van Es, C. 1993. Spatial nature of randomization and its effect on the

outcome of field experiments. Agron. J. 85: 420 – 428

Vieira, S., Nielsen, D. y Biggar, J. 1981. Spatial variability of field-measured infiltration

rate. Soil Sci. Soc. Am. J. 45: 1040 – 1048

Warren, J. y Mendez, I. 1982. Methods for estimating background variation in field

experiments. Agron. J. 74: 1004 – 1009

Wilding, L. y Smeck, N. 1983. Pedogenesis and soil taxonomy. Elsevier Science

Publisher B. V. New York, NY, EUA. 303 pp.

Wilkinson, G., Eckert, S., Hancock, T. y Mayo, O. 1983. Nearest neighbour (NN)

analysis of field experiments. J. R. Stat. Soc. B 45: 151 – 211

Williams, E. 1986. A neighbour model for field experiments. Biometrika 73: 279 – 287

Wonnacott, T. y Wonnacott, R. 1972. Introductory statistics. John Wiley & Sons, Inc.

Nueva York, NY, EUA. 510 pp.

Wu, T. y Dutilleul, P. 1999. Validity and efficiency of neighbor analyses in comparison

with classical complete and incomplete block analyses of field experiments. Agron. J.

91: 721 – 731

Yates, F. 1936. A new method of arranging variety trials involving a large number of

varieties. J. Agric. Sci., Camb. 26: 424 – 455

Ye, G., McNeil, D. y Hill, G. 2001. Methods for analysing multi-site plant variety trials. I

Estimating genotypic means at each site. Agron. N. Z. 31: 13 – 24

Yost, R., Uehara, G. y Fox, R. 1982. Geostatistical analysis of soil chemical properties

of large land areas. I. Semi-variograms. Soil Sci. Soc. Am. J. 46: 1028 – 1032

114

Zimmerman, D. y Harville, D. 1991. A random field approach to the analysis of field-plot

experiments and other spatial experiments. Biometrics 47: 223 – 239

115

7. ANEXOS

116

7.1 Anexo A: Modelamiento del variograma experimental

Es importante la elección de un adecuado modelo para estimar el variograma debido a

que cada modelo, para cada variable, entregan diferentes valores para el nugget,

umbral y rango, los cuales son importantes para la interpolación con kriging (Trangmar

et al., 1985).

Según Emery (2000), los modelos de variograma se pueden clasificar en:

7.1.1. Modelos con umbral y comportamiento en el origen.

− Discontinuo.

• Efecto de nugget puro:

0 para h = 0

γ(h) =

C para h > 0

− Lineal.

• Esférico:

C

−

3

3

21

23

ah

ah para 0 < h < a

γ(h) =

C para h > a

• Exponencial:

γ(h) =

−−

ah

C exp1

−− Parabólico.

• Gausiano:

117

γ(h) =

−−

2

2

exp1ah

C

• Cúbico:

−+−

743

27

4357 7

5

5

3

32

hh

ah

ah

ah

C para 0 < h < a

γ(h) =

C para h > a

Otros modelos con umbral y comportamiento en el origen son:

• Triangular.

• Cuadrático.

• Circular.

• Pentaesférico.

• Estable.

• Gamma.

• De Cauchy.

• De Bessel modificado.

7.1.2. Modelos con umbral y efecto de agujero (hole effect).

• Coseno, de periodo a y amplitud 2C (válido solamente en R):

γ(h) =

Π

−a

hC

2cos1

• Coseno amortiguado, de parámetros a, b, α y sill C (válido en R):

γ(h) = ( )

Π−−

ah

bhC2cosexp1 α con 0 < α < 2

118

Otros modelos:

• J de Bessel.

• Polinomiales truncados.

• Estable generalizado.

7.1.3. Modelo sin umbral, estos modelos sobrepasan el marco estacionario de segundo

orden. Corresponden funciones aleatorias intrínsecas estrictas.

• Potencia:

γ(h) = θϖh con 0 < θ < 2

• Lineal, se trata de un caso particular del modelo potencia, con exponente igual

a 1:

γ(h) = hϖ

• Logarítmico:

γ(h) = ( )hln3α

donde en los modelos C es la covarianza espacial, a es el rango de la dependencia

espacial y h es la distancia lag.

El estudio de variogramas relativos, como el variograma local relativo, el variograma

global relativo y el variograma pairwise relativo, al igual que el modelamiento de

anisotropía, está fuera del alcance de esta tesis.

119

7.2 Anexo B: Metodología de las interpolaciones

7.2.1 Polígonos de Thiessen

Este método asigna a cada punto de los datos un polígono de influencia y cada

muestra que está dentro de la zona de influencia tiene un valor cercano al del polígono

que cualquier muestra de otra zona (Davis y Reich, 2000).

Para la construcción de un polígono se designa un bisector perpendicular equidistante

a una línea que une dos puntos cercanos. El bisector perpendicular entre muestra y las

muestras vecinas forman los límites de un polígono, por lo que queda desigualmente

definido (Isaaks y Srivastava, 1989). (Figura B.1)

Figura B.1. Construcción de un polígono (Fuente: Isaaks y Srivastava, 1989).

7.2.2 Triangulación

El método de polígonos provee una estimación discontinua (Figura B.2), y la

discontinuidad en la estimación de los valores no es adecuada (Isaaks y Srivastava,

1989).

120

Figura B.2. Discontinuidad del método de polígonos (Fuente: Isaaks y Srivastava,

1989).

El método de triangulación no presenta este problema, ya que remueve las posibles

discontinuidades entre puntos adyacentes por medio del ajuste de un plano dado por

tres muestras que rodean el punto que se desea estimar (Davis y Reich, 2000). La

ecuación de un plano puede ser expresada como (Isaaks y Srivastava1989):

[B.1] z = ax + by + c

donde z es el valor de la variable a estimar, x es la coordenada del este (ó longitud) e y

es la coordenada del norte (ó latitud).

Al seleccionar las tres muestras cercanas se construye un sistema de ecuaciones:

z1 = ax1 + by1 + c

z2 = ax2 + by2 + c

z2 = ax2 + by2 + c

al resolver el sistema de ecuación se estima el valor de a, b y c:

ccybbaa ˆˆ,ˆ ===

121

donde cyba ˆˆ,ˆ son los parámetros estimados, con lo que la formula de estimación de

una variable no muestreada es (Figura B.3):

[B.2] cybxaz ˆˆˆˆ ++=

Figura B.3. Método de triangulación (Fuente: Isaaks y Srivastava, 1989).

7.2.3 Distancia Inversa

En el método de polígonos y el método de triangulación se ignora información de las

parcelas adyacentes (Isaaks y Srivastava, 1989). El método de la distancia inversa

entrega más peso a las muestras más cercanas y menos peso a las que se encuentran

más alejadas (Davis y Reich, 2000), esto se realiza mediante el peso entregado a cada

muestra es inversamente proporcional a la distancia desde donde el punto de la

variable aleatoria es estimado:

[B.3]

∑

∑

=

=

=n

i i

n

ii

i

d

yd

y

1

1

1

1

ˆ

donde � es el valor de la variable estimada, di es la distancia de las muestras cercanas

a la variable a estimar e yi es el valor de la variable vecina correspondiente a la

distancia di.

122

7.2.4 Kriging

Inicialmente, el procedimiento de kriging fue introducido por Krige en el año 1951 y

formalizado por Matheron en el año 1962 (Citados por Journel y Huijbregts, 1978).

Kriging se apoya en la interpretación de la variable regionalizada como una realización

de una función aleatoria, de la cual se obtiene un modelo de variograma. Se trata de

buscar, entre los estimadores formados por las combinaciones lineales ponderadas de

los datos, aquel que presente las mejores propiedades (Emery, 2000).

El método kriging es asociado con la sigla en inglés “B.L.U.E.” (best linear unbiased

estimator), ya que, es lineal, por que los estimadores se forman por la combinación

lineal de los datos disponibles, es el mejor por que minimiza la varianza del error, es

insesgado, por que intenta que la media del error sea cercana a cero (Journel y

Huijbregts, 1978).

Los métodos anteriormente descritos, también son lineales y teóricamente insesgados,

pero lo que distingue a kriging de los otros métodos es que minimiza la media y la

varianza del error (Isaaks y Srivastava, 1989).

Existen muchos métodos de kriging (Trangmar et al., 1985):

• Kriging puntual

• Kriging ordinario

• Kriging en bloques

• Kriging universal o de orden k

• Kriging disyuntivo

• Lognormal kriging

• Cokriging

Pero el kriging puntual es, probablemente, el método más utilizado en las ciencias del

suelo (Vieira et al., 1981; Burgess y Webster, 1980; Trangmar et al., 1985; Gotway et

al., 1996).

La estimación de las variables no muestreadas para el kriging, está dada por la

siguiente formula lineal (Emery, 2000):

Kriging Simple

123

[B.4] ( ) ( )i

n

i

xyxy ∑=

=1

0ˆ αλ

donde �(x0) es el valor de la variable estimada, xi (i =1,... n) son los puntos utilizados

para la estimación y los ponderadores λα son las incógnitas del problema de kriging.

Estos ponderadores dependerán a la vez de la estructura espacial de la

regionalización.

Los ponderadores o pesos son seleccionados, de tal manera que, el estimado �(x0) del

verdadero valor y(x0) carece de sesgo (Trangmar et al., 1985):

[B.5] ( ) ( )[ ] 0ˆ 00 =− xyxyE

y la varianza estimada 2σ̂ es minimizada:

[B.6] ( ) ( )[ ] mínimoxyxyVar =−= 002 ˆσ̂

Los pesos utilizados para cada muestra cercana suman uno, y su única combinación

para la cual 2σ̂ es minimizada puede ser obtenida cuando:

[B.7] ( ) ( )01

,, xxyxxy iji

n

j

=+∑=

µλα

Los valores y(xi, x j) y y(xi, x0) son las semi-varianzas entre las localidades observadas xi

y xj, y entre la localidad observada xi y la localidad interpolada x0, estos valores son

obtenidos del variograma de y(x).

Los supuestos de para la utilización de kriging son que las muestras son normalmente

distribuidos y estacionarias (Journel y Huijbregts, 1978).

Cuando no se cumplen adecuadamente los supuestos los otros métodos de kriging

pueden ser utilizados (Figura B.4).

124

Figura B.4. Métodos de kriging bajo diferentes condiciones de estacionaridad y

probabilidad de distribución de los datos (Adaptado de Trangmar et al., 1985).

125

7.3 Anexo C: Procedimientos SAS

Análisis de varianza de un diseño de bloques completos al azar y α - lattice.

Los datos originalmente utilizados correspondían a bloques incompletos con sus

correspondientes repeticiones. Las correspondientes abreviaciones son trt híbrido,

block bloque incompleto, rep la repetición o súper bloque y yld rendimiento.

7.3.1. Bloques completos al azar y análisis de normalidad de los residuales:

options nodate ls=75; data pioneer; input trt $ yld rep block; datalines; /*(datos)*/ proc glm; class trt rep; model yld= trt rep; output out=resdat r=res; Proc univariate data=resdat normal; Var res; title 'Análisis de Bloques Completos al Azar'; run;

7.3.2. α - lattice:

options nodate ls=75; data Pioneer; input trt $ yld rep block; datalines; /*(datos)*/ proc glm; class trt rep block; model yld= trt block rep; title 'Análisis de Lattice'; run;

126

7.3.3. Errores correlacionados, lon (longitud) y lat (latitud) corresponden a las

coordenadas geográficas de los híbridos:

options nodate ls=120; data pioneer; input lon lat trt $ yld; datalines; /*(datos)*/ proc mixed noprofile; class trt; model yld= trt; parms () ()/noiter; /*Parámetros del Variograma: sill range */ repeated / type=sp(sph)(lon lat); title 'Análisis de EC'; run;

7.3.4. Análisis de tendencia, los datos fueron dispuestos en filas (row) y columnas (col)

desde su diseño original, trend corresponde al polinomio de la superficie de respuesta:

options nodate ls=75; data pioneer; input row col trt $ yld; trend = /* formula del polinomio de la superficie de respuesta */ datalines; /*(datos)*/ proc glm; class trt; model yld= trt trend; title 'Análisis de Tendencia'; run;

7.3.5. Análisis de tendencia más error correlacionado, se utiliza la misma fórmula de la

superficie de respuesta utilizada en el análisis de tendencia y los parámetros del

variograma usado en el modelo de error correlacionado:

proc mixed noprofile; class trt; model yld = trt trend; parms () ()/noiter; /* Variogram param: sill range */ repeated / type=sp(sph)(lon lat); title 'Análisis de Tendencia + EC'; run;

127

7.3.6. Zonas incorporadas al diseño experimental:

options nodate ls=75; data pioneer; input trt $ yld rep block z(número de zona)$; datalines; /*(datos)*/

El siguiente paso varía dependiendo del diseño experimental:

Bloques completos al azar:

proc glm data = pioneer; class trt rep z(más el número de zona de interés); model yld = rep hibrido z hibrido*z; title 'Zonas'; run;

α - lattice:

proc glm data = pioneer; class trt block rep z; model yld= rep block hibrido z hibrido*z; title 'Zonas'; run;

7.3.7. Método de Papadakis, los datos fueron dispuestos en filas (row) y columnas (col)

desde su diseño original, este procedimiento permite a SAS obtener los residuales a

partir de un diseño completamente al azar y calcular la covariable:

options nodate ls=75; data pioneer; input row col trt $ yld rep; datalines; /*(datos)*/ data sub; set pioneer; row = row; col = col; keep row col yld trt rep; proc sort; by row col; title 'Residuales'; proc glm; class trt rep; model yld=trt; output out=new r=res; data left; set new;

128

col=col+1; if col <=36; left=res; keep left col row; data right; set new; col=col-1; if col >=1; right=res; keep right col row; data top; set new; row=row-1; if row >=1; top=res; keep top col row; data bott; set new; row=row+1; if row <=20; bott=res; keep bott col row; data tog; merge sub left right top bott; by row col; cov = mean(left, right, top, bott); title 'Análisis de Papadakis'; proc glm; class trt; model yld=trt cov; run;

129

7.4 Anexo D: Metodología del análisis de agrupamiento (cluster analysis)

utilizado por MapCalc.

El agrupamiento (cluster) es utilizado para identificar áreas con características

similares a partir de un grupo de capas de mapas. El proceso pasa a través de un

grupo de valores de un sinnúmero de capas, luego investiga el patrón de los datos, los

cuales esta formado por valores, para determinar otras ubicaciones que sean

similares. Las etapas del procedimiento son:

(1) Establecer arbitrariamente un centro de datos para cada agrupamiento, por

medio de asignar aleatoriamente valores a los datos. La similitud, o distancia de

los datos, es computada por un mapa de ubicación del centro de datos para

cada uno de los agrupamientos. La ubicación es asignada al agrupamiento que

se encuentre más cerca al centro de datos (el modelo de datos más similares)

El procedimiento es repetido hasta que todos los mapas de ubicación tengan

asignado un agrupamiento inicial.

(2) Calcular el promedio de los datos de las ubicaciones asignadas pertenecientes

al agrupamiento inicial. Los promedios forman un centro de datos actualizados,

el cual refleja el modelo de los datos de cada agrupamiento. Los valores

actualizados son utilizados para redistribuir los agrupamientos

correspondientes, por medio de comparar repetidamente cada modelo de datos

de ubicación con el modelo de datos actualizados de los agrupamientos.

(3) Iteración de estos pasos hasta que no cambie la asignación al agrupamiento, o

hasta que se cumpla un máximo de 30 iteraciones.

130

7.5 Anexo E: Metodología de selección de las zonas

La selección del número óptimo de zonas se realizó mediante el siguiente

procedimiento:

(4) Se comparó la eficiencia relativa de las zonas con respecto a los diseños

experimentales, eligiendo el número de zonas que presentara una eficiencia

relativa sobre uno y fuese mayor al de las otras zonas. (Cuadro E.1)

(5) Se observó la prueba de falta de ajuste para determinar bajo la hipótesis nula

de que no existe diferencia entre el diseño originalmente descrito y el

propuesto, la cual tiene que ser significativa. (Cuadro E.2)

(6) Si se cumplen estos requisitos se selecciona el correspondiente número de

zonas.

Cuadro E.1. Eficiencia relativa de las zonas con respecto a los distintos diseños bajo

los distintos experimentos.

Zonas BCA � - lattice Zonas BCA � - lattice2 Zonas 1,04 1,02 2 Zonas 0,95 0,883 Zonas 0,97 0,99 3 Zonas 0,94 0,854 Zonas 0,88 0,71 4 Zonas 1,14 1,055 Zonas 0,91 0,88 5 Zonas 1,06 0,906 Zonas 0,99 0,99 6 Zonas 1,15 1,057 Zonas 1,45 3,69 7 Zonas 0,87 0,678 Zonas 1,44 27,84 8 Zonas 0,91 1,069 Zonas 1,00 1,05 9 Zonas 1,18 1,16

10 Zonas 0,98 0,60 10 Zonas 1,59 1,5011 Zonas 1,41 N/D 11 Zonas 1,05 0,6812 Zonas 0,59 N/D 12 Zonas 0,84 4,8213 Zonas 1,75 N/D 13 Zonas 1,13 0,8314 Zonas 2,03 N/D 14 Zonas 1,78 3,0815 Zonas 0,68 N/D 15 Zonas 1,22 4,1516 Zonas 0,77 N/D 16 Zonas 1,51 N/D17 Zonas 1,51 N/D 17 Zonas 1,42 N/D18 Zonas 2,24 N/D 18 Zonas 1,02 0,8119 Zonas 2,18 N/D 19 Zonas 1,19 N/D20 Zonas 0,56 N/D 20 Zonas 0,81 15,18

Estrés hídrico Riego normalDiseño experimental Diseño experimental

N/D = no determinado

131

Cuadro E.2. Prueba de falta de ajuste de las zonas con respecto a los distintos

diseños y en los distintos experimentos.

Zonas F Pr > F F Pr > F Zonas F Pr > F F Pr > F2 Zonas 2,30*** 3,511E-08 3,53*** 2,84E-17 2 Zonas 0,93 0,666 0,88 0,8113 Zonas 1,50** 0,005 2,43*** 3,47E-07 3 Zonas 0,93 0,693 0,89 0,7494 Zonas 1,26 0,163 1,57 0,108 4 Zonas 1,22 0,116 1,17 0,2045 Zonas 1,30 0,090 1,94** 0,007 5 Zonas 1,10 0,305 0,99 0,5336 Zonas 1,43 0,058 2,24* 0,020 6 Zonas 1,22 0,170 1,20 0,2797 Zonas 2,15** 0,007 9,61** 0,004 7 Zonas 0,87 0,778 0,73 0,8948 Zonas 2,14* 0,013 84,11** 0,002 8 Zonas 0,93 0,649 1,28 0,3029 Zonas 1,49 0,140 4,19 0,375 9 Zonas 1,26 0,182 1,47 0,25910 Zonas 1,47 0,179 1,79 0,356 10 Zonas 1,74* 0,023 2,00 0,16611 Zonas 2,15* 0,038 N/D N/D 11 Zonas 1,10 0,368 0,92 0,63012 Zonas 0,90 0,648 N/D N/D 12 Zonas 0,88 0,715 8,54 0,11013 Zonas 2,75* 0,025 N/D N/D 13 Zonas 1,21 0,266 1,33 0,47914 Zonas 3,35* 0,034 N/D N/D 14 Zonas 1,98* 0,032 6,54 0,30415 Zonas 1,06 0,498 N/D N/D 15 Zonas 1,33 0,195 8,82 0,26416 Zonas 1,43 0,406 N/D N/D 16 Zonas 1,69 0,088 N/D N/D17 Zonas 2,61 0,110 N/D N/D 17 Zonas 1,58 0,113 N/D N/D18 Zonas 3,78* 0,033 N/D N/D 18 Zonas 1,15 0,399 1,71 0,55519 Zonas 3,92 0,063 N/D N/D 19 Zonas 1,33 0,253 N/D N/D20 Zonas 0,89 0,657 N/D N/D 20 Zonas 0,88 0,691 32,22 0,140

Prueba de falta de ajusteBCA � - lattice

Diseño experimentalEstrés hídrico

BCA � - latticePrueba de falta de ajuste

Diseño experimentalRiego normal

Significativo a un nivel de *** α = 0,001, ** α = 0,01 y * α = 0,05, N/D = no determinado

Las zonas seleccionadas en el experimento de estrés hídrico fueron:

• 18 zonas para el diseño experimental de BCA.

• 8 zonas para el diseño experimental de α - lattice.

Las zonas seleccionadas en el experimento de riego normal fueron:

• 10 zonas para el diseño experimental de BCA.

• No existe una zona que cumpla con la totalidad de los requisitos, pero se

seleccionó un número de 12 zonas para el diseño experimental α -lattice, por

presentar la eficiencia relativa de mas alto valor.

132

7.6 Anexo F: Variogramas de las propiedades del suelo bajo los distintos

experimentos

Figura F.1. Variograma y modelo esférico para la variable pH bajo estrés hídrico.

Figura F.2. Variograma y modelo esférico para la variable Conductividad Eléctrica bajo estrés hídrico.

133

Figura F.3. Variograma y modelo esférico para la variable Amonio bajo estrés hídrico.

Figura F.4. Variograma y modelo esférico para la variable Nitrógeno bajo estrés hídrico.

134

Figura F.5. Variograma y modelo esférico para la variable Fósforo bajo estrés hídrico.

Figura F.6. Variograma y modelo esférico para la variable Potasio bajo estrés hídrico.

135

Figura F.7. Variograma y modelo esférico para la variable Sodio bajo estrés hídrico.

Figura F.8. Variograma y modelo esférico para la variable Calcio bajo estrés hídrico.

136

Figura F.9. Variograma y modelo esférico para la variable Magnesio bajo estrés hídrico.

Figura F.10. Variograma y modelo esférico para la variable Conductividad Eléctrica bajo riego normal.

137

Figura F.11. Variograma y modelo esférico para la variable Materia Orgánica bajo riego normal.

Figura F.12. Variograma y modelo esférico para la variable Amonio bajo riego normal.

138

Figura F.13. Variograma y modelo gausiano para la variable Nitrato bajo riego normal.

Figura F.14. Variograma y modelo esférico para la variable Nitrógeno bajo riego normal.

139

Figura F.15. Variograma y modelo esférico para la variable Fósforo bajo riego normal.

Figura F.16. Variograma y modelo esférico para la variable Potasio bajo riego normal.

140

Figura F.17. Variograma y modelo esférico para la variable Sodio bajo riego normal.

Figura F.18. Variograma y modelo esférico para la variable Magnesio bajo riego normal.

modelos espaciales para experimentos de gran tamaño

Documents