modelos espaciales para experimentos de gran tamaño
TRANSCRIPT
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE FACULTAD DE AGRONOMIA E INGENIERIA FORESTAL
DIRECCION DE INVESTIGACION Y POSTGRADO PROGRAMA DE POSTGRADO EN CIENCIAS DE LA AGRICULTURA
MAGISTER EN CIENCIAS VEGETALES TESIS DE GRADO
USO DE MODELOS ESPACIALES PARA EL ANALISIS ESTADISTICO DE EXPERIMENTOS AGRONOMICOS DE GRAN
TAMAÑO
GIOVANNI VERGES SAN MARTIN
SANTIAGO-CHILE 2004
USO DE MODELOS ESPACIALES PARA EL ANALISIS ESTADISTICO DE EXPERIMENTOS AGRONOMICOS DE GRAN TAMAÑO
Tesis presentada como requisito para optar al grado de
Magíster en Ciencias Vegetales
por:
Giovanni Vergés San Martín
Comité de Tesis Profesor Guía: Rodrigo Ortega, Ing. Agr., M. Sc., Ph. D.
Profesores Informantes: Hugo Campos, Ing. Agr., Ph. D.
Marcelo Kogan, Ing. Agr., M. Sc., Ph. D.
2004 Santiago-Chile
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE FACULTAD DE AGRONOMIA E INGENIERIA FORESTAL
DIRECCION DE INVESTIGACION Y POSTGRADO PROGRAMA DE POSTGRADO EN CIENCIAS DE LA AGRICULTURA
MAGISTER EN CIENCIAS VEGETALES
AGRADECIMIENTOS A Semillas Pioneer Chile Limitada por el financiamiento que hizo posible la presente
investigación, así como al Sr. Miguel Ibáñez, ingeniero agrónomo, por la conducción de
los experimentos de campo.
Al Laboratorio de Servicios de la Pontificia Universidad Católica de Chile, en especial al
Sr. Ricardo Valdés y al Sr. Manuel Araya por su ayuda en el análisis químico de las
muestras de suelo.
Al Centro de Agricultura de Precisión de la Universidad Católica (CAPUC), en especial
a Andrés Esser por su ayuda y el facilitarme los software necesarios para el desarrollo
de esta tesis.
A mi profesor guía el Dr. Rodrigo Ortega por su amistad e inspirar y darme la confianza
de realizar esta tesis.
A mi profesor informante el Dr. Hugo Campos, por los acertados comentarios,
sugerencias y revisiones que proporcionó durante el transcurso de esta tesis .
A mi tío el Sr. Carlos Vergés por financiar y hacer posible la realización de mi
postgrado.
Y por último pero no menos importante al Dr. Patricio Parodi, por todo su infinita
preocupación que me brindó extra académicamente durante mi vida universitaria, como
también su incondicional amistad que lo ha llevado a que lo estime como alguien de mi
propia familia.
“…Un viaje de ilusiones y anhelos comencé a través de un difícil sendero me llevó
cansado y desalentado caminé mas al final del recorrido una luz resplandeció
un manantial de esperanza y energía fue de voluntad mi corazón se llenó
un sueño inalcanzable conquisté y una nueva vida comenzó…”
A mis padres
1
INDICE
RESUMEN.......................................................................................................................4
ABSTRACT......................................................................................................................5
1. INTRODUCCIÓN.........................................................................................................6
2. ANTECEDENTES GENERALES.................................................................................9
2.1 Variabilidad Espacial....................................................................................8
2.1.1 Formación de los suelos...............................................................9
2.1.1.1 Material de origen............................................................11
2.1.1.2 Relieve.............................................................................11
2.1.1.3 Clima................................................................................11
2.1.1.3.1 Temperatura......................................................12
2.1.1.3.2 Precipitación......................................................12
2.1.1.3.3 Viento................................................................12
2.1.1.4 Organismos.....................................................................13
2.1.1.5 Tiempo.............................................................................13
2.1.2 Factores antrópicos.....................................................................13
2.2 Diseño experimental...................................................................................15
2.2.1 Prueba de hipótesis.....................................................................15
2.2.2 Diseño experimental……….. ......................................................18
2.2.2.1 Error experimental...........................................................19
2.2.2.2 Repeticiones....................................................................20
2.2.2.3 Aleatorización..................................................................22
2.2.2.4 Diseños............................................................................22
2
2.2.3 Análisis de varianza……………...…….……………………………27
2.2.3.1 Prueba de F.....................................................................29
2.2.3.2 Supuestos del análisis de varianza…..............................31
2.3 Geoestadística............................................................................................32
2.3.1 Teoría de la variable aleatoria.....................................................33
2.3.1.1 Características de una función aleatoria.........................34
2.3.2 Análisis de dependencia espacial..............................................36
2.3.2.1 Autocorrelación................................................................37
2.3.2.2 Variograma......................................................................37
2.3.3 Interpolaciones.............................................................................40
2.3.4 Validación cruzada.......................................................................41
2.3.5 Geoestadística aplicada al diseño experimental......................42
2.4 Análisis estadístico espacial……..............................................................44
2.4.1 Variabilidad espacial y error experimental................................44
2.4.2 Violación de supuestos del análisis de varianza......................46
2.4.3 Remoción de la variabilidad espacial........................................48
2.4.3.1 Método de Papadakis......................................................50
2.4.3.2 Análisis de tendencia.......................................................51
2.4.3.3 Errores correlacionados...................................................53
2.4.3.4 Análisis de tendencia más Error correlacionado……......54
2.4.3.5 Estimación geoestadística...............................................55
3
3. MATERIALES Y MÉTODOS.....................................................................................57
3.1 Material experimental.................................................................................57
3.2 Caracterización y mapeo del sitio experimental......................................57
3.3 Análisis estadístico....................................................................................59
3.4 Análisis estadístico utilizando modelos espaciales...............................61
3.5 Análisis geoestadístico..............................................................................63
3.6 Análisis estadístico utilizando diseños experimentales asociados a
zonas…..............................................................................................................64
4. DISCUSION DE RESULTADOS................................................................................67
5. CONSIDERACIONES FINALES................................................................................99
6. BIBLIOGRAFÍA.......................................................................................................105
7. ANEXOS..................................................................................................................115
4
RESUMEN
Vergés, G. 2004. Uso de modelos espaciales para el análisis estadístico de
experimentos agronómicos de gran tamaño. Tesis, Magíster en Ciencias Vegetales,
Facultad de Agronomía e Ingeniería Forestal, Pontificia Universidad Católica de Chile.
Santiago, Chile. 141 pp.
En experimentos de gran tamaño, la variación en las propiedades del suelo puede
resultar en un efecto sobre el rendimiento, debido a una correlación positiva o negativa
entre estas y el rendimiento. Esta heterogeneidad puede incrementar el error
experimental produciendo una estimación insuficiente de los tratamientos. La precisión
de la estimación puede mejorarse empleando análisis estadísticos en los cuales la
variabilidad espacial puede ser removida para la estimación de los efectos de los
tratamientos. Algunos de estos análisis espaciales son el método de Papadakis,
análisis de tendencia y análisis basados en modelos con errores correlacionados, en
los cuales la variación espacial es medida por medio de la correlación entre
rendimientos de parcelas vecinas. Esta tesis presenta los resultados del uso de zonas
geográficas como modelo espacial para controlar la variabilidad espacial y mejorar la
interpretación del análisis de varianza. Se obtuvieron los datos de rendimiento de 360
híbridos de maíz bajo los tratamientos de estrés hídrico y riego normal en un diseño de
α - lattice. Basado en la teoría de la variable regionalizada y el uso del análisis de
agrupamiento, se construyeron zonas geográficas homogéneas, sobre las cuales se
sobrepusieron los rendimientos y se realizó el análisis de varianza de los híbridos
pertenecientes a cada zona. La eficiencia relativa fue utilizada para comparar las zonas
con los modelos espaciales y con los diseños experimentales α - lattice y bloques
completos al azar. Los resultados indican que frente a un alto coeficiente de variación
de los datos de rendimiento, el uso de zonas es mejor que los diseños experimentales
y los modelos espaciales. Sin embargo, frente a un bajo coeficiente de variación, la
utilización de diseño experimental adecuado es suficiente para controlar la variabilidad
espacial. No obstante, el uso de zonas asegura la independencia de los errores,
supuesto necesario del análisis de varianza para que los resultados sean válidos, el
cual no se cumple con el uso de diseños experimentales.
Palabras claves: zonas homogéneas, autocorrelación, dependencia espacial,
modelos espaciales
5
ABSTRACT
Vergés, G. 2004. Use spatial models in the statistic analysis of large field trials.
Tesis, Magíster en Ciencias Vegetales, Facultad de Agronomía e Ingeniería Forestal,
Pontificia Universidad Católica de Chile. Santiago, Chile. 141 pp.
In large yield trials, grain yield and other variables can be affected by variations in soil,
due to a positive or negative correlation between the variables under study and soil
properties. This heterogeneity increases experimental error, therefore decreases the
power to estimate treatments means. Precision can be improved using statistical
analyses that take into account spatial variability in the estimation of means. There are
several spatial models, such as trend analysis, Papadakis method, and models that
account for spatial variation through a correlation analysis between yields of adjacent
plots. This thesis implemented geographical zonification as a spatial model to account
for soil spatial heterogeneity and to improve the output from analyses of variance.
Three hundreds and sixty hybrids were field tested under water stress and normal
irrigation conditions using an α - lattice experimental design. Homogeneous zones were
constructed using the theory of regionalized variables and cluster analysis, and
analyses of variance were conducted on hybrid grain yield belonging to each zone.
Relative efficiency was used to compare zones with experimental design α - lattice,
random complete blocks and spatial models. Data suggests that zonification
outperformed the use of experimental design and spatial models when high coefficients
of variation are observed. On the other hand, when low coefficients of variation are
observed, the use of appropriate experimental design is enough to control the spatial
variability. The use of zonification ensures independency of errors, one of the
assumptions analyses of variance rely upon.
Key words: management zones, autocorrelation, spatial dependency, spatial
models.
6
1. INTRODUCCION
La variación espacial es producida por la combinación de distintos factores como el
material generador, relieve, clima, organismos y tiempo (Jenny, 1941), a lo que se
debe sumar la acción antrópica (Belobrov 1976; Jenny, 1941; Ortega y Flores, 1999).
Esto trae como consecuencia que la heterogeneidad del suelo varíe de localidad en
localidad, siendo específica a cada superficie ó, como es llamada, sitio específico.
Esta variación no es aleatoria, en otras palabras, no presenta cambios abruptos a lo
largo del campo, más bien es función de la distancia, valores cercanos tienden a ser
más parecidos de los más lejanos (Steel y Torrie, 1960).
Esta correlación espacial ó autocorrelación esta presente en todos los suelos, por lo
que al presentarse valores cercanos semejantes, estos presentan una varianza menor.
Variables que se comportan de esa manera se conocen como variables espacialmente
dependientes ó autocorrelacionadas.
La variabilidad espacial afecta los rendimientos de los cultivos, la cual a sido
reconocida por los agricultores (Gotway et al. 1997), ya que uno de los factores que
más afectan al rendimiento son las propiedades físico − químicas del suelo (Trangmar
et al., 1987; Camberdella et al., 1994; Ortega et al., 1999). Esta heterogeneidad
sistemática sigue un modelo o estructura espacial y los rendimientos tienden a seguir
el modelo de las variables del suelo que más lo afectan.
Pero no sólo el cultivo de una especie se ve afectada por la variabilidad espacial, los
experimentos de campo también son afectados, ya que al ensayar un tratamiento
sobre los cultivos, generalmente la variable medida es la del rendimiento.
Fisher (1925), al introducir el análisis de varianza para la cuantificación de la diferencia
en los tratamientos, implementó la aleatorización, la que no sólo evita el sesgo del
análisis, sino también produce la independencia de las muestras, supuesto necesario
para la validación del análisis. Este mismo autor, al reconocer la existencia de la
variabilidad espacial, incorporó el sistema de bloqueo con el fin de controlar la
heterogeneidad del suelo, maximizando la variabilidad entre bloques y minimizándola
dentro del bloque, ya que se asume que la desigualdad espacial dentro del bloque es
homogénea.
El inconveniente de la variación espacial, es que la incorporación de los bloques
homogéneos no es suficiente para controlar la variabilidad dentro del bloque (Bhatti et
7
al., 1991), lo que produce que los supuestos del análisis de varianza, como es el caso
de la independencia de los errores, fallen y aumente el error experimental, por lo que el
análisis estadístico no sería completamente válido.
Frente a este problema los estadísticos, ingenieros agrónomos y científicos del suelo,
en el transcurso de la historia, han tratado de sobrellevar este problema. Smith (1938),
propuso una ley empírica de la heterogeneidad de la fertilidad del suelo y como se
correlaciona con el rendimiento, estableciendo una relación inversa entre el tamaño de
la parcela y la varianza del rendimiento.
Para superar el problema de variación espacial y su consecuente autocorrelación
espacial, el ingeniero agrónomo griego Jean Papadakis (1937), propuso el uso de los
residuales de las parcelas vecinas como covariante para proveer un acercamiento
estadístico al uso de las parcelas controles, convirtiéndose en el trabajo de base para
el desarrollo de otros métodos estadísticos que utilizan las parcelas vecinas para
ajustar los rendimientos, conocidos actualmente como análisis del vecino más cercano.
También se han desarrollado otros métodos alternativos que incluyen la variación
sistemática, como el análisis de tendencia propuesto por Kirk et al. (1980), en el que se
describe la heterogeneidad espacial por medio de una función polinomial y la
aproximación de campo variable introducido por Zimmerman y Harville (1991), en la
que se ajusta la variación local, dividida en gran escala y pequeña escala, por medio
de la modelación de la pequeña escala a través de la estructura espacial de los
residuales.
El desarrollo de la geoestadística propuesta por Matheron (1962), para solucionar el
problema de la estimación minera, ha impulsado el uso de las herramientas como el
variograma y la interpolación al estudio agrícola. Este nuevo enfoque sumado al
desarrollo de los sistemas de posicionamiento global (GPS), ha desplegado nuevos
métodos para el estudio de la variación espacial, como es el caso de la estructuración
de las propiedades físico − químicas del suelo y la estimación de sus valores en
sectores que no se ha hecho un muestreo. Los diseños experimentales también se han
visto favorecidos por este nuevo enfoque, como el propuesto por van Es et al. (1989)
en la que utiliza la teoría de la variable aleatoria para la configuración espacial de un
diseño experimental y el propuesto por Fagroud y Van Meirvenne (2002), el que por
medio del uso de variogramas determinan el tamaño, forma, número de parcelas por
bloque y la orientación de los bloques. En cuanto a la remoción de la variabilidad
8
espacial para validar el análisis de varianza, Hernández y Mulla (2002), proponen la
incorporación de kriging al análisis del vecino más cercano para mejorar la
interpretación de los datos.
Estos son ejemplos del creciente interés de los científicos por enfrentar y solucionar el
inconveniente de la falta de ajuste de los tratamientos, en experimentos de campo, por
el efecto de la variabilidad espacial.
El objetivo principal de esta tesis es proponer la incorporación de las zonas geográficas
homogéneas como factor de control de la variabilidad espacial para mejorar la
interpretación del análisis de varianza, demostrando como objetivos secundarios, la
violación de supuestos del análisis de varianza, la variabilidad sitio específica de las
muestras de suelo, la correlación que existe entre las propiedades químicas del suelo y
el rendimiento, la utilidad de las herramientas geoestadísticas y, el beneficio y
conveniencia que presentan los métodos estadísticos no tradicionales para la remoción
de la variabilidad espacial, para la validación del análisis de varianza.
9
2. ANTECEDENTES GENERALES
2.1 VARIABILIDAD ESPACIAL
La variabilidad espacial de las propiedades del suelo ha sido reconocida desde los
inicios de la agricultura (Gotway et al., 1997; Wilding y Smeck, 1983), y una forma de
medir variabilidad es por medio de la desviación estándar, la que se calcula como la
raíz de la suma de las desviaciones al cuadrado dividido por sus grados de libertad
(Mendenhall y Ott, 1980), esto corresponde a la medición de la disparidad de las
observaciones medidas de una propiedad en el espacio.
La alta o baja variación espacial que presentan los suelos es atribuida a los factores de
su formación como también al manejo agronómico de los mismos (Belobrov 1976;
Jenny, 1941; Ortega y Flores, 1999).
2.1.1 Formación de los suelos
El suelo corresponde a un sistema de tres fases. La fase sólida se forma por el material
mineral y material orgánico, la fase gaseosa por la atmósfera del suelo, mientras que la
fase líquida se constituye por las soluciones del suelo. La proporción de agua y de aire
está sujeta a grandes fluctuaciones dentro de un mismo suelo por influencia del clima y
del manejo (Honorato, 1993). La porción de los constituyentes sólidos es igualmente
variable, el material orgánico esta formado por diversas fuentes orgánicas que se
encuentran en distintos grados de descomposición, y el material mineral corresponde a
una mezcla de varios componentes, con características y propiedades diversas.
Estos componentes se encuentran íntimamente interrelacionados (Hardy, 1970;
Honorato 1993) y provienen de un proceso dinámico y formativo del suelo
caracterizado por tres procesos distintos (Cobertera, 1993):
1. Un proceso de descomposición y de alteración del material originario, es decir la
roca madre, con la formación de un complejo de alteración que incluye procesos de
neoformación de minerales secundarios a partir de los primarios del material original.
2. Un proceso cíclico de formación y mineralización de humus a partir de restos
vegetales depositados sobre el suelo, alcanzando un equilibrio entre los depósitos
10
orgánicos, la humificación de los mismos, su mineralización y su retorno a formas
orgánicas a través de las plantas.
3. Un proceso de transporte de la materia soluble y coloidal del suelo a través de su
propio perfil, con la consiguiente formación de horizontes de lavado y acumulación
(eluviación e iluviación).
La superficie del planeta no es uniforme y varia en distintas regiones naturales. Cada
una de esas regiones, se distinguen unas de otras por las diferentes características
que presentan (De Oliveira, 1975), como:
a. Topografía
b. Cobertura vegetal
c. Suelo
d. Régimen climático
e. Altitud
f. Edad de las superficies
De esta manera, Jenny (1941), retomando conceptos inicialmente enunciados por
Dokuchaeiv en 1883, establece la siguiente fórmula:
[2.1] ( )toclrmgS ,,,,=
donde: S = Suelo
mg = material generador
r = relieve
cl = clima
o = organismos
t = tiempo
En consecuencia, el suelo es función de estos factores y su combinación genera los
diversos tipos de suelos (De Oliveira, 1975; Honorato 1993).
11
2.1.1.1 Material de origen
El material de origen no es necesariamente una roca consolidada, en especial en
zonas tropicales, De Oliveira (1975) señala cuatro principales grupos de material
original:
1. Rocas y sedimentos consolidados in situ: Afloraciones rocosas y los sedimentos no
consolidados, recientes, como rocas cristalinas y aluviales.
2. Productos de alteración de rocas in situ: Espesas capas formadas en zonas
tropicales húmedas, bajo cobertura vegetal protectora.
3. Productos de a alteración remanejados: Corresponden a evidencias debido a líneas
de piedras (stone-lines) o restos de protección laterítica. Las causa principales de la
alteración son la erosión, flora y fauna.
4. Productos de la pedogénesis anterior: Son el resultado del remanente y transporte
de capas alteradas en profundidad, provenientes sobre todo de materias superficiales
que ya tuvieron una alteración pedogénica. Esos materiales pudieron haber sido
transportado por erosión o remanejados in situ, bajo la influencia de la flora y fauna.
2.1.1.2 Relieve
Se refiera a la forma del terreno que compone un paisaje. Su acción se refleja
principalmente sobre la dinámica del agua, en el sentido vertical (infiltración) y
horizontal (run-off), así como indirectamente sobre la temperatura y radiación.
D’Hoore (1970), reconoce tres zonas del paisaje, que pueden adquirir grandes
individualidades: zonas de exportación, zonas de pasada y zonas de acumulación. Las
pendientes tienen una gran importancia en la formación del suelo, pero también en el
movimiento del agua sobre la superficie y en la infiltración al interior del suelo.
2.1.1.3 Clima
Corresponde a un conjunto de fenómenos metereológicos (temperatura,
precipitaciones, viento, entre otros), que caracterizan una localidad.
12
Los elementos del clima que poseen una mayor incidencia sobre la formación del suelo
son:
• Temperatura
• Precipitaciones
• Vientos
2.1.1.3.1 Temperatura
Este factor afecta principalmente las reacciones bioquímicas de la pedogénesis,
caracterizado en la proporción:
[2.2] aTemperatur
reaccióndeVelocidad
Los organismos poseen una temperatura óptima de funcionalidad, y en zonas
tropicales húmedas que poseen una cobertura vegetal que amortiza los efectos de la
temperatura, esta alcanza su máxima expresión.
2.1.1.3.2 Precipitación
Las aguas que llegan al suelo tienen dos papeles importantes:
a. Integran la mayoría de los constituyentes neos formados al suelo: materia
orgánica, óxidos hidratados, entre otros, transportados por drenaje y/o
percolación.
b. Mantienen el equilibrio de la temperatura en el perfil del suelo.
2.1.1.3.3 Viento
El viento tiene acción sobre el balance hídrico del suelo, al remover la capa superficial
húmeda permitiendo la capilaridad y el desecamiento de las capas superficiales del
suelo.
13
También posee una acción mecánica al contribuir a procesos de erosión, removiendo
cobertura vegetal y capas superficiales.
2.1.1.4 Organismos
Los organismos lo conforman la microflora, microfauna, macroflora, macrofauna y el
hombre, que en el transcurso de su vida actúan como agentes pedogénicos.
La flora actúa como protectora del suelo, reguladora de temperatura, incidencia de las
precipitaciones, entre otros, como también, fuente de materia orgánica.
La fauna ayuda en las reacciones bioquímicas, aportan materia orgánica, ayudan a la
subdivisión de las materias, mejoran la estructura, exportación de compuestos de
ciertos perfiles, entre otros.
2.1.1.5 Tiempo
Es uno de los factores pasivos de la pedogénesis, ya que no adiciona ni exporta
material, como tampoco aporta energía, pero el sistema formativo del suelo no es
estático, varía con el tiempo. Por lo tanto, para que se logre una adecuada evolución
del suelo, se necesita de un tiempo para lograr una diferenciación de sus horizontes.
Si nos situamos en un tiempo t, encontraremos un perfil de suelo distinto a un tiempo t
+1, lo que nos muestra la dinámica que ocurre en la interacción de los distintos factores
de formación del perfil.
La interacción de los distintos factores genera una gran variabilidad de suelos y de sus
propiedades, esta variabilidad se ve aumentada por el manejo agronómico que se
efectúa en dicho suelo.
2.1.2 Factores antrópicos
El hombre mediante distintos manejos agrícolas, proporciona las mejores condiciones
a la planta para un buen crecimiento y desarrollo, lo que provoca un cambio en el
ambiente natural donde se desarrolla el cultivo.
Diversos autores concuerdan con esta acción antrópica, Gaucher (1971) indica que la
influencia del hombre al intervenir el ritmo de erosión ejerce una influencia indirecta
14
sobre los procesos de descomposición de las materias minerales. Ortega y Flores
(1999), también reconocen la influencia antrópica al elegir la forma y tamaño de los
potreros, la intensidad del pastoreo, la aplicación de materiales orgánicos, entre otros.
Según Gil (2001) al construir la cama de raíces con un subsolador, se rompe la
estructura original del suelo, si pensamos que la estructura domina las propiedades
físicas del suelo, y por lo tanto su funcionalidad, con esta acción se estará cambiando
la funcionalidad del suelo. El mismo autor afirma que la porosidad es la variable más
fácil, frecuente y ampliamente alterada por las operaciones de labranza o manejo sin
laboreo. En el mismo sentido Gaucher (1971), afirma que es un hecho que en los
suelos compactados por el laboreo, del hombre o del ganado, la cohesión es mas
fuerte y la estabilidad estructural más grande, las partículas han sido acercadas unas a
otras artificialmente, la porosidad por el contrario es más débil y la humectación de los
agregados más lenta, lo que demuestra que la porosidad es una resultante que
depende de la textura, estructura y también de la actividad biológica, ya que esta
última, genera un gran número de canículos finos.
Según Jorge (1975), la materia orgánica es una fuente de nutrientes para las plantas.
Durante el proceso de descomposición varios elementos son liberados, principalmente
nitrógeno, con lo cual se mejoraría la fertilidad natural.
Con respecto a la fertilidad, Cobertera (1993) estima que en los suelos cultivados se
producen unos procesos biológicos distintos de los constatados en los mismos suelos
cuando éstos evolucionan sin la intervención antrópica. Esta intervención produce, en
términos generales, un aumento de la tasa de mineralización de la materia orgánica,
con lo cual se produce un aumento de las concentraciones de elementos nutritivos
asimilables en el suelo, aumentando la fertilidad del mismo. Sin embargo, esta
“mineralización forzada” provoca a mediano plazo, un empobrecimiento del humus con
la consiguiente pérdida del coloide orgánico, lo que determina una menor capacidad de
intercambio catiónico, y por lo tanto, una menor concentración de elementos nutricios
asimilables. Por el contrario, la mineralización excesiva puede provocar un
empeoramiento de las condiciones físicas, tanto de la estructura como de la textura, al
ser menor el número de partículas coloidales en el suelo.
El pH también puede variar por acción antrópica. Según Gaucher (1971), los trabajos
de cultivo se oponen al lavado del perfil, y por lo tanto conducen a la acidificación,
llevando periódicamente a la superficie los horizontes más profundos; los aportes de
15
estiércol sin encalado conducen progresivamente a una acidificación del suelo y
también al favorecer la permeabilidad se favorece el lavado eliminando las bases y
disminuyendo el pH.
2.2 DISEÑO EXPERIMENTAL
En el desarrollo de las ciencias en general y, en particular, el de las ciencias biológicas,
el conocimiento de la metodología estadística es una herramienta imprescindible para
la obtención, análisis e interpretación de todos los datos que proceden de las
observaciones sistemáticas o de experimentaciones proyectadas específicamente para
conocer los efectos de uno o varios factores que intervienen en los fenómenos bajo
estudio (Cochran y Cox, 1950).
La ciencia de la estadística es una rama de las matemáticas aplicadas, y corresponde
a las matemáticas aplicadas a los datos que pueden ser objeto de observación, por lo
que la estadística puede ser considerada como el estudio de las poblaciones, de la
variación y los métodos para sintetizar los datos (Fisher, 1925). Ella tiene como
objetivo extraer inferencias acerca de una población de interés basado en la
información contenida en una muestra (Mendenhall y Ott, 1980).
2.2.1 Prueba de hipótesis
Cuando una variable aparentemente tiene un efecto, es muy importante establecer con
cierta confianza que el efecto es realmente debido a dicha variable y no al azar. Para
esto, una herramienta del análisis estadístico es la prueba de hipótesis, o
alternativamente, la prueba de significancia (Snedecor y Cochran, 1980), la cual
permite conocer el efecto de la variable medida.
La hipótesis acerca de un parámetro de la población es llamada hipótesis nula, a la
cual se le asigna el símbolo H0 (Wonnacott y Wonnacott, 1972). En estadística el
término nulo es utilizado para indicar la hipótesis que se comienza por probar.
Típicamente se prueba que no existe diferencia, por eso el término nulo o sin diferencia
y se puede representar por el siguiente modelo:
H0: µ1 = µ2 ó
16
H0: µ1 - µ2 = 0
donde, H0 corresponde a la hipótesis nula, µ1 es la media del tratamiento 1 y µ2 es la
media del tratamiento 2.
Al no encontrarse evidencia suficiente para avalar esta hipótesis, se rechaza la
hipótesis nula y por consiguiente se acepta la hipótesis que existe diferencia entre la
media de los datos. Esta es llamada hipótesis alternativa, a la cual se le signa el
símbolo Ha y se puede representada por el modelo:
Ha: µ1 ≠ µ2 ó
Ha: µ1 - µ2 < ó > 0
donde, Ha es la hipótesis alternativa, µ1 es la media del tratamiento 1, µ2 es la media del
tratamiento 2.
En la decisión de aceptar o rechazar la hipótesis nula en favor de la hipótesis
alternativa existen errores asociados (Wonnacott y Wonnacott, 1972):
• Rechazar la hipótesis nula cuando esta es verdadera o error tipo I.
• Aceptar la hipótesis nula cuando esta es falsa o error tipo II.
Cuadro 2.1. Tipos de error.
Decisión estadística Verdadera Falsa
ErrorAceptar Correcto tipo II
p = �
ErrorRechazar tipo I Correcto
p = �
Hipótesis nula
La probabilidad de cometer el error tipo I, depende del valor exacto del parámetro p, al
cual se le asigna el símbolo α, este valor restringe el rango cubierto por H0. La
probabilidad de cometer un error tipo II se le asigna el símbolo β y es conocido como
17
poder de la hipótesis alternativa (Steel y Torrie, 1960). Estas probabilidades son
llamadas niveles de significancia o valor de p (Mendenhall y Ott, 1980).
Figura 2.4. Prueba de hipótesis con α igual a 5%.
La Figura 2.4 muestra una prueba de hipótesis donde el caso:
a) Si H0 es verdadera entonces α = probabilidad de rechazar la hipótesis H0
cuando es verdadera, error tipo I.
b) Si H0 es falsa (Ha verdadera) entonces β = probabilidad de aceptar la hipótesis
H0 cuando es falsa, error tipo II.
Un error tipo II es considerado como la pérdida de oportunidad de rechazo de la
hipótesis nula cuando la hipótesis alternativa es verdadera (Bhattacharyya y Johnson,
1977):
β = P [error tipo II] = P [falla de rechazar H0 cuando Ha es verdadera]
Idealmente se desea que α y β sean cero, sin embargo esto no es posible, por lo que
alternativamente se pretende que α y β sean lo más pequeñas posibles. Existe una
relación inversa entre estas dos probabilidades, tal como se muestra en la Figura 2.5
donde a =α y b =β, mientras α aumenta β disminuye (Mendenhall y Ott, 1980).
18
Figura 2.5. Relación inversa entre α y β.
El cálculo de α es simple, según la fórmula (Wonnacott y Wonnacott, 1972):
[2.3]
−
≥=
n
xzP
σ
µα 0
Donde z es la variable aleatoria distribuida normalmente, x es la media de la muestra,
µ0 es la media poblacional de la hipótesis nula, σ es la desviación estándar de la
población y n es el número de observaciones. Las pruebas de hipótesis generalmente
utilizan niveles de significancia de α igual a 0,1, 0,05 ó 0,01 para rechazar o aceptar la
hipótesis nula, por lo cual no se necesita calcular β.
2.2.2 Diseño experimental
La experimentación de campo es conducida para probar hipótesis o para determinar
las respuestas relativas a la aplicación de distintos tratamientos (Mulla et al., 1990), de
la manera más económica posible (Mendenhall y Ott, 1980). Esta verificación exige la
recolección de observaciones y el diseño del experimento corresponde esencialmente
al establecimiento del marco dentro del cual se colectarán las observaciones, por lo
que la consideración del diseño de un experimento al proveer evidencia para una
hipótesis, necesita considerable cuidado para así poder verificar o no la hipótesis
(Kempthorne, 1952).
Un diseño experimental involucra numerosos aspectos, siendo los principales
(Bhattacharyya y Johnson, 1977; Cochran y Cox, 1950):
19
• Seleccionar los factores a ser estudiados en un experimento y los niveles de
cada factor que son relevantes en la investigación. Esto determina el
tratamiento a utilizar.
• Considerar el alcance de la inferencia y elegir el tipo de unidad experimental
sobre los cuales serán aplicados los tratamientos.
• Desde la perspectiva de los costos y el deseo de la precisión de la inferencia,
decidir cuantas unidades serán incluidas en el experimento.
• Determinar la manera en cual tratamiento será aplicado la unidad experimental.
• Refinar la técnica a utilizar, con lo cual se asegura la uniformidad en la
aplicación del tratamiento, se ejerce un control sobre las influencias externas,
se hacen mediciones insesgadas de los efectos del tratamiento y se previenen
grandes errores.
Según Bhattacharyya y Johnson (1977), los distintos tipos de condiciones que son
utilizados sobre las unidades experimentales son llamados factores, los diferentes
modos de presencia de un factor son llamados niveles y la combinación específica de
los niveles de los diferentes factores es llamada tratamientos.
La unidad experimental se define como la unidad del material al cual es aplicado un
tratamiento y cuando el efecto de un tratamiento es medido sobre una unidad se
denomina unidad de muestreo (Steel y Torrie, 1960). En investigación con especies
vegetales, la unidad experimental es usualmente denominada parcela (Parodi y
Nebreda, 1997; Steel y Torrie, 1960).
2.2.2.1 Error experimental
La continua repetición de un experimento usando exactamente el mismo tratamiento
sobre las unidades experimentales resulta en diferentes respuestas; estas diferencias
son impredecibles y son llamadas error experimental (Wonnacott y Wonnacott, 1972).
Por lo tanto, los resultados de los experimentos son afectados no sólo, por la acción de
los tratamientos, sino también por variaciones que tienden a enmascarar los efectos de
los tratamientos. El término error experimental es aplicado a esta variación, sin
embargo el concepto de error no es sinónimo de equivocación, correspondiendo al
20
conjunto de la variación observada en un experimento que no es explicada
adecuadamente por el modelo estadístico en uso.
El error experimental puede provenir de dos tipos de fuentes (Steel y Torrie, 1960):
• La variabilidad inherente al material experimental al cual serán aplicados los
tratamientos.
• La falta de uniformidad en la conducción física del experimento, es decir
deficiencias en la estandarización de la técnica experimental.
En muchas investigaciones de campo, el resultado puede ser ampliamente influido por
el error experimental y sólo los tratamientos con una considerable diferencia pueden
ser detectados (Cochran y Cox, 1950), por lo que es esencial reducir el error
experimental para mejorar una prueba estadística y disminuir el intervalo de confianza
(Steel y Torrie, 1960).
Como consecuencia de la omnipresencia de esta variabilidad, se han utilizado métodos
que aumentan la precisión de los experimentos, los cuales pueden ser clasificados, de
manera general, dentro de tres tipos (Cochran y Cox, 1950):
• Incrementar el tamaño del experimento a través de la incorporación de un
mayor número de repeticiones o adicionando tratamientos.
• Refinando la técnica experimental.
• Selección cuidadosa del material experimental.
2.2.2.2 Repeticiones
Según Gotway et al. (1997), la repetición se refiere a la replicación independiente del
experimento básico y el propósito de la repetición es proveer una estimación del error
experimental, el cual es usado en la prueba de la hipótesis estadística para asegurar
que el efecto del tratamiento es real y no es debido sólo al azar. Es importante
diferenciar las repeticiones de la seudorepetición o submuestra, la que consiste en
múltiples mediciones de una sola repetición.
Cox (1958) indica que dos observaciones de un mismo tratamiento serán consideradas
que provienen de diferentes unidades experimentales sólo sí:
21
• El diseño experimental es tal que, el material experimental forzosamente tiene
que recibir los diferentes tratamientos.
• El material ha sido distribuido independientemente en todos los aspectos en la
cual la variación importante puede ocurrir.
El propósito más importante de la repetición es disminuir el error de las comparaciones
entre tratamientos, ya que la verdadera varianza de cualquier comparación entre la
media de los tratamientos es proporcional a:
[2.4] r
2σ
donde σ2 es la varianza por parcela (o unidad) y r el número de repeticiones. Esta
varianza decrece directamente con incrementos de r, aunque este resultado es válido
si el aumentar la repetición es al menos acompañado de usar material experimental
homogéneo o una cuidadosa técnica (Cochran y Cox, 1950).
Steel y Torrie (1960) entregan una lista de las funciones de la repetición:
• Proveer una estimación del error experimental.
• Mejorar la precisión del experimento, reduciendo la desviación estándar de la
media de tratamientos.
• Aumentar la magnitud de la inferencia del experimento por selección y
apropiado uso de las unidades experimentales.
• Controlar la varianza del error.
• Incrementar el rango de condiciones bajo los cuales los efectos de los
tratamientos son evaluados.
Estos mismos autores agregan que se requiere la estimación del error experimental
para pruebas de significación y para estimar los intervalos de confianza. Kempthorne
(1952) señala que en cualquier experimento es necesario tener al menos dos
repeticiones para obtener una estimación de la varianza del error.
22
2.2.2.3 Aleatorización
La aleatorización se refiere a que cada tratamiento tiene igual oportunidad de ser
asignado a cualquier unidad experimental de manera favorable o infavorable (Steel y
Torrie, 1960) y sólo bajo estas circunstancias el experimentador puede atribuir
cualquier efecto solamente al tratamiento y sus conclusiones serán confiables
(Kempthorne, 1952).
Fisher (1925), fue el primero en introducir la idea de aleatorización, ya que según este
autor, la ordenación sistemática de las parcelas puede tener características comunes
con la variación sistemática de la fertilidad.
Según Steel y Torrie (1960), la función de la aleatorización es:
• Obtener una estimación insesgada del error experimental.
• Obtener una estimación insesgada de la media de los tratamientos.
• Obtener una estimación insesgada de la diferencia entre tratamientos.
Por medio de esto, el tipo de inferencia estadística que puede ser realizada de los
datos, sólo dependa de la naturaleza de los datos (Cochran y Cox, 1950) y según
Snedecor y Cochran (1980), una de las grandes virtudes de la aleatorización es que
protege contra fuentes de sesgo insospechadas.
2.2.2.4 Diseños
En un sentido más restrictivo, el término diseño experimental consiste en un tipo
particular de plan de asignación de sujetos a condiciones experimentales y el análisis
estadístico asociado con ese plan.
El apropiado uso de la palabra experimento corresponde al de una prueba u
observación realizada para confirmar o rechazar algo dudoso o incierto, especialmente
bajo condiciones determinadas por el experimentador, como un acto u operación
tomada para descubrir algún principio desconocido, efecto o ensayo, estableciendo o
ilustrando alguna sugerencia o verdad (Kempthorne, 1952).
23
El objetivo de usar un diseño experimental en investigación científica es controlar parte
de la variabilidad o error experimental, que en forma natural existe en todos los
fenómenos biológicos (Steel y Torrie, 1960).
Uno de los primeros diseños experimentales utilizados fue el diseño sistemático
(Fisher, 1935). Bailey et al. (1995), afirman que el análisis de este tipo de diseño, al
cual llama diseño absurdo, no es válido por el análisis de varianza o los clásicos
métodos de vecindad, fundamentando su posición en los siguientes elementos:
• El análisis de vecindad entrega la misma estimación del efecto de los
tratamientos que el análisis de varianza.
• El análisis de varianza posee una validez cuestionable si las parcelas en
diferentes bloques no están correlacionadas, incluso si no están aleatorizadas.
Figura 2.6. Ejemplos de Diseños sistemáticos.
Como se aprecia en la Figura 2.6 A, B y C son los tratamientos, los cuales están
dispuestos sistemáticamente dentro de un bloque y las repeticiones no tienen
aleatorización (Bailey et al., 1995).
En los diseños con aleatorización, las unidades experimentales son aleatoriamente
asignadas a los tratamientos, con esto se puede estimar en forma válida la variabilidad
natural existente en las unidades de experimentación (Cochran y Cox, 1950).
Dentro de este diseño existen grupos con subdivisiones entre los cuales podemos
nombrar (Kempthorne, 1952; Steel y Torrie, 1960; Cochran y Cox, 1950; Patterson et
al., 1978):
a. Área experimental no subdividida con anterioridad a la aleatorización.
Por ejemplo:
• Diseño Completamente al Azar.
A B C
A B C
A B C
A A A
B B B
C C C
24
b. Área experimental subdividida con anterioridad a la aleatorización.
b.1. Bloques Completos
Por ejemplo:
• Diseño de Bloques Completos al Azar.
• Cuadrado Latino.
• Cuadrado Greco-latino.
b.2. Bloques Incompletos.
Por ejemplo:
• Diseños de Bloques Incompletos Balanceados.
• Diseños de Bloques Incompletos Parcialmente Balanceados.
• Lattices.
• α - lattice.
c. Experimentos Factoriales.
Por ejemplo:
• Diseño Factorial Completamente al Azar.
• Diseño Factorial en Bloques al Azar.
• Diseño Jerarquía en Completamente al Azar.
• Diseño de Parcelas Divididas.
• Diseño de Bloques Divididos.
d. Experimentos con Análisis de Covarianza.
Por ejemplo:
• Diseño Completamente al Azar con Covarianza.
• Diseño de Bloques al Azar con Covarianza.
• Diseño de Cuadrado Latino con Covarianza.
En el diseño de bloques completos al azar (BCA), el material experimental es dividido
dentro de grupos, el número de grupos debe ser igual al número de tratamientos o
algún múltiplo de este, a cada grupo se le llama bloque y corresponde a una repetición,
el material experimental esta distribuido aleatoriamente dentro del grupo (Steel y
Torrie, 1960).
25
Figura 2.7. Diseño de bloques completos al azar.
Donde A, B, C, D y E son los tratamientos dispuestos aleatoriamente dentro del bloque
con cuatro repeticiones.
Este diseño es apropiado para mantener el error experimental dentro del grupo lo más
pequeño posible (Cochran y Cox, 1950) y la fuente de variación es solamente atribuida
al efecto del tratamiento (Steel y Torrie, 1960).
El análisis de este diseño está representado por el siguiente modelo (Bhattacharyya y
Johnson, 1977):
[2.5] ijjiijy εβτµ +++=
donde ijy es el valor de la unidad experimental bajo el tratamiento i en el bloque j, µ
representa la media poblacional, τi es el efecto del tratamiento i, βj es el efecto del
bloque j y εij representa la desviación aleatoria de la unidad experimental j sometida al
tratamiento i.
Según Cochran y Cox (1950), las principales ventajas y desventajas de este diseño
son:
Ventajas:
• La eliminación de la suma de cuadrados de bloque desde la suma de
cuadrados del error resulta en un decrecimiento del cuadrado medio del error,
lo que aumenta la precisión del diseño comparado con el completamente al
azar.
• Cualquier número de tratamientos y cualquier número de replicaciones pueden
ser incluidos, por lo que le da más flexibilidad al diseño.
• Algunos tratamientos o grupos con problemas pueden ser eliminados y
proceder con el análisis sin introducir ninguna complicación.
Bloque 1 A D E C BBloque 2 B C A E DBloque 3 D A B E CBloque 4 E B D A C
26
Desventajas:
• La principal objeción de este diseño es que no es adecuado para un gran
número de tratamientos.
• No es adecuado para los casos en que cada bloque contenga una considerable
variabilidad, ya que produce un término del error muy alto.
El diseño de lattice fue introducido por Yates (1936), específicamente para evaluar
cultivares. Este diseño ha demostrado ser eficiente, fácil de construir y de analizar
(Cochran y Cox, 1950). Sin embargo, esta disponible sólo para un limitado número de
pruebas (Patterson et al., 1978; Bowman, 1990). De esta manera, un lattice simple o
cuadrático requieren que el número de tratamientos v, sea el cuadrado del número de
bloques s en cada replicación, el tamaño del bloque k es igual a s, estas condiciones
imposibilitan para v en cuádruplo o lattices de mayor orden (Patterson y Williams,
1976).
David (1967), en la construcción de diseños cíclicos es capaz de producir un gran
número de diseños con solución, pero con una nueva restricción, k debe ser igual al
número de repeticiones r o múltiplo de este.
Patterson y Williams (1976), introducen un nuevo diseño viable de bloques incompletos
para un gran número de tratamientos combinando los diseños cíclicos con los lattices
al que llaman diseño α ó α - lattice, el cual no tiene restricciones en el tamaño del
bloque, aún cuando inevitablemente k debe ser factor de v.
Para la construcción de este diseño se tiene que cumplir:
[2.6] skv ×=
donde v es el número de variedades, k es el tamaño del bloque y s es el número de
bloques por repetición.
El análisis de este diseño según Patterson et al. (1978) es complejo, pero para efectos
prácticos puede ser analizado como lattice rectangular, el cual esta dado por el
siguiente modelo:
[2.7] ijkkjiijk ry εβτµ ++++=
27
donde ijy es el valor de la unidad experimental bajo el tratamiento i en el bloque j en la
repetición k, µ representa la media poblacional, τi es el efecto del tratamiento i, βj es el
efecto del bloque j, rk es la repetición k y εij representa la desviación aleatoria de la
unidad experimental sometida al tratamiento i en el bloque j en la repetición k.
Ventajas
• Puede ser utilizado con un gran número de tratamientos, en donde otros
diseños no pueden ser utilizados.
Desventajas
• Tiene la restricción de skv ×=
2.2.3 Análisis de varianza
El método clásico para el análisis estadístico de los experimentos de campo es el
análisis de varianza (ANDEVA ó ANOVA, por sus siglas en inglés) (Mulla et al., 1990).
El análisis de varianza, o más apropiadamente el análisis de la variación alrededor de
la media (Bhattacharyya y Johnson, 1977), consiste en un proceso aritmético en que la
partición de la variación total presente en los datos es dividida en sus componentes de
variación conocidos (Steel y Torrie, 1960).
Cada componente representa la variación debido a factores incontrolables y errores
aleatorios asociado con la respuesta medida, específicamente, si los datos consisten n
medidas desde y1,....., yn y su media es designada por y , la variación total alrededor
de la media es incluida en la suma de desviaciones al cuadrado:
[2.8] ( )∑=
−n
ii yy
1
2
el cual es llamado la suma de cuadrados totales (Bhattacharyya y Johnson, 1977).
28
Figura 2.8. Descomposición de la suma de cuadrados totales con tres fuentes de
variación.
El número de las fuentes de variación no identificables y las fórmulas para la suma de
cuadrados de los componentes están intrínsicamente conectados al particular diseño
experimental empleado en la colección de datos y el modelo estadístico considerado
apropiado para el análisis (Steel y Torrie, 1960). Por ejemplo, para el diseño de BCA se
asume que la observación y es expresable como una función lineal conocida de
parámetros desconocidos más el error, en este caso, yi (i =1, 2,..., t) es el número de
tratamientos, yj (j =1, 2,..., r) correspondientes al número de bloques:
[2.9] ijjiijy εβτµ +++=
donde µ, τi y βj son los parámetros desconocidos y εij es el error. Cada parámetro
desconocido o fuente de variación esta asociado a ciertos grados de libertad (Cuadro
2) (Kempthorne, 1952).
Cuadro 2.2. Grados de libertad asociados a las fuentes de variación.
Fuente de Variación Grados de Libertad
Bloques (r -1)Tratamientos (t - 1)Error (r -1) (t - 1)
Total rt - 1
SC debido SC debido SC debido ErrorFuente Nº 1 Fuente Nº 2 Fuente Nº 3 Residual
Suma de cuadrados totales
( )21
∑=
−n
iyiy
29
El término grados de libertad (g.l.), puede ser explicado de la siguiente manera,
originalmente existen n grados de libertad en una muestra de n observaciones y si
calculamos x y s2, utilizamos un grado de libertad para el cálculo de x , dejando sólo n
– 1 grados de libertad el residual ( )2xx i − en el cálculo de s2 (Wonnacott y Wonnacott,
1972), por lo tanto, los grados de libertad asociados con cualquier componente es el
número de los parámetros independientes requeridos para describir ese componente
en el modelo (Cochran y Cox, 1950).
2.2.3.1 Prueba de F
El cuadrado medio es definido como la suma de cuadrados asociados a un
componente, dividido por sus respectivos grados de libertad (Steel y Torrie, 1960), la
cual puede ser descrita por la siguiente fórmula:
[2.10] libertaddeGrados
cuadradosdeSumamedioCuadrado =
El cuadrado medio del error es simbolizado por s2 y frecuentemente es referido como
un término de error generalizado, puesto que es un promedio de los componentes
contribuidos por las poblaciones o los tratamientos. Este es un estimador de un σ2
común, lo cual es un supuesto, y s2 es un estimador válido para s2 sólo si la suposición
es verdadera (Bhattacharyya y Johnson, 1977).
La hipótesis nula en que no existe diferencia entre k medias poblacionales puede ser
representada por:
H0: µ1 = µ2 =....= µk = 0
La hipótesis alternativa es la que alguna de los valores de µ es diferente de cero. Por
ejemplo para un diseño completamente al azar, cuando las medias de las poblaciones
son todas iguales, el cuadrado medio del tratamiento es de esperarse que sea
pequeño y es probable que sea mayor cuando las medias difieran marcadamente, por
otro lado, el cuadrado medio del error, puede ser usado como un regulador para
determinar como un gran valor del cuadrado medio del tratamiento, descrito
30
anteriormente, es un indicador de diferencia significativa (Bhattacharyya y Johnson,
1977). Esto sugiere que bajo H0 la relación,
[2.11] ( )
( )∑=
−
−==
k
jj kn
SCEk
otratamientdelSC
errordelmedioCuadradootratamientdelmedioCuadrado
F
1
1
tiene una distribución F con g.l. = (k−1, n−k), donde n = ∑=
k
j 1
nj y este sea un buen
criterio para probar la hipótesis nula que la media de las poblaciones es la misma para
todos los tratamientos (Snedecor y Cochran, 1980).
La distribución fue tabulada primero por Fisher y en honor a este autor, este criterio fue
llamado F (Snedecor, 1934), Fisher y Yates (1938) designaron a F como la relación de
la varianza.
En la tabla de F, si el cuadrado medio del tratamiento es menor que el error, el
resultado es declarado no significativo sin importar que tan pequeña sea la relación de
F. Un F significativo implica que la evidencia es suficientemente fuerte para indicar que
no todos los tratamientos pertenecen a una población con un µ común (Steel y Torrie,
1960). Sin embargo, esto no indica cuál diferencia debe ser considerada
estadísticamente significativa.
Según Mendenhall y Ott (1980) esta distribución posee las siguientes propiedades:
• La distribución de F no es simétrica (Figura 2.9).
• Existen muchas distribuciones y formas de F, de las cuales una puede ser
especificada por la designación de los grados de libertad (Figura 2.10).
• Los valores de los extremos de la distribución F están calculados en tablas.
31
Figura 2.9. Distribución de F.
Figura 2.10. Distintas distribuciones de F.
2.2.3.2 Supuestos del análisis de varianza
Cuando las fórmulas y el procedimiento del análisis de varianza son utilizadas para
resumir los datos, no es necesario ningún supuesto para validar los resultados, en
cambio, cuando el análisis de varianza es utilizado como método de inferencia
estadística, ciertos supuestos acerca de la población y el procedimiento de muestreo
son necesarios para validar las inferencias (Eisenhart, 1947):
• Las poblaciones de la cual se extraen las muestras poseen la misma varianza.
• Los efectos en el modelo matemático son aditivos. Por ejemplo, para los
efectos de bloques y tratamientos implica que la diferencia entre los efectos
32
verdaderos para dos tratamientos es la misma en todos los bloques (Cochran y
Cox, 1950).
• Los errores experimentales son independientes y normalmente distribuidos con
µ = 0 y varianza común σ2. Puede asumirse que los errores son independientes
si las unidades experimentales son aleatoriamente asignados a los tratamientos
y si las variables asociadas con la conducta del experimento son también
aleatorias (Steel y Torrie, 1960).
2.3 GEOESTADISTICA
“La geoestadística corresponde a la aplicación del formalismo de las funciones
aleatorias al reconocimiento y estimación del fenómeno natural”, con esta definición
Matheron introduce el término geoestadística en el año 1962, para describir una
aproximación científica al problema de evaluación geológica y minera (Journel y
Huijbregts, 1978).
La originalidad de la geoestadística con respecto a la estadística clásica radica en que
la primera toma en cuenta la dependencia entre las observaciones, considerando que
ellas están ubicadas en el espacio (Emery, 2000).
La estadística clásica asume que la media de una unidad de una muestra es el valor
esperado de cualquier unidad, con una estimación del error expresado por la varianza
de la unidad (Trangmar et al., 1985), es decir considera la magnitud de éstos como si
los puntos en que se realizan las observaciones, estuvieran ubicados completamente
al azar (Gurovich y Stern, 1983).
Distintos estudios muestran que este aspecto “aleatorio” de las observaciones
frecuentemente contiene componentes que son espacialmente dependientes
(Campbell, 1978; Burgess y Webster, 1980; Gajem et al., 1981; Vieira et al., 1981; Yost
et al., 1982; Trangmar et al., 1987; Cambardella et al., 1994; Ortega et al., 1999). Esto
implica que dada una distancia o rango de la diferencia de la dependencia espacial en
las propiedades del suelo pueden ser descritas como una función de la separación
espacial. Los métodos tradicionales en la clasificación del suelo y análisis estadístico
no consideran directamente este aspecto (Trangmar et al., 1985).
33
La geoestadística considera la estructura y las características aleatorias de la
distribución espacial de las variables, proporcionando herramientas cuantitativas para
su descripción y una estimación insesgada optima.
2.3.1 Teoría de la variable regionalizada
La geoestadística se define como el estudio de fenómenos regionalizados, es decir,
fenómenos que se extienden en el espacio y que presentan una organización o
estructura. Por espacio se entiende en general al espacio geográfico, puede tratarse
del eje temporal o de espacios más abstractos (Emery, 2000). Cuando una variable
está distribuida en el espacio, se dice que esta regionalizada (Journel y Huijbregts,
1978). Por lo tanto cuando una variable pertenece a un estudio de un fenómeno que se
extiende en el espacio se llama variable regionalizada.
Una definición de variable regionalizada dada por Journel y Huijbregts (1978),
corresponde a una variable distribuida en el espacio netamente descriptiva que no
implica ninguna interpretación estadística. Dado que una variable regionalizada no
posee una extensión infinita, esta pertenece a un dominio limitado D llamado campo y
la superficie o volumen de base sobre la cual se considera la variable regionalizada se
denomina soporte (Emery, 2000). Desde un punto matemático, una variable
regionalizada es una función determinista denotada tradicionalmente z. Según Journel
y Huijbregts (1978), en general esta función presenta dos características
aparentemente contradictorias (Figura 2.11):
• Localmente, a menudo es irregular, errática y no puede ser representada por
una función matemática determinista.
• General o global, presenta cierta organización o estructura en el espacio.
Una variable aleatoria es un valor numérico que varía de una manera impredecible
(Mendenhall y Ott, 1980). La variable aleatoria es caracterizada por los parámetros de
distribución, como por ejemplo la media y la varianza, sin embargo, cuando los datos
están ubicados en el espacio geográfico, las hipótesis de la estadística clásica son
raramente aceptables. Una variable regionalizada z(x) es una variable aleatoria que
34
toma diferentes valores z de acuerdo a su localización x dentro de una región (Journel
y Huijbregts, 1978).
Figura 2.11. Características de la variable aleatoria. (Adaptado de Emery, 2000)
Una variable regionalizada z(x) puede ser considerada como una realización particular
de una variable aleatoria Z para una localidad x dentro de una región. Cuando x recorre
un campo D, o región, se obtiene una familia de variables {Z(x), x ∈ D} que constituyen
una función aleatoria (Emery, 2000).
Así, según Journel y Huijbregts (1978), la definición de función aleatoria permite tomar
en cuenta los aspectos aleatorios y estructurados de la variable regionalizada:
• Localmente, en cada punto x, Z(x) es una variable aleatoria.
• Globalmente, para todo conjunto de puntos, las variables aleatorias están
ligadas por una correlación que cuantifica la semejanza entre los valores que
toman (de donde proviene el aspecto estructurado).
2.3.1.1 Características de una función aleatoria
Si se considera una función aleatoria Z(x), x ∈ D, y una serie de puntos {x1,.., xk}. El
grupo de valores aleatorios {Z(x1),.., Z(xk)} esta caracterizado por una función de
distribución que depende de k argumentos:
Fx1,..., xk (z1,..., zk) = P [Z(x1) < z1,..., Z(xk )< zk]
35
El conjunto de funciones de distribución, para todos los enteros k y todas las
elecciones posibles de {x1,.., xk} en D, constituyen la ley espacial de una función
aleatoria.
Para poner en marcha el formalismo probabilístico, es necesario determinar la ley de la
función aleatoria Z(x) a partir de los datos disponibles sobre la variable regionalizada
z(x), esta etapa se conoce bajo el nombre de inferencia estadística (Emery, 2000).
Dos razones dificultan la inferencia estadística en su forma más general, por una parte,
sólo se dispone de una única realización de la función aleatoria, la cual es la variable
regionalizada, y por otra parte, esta realización sólo se conoce de manera
fragmentaria, en algunos puntos de muestreo (Journel y Huijbregts, 1978).
Para superar esta situación según Emery (2000), se hace uso de la noción de
estacionaridad, que describe de alguna manera, una homogeneidad espacial de la
regionalización. El concepto es permitir la inferencia estadística, reemplazando la
repetición sobre las realizaciones de la función aleatorias (inaccesible) por una
repetición en el espacio. Los valores que se encuentran en las diferentes regiones del
campo presentan distintas características y pueden considerarse como distintas
realizaciones del mismo proceso aleatorio (Journel y Huijbregts, 1978).
Desde el punto de vista matemático, la hipótesis de estacionaridad consiste en suponer
que todo o parte de la ley espacial de la función aleatoria es invariante por traslación,
es decir, que las propiedades probabilísticas de un conjunto de valores no dependen
de la posición absoluta de los sitios asociados, sino sólo de sus separaciones (Emery,
2000).
∀ h ∈ Rd, ∀ k ∈ N*, ∀ x1,.., xk ∈ Rd, los vectores aleatorios (Z(x1),.., Z(xk)) y (Z(x1 + h),..,
Z(xk + h)), tienen igual ley de probabilidad conjunta.
donde Rd representa las dimensiones del espacio y N* el número de variables
regionalizadas reales.
Esta propiedad expresa la idea que todas las características de la regionalización son
invariables en el espacio, la cual es muy restrictiva, pues supone una identidad de
todas las leyes de probabilidad en el espacio. Sin embargo, esta propiedad se puede
restringir a los dos primeros momentos de la función aleatoria, ya que la ley espacial
entera nunca es requerida (Journel y Huijbregts, 1978).
36
Según Trangmar et al. (1985) los momentos son:
Una función aleatoria Z(x) es estacionaria de primer orden, si su valor esperado es la
misma en cualquier localidad de la región en estudio:
[2.12] ( )[ ] mxZ =Ε
donde m es la media de la estadística clásica, y
[2.13] ( ) ( )[ ] 0=+−Ε hxZxZ
donde h es el vector de separación entre las localidades de las muestras.
Una estacionaridad de segundo orden se aplica si la covarianza espacial C(h) de cada
par de Z(x) y Z(x + h) es la misma, independiente de la posición a través de la región y
depende de h:
[2.14] ( ) ( )[ ] ( )[ ]{ }mhxZmxZhC −+−Ε=
Según Trangmar et al. (1985), un estacionaridad de segundo orden no se aplica si una
varianza y covarianza finita no pueden ser definidas, por lo que una débil función de
estacionaridad llamada hipótesis intrínseca debe ser asumida.
Según Emery (2000) la hipótesis intrínseca requiere que para todos los vectores de h,
la varianza del incremento Z(x) − Z(x + h) es finita e independiente de la posición
dentro de la región:
[2.15] ( ) ( )[ ] ( ) ( )[ ]2hxZxZhxZxZVar +−Ε=+−=
2.3.2 Análisis de dependencia espacial
Los conceptos de variable regionalizada y estacionaridad, proveen la teoría básica
para el análisis de dependencia espacial usando la autocorrelación y el variograma
(Trangmar et al., 1985).
37
El conjunto de las correlaciones o dependencias que existen en la distribución espacial
de los valores constituyen la estructura del fenómeno regionalizado (Emery, 2000) y es
el primer e indispensable paso para cualquier estudio geoestadístico (Journel y
Huijbregts, 1978), ya que las técnicas de gráficos descriptivos como histogramas,
esquemas de torta y diagramas de dispersión entregan poca o ninguna información
sobre la distribución espacial de la variable de interés (Davis y Reich, 2000).
2.3.2.1 Autocorrelación
La función de autocorrelación expresa la correlación lineal entre series espaciales y la
misma serie en un intervalo de distancia (Vieira et al., 1981; Wu y Dutilleul, 1999). Esta
definición asume una estacionaridad de segundo orden, en el cual la autocorrelación
se expresa por:
[2.16] ( ) ( )2shC
hr =
donde r(h) es la autocorrelación entre muestras a cierta distancia de separación o lag y
C(h) es la covarianza espacial del par Z(x) y Z(x + h). Un grafico de los valores de
autocorrelación versus el lag es llamado autocorrelograma (Trangmar et al., 1985).
Los valores de la función de autocorrelación son normales en el rango de –1 y 1.
El autocorrelograma ha sido utilizado para expresar los cambios espaciales en las
propiedades medidas de un campo y el grado de dependencia entre observaciones
vecinas (Gajem et al., 1981; Gurovich y Stern, 1983; Sainato et al., 1996; Ortega et al.,
1999; Vieira et al., 1981), y en el diseño de experimentos (van Es y van Es, 1993).
2.3.2.2 Variograma
Si se considera dos valores numéricos z(x) y z(x + h), en dos puntos x y x + h
separados por un vector h. La variabilidad entre estas dos cantidades se caracteriza
por la función variograma 2γ(x, h), la cual es definida como la esperanza de la variable
aleatoria [Z(x) − Z(x + h)]2 (Journel y Huijbregts, 1978):
38
[2.17] ( ) ( ) ( )[ ]{ }2,2 hxZxZhx +−Ε=γ
Este variograma 2γ(x, h) es una función del punto x y del vector h. La estimación del
variograma requiere varias realizaciones [zk(x), zk(x + h)], [zk’(x), zk’(x + h)],..., [zk’’(x),
zk’’(x + h)], de pares de variables aleatorias [Z(x), Z(x + h)]. En la practica, sólo es
posible de efectuar una realización [z(x), z(x + h)]. Para solucionar este problema, es
necesario utilizar la hipótesis intrínseca (Journel y Huijbregts, 1978; Trangmar et al.,
1985). Con esta hipótesis la función variograma 2γ (x, h) depende sólo del vector de
separación h (modulo y dirección) y no de su localización x. Con esto es posible
estimar el variograma con los datos disponibles, el cual se define como la media
aritmética del cuadrado de la diferencia entre dos medidas experimentales [z(xi), z(xi +
h)] de cualquier par de puntos separados por el vector h (Journel y Huijbregts, 1978):
[2.18] ( ) ( ) ( ) ( )[ ]( )
2
1
12 ∑=
+−=hn
iii hxzxz
hNhγ
donde N(h) es el número de pares experimentales [z(xi), z(xi + h)] de datos separados
por el vector h.
El semi – variograma se define como la mitad del variograma (Isaaks y Srivastava,
1989):
[2.19] ( ) ( ) ( ) ( )[ ]( )
2
121 ∑
=
+−=hn
iii hxzxz
hNhγ
Para evitar confusiones se omitirá el prefijo “semi” al referirse al semi-variograma.
El variograma γ(h) es isótropo si depende sólo de la distancia de separación y no de la
dirección, en este caso, todos los variogramas direccionales serán los mismos, en caso
contrario, cuando depende de la distancia y de la dirección el variograma es
anisotrópico (Isaaks y Srivastava, 1989).
El variograma anteriormente descrito es llamado variograma experimental, este no es
una función propiamente tal, sino que una serie discreta de puntos pues sólo se puede
calcular para valores de h tal que N(h) no es vacío, por lo que es incompleto y es
necesario buscar un modelo teórico de variograma que sea parecido al variograma
experimental. Esta etapa de modelamiento, llamada análisis estructural o análisis
39
variográfico, es la fase esencial de un estudio geoestadístico, obteniéndose resultados
insatisfactorios en caso de realizar un mal modelamiento (Emery, 2000).
Los modelos de un variograma experimental pueden tomar muchas formas, los que
dependen de los datos y los intervalos de muestreo utilizados (Trangmar et al., 1985).
Idealmente, el variograma aumenta con la distancia entre la localización de las
muestras, elevándose hasta un valor más o menos constante llamado umbral o sill, el
cual está dado a una cierta distancia llamada rango de la dependencia espacial (Isaaks
y Srivastava, 1989). El rango del variograma depende de la escala de la observación y
de la interacción espacial de los procesos del suelo que afectan cada propiedad a la
escala de muestreo utilizada (Trangmar et al., 1985).
El umbral se aproxima a la varianza s2 para los datos estacionarios. Muestras
separadas bajo el rango están espacialmente relacionadas, o autocorrelacionadas, las
muestras que están por sobre el rango no están espacialmente relacionadas, lo que
implica una variación aleatoria o independiente (Trangmar et al., 1985).
Idealmente, el variograma experimental debe pasar por el origen cuando la distancia
de separación de las muestras es cero, pero muchas propiedades del suelo no
presentan un valor cero cuando la distancia es cero, esto es llamado efecto nugget
(Journel y Huijbregts, 1978) y el interceptor es llamado varianza de nugget (Burgess y
Webster, 1980; McBratney Webster, 1986). (Figura 2.12)
Esto representa un error de medición o microvariabilidad de la propiedad, la cual no
puede ser detectada a la escala del muestreo (Trangmar et al., 1985).
Figura 2.12. Parámetros del variograma
40
Los parámetros del variograma experimental son comúnmente estimados usando la
regresión de mínimos cuadrados, dándole “peso” al número de pares de muestras en
cada lag (Vieira et al., 1981; Yost et al., 1982; Trangmar et al., 1985; McBratney
Webster, 1986).
Es importante la elección de un adecuado modelo1 para estimar el variograma debido a
que, cada modelo de rendimiento entrega diferentes valores para el nugget, umbral y
rango, los cuales son importantes para la interpolación mediante kriging (Trangmar et
al., 1985).
2.3.3 Interpolaciones
La estimación global consiste en evaluar el promedio de la variable regionalizada en la
totalidad del campo, por lo que no representa el resto del área, y es raramente utilizado
como finalidad en un estudio geoestadístico (Isaaks y Srivastava, 1989), ya que la
estimación aritmética de la media es un pobre estimador de la media poblacional,
debido a que si las muestras están ubicadas en zonas similares (clustering), afectan la
estimación de la media (Davis y Reich, 2000).
Contrariamente, la estimación local sólo concierne a un sector del campo estudiado y
en general utiliza un número limitado de los datos disponibles (Emery, 2000).
La necesidad de estimar áreas pequeñas, comprende la necesidad de estimar valores
desconocidos de localidades específicas, las que dependen de los valores de las
muestras vecinas (Isaaks y Srivastava, 1989). Existen distintos métodos de estimación
puntual2, algunos utilizados en estimación global, de los cuales podemos mencionar:
− Estimación global:
• Disgregamiento poligonal.
• Celda disgregada.
− Estimación puntual:
• Polígonos de Thiessen.
• Triangulación. 1 Mayor detalle de distintos modelos de variograma se presenta en el anexo A. 2 Mayor detalle de la metodología de los interpoladores polígonos de Thiessen, triangulación, distancia inversa y Kriging se presenta en el anexo B.
41
• Distancia Inversa.
• Kriging.
El método kriging es asociado con la sigla en inglés “B.L.U.E.” (best linear unbiased
estimator), ya que, es lineal, por que los estimadores se forman por la combinación
lineal de los datos disponibles, es el mejor por que minimiza la varianza del error y es
insesgado, por que intenta que la media del error sea cercana a cero (Journel y
Huijbregts, 1978).
Los métodos polígonos de Thiessen, triangulación y distancia inversa también son
lineales y teóricamente insesgados, pero lo que distingue a kriging de los otros
métodos es que minimiza la media y la varianza del error (Isaaks y Srivastava, 1989).
2.3.4 Validación cruzada
La elección de uno u otro método lleva a la incertidumbre de saber si el modelo es el
correcto en la estimación del verdadero valor de la variable aleatoria. Una herramienta
útil es la validación cruzada, la cual es una técnica que permite comparar los valores
estimados y los verdaderos, utilizando sólo la información disponible de los datos de
una muestra, la cual ayuda en la elección entre diferentes procedimiento con “peso”,
estrategias de búsqueda o diferentes variogramas (Isaaks y Srivastava, 1989).
La forma más simple de calcular la validación cruzada, es comparando la distribución
de los residuales o errores de los diferentes procedimientos de estimación (Isaaks y
Srivastava, 1989).
Gotway et al. (1996), utilizaron la predicción del cuadrado medio del error (PCME ó
PMSE, por sus siglas en inglés), para la comparación entre kriging y distancia inversa,
el cual también es una forma de comparar los valores estimados y reales:
[2.20] ( ) ( )[ ]∑ −= 200 ˆ sysyPCME
donde ( )0sy es el valor real en la posición s0 y ( )0ˆ sy es el valor estimado. Los valores
de PCME serán pequeños para una adecuada estimación.
Agterberg (1984) (Citado por Gotway et al., 1996), también propone otro método:
42
[2.21] ( ) ( )[ ] %10012
00
×
−−=
∑ sysyPCME
G
donde PCME es el valor de los residuales al cuadrado, dividido por la desviación de las
observaciones ( )0sy , en el punto s0, menos el promedio ( )0sy , multiplicado por 100.
Los valores cercanos a 100%, son los modelos de mejor estimación.
2.3.5 Geoestadística aplicada al diseño experimental
La geoestadística ha sido empleada para cuantificar la heterogeneidad del suelo, por
medio de analizar la estructura de la variable regionalizada (Gajem et al., 1981;
Gurovich y Stern, 1983; Sainato et al., 1996; Ortega et al., 1999; Vieira et al., 1981;
Yost et al., 1982; Trangmar et al., 1987), pero sólo se han realizado unos pocos
estudios para aplicarla al diseño de experimentos (van Es et al., 1989; van Es y van Es,
1993; Gotway et al., 1997; Fagroud y Van Meirvenne, 2002).
Los autores van Es et al. (1989), y van Es y van Es (1993), indican que al analizar, por
ejemplo, un experimento diseñado como bloques completos al azar, la comparación
entre tratamientos mas cercanos entre si sobreestiman la varianza por lo que
incrementa la probabilidad de cometer un error del tipo II; la comparación de
tratamientos que están mas alejados subestiman la varianza, por lo que aumenta la
probabilidad de cometer un error del tipo I. Si bien la aleatorización evita este
problema, el análisis dificulta asegurar que todas las comparaciones entre tratamientos
son realizadas con igual precisión.
Estos autores proponen un diseño, basado en la teoría de la variable regionalizada, de
bloques incompletos con bloques de tamaño dos (por ejemplo, dos tratamientos por
bloque), en la cual el bloque es dividido en dos, una mitad pertenece a un tratamiento y
la otra mitad al otro tratamiento. Una vez efectuado lo anterior, en cada bloque
incompleto (par de tratamientos), se distinguen regiones, en la cual dos observaciones
existen en cada región, una por cada tratamiento (Figura 2.13). La distancia entre
observaciones es minimizada y es constante para todas las regiones. Este diseño
presenta la ventaja que mejora la comparación entre tratamientos a una distancia
breve y constante, sin embargo posee la desventaja que su análisis es complicado,
limita el número de tratamientos a estudiar o el número de comparaciones, si se utiliza
43
un gran número de tratamientos, para disminuir el tamaño del diseño y necesita que el
diseño sea balanceado.
Figura 2.13. Distribución de los bloques incompletos, ubicación de la región y las
observaciones. (Adaptado de van Es y van Es, 1993)
Fagroud y Van Meirvenne (2002), determinaron el diseño experimental óptimo
mediante el uso del variograma. Estos autores afirman que la capacidad de agua
disponible (CAD) es la principal fuente de variación de los rendimientos en los
experimentos de eficiencia del uso del agua. Mediante el uso de variogramas de CAD,
obtienen los valores de umbral y nugget, los cuales utilizan para calcular la proporción
nugget / umbral (PNS), con lo cual al graficar el largo versus PNS y el ancho versus
PNS de la parcela, pueden obtener los valores óptimos de largo y ancho de parcela en
la que los valores de CAD se consideran independientes o aleatorios, ya que un alto
valor de PNS representa que la variable medida, en este caso CAD, tiene efectos
aleatorios. Para determinar el número de parcelas (ó tratamientos) por bloque, se
obtienen los residuales del análisis de varianza restando el efecto del bloque al valor
de la parcela, utilizando el variograma sobre los residuales obtienen el valor de rango,
con el cual, calculan la proporción de PNS / rango y lo grafican versus el número de
parcelas por bloque. Un elevado valor de la proporción PNS / rango indica una débil
dependencia espacial de los residuales. El tipo de diseño se selecciona mediante la
comparación del modelo elegido versus el diseño de bloques completos al azar,
cuantificándolo con la eficiencia relativa del diseño seleccionado y el diseño de bloques
completos. La orientación de los bloques la determinan mediante la tendencia que
44
muestra CAD en el espacio, donde los bloques los ubican perpendiculares al sentido
de la mayor variación.
Gotway et al. (1997), indican que si la caracterización de un campo indica que las
áreas con similar variación espacial son suficientemente grandes para la incorporación
de bloques, estos pueden ser dispuesto de tal manera que la variación dentro del
bloque sea mínima. En el mismo sentido Mulla et al. (1990), asegura que si los efectos
de la variabilidad espacial pueden ser anticipados, el tamaño y ubicación de los
bloques pueden ser correctamente utilizados. (Figura 2.14)
Figura 2.14. Ubicación de los bloques según la variabilidad espacial conocida
2.4 ANALISIS ESTADISTICO ESPACIAL
2.4.1 Variabilidad espacial y error experimental
Una precisa evaluación de cultivares y la capacidad de diferenciar entre ellos es un
punto crítico para cualquier programa de mejoramiento. Estos programas se basan en
experimentos de campo con repeticiones y el uso de parcelas que pueden ser
estadísticamente analizadas, para de este modo seleccionar aquellos cultivares de
propiedades superiores (Stroup et al., 1994; Wu y Dutilleul, 1999).
Uno de los objetivos principales de los programas de mejoramiento genético es
incrementar el rendimiento y la estabilidad del mismo (Ball et al., 1993).
45
El rendimiento puede ser definido como una respuesta integral de un cultivo a un
ambiente específico de campo (Ball et al., 1993). Según Kirk et al. (1980), este
rendimiento puede ser afectado por numerosos factores, entre los cuales destacan:
• La presencia de variación sistemática de naturaleza desconocida, la cual se
refiere directamente a la posición de las parcelas en el campo.
• Efecto de factores aleatorios, el cual se refiere al error causado por los errores
medidos y la variación genética, sumado al gran número de pequeños efectos
aditivos.
Según Reich y Davis (2000), la variación sistemática desconocida es también conocida
como variación a gran escala, la cual se ve influenciada por el relieve, precipitación,
entre otros, mientras que la variación debida a factores aleatorios es conocida como
variación a pequeña escala, la cual también se ve influenciada por la permeabilidad del
suelo, nutrientes disponibles, pH, entre otros.
La magnitud del error experimental, el cual proviene de estas dos fuentes de variación,
es una interrogante de gran importancia para los programas de mejoramiento genético.
La heterogeneidad espacial, incluyendo la variabilidad del suelo, es una de las
mayores fuentes de variación que aumenta el error experimental (van Es y van Es,
1993; Mulla et al., 1990; Bhatti et al., 1991; van Es et al., 1989; Fagroud y Van
Meirvenne, 2002).
Smith (1938), fue el primero en modelar en forma empírica una ley de la variación de la
fertilidad del suelo y como se correlaciona con el rendimiento del cultivo, en la cual,
establece una relación lineal negativa entre la varianza del rendimiento y la superficie
del cultivo (tamaño de las parcelas), ambas expresadas en término de logaritmos. La
pendiente de esta relación es un indicador de la heterogeneidad del rendimiento, con lo
cual se puede establecer el tamaño de una parcela para la reducción de la
heterogeneidad del cultivo.
Se ha visto que en el procedimiento experimental se incluyen un número de
características que permiten medir y controlar el error experimental, entre ellas se
puede nombrar:
• Repetición.
46
• Bloqueo.
• Aleatorización.
Frente a esto, el diseño experimental más popular en investigaciones científicas es el
diseño de bloques completos al azar (Nelson y Rawlings, 1983; Eskridge, 2003; Ye et
al., 2001), seguramente por que alcanza un satisfactorio nivel de precisión (Cochran y
Cox, 1950).
2.4.2 Violación de supuestos
La violación de alguno de los supuestos del análisis de varianza puede afectar el nivel
de significancia y sensibilidad de la prueba de F, por lo que es una correspondiente
perdida en la precisión en la estimación obtenida para el efecto de los tratamientos
(Steel y Torrie, 1960).
El supuesto de normalidad no es necesario para la estimación de los componentes de
la varianza, pero afecta la prueba de significancia. Cuando la distribución es sesgada,
el componente del error de un tratamiento tiende a ser función de la media del
tratamiento. Esto resulta en una heterogeneidad del término del error, y para el análisis
de varianza es necesario que el error sea homogéneo (Steel y Torrie, 1960).
La falla en el supuesto de una varianza común, constante a través de todas las
observaciones, es producida por que ciertos tratamientos son erráticos en sus efectos.
En este caso, el error utilizado para la comparación de un par de tratamientos puede
ser cuatro veces más grande que para otro par de tratamientos, siendo que se utiliza el
mismo error para la comparación, puede llevar a que la prueba utilizada, t o F, resulte
completamente errónea (Cochran y Cox, 1950).
Sin embargo, el supuesto de normalidad y varianza constante a menudo se aproximan
a la verdad (Grundy y Healy, 1950), como también, el procedimiento de análisis es
robusto en el caso de una pequeña o moderada falla de normalidad y varianza
constante, por lo que el desempeño del análisis no se ve seriamente afectado
(Bhattacharyya y Johnson, 1977).
Para el caso del supuesto en que los errores son independientes, es conocido por los
estadísticos que en experimentos de campo la respuesta de los cultivos de las parcelas
adyacentes tiende a ser parecido (Steel y Torrie, 1960; Cochran y Cox, 1950); el
47
resultado del análisis puede ser engañoso si no se toma en cuenta este inconveniente.
Para evitar este problema en la practica, los tratamientos son asignados
aleatoriamente a las unidades experimentales o el orden de las observaciones es
determinado aleatoriamente (Kempthorne, 1952).
Sin embargo, según Zimmerman y Harville (1991) una característica de la mayoría de
los experimentos es la presencia de heterogeneidad sistemática a través de las
unidades experimentales, y típicamente, la naturaleza de esta heterogeneidad es tal
que existe una apreciable correlación entre unidades vecinas, por lo que el supuesto
de errores independientes no se cumple (Fagroud y Van Meirvenne, 2002; Mulla et al.,
1990). Estas observaciones entregan menos información que una observación
independiente, por lo que el aumento en el número de puntos muestreados entregan
poca o ninguna información adicional en contraste con una observación independiente
(Davis y Reich, 2000).
La imposibilidad de controlar la heterogeneidad espacial, produce una variación entre
los rendimientos de las parcelas, lo que disminuye la estimación entre el efecto de los
tratamientos, ya que el error experimental es incrementado, lo que invalida el análisis
de varianza (Brownie et al., 1993; Wu y Dutilleul, 1999; van Es y van Es, 1993).
Si bien los sistemas de bloqueos son efectivos en el control de la variabilidad espacial,
estos no son efectivos si la variabilidad es sistemática o compleja a través del campo,
por lo que estos sistemas de bloqueos son ineficientes (Tamura et al., 1988; Amaro y
Cobo, 1994; Pearce, 1998). Warren y Mendez (1982), demostraron que cuando los
bloques no tienen éxito, el cuadrado medio del error del análisis del tratamiento puede
ser seriamente sobreestimado. Dentro de esta variación espacial, las propiedades
químicas y físicas del suelo son las fuentes más importantes de variación que afectan
el rendimiento de los cultivos (Trangmar et al., 1987; Camberdella et al., 1994; Ortega
et al., 1999) y para el caso de experimentos con variedades, la heterogeneidad nace
comúnmente por el gran número de genotipos que son probados (Ye et al., 2001).
Aún cuando Fisher (1935), demostró que el análisis de varianza para el diseño de
bloques completos al azar es válido sin importar si los datos están correlacionados,
esto sólo se cumple si la correlación es uniforme en la parcela y no aumenta con la
distancia, con lo cual el diseño y el análisis no son eficientes (Bailey et al., 1995).
48
2.4.3 Remoción de la variabilidad espacial
Un acercamiento histórico para el control local de la variabilidad de la fertilidad del
suelo, es mediante el método de parcelas controles (check plots), comúnmente
utilizado en la investigación agrícola entre 1900 y 1930 (Dagnelie, 1989), el cual
envuelve la interposición sistemática de parcelas que contienen un tratamiento
estándar entre las parcelas con tratamientos experimentales. (Figura 2.15)
Figura 2.15. Método de parcelas controles (Adaptado de Besag y Kempton, 1986).
En la Figura 2.15, se puede observar la disposición de las parcelas con tratamientos
experimentales (T) y las parcelas estándar (st). En su antiguo uso, los tratamientos
experimentales eran sin repetición y los rendimientos de las parcelas controles se
usaban para calcular un índice de fertilidad para cada parcela, ajustando los
rendimientos de los tratamientos experimentales como una diferencia o relación del
índice de fertilidad de la parcela. La información proveniente de los parcelas controles
en ensayos con repetición fue incluida en los análisis, sin embargo se demostró que
esto causaba un sobre ajuste de las parcelas experimentales (Richey, 1924;
McClelland, 1926, citados por Besag y Kempton, 1986).
Yates (1936), colocó énfasis en la aleatorización de los tratamientos experimentales
para una estimación válida del error experimental y demostró la menor eficiencia del
uso de parcelas controles en contraste con el uso de diseños de lattices.
Para aquellos experimentos con repeticiones que no implican parcelas controles, es
importante disminuir la heterogeneidad espacial, lo que ha sido logrado mediante
distintos sistemas de reducción de la variabilidad espacial, comúnmente llamados
análisis de modelos espaciales (Ye et al., 2001).
st T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T stst T T T T T st T T T T T st T T T T T st
49
El primero fue Papadakis, quien percibió que el uso tradicional de los bloques ignoraba
la forma del verdadero modelo de fertilidad (Pearce, 1998), por lo que en 1937, y
siguiendo los pasos previos de Richey (1924) de ajustar el rendimiento de cada parcela
mediante un análisis de regresión, propuso el uso de los residuales de los rendimientos
de parcelas vecinas como covariables. Pero este método fue propuesto sólo como una
modificación del método de distribución sistemática de parcelas controles (Dagnelie,
1989).
Esta idea fue discutida y desarrollada por Bartlett (1938, 1978) y Wilkinson et al.
(1983). El trabajo de Papadakis (1937), forma substancialmente la base para otros
análisis estadísticos que utilizan las parcelas vecinas para ajustar los rendimientos
como por ejemplo Besag y Kempton (1986), Wilkinson et al. (1983), Bartlett (1978),
Williams (1986), Schwarzbach (1985); a este grupo de métodos se conoce con el
término de análisis del vecino más cercano (nearest neighbour analysis).
Un método alternativo al vecino más cercano, es el que incluye la variación sistemática
del suelo. Neyman et al. (1953) propuso utilizar una ecuación de regresión polinomial
para describir la variación de la fertilidad en los experimentos, en los cuales los
tratamientos son arreglados en el mismo orden en todos los bloques y los bloques son
dispuestos sucesivamente.
La existencia de tendencias locales en experimentos de campo implica que la similitud
existente entre parcelas cercanas es superior de las más distantes, lo cual implica una
correlación espacial de los residuales. Basados en este principio, Zimmerman y
Harville (1991) propusieron un modelo para ajustar tendencias locales llamado
aproximación al campo aleatorio (random field approach), en el cual la tendencia local
es modelada mediante la inclusión de una variación a gran escala y una variación a
pequeña escala.
Según Brownie et al. (1993), los análisis espaciales asumen un esquema rectangular a
x b de las parcelas, con una disposición en filas descritas por Ri, donde i = 1,..., a, y
una disposición en columnas descritas por Cj, donde j = 1,..., b. Cada uno de los t
tratamientos es replicado r veces, por lo que el número total de parcelas en el ensayo
es ab = rt. Para la parcela en la fila i y columna j, sea yij el que representa el
rendimiento observado, Ti j es el término de ajuste y τi el efecto del tratamiento asignado
a la parcela i. Por lo que el modelo que incorpora la variación espacial es:
50
[2.22] ijijiij Ty ετµ +++=
donde µ es la media poblacional y εij es el error aleatorio con ε ~ NID (0, σ2).
Los diferentes modelos espaciales difieren en el supuesto acerca de Tij y εij.
2.4.3.1 Método de Papadakis
El método de Papadakis consiste en obtener los residuales de cada tratamiento, bajo
un diseño completamente al azar, los cuales pueden ser positivos o negativos:
[2.23] iijij yyr −=
donde rij es el residual del rendimiento de la parcela i bajo el tratamiento j, yij es el
rendimiento observado de la parcela i, bajo el tratamiento j e iy es el promedio del
tratamiento asociado a la parcela i.
Posteriormente se calcula la covariante, también llamado índice de fertilidad por
parcela (Amaro y Cobo, 1994) ó variante concomitante (Pearce y Moore, 1976), que
corresponden a los residuales promedio de las parcelas vecinas del rendimiento que se
quiere ajustar, por ejemplo si tomamos dos parcelas sobre una misma línea para el
caso del análisis en una dimensión, ó cuatro parcelas vecinas dispuestas en filas
horizontales y columnas verticales, para el caso de dos dimensiones (Draper y Faraggi,
1985).
[2.24] ( )jijijijiij rrrrX ,1,11,1,41
+−+− +++=
donde Xij es el valor de la covariable en la fila i y en la columna j, 1,1 ±± jir son los
residuales de las parcelas vecinas.
Finalmente, los datos son examinados por el análisis de covarianza, aunque Xij no es
una verdadera covariable, ya que los rij son obtenidos de los valores de rendimientos
observados yij, bajo el siguiente modelo lineal:
51
[2.25] )()( ijkijkijk BXy ετµ +++=
donde µ es la media poblacional, ôk es el tratamiento k, Xij es el término de ajuste de Tij
y representa la covariable, B es el coeficiente de regresión asociado a la covariable y
εk(ij) son los efectos aleatorios con ε ~ NID (0, σ2) del modelo que incorpora la variación
espacial.
Según Brownie et al. (1993), los bloques son ignorados debido a que al incluir el efecto
de los bloques se puede introducir, aparentemente, una discontinuidad artificial en el
rendimiento potencial para las parcelas adyacentes que se encuentran en diferentes
bloques.
Este método puede variar, dependiendo de las parcelas utilizadas como residuales
para este análisis, así, pueden ser utilizadas parcelas de la misma fila, parcelas de la
misma columna, como también utilizar mas de una covariable en el modelo (Pearce y
Moore, 1976).
Un método iterativo del método de Papadakis es presentado por Bartlett (1978), bajo la
sospecha de que el método produce un sesgo en la estimación del contraste de los
tratamientos, aunque según Pearce (1998), la intención de la iteración es hacer el
procedimiento consistente y no para minimizar el residual del error estándar, ya que no
se ha probado nada sobre el cuestionamiento de sesgo por este método.
2.4.3.2 Análisis de tendencia
Neyman et al. (1953), fueron pioneros al sugerir un modelo que explique la variación
sistemática del suelo. Estos investigadores propusieron utilizar una ecuación de
regresión polinomial para describir la variación de la fertilidad en los experimentos,
donde los tratamientos son arreglados en el mismo orden en todos los bloques y los
bloques son dispuestos sucesivamente.
La variabilidad sistemática del experimento es removida por el ajuste de una ecuación
de regresión polinomial de la gradiente de fertilidad usando filas y columnas como
variables independientes en la función polinomial. La función resultante es conocida
como modelo de superficie de respuesta (Kirk et al., 1980).
52
Para la obtención de la regresión polinomial, primero se obtienen los residuales de
cada observación a partir de un diseño completamente al azar, los cuales son
identificados por su respectiva fila y columna (Fórmula [2.23]).
Luego se calculan todos los posibles modelos de superficie de respuesta de los valores
de los residuales y se seleccionan los p – modelos que producen la menor suma de
cuadrados del error. Estos p-modelos consisten en encontrar el mejor modelo de p –
términos expresados como suma de cuadrados del error. Como último paso se evalúan
los distintos p – modelos y se selecciona el mejor, el cual se utiliza como superficie de
respuesta. El procedimiento de selección envuelve una serie de pruebas de F de los
distintos modelos, utilizando un nivel de significancia de α = 0,01 (Kirk et al., 1980;
Tamura et al., 1988). Este procedimiento se realiza hasta que la introducción de un
término adicional no resulta en una reducción significativa de la suma de cuadrados del
error.
Según Brownie et al. (1993), los bloques son ignorados porque el límite entre bloques
contiguos es artificial y el rendimiento potencial no es probable que cambie
abruptamente a lo largo de la línea correspondiente a ese límite. Esto resulta en una
discontinuidad a lo largo de los límites del bloque, mientras que el análisis de tendencia
asume que el rendimiento potencial varía de una manera uniforme. En el análisis de
varianza, la suma de cuadrados asociado con el modelo de superficie seleccionado, es
substraída del total en lugar del asociado a los bloques y los grados de libertad de la
superficie de respuesta es equivalente al número de términos de la ecuación polinomial
seleccionado (Bowman, 1990).
Por lo que el modelo lineal que incorpora la superficie de respuesta es:
[2.26] ( ) ( ) ( )ijkjikijk CRfy ετµ +++= ,
donde yk(ij) es el rendimiento observado bajo el tratamiento k en la fila i y columna j, ì
es la media poblacional, f (Ri, Cj) es el termino de ajuste de Ti j y representa la superficie
de respuesta en función de las filas denominadas Ri, donde i = 1,..., a, de las columnas
descritas por Cj, donde j = 1,..., b (Ye et al., 2001) y εk(ij) son los efectos aleatorios con ε
~ NID (0, σ2) del modelo que incorpora la variación espacial.
La dificultad de este método es determinar correctamente la función polinomial (Ye et
al., 2001), ya que los problemas asociados a este modelo es la sobreestimación o el
53
ajuste de un modelo incorrecto. Según Brownie et al. (1993), la sobreestimación ocurre
si la verdadera función para Tij es un polinomio, sin embargo se ajusta un polinomio
con demasiados términos. Ajustar un modelo incorrecto ocurre si muy pocos términos
son ajustados ó si la verdadera función no puede ser modelada como un polinomio.
2.4.3.3 Errores correlacionados
Zimmerman y Harville (1991) propusieron modelos de campo aleatorio (random field
models) para calcular directamente la variabilidad espacial sistemática.
Este modelo se desarrolló al observar que la heterogeneidad espacial surge de dos
fuentes de dependencia espacial, una dependencia a gran escala o tendencia, la cual
es modelada por la estructura de la media y una dependencia a pequeña escala, la
cual es modelada por la estructura de la correlación espacial. El modelo se basa sobre
la teoría de ciertos procesos estocásticos conocidos como campos aleatorios, y en los
que se toma la estructura de la media como una función lineal de parámetros
desconocidos. En consecuencia, a este modelo se le denomina campo lineal aleatorio
(random fiel linear model), los cuales pueden ser aplicados a distintos fenómenos
espaciales como también a experimentos espaciales (Zimmerman y Harville, 1991). La
mayoría de los modelos espaciales solo incluyen la gran escala (random field) y los
que incluyen solo la pequeña escala se denominan modelo de error correlacionado
(correlated error model) (Ye et al., 2001). Claramente es preferible utilizar la variación a
gran y pequeña escala, para lo cual se puede utilizar una función para calcular la
variación a gran escala y la estructura espacial del error para la pequeña escala
(Brownie et al., 1993).
El modelo de error correlacionado asume que la correlación entre dos términos de error
es grande para las parcelas vecinas y disminuye cuando la distancia entre parcelas
aumenta, lo que implica que las parcelas cercanas son más parecidas a las más
lejanas.
Para estructurar la variación a pequeña escala, primero se obtienen los residuales
desde un diseño completamente al azar (Fórmula [2.23]).
Se asume que este residual posee una covarianza que puede ser modelada
(Zimmerman y Harville, 1991), por ejemplo para un modelo exponencial:
54
[2.27] ( ) ( ) ( )lmijdlmijlmij eCorrCov ,22 ,, θσεεσεε −==
donde d(ij, lm) es la distancia entre parcelas (i, j) y (l, m), y θ es el parámetro a estimar.
Una herramienta utilizada en geoestadística, conocida como semivariograma, es útil
para modelar la estructura de la correlación espacial de los residuales (Journel y
Huijbregts, 1978).
Una vez calculado el variograma experimental es necesaria la elección del mejor
modelo que se ajuste al variograma experimental.
Los parámetros del variograma son utilizados como covarianza para el análisis de la
covarianza (Ye et al., 2001).
Según Gotway et al., (1997) la desventaja de este método es el esfuerzo en el uso de
la computación para los cálculos, el cual no es fácil para experimentos con un gran
número de observaciones, por ejemplo superior a 2000 y según Brownie et al. (1993),
también tiene el inconveniente de elegir adecuadamente la covarianza del error.
2.4.3.4 Análisis de tendencia más error correlacionado
Este modelo surge de la necesidad de modelar la variación en sus dos formas a gran y
pequeña escala (Brownie et al., 1993), ya que la gran escala puede ser modelada por
la estructura de la media como una función polinomial al incorporar la tendencia sobre
el ensayo, y la pequeña escala puede ser modela por la estructura de la correlación
espacial del error (Zimmerman y Harville, 1991).
La variación de este modelo incluye la función polinomial para Ti j y la incorporación de
la covarianza para el término del error εij, este último incluye la correlación entre
parcelas adyacentes.
Para este análisis primero se obtiene los residuales desde un modelo completamente
al azar (Fórmula [2.23]).
Luego se modela el variograma del error, obteniéndose los parámetros de la
covarianza, posteriormente se obtiene la superficie de respuesta con los mismos
criterios utilizados en el análisis de tendencia (Fórmula [2.26]).
Los parámetros del variograma son utilizados como covarianza en el análisis de
covarianza que incluyen este modelo.
55
2.4.3.5 Estimación geoestadística
Hernández y Mulla (2002), propusieron un nuevo método para remover la variabilidad
espacial, mediante el uso de herramientas geoestadísticas como el variograma y el
interpolador kriging sumado al análisis del vecino más cercano (AVMC).
Este método estima la variación espacial mediante le estructura espacial de los
residuales y ajusta los rendimientos mediante la ecuación de kriging.
El uso de AVMC para ajustar los rendimientos por autocorrelación espacial a sido
descrito por varios autores (Wilkinson et al, 1983; Papadakis, 1988; Mulla et al, 1990;
Bhatti et al, 1991; Brownie et al, 1993).
Hernández y Mulla (2002), utilizan AVMC para calcular la verdadera media del
tratamiento mediante el iterativo ajuste de la desviación de las observaciones.
Primero se estandarizan los residuales de cada rendimiento observado sustrayendo la
media de los tratamientos a cada valor de rendimiento observado, este residual
representa una localizada medida de los efectos del espacio sobre el rendimiento:
[2.28] ( )
( )ijt
ijtijij
m
y
yyr
−=
donde ijm r es el residual normalizado en cada localidad, yij es el valor observado de
rendimiento en la posición i y j e ( )ijty es el rendimiento promedio para el tratamiento t.
Luego se obtiene el semivariograma de los residuales normalizados.
La ecuación del kriging ordinario es utilizado para estimar los nuevos residuales ( 0̂r ) de
las observaciones de las parcelas vecinas por medio de la validación cruzada. Este
procedimiento identifica la porción de los residuales debido a un uniforme efecto
espacial localizado. El modelo lineal de la ecuación de kriging es:
[2.29] ∑=
+ =n
hij
mh
m rr1
01 ˆ λ
donde 01r̂m + es el residual estimado para la iteración m + 1, λh es el vector de peso del
kriging ordinario basado en el modelo de variograma y ijm r es el residual normalizado.
56
Una nueva estimación para el rendimiento observado es utilizando la siguiente
ecuación, donde la constante b es típicamente un valor de 0,5, así el procedimiento de
ajuste por la remoción parcial de la tendencia y la oscilación en la media del
tratamiento es pesado (Bhatti et al, 1991).
[2.30] ( )011 ˆ1 rbyy m
ijm
ijm ++ ×−=
donde ijm y1+ es el valor del rendimiento actualizado para la iteración m + 1, ij
m y es el
rendimiento original en la posición i y j, b es una constante y 01r̂m + es el residual
estimado para la iteración m + 1.
Estos valores son utilizados en un proceso iterativo hasta que el umbral del
semivariograma de los rij indique que no existe estructura espacial (efecto nugget
puro).
Estos autores indican que al menos seis iteraciones son necesarias para la
convergencia.
Finalmente, se calcula un mapa de diferencia de rendimientos, por medio de la resta
del rendimiento actualizado con el rendimiento original.
57
3. MATERIALES Y METODOS
3.1 Material experimental
El experimento fue sembrado el 30 de Noviembre de 2001 y consistió en 360 híbridos
de maíz (Zea mays L.). El diseño experimental correspondió a bloques incompletos (α -
lattice), y consistió en 20 bloques incompletos y 18 híbridos por bloque en dos
repeticiones. Los genotipos fueron evaluados bajo condiciones de riego normal y bajo
estrés hídrico, y la unidad experimental correspondió a parcelas de 3,75 m de largo.
Cada parcela se constituyó por dos hileras separadas 0,75 m entre sí y sembradas a
0,12 m sobre la hilera. La superficie total del experimento alcanzó a 12.474 m2. La
fertilización a la siembra fue de 748 kg en una mezcla de 27,5 % N, 16,7 % P2O5 y 10,9
% K2O; en el resto de la temporada se realizó fertirrigación parcializada en 4 – 5
oportunidades hasta floración, aplicándose un total de 300 kg de Supernitro (36 % N).
El riego fue por goteo, frecuencia fija y cantidad variable de acuerdo a los
requerimientos de evapotranspiración del cultivo.
El experimento fue establecido en el Centro de Investigación Viluco (33º 47’ Lat. S., 70º
48’ Long. E., altitud 380 m), perteneciente a Semillas Pioneer Chile Limitada.
La variable a analizar correspondió a rendimiento de grano, la cual al momento de
cosecha, se midió el peso en libras (lb.) y se obtuvo la humedad de cosecha.
Finalmente el rendimiento es expresado en bushel · acre-1 a través de la siguiente
formula:
[3.1] ( ) ( )
××−
pulgadasenparceladeanchopiesenparceladelargo
factorlb.enorendimientcosechadehumedad
815109100
,
3.2 Caracterización y mapeo del sitio experimental
El suelo corresponde a un franco arcilloso de la serie Maipo, ubicado en el valle regado
de la zona central de Chile. El mapeo y muestreo de suelo se realizó el 11 de junio de
2002 una vez cosechado el experimento. Para ello se utilizó el software FarmGPS
(Red Hed Systems, 2000) unido al programa MapInfo (MapInfo Corporation, 1999), con
58
el cual se obtenían las coordenadas geográficas de las muestras y el perímetro. Estos
programas estaban unidos a un receptor GPS (Global Positioning System) con
diferencial (DGPS, modelo Trimble 114), por lo cual los datos se expresaron en el
sistema UTM (Universal Tranverse Mercator), en metros. De esta forma cada muestra
colectada y el perímetro contaban con sus correspondientes coordenadas cartesianas
X e Y, necesarias para el análisis espacial cuantitativo.
Una vez determinado el perímetro, se eligió el método de muestreo, optando por el
método sistemático no alineado proporcionado por el programa FarmGPS. Los puntos
muestreados se tomaron a 20 cm de profundidad y estaba constituido por cinco
submuestras.
Las muestras de suelo fueron extendidas y secadas al aire, posteriormente se realizó
el análisis de las propiedades químicas del suelo, los cuales están estandarizados por
el Servicio Agrícola y Ganadero (SAG) y son los comúnmente utilizados en la mayoría
de los laboratorios del país (Ortega y Flores, 1999):
• pH: al agua, en relación suelo: agua 1:2,5.
• CE: al agua, en relación suelo: agua 1:2,5.
• Materia Orgánica: Método de Walkley y Black o reducción del dicromato de
potasio (K2Cr2O7).
• Nitrógeno (N) disponible: Determinación de NO3 –N + NH4 –N. Suelos se
extraen con cloruro de potasio (KCl) 2M.
• Fósforo (P) Olsen: Suelos se extraen con bicarbonato de sodio (NaHCO3) 0,5
M, pH 8,5.
• Potasio (K) extractable: Extracción con acetato de amonio (NH4OAC) 1M, pH 7,
por 5 minutos.
• Calcio (Ca), magnesio (Mg) y sodio (Na) de intercambio: Extracción con acetato
de amonio (NH4OAC) 1M, pH 7, por 30 minutos.
Respecto de las unidades más comunes en que se expresa el análisis de suelo, tanto
N disponible, P Olsen y el K extractable se expresan en partes por millón (ppm) o mg ·
kg-1 de suelo. Los cationes de intercambio (Ca, Mg, Na y K) normalmente se expresan
en meq · 100g-1 suelo o más reciente en Cmol (+) · kg-1 de suelo, siendo estas
unidades equivalentes (Ortega y Flores, 1999).
59
La información generada fue sometida a distintos procedimientos analíticos, como se
describen a continuación.
3.3 Análisis estadístico
Los parámetros de los estadísticos descriptivos de las propiedades químicas del suelo
y del rendimiento de grano fueron calculados utilizando el procedimiento PROC
UNIVARIATE en SAS (SAS Institute, 2001).
El análisis de correlación fue utilizado para determinar la relación entre el rendimiento
de grano y las propiedades de suelo medidas, estas se calcularon utilizando el
procedimiento PROC CORR en SAS, con la información obtenida de la interpolación
de los mapas de las propiedades químicas del suelo con el mapa de rendimiento.
Para probar el supuesto de varianza homogénea se utilizó la prueba de F en la relación
de variación (variance ratio F test) la cual se describe como:
[3.2] ( )( )11.., minmax2min
2max −−== nnlg
S
SF
donde 2maxS corresponde a la varianza de mayor valor calculado de todas las muestras,
2minS Corresponde a la varianza de menor valor calculado de todas las muestras, maxn y
minn corresponde al número de observaciones asociado a cada varianza. La hipótesis
nula corresponde a que no existe diferencia entre las varianzas de las muestras.
La prueba de normalidad de los residuales se realizó con el estadístico W de la prueba
Shapiro – Wilk, propuesta por Shapiro y Wilk (1965), utilizada cuando el número de
observaciones es menor a 2000. La hipótesis nula corresponde a que los datos se
distribuyen normalmente. El cálculo se realizó en SAS con el procedimiento PROC
UNIVARIATE.
Para probar el supuesto de independencia de los residuales, se obtuvieron los
variogramas de los residuales con la sentencia VARIOGRM de la librería espacial
(Davis y Reich, 2000) en S-PLUS (Statistical Sciences, 1994), los cuales debieran
mostrar un efecto de nugget puro para demostrar que no son espacialmente
dependientes.
60
El análisis de varianza fue realizado para evaluar y modelar la respuesta de los
rendimientos con los distintos métodos de bloque o remoción de la autocorrelación en
SAS utilizando el procedimiento PROC GLM. Para los análisis de varianza de los
diseños bloques completos al azar y α - lattice se utilizó el software LATANOVA
(Barreto et al., 1997).
Para comparar la ganancia en la reducción del Cuadrado Medio del Error (CME) con
respecto a los diseños BCA y α - lattice, y también para determinar la selección de un
diseño, modelo o zona, se utilizó la eficiencia relativa (ER) propuesta por Fisher (1925)
y utilizada por Cochran y Cox (1950), y Kirk et al. (1980):
[3.3] ( ) ( )( )( )( ) 2
112
22212
221 31
31Snn
SnnSarespectoconSER
++++
=
donde 21S y 2
2S corresponden a los cuadrados medios del error de los dos diseños a
comparar, n1 y n2 son los grados de libertad asociados a 21S y 2
2S respectivamente.
Un segundo método para determinar la eficiencia o selección de un diseño, modelo o
zona, se utilizó la prueba de falta de ajuste (lack of fit test), para determinar la falta de
ajuste del uso del diseño experimental inicialmente utilizado con respecto al diseño o
modelo propuesto, esta prueba fue originalmente descrito para ajustar una regresión
lineal y consiste en dividir la suma de cuadrados del error en dos componentes, la
suma de cuadrados del error puro (SCep) y la suma de cuadrados del error asociados a
la falta de ajuste (SCfda) (Bhattacharyya y Johnson, 1977):
[3.4]
( )( )
( )
( )( )knklg
kn
SCk
SCSCE
CMCM
Fep
ep
ep
fda −−=
−
−
−
== 2..,2
donde CMfda corresponde el CME debido a la falta de ajuste, CMep es el cuadrado
medio del error debido al error puro, SCE es la suma de cuadrados del error, k − 2 son
los grados de libertad asociados a SCfda y n − k son los grados de libertad asociados a
SCep, donde n es el número total de observaciones y k son los distintos niveles de la
variable independiente incluida en el experimento.
61
Para ser utilizada en la comparación de diseños, métodos y zonas, bajo la hipótesis
nula que no existe diferencia entre el modelo originalmente descrito y el propuesto, la
SCE se asoció a la suma de cuadrados de un diseño bloques completos al azar, SCep
a la suma de cuadrados del diseño a ser comparado (SCdiseño), k − 2 a la diferencia de
los grados de libertad asociados a SCE y SCdiseño, y n − k a los grados de libertad
asociados al cuadrado medio del error del diseño a ser comparado:
[3.5]
( )( )( )comparadodiseñodelCMElgdediferencialg
CMElgdediferencia
SCSCE
Fdiseño
diseñoCA
....,.. =
−
=
3.4 Análisis estadístico utilizando modelos espaciales
Para los distintos análisis los rendimientos de grano fueron dispuestos en filas y
columnas, y los modelos asociados a un diseño experimental completamente al azar.
En el método de Papadakis, se obtuvieron los residuales del análisis de varianza
utilizando un diseño experimental completamente al azar, según la fórmula:
[3.6] iijij yyr −=
donde rij es el residual del rendimiento de la parcela i bajo el tratamiento j, yij es el
rendimiento observado de la parcela i, bajo el tratamiento j e iy es el promedio del
tratamiento asociado a la parcela i.
La covariable se obtuvo del promedio de los residuales de las cuatro parcelas vecinas
dispuestas horizontal y verticalmente, recomendado por Pearce y Moore (1976),
llamadas izquierda (left), derecha (right), arriba (top) y abajo (bott), con la siguiente
fórmula:
[3.7] ( )botttoprightleftCov +++=41
donde Cov es la covariable de los valores ubicado a la derecha, izquierda, arriba y
abajo del residual del rendimiento a ajustar.
62
Para el análisis de varianza se desarrollo una sentencia para ser calculada con el
procedimiento PROC GLM3 en SAS.
En el método de análisis de tendencia (AT) se eligió un polinomio que representa la
superficie de respuesta de los residuales obtenidos del análisis de varianza utilizando
un diseño experimental completamente al azar. Para el cálculo del polinomio se utilizó
la sentencia TRENDLS de la librería espacial en S-PLUS, seleccionándose aquel con
un valor inferior del Akaike Information Criteria (AIC) (Akaike, 1973), según la formula:
[3.8] ( ) ( )( )parámetrosdeNlikelihoodmaximumtudverosimili máximaA º2ln2 ×+−=
y es estimada por:
[3.9] ( ) pRnA 2lnˆ += ,
donde n es el número de observaciones, R es el residual y p es el número de
parámetros estimados. El modelo que presente menor AIC es el seleccionado.
El análisis de varianza se calculó usando PROC GLM en SAS.
Para el análisis de errores correlacionados (EC), se obtuvieron los residuales del
análisis de varianza utilizando un diseño experimental completamente al azar.
Se utilizó la sentencia VARIOGRM en S-PLUS para ajustar el variograma experimental
del error y obtener los valores de umbral, nugget y rango, los cuales son utilizados
como covarianza, el cálculo del análisis de varianza se realizó con el procedimiento
PROC MIXED en SAS.
Para el análisis de AT + EC, se utilizó el polinomio seleccionado para el método de AT
y los valores de umbral, nugget y rango del variograma de los residuales adoptado
para EC, bajo los mismos criterios anteriormente descritos.
Para el análisis de varianza se utilizó el procedimiento PROC MIXED en SAS.
3 Los procedimientos SAS de los distintos modelos se presentan en el anexo C, en el cual se incluyen los procedimientos SAS para el análisis de las zonas incorporadas al diseño experimental.
63
3.5 Análisis geoestadístico
Para mapear adecuadamente la variabilidad espacial de cualquier variable de interés,
es necesario que ésta exhiba dependencia espacial o autocorrelación, para su
posterior interpolación.
La teoría de la variable regionalizada asume estacionaridad de los datos, sin embargo,
tendencias a gran escala en la variable espacial pueden permitir que no se cumpla el
supuesto de estacionaridad. Para revelar y eliminar la tendencia se utilizó un modelo
lineal de análisis de tendencia de acuerdo a la siguiente formula:
[3.10] ( ) ii sCoordenaday εβα ++=
donde yi es la variable de interés en la posición i, á es el intercepto y â es la pendiente
del modelo de regresión de la variable de interés, los cuales son dependientes de las
coordenadas utilizadas, y åi es el residual de la variable en la posición i. Cuando la
tendencia lineal fue significativa (P � 0,05) los variogramas fueron calculados sobre los
residuales åi proveniente del análisis de tendencia; si no era significativa, los
variogramas fueron calculados directamente con los datos de la variable de interés.
La dependencia espacial de las propiedades químicas del suelo y los rendimientos se
evaluó por medio de variogramas con la sentencia VARIOGRM de la librería espacial
en S-PLUS.
Una vez calculado el variograma experimental es necesario la elección del mejor
modelo (Exponencial, Gausiano, Esférico, entre otros) que se ajuste al variograma
experimental, la elección se realizó por medio de comparación, seleccionando el
modelo que arrojara un menor valor de AIC, según lo sugerido por McBratney Webster
(1986).
Para la interpolación de las variables se evaluaron distintos métodos de interpolación,
eligiéndose el método que entregara un R2 mayor, los métodos utilizados fueron:
• Distancia inversa.
• Kriging puntual.
• Curvatura mínima.
• Método modificado de Shepard.
64
• Vecino natural.
• Regresión polinómica.
• Función de base radial.
• Triangulación con interpolación lineal.
Los cálculos de R2 se realizaron con los residuales entregados por SURFER y se
calculó con la siguiente fórmula:
[3.11] SCT
SCER
−= 12
[3.12] ( )∑ −= 2ˆ ii yySCE
[3.13] ( )
∑ ∑
−=
n
yySCT i
i
2
2
Donde SCE es la suma de cuadrados del error, SCT es la suma de cuadrados totales,
yi es el valor observado, �i es el estimado en el punto i y n es el número de
observaciones. Un valor cercano a 1, es el interpolador que mejor ajusta la estimación.
3.6 Análisis estadístico utilizando diseños experimentales asociados a zonas
La determinación de las zonas se realizó mediante el análisis de agrupamiento (cluster
analysis)4 en MapCalc (Red Hed Systems, 1999), en la cual se incorporaron nueve
variables a ser analizadas. Para evitar la diferencia en la magnitud de los valores de las
distintas propiedades, fue necesario estandarizar los valores interpolados por medio de
la fórmula:
[3.14] ( )
σ
µ−= iy
z
donde z es el valor de la variable estandarizada, yi es el valor observado, µ es la media
de la muestra y σ es la desviación estándar de la muestra.
4 Mayor detalle del procedimiento de análisis de cluster utilizado por MapCalc se presenta en el anexo D.
65
Los mapas de las zonas se exportaron como mapa de contorno (contour map) a
MapInfo, en el cual se interpolaron con los datos de rendimientos para obtener los
híbridos que integran una zona específica.
La selección del número óptimo de zonas se realizó mediante el siguiente
procedimiento5:
(1) Se comparó la eficiencia relativa de las zonas con respecto a los diseños
experimentales, eligiendo el número de zonas que presentara una eficiencia
relativa sobre uno y fuese mayor al de las otras zonas.
(2) Se observó la prueba de falta de ajuste para determinar bajo la hipótesis nula
de que no existe diferencia entre el diseño originalmente descrito y el
propuesto, la cual tiene que ser significativa.
(3) Si se cumplen estos requisitos se selecciona el correspondiente número de
zonas.
Para obtener los análisis de varianza utilizando los diseños experimentales bloques
completos al azar y á – lattice asociados a las zonas, se utilizó el procedimiento PROC
GLM en SAS, en el cual las zonas se ingresaron como variables clasificatorias según
los siguientes modelos:
Bloques completos al azar:
[3.15] ( ) ijkkijjiijk HZZHy εβµ +++++=
donde ijky es el valor de la unidad experimental del híbrido i en la zona j en el bloque k,
µ representa la media poblacional, iH es el efecto del nivel i del factor híbrido, jZ es el
efecto del nivel j del factor zona, ( )ijHZ es el efecto de la interacción entre los niveles i j
de los factores híbrido y zona, βk es el efecto del bloque k y ijkε representa la
5 Mayor detalle de las zonas seleccionadas y las tablas originales de eficiencia relativa y prueba de falta de ajuste, se presentan en el anexo E.
66
desviación aleatoria de la unidad experimental sometida al híbrido i en la zona j en el
bloque k, con ε ~ NID (0, σ2)
á – lattice:
[3.16] ( ) ijkllkijjiijkl rHZZHy εβµ ++++++=
donde ijkly es el valor de la unidad experimental del híbrido i en la zona j en el bloque k
en la repetición l, µ representa la media poblacional, iH es el efecto del nivel i del factor
híbrido, jZ es el efecto del nivel j del factor zona, ( )ijHZ es el efecto de la interacción
entre los niveles i j de los factores híbrido y zona, βk es el efecto del bloque k, rk es el
efecto de la repetición l y ijklε representa la desviación aleatoria de la unidad
experimental sometida al híbrido i en la zona j en el bloque k en la repetición l, con ε ~
NID (0, σ2)
67
4. DISCUSION DE RESULTADOS
Análisis estadístico
El Cuadro 4.1 presenta los parámetros de los estadísticos descriptivos de las distintas
propiedades químicas de las muestras de suelo y del rendimiento de grano de maíz,
ubicados en los experimentos de riego normal y estrés hídrico.
Cuadro 4.1. Estadísticas básicas de las distintas variables medidas bajo los distintos
experimentos.
Variable Estrés hídrico Riego normalMedia Desv. Est. CV Media Desv. Est. CV
CE (dS � cm-1) 158,10 21,92 13,87 158,39 25,51 16,11
Ca (meq � 100g-1) 3968,08 223,30 5,63 4044 199,42 4,93K (mg � kg-1) 192,73 38,80 20,13 202,17 25,07 12,40Mg (meq � 100g-1) 139,62 8,59 6,15 154,33 16,21 10,50MO (%) 1,54 0,15 9,59 1,60 0,28 17,70N (mg � kg -1) 18,42 23,25 126,21 12,35 3,22 26,07Na (meq � 100g-1) 91,25 25,05 27,45 73,69 12,53 17NH4
+ (mg � kg-1) 1,95 2,71 138,88 1,69 1,19 70,50
NO3- (mg � kg -1) 16,47 20,61 125,17 10,66 3,12 29,27
P (mg � kg-1) 10,83 3,84 35,43 16,42 6,91 42,08pH (1:2,5) 8,21 0,24 2,94 8,27 0,25 2,99Rendimiento (kg � ha-1) 132,57 45,90 34,62 226,17 19,09 8,44
Según el Cuadro 4.1, al comparar el coeficiente de variación (CV) de las diferentes
variables ubicadas en ambos experimentos, se observó que calcio (Ca), conductividad
eléctrica (CE), fósforo (P) y pH no presentaron diferencias en el CV, sin embargo bajo
el experimento de estrés hídrico la mayor parte de las variables estudiadas mostraron
un CV mayor, lo que implica que el sistema de riego afectó la variabilidad de las
propiedades químicas del suelo o redujo su impacto sobre la productividad del maíz.
El coeficiente de correlación de Pearson entre las propiedades del suelo y el
rendimiento de grano de maíz es presentado en el Cuadro 4.2.
68
Cuadro 4.2. Coeficiente de correlación de Pearson entre el rendimiento de granos de
maíz y las propiedades químicas del suelo.
Variable Estrés hídrico Riego normaln = 720 RendimientoP (mg � kg-1) 0,07 -0,07pH (1:2,5) 0,24** 0,16**CE (dS � cm-1) -0,05 -0,05MO (%) 0,01 -0,05NH4
+ (mg � kg-1) -0,11** -0,11**NO3
- (mg � kg-1) -0,10** -0,09*
N (mg � kg-1) -0,10** -0,13**K (mg � kg-1) 0,02 0,10**Na (meq � 100g-1) -0,11** -0,21**Ca (meq � 100g-1) 0,14** -0,03Mg (meq � 100g-1) 0,03 -0,10**
EXPERIMENTO
** P � 0,01, * P � 0,05
En el Cuadro 4.2, se puede observar que el rendimiento de grano de maíz tiene una
correlación positiva o negativa con la mayoría de las variables bajo los dos
experimentos, excepto P, CE y materia orgánica (MO) los cuales no mostraron
evidencia estadística significativa de correlación con el rendimiento. Estos resultados
demuestran que las propiedades químicas del suelo afectan al rendimiento, lo cual
también es afirmado por Trangmar et al., 1987; Camberdella et al., 1994 y Ortega et
al., 1999. Esta correlación significativa es importante para cualquier programa de
mejoramiento ya que según Ball et al., (1993), uno de los objetivos principales de los
programas de mejoramiento genético es incrementar el rendimiento y la estabilidad del
mismo. Por otra parte, de acuerdo a Stroup et al., (1994) y Wu y Dutilleul (1999), una
precisa evaluación de cultivares y la capacidad de diferenciar entre cultivares es un
punto crítico para cualquier programa de mejoramiento y como se ha visto, la
heterogeneidad espacial, incluyendo la variabilidad del suelo, es una de las mayores
fuentes de variación que aumenta el error experimental (van Es y van Es, 1993; Mulla
et al., 1990; Bhatti et al., 1991; van Es et al., 1989; Fagroud y Van Meirvenne, 2002).
Las Figuras 4.1 y 4.2 muestran la distribución espacial del rendimiento de grano de
maíz bajo el experimento de estrés hídrico y riego normal.
69
Figura 4.1. Distribución espacial de los rendimientos de grano de maíz bajo el
experimento de estrés hídrico.
En las Figuras 4.1 y 4.2, se puede apreciar que bajo el experimento de estrés hídrico la
respuesta del rendimiento tuvo mayor variabilidad espacial comparada con el
experimento bajo riego normal.
Figura 4.2. Distribución espacial de los rendimientos de grano de maíz bajo el
experimento de riego normal.
70
En la comprobación de supuestos del ANDEVA, para el caso en que los residuales se
distribuyen normalmente con µ igual a 0 y varianza igual a σ2, el Cuadro 4.3 muestra
que en los distintos diseños y bajo los distintos experimentos, la prueba de normalidad
Shapiro - Wilk no fue significativa al 5%, por lo que se acepta la hipótesis nula de
distribución normal de los residuales de los distintos diseños.
Cuadro 4.3. Probabilidad y valor del estadístico W de la prueba Shapiro - Wilk de los
residuales de los distintos diseños bajos los distintos experimentos.
Estadístico BCA � - lattice BCA � - latticeW 0,99 0,99 0,99 0,99Pr < W 0,56 0,29 0,71 0,19
Estrés hídrico Riego normal
En el caso del supuesto de varianza constante el Cuadro 4.4 muestra que el valor del
estadístico F es significativo al 0,1% y 1% en el experimento de estrés hídrico y riego
normal respectivamente, rechazando la hipótesis nula de igualdad de varianza, con lo
que el supuesto no se cumple; sin embargo, según Mitchell (1995), si el supuesto de
varianza constante no se cumple, no tiene mayor implicancia si las muestran poseen el
mismo número de observaciones. Sin embargo, el procedimiento del análisis es
robusto en el caso de una pequeña o moderada falla de normalidad y varianza
constante, por lo que el desempeño del análisis no se ve seriamente afectado
(Bhattacharyya y Johnson, 1977).
Cuadro 4.4. Prueba de F en la relación de variación, de los distintos experimentos
Experimento Valor de FEstrés hídrico 4068211,83***Riego normal 223998,88**
Significativo al nivel de *** α = 0,001 y ** 0,01
Para el caso del supuesto en que los errores son independientes, según Steel y Torrie
(1960) y, Cochran y Cox (1950), es conocido por los estadísticos que en los
experimentos de campo la respuesta de los cultivos de las parcelas adyacentes
tienden a ser similares entre sí, por lo que el resultado del análisis puede ser mal
interpretado. Kempthorne (1952), propuso que los tratamientos sean asignados
71
aleatoriamente a las unidades experimentales y que el orden de las observaciones sea
determinado de forma aleatoria, con lo cual se logra la independencia de los errores.
El Cuadro 4.5 muestra los parámetros de un modelo de variograma esférico de los
residuales de los distintos diseños en los distintos experimentos.
Cuadro 4.5. Parámetros de un variograma esférico de los residuales de los distintos
diseños y experimentos.
Al observar el Cuadro 4.5, los valores del umbral de los distintos variogramas son
cercanos al valor de la varianza de los residuales, lo que concuerda con Mcbratney y
Webster (1986), Trangmar et al. (1985), Trangmar et al. (1987) y Yost et al. (1982), los
que indican que el valor del umbral se aproxima al valor de la varianza de los datos.
Los valores de rango en el experimento de estrés hídrico para BCA (9,52 m), α - lattice
(6,17 m) y en el experimento de riego normal para BCA (8,75 m) y α - lattice (9,18 m),
sumado a las Figuras 4.3 y 4.4 de los variogramas de los residuales, indican que los
residuales presentan una dependencia espacial bajo un cierto rango, implicando que
los errores no son independientes; esto concuerda con Kirk et al. (1980), los que
afirman que la heterogeneidad del suelo no sólo incrementa el error experimental, si
no que además afecta la independencia de las observaciones, las cuales han sido
consideradas independientes. Esta dependencia espacial se puede explicar por la
heterogeneidad espacial presente y su correlación con el rendimiento, lo que coincide
con Fagroud y Van Meirvenne (2002) y Mulla et al. (1990), en que la naturaleza de esta
heterogeneidad es tal que existe una apreciable correlación entre unidades vecinas,
por lo que el supuesto de errores independientes no se cumple.
Varianza VarianzaDiseño Rango Nugget Umbral Residuales Rango Nugget Umbral ResidualesExperimental (m) (unidades)2 (unidades)2 (unidades)2 (m) (unidades)2 (unidades)2 (unidades)2
BCA 9,52 415,13 703,24 704 8,75 68,31 98,42 99,09� - Lattice 6,17 293,76 413,48 419,19 9,18 59,96 83,47 83,12
Parámetros del variogramaRiego Normal
Parámetros del variogramaEstrés Hídrico
72
Figura 4.3. Variograma de los residuales de los diseños BCA y α - lattice bajo el
experimento de estrés hídrico.
Figura 4.4. Variograma de los residuales de los diseños BCA y α - lattice bajo el
experimento de riego normal.
En un programa de mejoramiento genético, la violación de los supuestos del análisis de
varianza es importante, ya que según Steel y Torrie (1960), esto puede afectar el nivel
de significancia y sensibilidad de la prueba de F, por lo que es una correspondiente
perdida en la precisión en la estimación obtenida para el efecto de los tratamientos. Por
otra parte y desde el punto de vista de la información entregada por estos datos, según
Davis y Reich (2000), estas observaciones entregan menos información que una
observación independiente, por lo que el aumento en el número de puntos
73
muestreados entrega poca o ninguna información adicional en contraste con una
observación independiente.
Los Cuadros 4.6 y 4.7, presentan los análisis de varianza (ANDEVA) del rendimiento
de grano de maíz bajo condiciones de estrés hídrico utilizando los diseños bloques
completos al azar (BCA) y α - lattice.
Cuadro 4.6. ANDEVA del rendimiento de grano de maíz bajo el experimento de estrés
hídrico utilizando un diseño de BCA.
FV gl SC SCM F R²Modelo 360 1010720,66 2807,55 1,99*** 0,66Híbrido 359 837478,23 2332,81 1,65***Bloque 1 173242,43 173242,43 122,87***Error 359 506176,52 1409,96
Total 719 1516897,18 Significativo al nivel de *** α = 0,001
Cuadro 4.7. ANDEVA del rendimiento de grano de maíz bajo el experimento estrés
hídrico utilizando un diseño α - lattice.
FV gl SC SCM F R²Modelo 398 1215496,68 3054,01 3,25*** 0,8Híbrido 359 655886,90 1826,98 1,95***Súper bloque 1 173242,43 173242,43 184,51***Bloque Incompleto 38 204777,96 5388,89 5,74***Error 321 301398,64 938,94
Total 719 1516897,31 Significativo al nivel de *** α = 0,001
El valor de R2 representa la proporción de la variabilidad explicada por las variables
independientes del modelo, por lo que se puede explicar la variación en el rendimiento
aproximadamente en un 66% para el diseño de BCA y un 80% para el diseño de α -
lattice, debido a la elección del respectivo diseño, es evidente que el diseño de α -
lattice explica en mayor proporción la variación del rendimiento.
74
El valor del estadístico F del modelo para BCA (1,99) y α - lattice (3,25), significativo al
0,01%, indican que el modelo asociado al diseño experimental, explica una proporción
significativa de la variación presente en la variable dependiente (Híbrido).
Al observar los valores del estadístico F de la variable híbrido para BCA (1,65) y α -
lattice (1,95), los cuales son significativos al 0,01%, indican que alguna diferencia entre
las medias de los híbridos es diferente de cero, pero no revela ninguna información
sobre la naturaleza de esta diferencia.
El valor del estadístico F significativo al 0,01%, de los bloques (122,87) para el diseño
BCA, súper bloque (184,51) y bloque incompleto (5,74) para el diseño de α - lattice,
demuestra que el sistema de bloqueo fue el adecuado para ambos diseños.
Debido al mayor valor de R2 y sumado a la ganancia del estadístico F de las variables
modelo, híbrido y sistema de bloqueo, revelan que el diseño de α - lattice controla de
mejor manera la variabilidad del rendimiento y explica de mejor manera la variación en
el rendimiento, además, este último diseño presento un SCM del Error inferior, lo que
sugiere que es más adecuado que el análisis BCA bajo las condiciones del
experimento, lo cual puede observarse en el valor de la ER mayor a uno del Cuadro
4.10 del diseño de α - lattice con respecto al diseño de BCA. Los Cuadros 4.8 y 4.9
muestran los ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando los diseños BCA y α - lattice.
Cuadro 4.8. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando un diseño BCA
FV gl SC SCM F R²Modelo 360 190792,02 529,98 2,67*** 0,73Híbrido 359 190642,78 531,04 2,68***Bloque 1 149,24 149,24 0,75Error 359 71243,19 198,45
Total 719 262035,21 Significativo al nivel de *** α = 0,001
75
Cuadro 4.9. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando un diseño α - lattice.
FV gl SC SCM F R²Modelo 398 202275,21 508,23 2,73*** 0,77Híbrido 359 180863,16 503,80 2,71***Súper bloque 1 149,26 149,26 0,8Bloque Incompleto 38 11483,43 302,20 1,62*Error 321 59760,40 186,17
Total 719 262035,61 Significativo al nivel de *** α = 0,001, * α = 0,05
El valor de R2 indica que aproximadamente en un 73%, para el diseño BCA y en un
77%, para el diseño de α - lattice, se explica la variación en el rendimiento debido a las
variables independientes del modelo.
El valor del estadístico F del modelo para BCA (2,67) y α - lattice (2,73), significativo al
0,01%, indican que el modelo asociado al diseño experimental, explica una proporción
significativa de la variación presente en la variable híbrido.
Al observar el valor del estadístico F de la variable híbrido para BCA (2,68) y α - lattice
(2,71), los que son significativos al 0,01%, indican que existe diferencia entre las
medias de los híbridos.
El valor del estadístico F no significativo de los bloques (0,75), para el diseño BCA,
sugiere que este diseño no es el adecuado para este experimento. Para el diseño de α
- lattice, el bloque incompleto (5,74) es significativo al 5%, lo que demuestra que el
sistema de bloqueo para este diseño fue apropiado y el uso del diseño α - lattice es
adecuado para el experimento de riego normal. Por otro lado, el valor del estadístico F
para el súper bloque (0,8) no fue significativo; este resultado era lo esperado, ya que el
súper bloque asemeja el sistema de bloques de un diseño de BCA, el cual demostró
ser ineficiente en controlar la variabilidad espacial.
La elección de un diseño de α - lattice fue la adecuada para los experimentos estrés
hídrico y riego normal debido a la alta proporción explicada en el valor de R2, como
también a la ganancia en términos de F y al eficiente sistema de bloqueo, comparado
con el diseño de BCA, esto confirma lo sostenido por Pearce (1998), en que el uso de
un adecuado diseño experimental tiene una marcada ganancia en el valor de F y es
suficiente para controlar la variabilidad espacial existente, lo cual puede observarse en
76
el valor de la ER mayor a uno del Cuadro 4.10 del diseño de α - lattice con respecto al
diseño de BCA.
Cuadro 4.10. Eficiencia relativa del diseño de α - lattice comparado con el diseño de
BCA bajo los distintos experimentos.
Estrés hídrico Riego normal
Diseño experimental BCA BCA� - lattice 1,50 1,07
Eficiencia relativa
La desigualdad en el CV bajo los distintos experimentos también implica que aún
cuando el sistema de bloqueo fue efectivo en el experimento bajo estrés hídrico, la
variabilidad sistemática presente en el campo impidió un adecuado control de la
variación de la variable de respuesta en el ANDEVA, lo cual también es afirmado por
Tamura et al. (1988) y Amaro y Cobo (1994), quienes aseveran que si bien los
sistemas de bloqueos son efectivos en el control de la variabilidad espacial, estos no
son efectivos si la variabilidad es sistemática a través del campo, por lo que estos
sistemas de bloqueos son ineficientes. Esta afirmación indica la presencia de una
correlación positiva o negativa de las propiedades del suelo con los rendimientos.
Para un programa de mejoramiento genético, los distintos cuadrados medio del error
(CME) del experimento de estrés hídrico poseen implicancias significativas al momento
de seleccionar individuos. En efecto, al ser superior el valor del estadístico F bajo el
experimento de riego normal, es posible que el uso de métodos de comparación
múltiple de medias detecten diferencias significativas entre la media de los híbridos. Al
respecto Brownie et al. (1993), Wu y Dutilleul (1999), y van Es y van Es (1993) indican
que la imposibilidad de controlar la heterogeneidad espacial, produce una variabilidad
indeseada entre los rendimientos de las parcelas, lo que disminuye la estimación de los
efectos de los distintos tratamientos, ya que el error experimental es incrementado
invalidando el análisis de varianza.
77
Análisis estadístico utilizando modelos espaciales
Previo a los resultados de este análisis, es importante indicar que los modelos
espaciales se calculan en base a los datos obtenidos del diseño utilizado en la
conducción del experimento, con lo cual el utilizar los modelos espaciales podría
aumentar la eficiencia del diseño. Sin embargo, no es posible utilizar los modelos
espaciales en ausencia de diseños experimentales.
Cuadro 4.11. Estadísticas descriptivas, estadístico W, modelo y parámetros del
variograma de los residuales de los distintos modelos espaciales, bajo el experimento
de estrés hídrico.
Varianza Media Prueba Modelo Modelo Rango Nugget Umbral Residuales Residuales NormalidadEspacial Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)Papadakis Esférico 8,71 313,54 395,97 402,08 0 0,99 nsAT Esférico 15,98 386,12 749,65 738,83 0 0,99 nsEC Esférico 12,05 430,16 764,21 944,95 0 0,99 nsAT + EC Esférico 11,06 433,23 740,95 733,78 0 0,99 ns
Parámetros del variograma
AT = análisis de tendencia, EC = error correlacionado, ns = no significativo
Cuadro 4.12. Estadísticas descriptivas, estadístico W, modelo y parámetros del
variograma de los residuales de los distintos modelos espaciales, bajo experimento de
riego normal.
Varianza Media Prueba Modelo Modelo Rango Nugget Umbral Residuales Residuales NormalidadEspacial Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)Papadakis Esférico 6,87 66,86 82,11 82,05 0 0,99 nsAT Esférico 8,52 67,03 94,96 94,57 0 0,99 nsEC Esférico 8,75 68,23 97,99 99,29 0 0,99 nsAT + EC Esférico 8,99 67,77 98,57 98,09 0 0,99 ns
Parámetros del variograma
AT = análisis de tendencia, EC = error correlacionado, ns = no significativo
De acuerdo a los Cuadros 4.11 y 4.12, los residuales de los modelos espaciales
cumplen con el supuesto de distribución con medio igual a cero y varianza ó². Los
valores de la prueba Shapiro – Wilk no son significativos al 5%, con lo cual no se
rechaza la hipótesis nula de normalidad, cumpliendo con el supuesto de distribución
normal. Sin embargo, los valores de rango varían entre 8,71 y 15,98 en el experimento
de estrés hídrico y entre 6,87 y 8,99, en el experimento de riego normal, lo que implica
78
dependencia espacial bajo el rango determinado, como se puede observar en las
Figuras 4.5 y 4.6, con lo cual el supuesto de independencia no se cumple.
Figura 4.5. Variogramas de los residuales después de remover la variabilidad espacial,
por medio del uso de modelos espaciales, en el experimento de estrés hídrico.
Figura 4.6. Variogramas de los residuales después de remover la variabilidad espacial,
por medio del uso de modelos espaciales, en el experimento de riego normal.
79
Los Cuadros 4.13 y 4.14, entregan la comparación de distintos diseños experimentales
y distintos modelos de remoción de la variabilidad espacial, comparándose el valor de
F y el CME. El Cuadro 4.15 muestra la ER de los modelos espaciales utilizando los
datos de un diseño α - lattice, comparado con los diseños experimentales BCA y α -
lattice, en los distintos experimentos.
Cuadro 4.13. ANDEVA del rendimiento de grano de maíz bajo el experimento de
estrés hídrico utilizando distintos diseños experimentales y modelos espaciales.
ANDEVA BCA � - lattice Papadakis AT EC AT + ECF Híbrido 1,65*** 1,95*** 2,04*** 1,61*** 3,05*** 3,10***CME 1409,96 938,94 805,28 1479,71 944,95 733,78
DISEÑO EXPERIMENTAL MODELO ESPACIAL
Significativo al nivel de *** α = 0,001, AT = análisis de tendencia, EC = error
correlacionado
Cuadro 4.14. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando distintos diseños experimentales y modelos espaciales.
ANDEVA BCA � - lattice Papadakis AT EC AT + ECF Híbrido 2,68*** 2,71*** 3,04*** 2,82*** 5,31*** 5,27***CME 198,45 186,17 164,32 189,40 99,29 98,09
MODELO ESPACIALDISEÑO EXPERIMENTAL
Significativo al nivel de *** α = 0,001, AT = análisis de tendencia, EC = error
correlacionado
Cuadro 4.15. Eficiencia relativa de los modelos espaciales con respectos a los diseños
experimentales y los distintos experimentos.
Modelo espacial BCA � - lattice Modelo espacial BCA � - latticePapadakis 1,75 1,17 Papadakis 1,21 1,13AT 0,95 0,63 AT 1,05 0,98EC 2,53 1,68 EC 2,11 1,98AT + EC 2,53 1,68 AT + EC 2,11 1,98
Estrés hídrico Riego normalDiseño experimental Diseño experimental
AT = análisis de tendencia, EC = error correlacionado
Como se aprecia en los Cuadros 4.13 y 4.14, para el experimento de estrés hídrico, la
utilización de modelos espaciales como el método de Papadakis, error correlacionado
80
(EC) y análisis de tendencia (AT) más EC con los datos de un diseño α - lattice,
tuvieron una significativa ganancia sobre el valor de F y una disminución del CME
comparado al de los diseños experimentales, no observándose ningún beneficio
derivado del uso del método AT.
Para el caso del experimento de riego normal, la utilización de los modelos espaciales
Papadakis, EC y AT más EC con los datos de un diseño α - lattice, tuvieron una
significativa ganancia sobre el valor de F y una disminución del CME comparado al de
los diseños experimentales. El método de AT alcanzó un valor de F mayor al de los
diseños experimentales, disminuyo el valor del CME comparado con el de BCA, pero
no se obtuvo una ganancia en la disminución del CME comparado con el diseño α -
lattice.
Según el Cuadro 4.15, bajo los experimentos de riego normal y estrés hídrico los
modelos espaciales utilizando los datos de un diseño α - lattice, presentaron una ER
superiores al de los diseños BCA y α - lattice. Sin embargo la diferencia en ER de los
modelos espaciales es superior en un diseño de BCA en contraste con un diseño de α
- lattice, debido a que el uso de bloques completos no es el adecuado para controlar la
variabilidad espacial en estos experimentos. El uso de AT, bajo el experimento de riego
normal no alcanzó una eficiencia superior a ningún diseño, y en estrés hídrico sólo
obtuvo una eficiencia mayor al diseño de BCA.
El uso del método de Papadakis, implica la determinación del número óptimo de
parcelas vecinas como covariables y el número de covariables. No obstante, un estudio
de Pearce y Moore (1976), en que probaron distintos números de parcelas vecinas y
número de covariables, concluyeron que con el uso de cuatro parcelas vecinas se
obtienen resultados superiores al uso de dos parcelas o dos covariables en el análisis.
Sin embargo, no es un objetivo de esta tesis determinar el número de covariables y
parcelas vecinas óptimas para el análisis, por lo que la obtención de un valor de F
significativo con el uso de cuatro parcelas vecinas fue suficiente para demostrar el uso
de este modelo espacial.
Si bien el método de EC obtuvo mayores valores de F y menores de CME, es
importante obtener los valores de la covarianza basado en las distancias originales de
las observaciones, ya que el comúnmente sistema de filas y columnas utilizado en los
otros modelos espaciales, las distancias son constantes por lo que los parámetros del
81
variograma serían sobrestimados y no reales, implicando que los resultados del
análisis de varianza no serán válidos.
Los autores Kirk et al. (1980), Tamura et al. (1988), Brownie (1993) y Bowman (1990)
utilizaron exitosamente el método AT, por lo que era de esperarse que el uso de este
modelo mejorara el análisis de varianza comparado con los diseños BCA y α - lattice,
lo cual no fue lo obtenido en este caso, quizás esto es debido a que la estructura
espacial del rendimiento es compleja, dificultando la acertada elección del modelo
polinomial, lo que puede traducirse en que el polinomio que realmente se ajuste al
modelo espacial de los rendimientos no puede ser determinado, esto coincide con van
Es et al. (1989), los que señalan que en el método AT, el problema es encontrar el
grado óptimo del polinomio a utilizar, como también el número de términos del
polinomio.
El uso de estos modelos fue diferente para cada experimento, lo que implica que la
obtención de un modelo no puede ser utilizado en otro experimento, demostrando que
es sitio específico, por otro lado la ganancia el valor del estadístico y F, y la
disminución del CME, favorecen la estimación entre los efectos de los tratamientos, ya
que con el uso de estos modelos se puede controlar la heterogeneidad espacial,
disminuyendo la variación entre los rendimientos y por lo tanto el cuadrado medio del
error, lo cual se puede observar en la Figura 4.7.
Figura 4.7. Disminución del CME de los distintos diseños y modelos, bajo el
experimento de estrés hídrico y riego normal
CME v/s Diseño Experimental y Modelo Espacial
0250500750
1000125015001750
BCA
Lattic
e
Papad
akis AT
EC
AT +
EC
Diseño Experimental y Modelo Espacial
CM
E Estrés HídricoRiego normal
82
En un programa de mejoramiento genético, el uso de los modelos espaciales tiene una
notable ganancia en el análisis de varianza en términos de reducción del CME y el
superior valor del estadístico F comparado con el uso de los diseños experimentales
sin un modelo de remoción de la variabilidad espacial, sin embargo estos no cumplen
el supuesto de residuales independientes por lo que los resultados obtenidos de estos
análisis pueden ser engañosos.
Análisis geoestadístico
A continuación se presentan los parámetros del variograma, modelo seleccionado y
varianza muestral para las propiedades del suelo bajo los distintos experimentos.
Cuadro 4.16. Parámetros del variograma, modelo seleccionado y varianza muestral
para las propiedades del suelo bajo el experimento de estrés hídrico.
ns = no significativo
VarianzaPropiedad Tendencia Modelo Rango Nugget Umbral Muestral
Lineal (m) (unidades)2 (unidades)2 (unidades) 2
pH (1:2,5) ns Esférico 26,25 0,00 0,05 0,06CE (dS • cm-1) ns Esférico 13,08 0,00 479,73 480,64MO (%) ns Esférico 15,98 0,00 0,02 0,02NH4
+ (mg • kg-1) ns Esférico 12,96 0,00 7,41 7,35NO3
- (mg • kg-1) ns Esférico 21,68 0,46 452,82 424,86N (mg • kg-1) ns Esférico 14,15 0,58 554,50 540,39P (mg • kg-1) ns Esférico 23,38 0,00 15,81 14,74K (mg • kg-1) ns Esférico 21,04 41,29 1579,39 1505,08Na (meq • 100g-1) ns Esférico 12,58 0,00 624,66 627,48Ca (meq • 100g-1) ns Esférico 13,33 0,00 50392,94 49863,70Mg (meq • 100g-1) ns Esférico 14,16 0,00 76,62 73,80
Parámetros del variograma
83
Cuadro 4.17. Parámetros del variograma, modelo seleccionado y varianza muestral
para las propiedades del suelo bajo el experimento de riego normal.
Significativo al nivel de * α = 0,05, ns = no significativo
De acuerdo con los Cuadros 4.16 y 4.17, la mayoría de las propiedades químicas del
suelo no presentaron tendencia lineal significativa, con lo cual el valor del umbral de los
modelos seleccionados fue cercano al valor de la varianza muestral. Para las
propiedades químicas del suelo que mostraron tendencia lineal significativa, como es el
caso de la MO y P bajo riego normal, el uso de los residuales de la regresión lineal
produjo que el valor del umbral fuera aproximadamente la mitad del valor de la
varianza muestral. La tendencia según Cressie (1993), afecta la estacionaridad de
segundo orden, debido a una correlación entre las observaciones, con lo cual se
aumenta el valor de la estimación de un variograma, por lo cual es necesario utilizar
algún procedimiento de remoción de la tendencia. Según Gotway y Hergert (1997) la
tendencia puede deberse a prácticas agrícolas como labranza, fertilización, riego, entre
otras.
El modelo esférico fue el adecuado para la mayoría de las propiedades químicas del
suelo, excepto para nitrato (NO3-) el que ajustó un modelo gausiano; esto concuerda
con lo afirmado por Trangmar et al. (1985), en que los modelos pueden tomar muchas
formas, dependiendo de los datos y los intervalos de muestreo utilizados. Los rangos
de dependencia espacial variaron entre 12 y 30 m; esto implica según Isaaks y
Srivastava (1989), que por sobre el rango del variograma la variable no está
espacialmente relacionada, implicando una variación aleatoria o independiente. El
conocimiento de la dependencia espacial es esencial en la construcción de mapas de
VarianzaPropiedad Tendencia Modelo Rango Nugget Umbral Muestral
Lineal (m) (unidades)2 (unidades)2 (unidades) 2
pH (1:2,5) ns Esférico 29,56 0,00 0,07 0,06CE (dS • cm-1) ns Esférico 15,70 0,01 641,01 650,89MO (%) * Esférico 18,04 0,02 0,04 0,08NH4
+ (mg • kg-1) ns Esférico 24,73 0,03 1,49 1,41NO3
- (mg • kg-1) ns Gausiano 19,32 0,00 10,35 9,73N (mg • kg-1) ns Esférico 18,33 0,00 10,48 10,37P (mg • kg-1) * Esférico 15,46 0,03 26,33 47,74K (mg • kg-1) ns Esférico 20,96 0,00 624,79 628,47Na (meq • 100g-1) ns Esférico 14,84 0,00 157,82 156,91Ca (meq • 100g-1) ns Esférico 17,44 0,00 39818,21 39768,57Mg (meq • 100g-1) ns Esférico 30,18 0,00 269,82 262,92
Parámetros del variograma
84
interpolación. El valor del efecto de nugget indica según Cambardella et al. (1994), una
variabilidad a nivel de campo y del experimento, o una variabilidad aleatoria, la cual es
indetectable a la escala de muestreo, según los Cuadro 4.16 y 4.17 el valor del efecto
nugget fue de baja magnitud en la mayoría de las propiedades químicas del suelo,
implicando una baja variabilidad a cortas distancias, como también que, la distancia de
muestreo fue adecuada.
Las Figuras 4.8 y 4.9, muestran los variogramas de algunas propiedades del suelo bajo
los distintos experimentos6.
Figura 4.8. Variogramas Materia orgánica y NO3-, bajo estrés hídrico.
Figura 4.9. Variogramas Calcio y pH, bajo riego normal.
La existencia de dependencia espacial de las variables estudiadas es importante en un
programa de mejoramiento genético debido a que el rendimiento se verá afectado por
6 Los variogramas de las restantes propiedades del suelo, se presentan en el anexo E.
85
la existencia de una correlación positiva o negativa de las propiedades del suelo,
implicando que si las variables son dependientes, el modelo de respuesta de los
valores del rendimiento también serán dependientes, con lo que el supuesto del
análisis de varianza en que los residuales son independientes fallaría para la obtención
de resultados válidos.
En este caso el tamaño del experimento es primordial para la independencia espacial,
dirigiendo el experimento a un tamaño considerable, lo que en la práctica puede no ser
viable, aun cuando las unidades experimentales sean aleatorizadas, no se logra la
completa independencia de las unidades, demostrando la necesidad de controlar la
heterogeneidad espacial en cualquier experimento de campo.
Los Cuadros 4.18 y 4.19, presentan los R2 de los distintos métodos de interpolación
estudiados de las distintas propiedades del suelo medidas, bajo los experimentos de
riego normal y estrés hídrico.
Cuadro 4.18. Métodos de interpolación y R2, para el experimento de estrés hídrico.
Cuadro 4.19. Métodos de interpolación y R2, para el experimento de riego normal.
Variable Distancia Kriging Curvatura Método Vecino Regresión Función Base TriangulaciónInversa Mínima Mod. Shepard's Natural Polinómica Radial Interpolación L.
pH (1:2,5) 1.000 0.999 0.999 1.000 0.999 0.281 0.883 0.999CE (dS • cm-1) 1.000 0.999 0.999 1.000 0.999 0.226 0.884 0.999MO (%) 1.000 0.999 0.999 1.000 0.999 0.025 0.855 0.999NH4
+ (mg • kg-1) 1.000 1.000 0.999 1.000 0.999 0.023 0.880 0.999NO3
- (mg • kg-1) 1.000 1.000 1.000 1.000 0.999 0.080 0.887 0.999N (mg • kg-1) 1.000 1.000 1.000 1.000 0.999 0.072 0.886 0.999P
(mg • kg
-1) 1.000 1.000 1.000 1.000 0.999 0.325 0.932 0.999
K (mg • kg-1) 1.000 0.999 1.000 1.000 0.999 0.146 0.887 0.999Ca (meq • 100g-1) 1.000 0.999 1.000 1.000 0.999 0.020 0.834 0.999Na (meq • 100g-1) 1.000 0.999 0.999 1.000 0.999 0.038 0.860 0.999Mg (meq • 100g-1) 1.000 1.000 0.999 1.000 0.999 0.271 0.915 0.999
Método de Interpolación
Variable Distancia Kriging Curvatura Método Vecino Regresión Función Base TriangulaciónInversa Mínima Mod. Shepard's Natural Polinómica Radial Interpolación L.
pH (1:2,5) 1.000 0.999 0.992 1.000 0.999 0.201 0.891 0.999CE (dS • cm-1) 1.000 0.999 1.000 1.000 0.999 0.133 0.887 1.000MO (%) 1.000 1.000 0.999 1.000 1.000 0.458 0.922 1.000NH4
+ (mg • kg-1) 1.000 0.999 0.998 1.000 1.000 0.110 0.869 1.000NO3
- (mg • kg-1) 1.000 0.999 0.999 1.000 1.000 0.041 0.870 1.000N (mg • kg-1) 1.000 0.999 0.999 1.000 1.000 0.087 0.843 1.000P (mg • kg-1) 1.000 1.000 0.999 1.000 1.000 0.463 0.949 1.000K (mg • kg-1) 1.000 0.999 0.999 1.000 0.999 0.008 0.835 0.999Ca (meq • 100g-1) 1.000 0.999 0.999 1.000 1.000 0.133 0.897 1.000Na (meq • 100g-1) 1.000 0.999 1.000 1.000 0.999 0.014 0.833 0.999Mg (meq • 100g
-1) 1.000 0.999 0.999 1.000 1.000 0.108 0.883 1.000
Método de Interpolación
86
Para los distintos métodos de interpolación se calculó el valor de R2, seleccionándose
aquel modelo que entregara un mayor valor en términos de R2. La regresión polinómica
resultó ser el de más baja precisión para las variables en ambos experimentos, lo cual
era lo esperado, puesto que el método de regresión polinómica no es considerado un
interpolador al no estimar valores en las áreas sin muestrear, más bien es utilizado
para definir superficies de respuesta. Para ambos experimentos, el método modificado
de Shepard’s (MMS) fue el interpolador que representó de mejor manera la distribución
de las distintas variables en la totalidad de la superficie, pero sus resultados mostraron
ser muy similares al utilizar el método de distancia inversa (DI), esto es debido a que
MMS es similar a DI en su metodología, el primero utiliza el método de cuadrados
mínimos con peso y el segundo le da peso a los valores más cercanos. Los métodos
de vecino natural y triangulación con interpolación lineal (TIL) obtuvieron un valor de R2
muy cercano al de MMS, sin embargo estos métodos sólo generan un mapa entre el
área muestreada y no fuera de sus límites. El método de función de base radial bajo
los dos experimentos obtuvo valores cercanos a 0,9, ya que este interpolador genera
mapas de contornos más uniformes entre los valores estimados. Kriging obtuvo valores
cercanos a 1, no obstante Isaaks y Srivastava (1989), indican que kriging se distingue
de los otros métodos descritos al minimizar la media y la varianza del error, por lo que
puede generar mapas sin afectarse por las características de los datos, ya que
incorpora la estructura espacial de las variables por medio de su variograma. Gotway
et al. (1996) utilizaron el CV para explicar sus resultados en la comparación de kriging
y DI con poder (ID with power, p = 1, 2, 4). Al compara el CV de las propiedades del
suelo del Cuadro 4.1, con los métodos de interpolación DI, MMS, kriging, curvatura
mínima, vecino natural y TIL bajo los dos experimentos, los interpoladores en términos
de R2, reflejaron que no se ven afectados por el tipo de variación que puedan tener las
variables a la distancia muestreada. Aunque este estudio no tiene una implicancia
directa para un programa de mejoramiento genético, fue útil en la elección de un
método adecuado de interpolación, el cual es necesario para la creación de mapas
utilizados en la interpolación de las variables del suelo con el rendimiento para el uso
de zonas geográficas como método de control de la variabilidad espacial.
87
Análisis estadístico utilizando diseños experimentales asociados a zonas
Las Figuras 4.10 y 4.11, muestran los variogramas de los residuales de los diseños
asociados a las zonas bajo los distintos experimentos.
Figura 4.10. Variograma de los residuales de los diseños BCA y α - lattice asociado a
18 y 8 zonas respectivamente, bajo el experimento de estrés hídrico.
Figura 4.11. Variogramas de los residuales de los diseños BCA y α - lattice asociado a
10 y 12 zonas respectivamente, bajo el experimento de riego normal.
88
Cuadro 4.20. Estadísticas descriptivas, estadístico W, modelo y parámetros del
variograma de los residuales de los distintos diseños experimentales asociados a las
zonas, bajo el experimento de estrés hídrico. Varianza Media Prueba
Diseño Modelo Rango Nugget Umbral Residuales Residuales NormalidadZonas Experimental Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)18 Zonas BCA Gausiano 0,72 2,50 4,93 4,93 0 0,13***8 Zonas � - lattice Gausiano 0,73 0,05 0,09 0,09 0 0,16***
Parámetros del variograma
Significativo al nivel de ***á = 0,001
Cuadro 4.21. Estadísticas descriptivas, estadístico W, modelo y parámetros del
variograma de los residuales de los distintos diseños experimentales asociados a las
zonas, bajo el experimento de riego normal. Varianza Media Prueba
Diseño Modelo Rango Nugget Umbral Residuales Residuales NormalidadZonas Experimental Variograma (m) (unidades)2 (unidades)2 (unidades)2 (unidades) (W)10 Zonas BCA Gausiano 1,90 2,85 5,96 5,96 0 0,39***12 Zonas � - lattice Gausiano 0,71 0,03 0,06 0,06 0 0,11***
Parámetros del variograma
Significativo al nivel de ***á = 0,001
Como se observa en las Figuras 4.10 y 4.11, y de acuerdo a los Cuadros 4.20 y 4.21,
los residuales de los diseños asociados a las zonas presentaron un valor de rango
cercano a 0,7 m, excepto el diseño experimental BCA asociado a 10 zonas, el cual
presentó un valor de 1,9 m, esto implica la independencia espacial de los residuales a
corta distancia. A pesar de esto, el supuesto de independencia estrictamente no se
cumple, sin embargo, la distancia exhibida resultó ser menor a la mostrada por los
diseños experimentales (Cuadro 4.5) y modelos espaciales (4.11 y 4.12), y
razonablemente pequeña para un experimento de gran tamaño, en que la distancia
entre híbridos a ser comparados es generalmente superior a 1 m, con lo que el
supuesto de independencia se cumple.
Según los Cuadros 4.20 y 4.21, la media de los residuales es igual a cero y la varianza
es igual a ó², con lo que el supuesto de distribución de los residuales con media igual a
cero y varianza igual a ó², se cumple. La prueba Shapiro – Wilk es significativa al 0,1%
por lo que se rechaza la hipótesis nula de normalidad, no obstante, según Cochran
(1947), la perdida en la eficiencia del análisis de varianza no es grande y la verdadera
probabilidad de un valor tabulado de un nivel de significancia al 5% varía entre 4% y
7%, y para el caso de un nivel de significancia al 1% varía entre 0,5% y 2%, esto
89
sumado a lo que indica Mitchell (1995), en que si las muestras poseen el mismo
número de observaciones, el nivel de significancia no es mayormente afectado. Por lo
tanto, los resultados obtenidos de los análisis de varianza del rendimiento de grano de
maíz bajo los distintos experimentos y utilizando un diseño experimental asociado a
zonas, son válidos.
Los Cuadros 4.22 y 4.23 muestran la ER y la prueba de falta de ajuste de las zonas
seleccionadas comparado con los respectivos diseños experimentales y experimentos.
Cuadro 4.22. Eficiencia relativa y prueba de falta de ajuste de las zonas seleccionadas
bajo el experimento de estrés hídrico.
Diseño experimental Nº de Zonas ER F Pr > FBCA 18 2,24 3,78 0,033
� - lattice 8 27,84 84,11 0,002
Prueba falta de ajuste
Cuadro 4.23. Eficiencia relativa y prueba de falta de ajuste de las zonas seleccionadas
bajo el experimento de riego normal.
El Cuadro 4.22 compara la ER del uso de diseños experimentales asociado a zonas
con respecto a los diseños BCA y α - lattice. El uso del diseño BCA asociado a 18
zonas presentó una ER de 2,24 por sobre el diseño BCA. El uso del diseño á – lattice
asociado a 8 zonas presentó una ER de 27,84 por sobre el diseño á – lattice.
Esto indica la eficiencia de estas zonas con respecto a los diseños experimentales en
la disminución del CME, ya que valores mayores a uno representan esta disminución.
Para el caso de la prueba de falta de ajuste los valores del estadístico F para 18 zonas
(3,78), el cual fue significativo al 5% y 8 zonas (84,11), significativo al 1%, implica que
existe evidencia estadística significativa para rechazar la hipótesis nula de que no
existe diferencia entre el uso del diseño originalmente descrito y el propuesto, esto
significa que la elección de este número de zonas es el adecuado bajo el respectivo
diseño experimental.
Diseño experimental Nº de Zonas ER F Pr > FBCA 10 1,59 1,74 0,023
� - lattice 12 4,82 8,54 0,110
Prueba falta de ajuste
90
Según el Cuadro 4.23, el uso del diseño BCA asociado a 10 zonas presentó una ER de
1,59 respecto a un diseño de BCA, y un valor del estadístico F (1,74), significativo al
5%, indicando que el uso de este número de zonas bajo un diseño de BCA, presenta
una ganancia en la reducción del CME y es el modelo adecuado para este diseño. El
uso del diseño á – lattice asociado a 12 zonas presentó una ER de 4,82 respecto a un
diseño á – lattice, pero el valor de F (8,54) no fue significativo, indicando que no existe
diferencia al utilizar el diseño originalmente descrito con el propuesto, sin embargo este
número de zonas fue utilizado por que presentó un valor de F significativo en los
tratamientos (híbridos), lo cual se puede apreciar en las tablas de ANDEVA de los
diseños y experimentos en los Cuadros 4.24, 4.25, 4.26 y 4.27.
Cuadro 4.24. ANDEVA del rendimiento de grano de maíz bajo el experimento de
estrés hídrico utilizando un diseño BCA asociado a 18 zonas.
FV gl SC SCM F R²Modelo 712 1513352,82 2125,496 4.2* 0,99Bloque 1 3067,7822 3067,7822 6.06*Híbrido 359 745117,49 2075,54 4.1*Zona 17 67777,84 3986,93 7.87**H*Z 335 431674,07 1288,58 2.54Error 7 3544,36 506,34
Total 719 1516897,18 Significativo al nivel de ** α = 0,01 y * α = 0,05, H*Z interacción híbrido * zona
De acuerdo al Cuadro 4.24, la fuente de variación “modelo” presentó un valor F de 4,2,
significativo al 5%, por lo que este modelo es el adecuado para este experimento y
explicó en términos de R2 un 99% la variabilidad presente en la variable de respuesta
híbrido. El efecto bloque fue significativo al 5%, indicando que el uso de bloques es
adecuado para controlar la variabilidad espacial. La variable híbrido fue significativa al
5%, implicando que existe diferencia estadística entre la media de los híbridos. El uso
de 18 zonas tuvo un valor de F significativo al 1%, lo que indica que las zonas explican
en una gran proporción la variabilidad presente en la variable híbrido y la interacción
H*Z no fue significativa, implicando que la respuesta de la variable híbrido no depende
de los niveles de la variable zona.
91
Cuadro 4.25. ANDEVA del rendimiento de grano de maíz bajo el experimento de
estrés hídrico utilizando un diseño α - lattice asociado a 8 zonas.
FV gl SC SCM F R²Modelo 716 1516829,30 2118,48 93.63** 0,99Súper Bloque 1 173242,43 173242,43 7656.65***Bloque Incompleto 22 22851,29 1038,70 45.91**Híbrido 359 629198,92 1752,64 77.46**Zona 7 11986,36 1712,34 75.68**H*Z 311 274454,97 882,49 39**Error 3 67,88 22,63
Total 719 1516897,18 Significativo al nivel de *** α = 0,001 y ** α = 0,01, H*Z interacción híbrido * zona
Según el Cuadro 4.25, el valor de F del modelo significativo al 1% y un valor de 99% en
términos de R2, indican que el uso de este modelo es el adecuado para este
experimento. El uso de bloques incompletos fue significativo al 0,1% mientras que los
súper bloques lo fueron al 1%, indicando que este sistema de bloques fue el adecuado
para este experimento. El uso de 8 zonas y la interacción H*Z fueron significativos al
1%, indicando que el uso de zonas explicó en gran medida la variabilidad en el
tratamiento y que la respuesta de la variable híbrido depende de los niveles de las
zonas.
Cuadro 4.26. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando un diseño BCA asociado a 10 zonas.
FV gl SC SCM F R²Modelo 683 257752,33 377,38 3.17*** 0,98Bloque 1 356,08 356,08 2,99Híbrido 359 178661,41 497,66 4.18***Zona 9 6562,33 729,15 6.13***H*Z 314 59848,54 190,60 1.6*Error 36 4283,28 118,98
Total 719 262035,61 Significativo al nivel de *** α = 0,001 y * α = 0,05, H*Z interacción híbrido * zona
92
Según el Cuadro 4.26, el modelo presentó un valor de F de 3,17 significativo al 0,1%,
por lo que este modelo es el adecuado para este experimento y explicó en términos de
R2 en un 98% la variabilidad presente en la variable de respuesta híbrido. El efecto
bloque no fue significativo, indicando que este diseño no es adecuado para controlar la
variabilidad espacial. La variable híbrido fue significativa al 0,1%, implicando que
existió diferencia estadística entre la media de los híbridos. El uso de 10 zonas tuvo un
valor de F significativo al 0,1%, lo que indicó que las zonas explican en una gran
proporción la variabilidad presente en la variable híbrido y la interacción H*Z fue
significativa al 5%, implicando que la respuesta de la variable híbrido dependió de los
niveles de la variable zona.
Cuadro 4.27. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando un diseño α - lattice asociado a 12 zonas.
FV gl SC SCM F R²Modelo 717 261988,96 365,40 15,67 0,99Súper bloque 1 149,26 149,26 6,4Bloque Incompleto 30 7080,82 236,03 10,12Híbrido 359 166979,90 465,13 19,94*Zona 11 3117,45 283,40 12,15H*Z 308 56350,24 182,96 7,84Error 2 46,65 23,33
Total 719 262035,61 Significativo al nivel de *α = 0,05, H*Z interacción híbrido * zona
Según el Cuadro 4.27, el valor de F del modelo no fue significativo, como también el
uso de bloques incompletos y los súper bloques no fueron significativos. El uso de 8
zonas y la interacción H*Z no fueron significativos, indicando que el uso de zonas no
explicó en gran medida la variabilidad en el tratamiento y que la respuesta de la
variable híbrido no depende de los niveles de las zonas, a pesar de esto la variable
híbrido fue significativa al 5%, existiendo diferencia estadística entre la media de los
tratamientos.
De acuerdo a los resultados de los ANDEVA de los distintos diseños experimentales y
zonas en los diferentes experimentos, se pudo observar que bajo el experimento de
estrés hídrico, en el cual existió una mayor variabilidad espacial comparado con el
experimento de riego normal, el uso de zonas homogéneas sólo fue efectivo junto a un
93
diseño experimental α - lattice. Estos resultados no fueron los mismos frente a un
diseño experimental de BCA; una posible explicación a esto es que debido a la gran
cantidad de híbridos dentro de un mismo bloque producen que el espacio utilizado en
el experimento sea extenso, frente a esto y sumado a la compleja estructura espacial
de las propiedades del suelo debido a su alta variabilidad, las distintas zonas no fueron
suficientes para controlar toda la heterogeneidad, removiendo sólo una parte de ella;
por esta razón la interacción de la variable híbrido con la variable zona no fue
significativa; en cambio fue significativo el valor del estadístico F asociado a la variable
híbrido y este valor fue superior en el uso de zonas asociado al diseño de BCA
comparado al sólo uso de un diseño de BCA. De esta manera el uso del diseño α -
lattice bajo el experimento de estrés hídrico alcanzó valores del estadístico F
superiores a los del diseño BCA, el uso de bloques incompletos, los que comprenden
un menor tamaño espacial que los bloques completos, permiten que las zonas puedan
controlar eficientemente la heterogeneidad espacial. Esto es confirmado con el mayor
número de zonas utilizadas bajo el experimento de estrés hídrico comparado con el
número de zonas utilizadas bajo el experimento de riego normal, frente a una mayor
variabilidad, un mayor número de zonas son necesarias.
Para el caso del experimento de riego normal, debido al razonamiento anteriormente
expuesto, era de esperarse que solamente frente a un diseño de BCA asociado a
zonas los resultados fueran significativos, ya que la variabilidad espacial presente bajo
este experimento era menor al observado bajo el experimento de estrés hídrico, con lo
cual las zonas geográficas lograron representar adecuadamente la heterogeneidad
espacial. Con esto, al utilizar bloques completos que abarcan una mayor proporción de
terreno, el valor del estadístico F para la zona e interacción mostró ser significativo, en
cambio entre bloques no hubo diferencia, ya que la respuesta fue muy similar debido a
la baja heterogeneidad espacial. De esta manera al utilizar un diseño de α - lattice con
bloques incompletos, no es necesario la utilización de zonas, debido a que la
variabilidad espacial es baja, implicando que la variabilidad entre zonas sea baja y no
significativa, por esta razón las zonas y la interacción de la variable híbrido con la
variable zona no son significativas.
Las Figuras 4.12 y 4.13, muestran las zonas seleccionadas para ser asociadas al
diseño α - lattice, bajo los experimentos de estrés hídrico y riego normal.
94
Figura 4.12. Análisis de cluster con 8 zonas seleccionadas, bajo el experimento de
estrés hídrico.
Figura 4.13. Análisis de cluster con 12 zonas seleccionadas, bajo el experimento de
riego normal.
95
Los Cuadro 4.28 y 4.29, comparan los diseños experimentales con los diseños
experimentales asociado a las zonas.
Cuadro 4.28. ANDEVA del rendimiento de grano de maíz bajo el experimento de
estrés hídrico utilizando distintos diseños experimentales y diseños experimentales
asociado a zonas.
ZONASANDEVA BCA �-lattice BCA + 18 Z �-lattice + 8 ZF Híbrido 1,65** 1,95** 4,1* 77,46**CME 1409,96 938,94 506,34 22,63
DISEÑO EXPERIMENTAL
Significativo al nivel de ** α = 0,01 y * α = 0,05
Cuadro 4.29. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando distintos diseños experimentales y diseños experimentales asociado
a zonas.
ZONASANDEVA BCA �-Lattice BCA + 10 Z �-Lattice + 12 ZF Híbrido 2,68** 2,71** 4,18*** 19,94*CME 198,45 186,17 118,98 23,33
DISEÑO EXPERIMENTAL
Significativo al nivel de *** α = 0,001, ** α = 0,01 y * α = 0,05
De acuerdo al Cuadro 4.28, bajo el experimento de estrés hídrico la utilización de
zonas homogéneas tuvo una ganancia significativa, al 1% y 5%, para el diseño BCA y
α - lattice respectivamente, en el valor del estadístico F comparado con el valor del
estadístico F de los diseños experimentales, el uso de un adecuado diseño de acuerdo
al experimento reflejo tener una mayor ganancia en términos de F, en este caso el uso
de un diseño de α - lattice. Con respecto al CME el utilizar zonas tuvo una ganancia en
la disminución del CME comparado con los diseños experimentales, con el uso del
diseño α - lattice asociado a zonas fue mayor al uso de un diseño BCA asociado a
zonas, debido a la envergadura del bloque en la cual las zonas no pueden explicar
adecuadamente la totalidad de la heterogeneidad espacial en comparación del uso de
bloques incompletos de menor tamaño.
96
En el experimento con riego normal, según el Cuadro 4.29, el utilizar zonas asociado a
los diseños experimentales obtuvo una ganancia significativa del valor del estadístico F
comparado con el valor del estadístico F de los diseños experimentales, en cuanto al
CME se obtuvo una disminución de este, mayor a la obtenida por los diseños
experimentales, en el caso del uso del diseño de α - lattice asociado a zonas se
alcanzó una mayor disminución compara al diseño de BCA asociado a zonas.
Los Cuadros 4.30 y 4.31, muestran la comparación entre los modelos espaciales y el
uso de diseños experimentales asociado a zonas homogéneas.
Cuadro 4.30. ANDEVA del rendimiento de grano de maíz bajo el experimento de
estrés hídrico utilizando distintos modelos espaciales y diseños experimentales
asociado a zonas.
AT = análisis de tendencia, EC = error correlacionado, significativo al nivel de *** α =
0,001, ** α = 0,01 y * α = 0.05
Cuadro 4.31. ANDEVA del rendimiento de grano de maíz bajo el experimento de riego
normal utilizando distintos modelos espaciales y diseños experimentales asociado a
zonas.
AT = análisis de tendencia, EC = error correlacionado, significativo al nivel de *** α =
0,001, ** α = 0,01 y * α = 0.05
Según el Cuadro 4.30, el uso de zonas bajo el experimento de estrés hídrico, se
observó una ganancia en el valor del estadístico F superior a los modelos espaciales.
Con respecto al CME se obtuvo una disminución superior al de los modelos espaciales,
siendo el del diseño α - lattice asociado a zonas, mayor al del diseño de BCA asociado
a zonas.
De acuerdo con el Cuadro 4.31, bajo el experimento con riego normal, el valor del
estadístico F con el uso de 12 zonas asociado al diseño α - lattice fue superior al de los
ANDEVA Papadakis AT EC AT + EC BCA + 18 Z �-Lattice + 8 ZF Híbrido 2,04** 1,61** 3,05*** 3,10*** 4,1* 77,46**CME 805,28 1479,71 944,95 733,78 506,34 22,63
MODELO ESPACIAL ZONAS
ZONASANDEVA Papadakis AT EC AT + EC BCA + 10 Z �-Lattice + 12 ZF Híbrido 3,04** 2,82** 5,31*** 5,27*** 4,18*** 19,94*CME 164,32 189,40 99,29 98,09 118,98 23,33
MODELO ESPACIAL
97
modelos espaciales. El uso de 10 zonas asociado al diseño de BCA tuvo un valor de F
superior a los modelos Papadakis y análisis de tendencia, no obstante, no fue superior
a los modelos error correlacionado y análisis de tendencia más error correlacionado.
En cuanto al CME, el diseño α - lattice asociado a 12 zonas obtuvo una reducción
superior del CME comparado con los modelos espaciales. El diseño de BCA asociado
a 10 zonas alcanzó una reducción del CME superior a los modelos Papadakis y
análisis de tendencia, sin embargo, no fue superior a la reducción del CME de los
modelos error correlacionado y análisis de tendencia más error correlacionado.
Según los resultados observados, el uso de zonas geográficas homogéneas
incorporado al diseño experimental alcanza una reducción del CME superior al sólo
uso de diseños experimentales ó modelos espaciales (Figuras 4.14 y 4.15), esto
permite obtener valores del estadístico F mayores que el obtenido al utilizar un diseño
experimental, estos resultados eran los esperado basado en los objetivos planteados,
no obstante la disminución del CME y la ganancia del valor de F dependen de la
variabilidad espacial presente sumado a una adecuada selección del diseño
experimental, ya que frente a una alta variabilidad espacial es necesario utilizar un
adecuado diseño experimental para que las zonas geográficas puedan explicar la
variabilidad existente, por el contrario si existe una baja variabilidad espacial el uso de
un diseño experimental adecuado permite controlar esta variabilidad y el uso de zonas
no es necesario por que la variación entre zonas es mínima, implicando que no es
estadísticamente significativa.
Figura 4.14. Disminución del CME de los distintos diseños, modelos y zonas
incorporado a los diseños, bajo el experimento de estrés hídrico.
CME v/s Modelo
0
300
600
900
1200
1500
BCA
Lattice
Papad
akis
AT EC
AT +
EC
BCA + 18 Z
Lattic
e +
8 Z
Modelo
CME
98
Figura 4.15. Disminución del CME de los distintos diseños, modelos y zonas
incorporado a los diseños, bajo el experimento de riego normal.
Al utilizar las zonas geográficas homogéneas en un programa de mejoramiento
genético, se puede lograr una notable disminución del CME, aumentando el valor del
estadístico F, lo que implica una probable estimación de la diferencia de la media de
los tratamientos superior al alcanzado por el uso tradicional de diseños experimentales.
Por otra parte, permite cumplir con los supuestos necesarios para utilizar el análisis de
varianza, con lo cual se logran obtener resultados estadísticamente válidos. Si bien la
implementación de estas metodologías es compleja, ellas pueden ser utilizadas en
cualquier experimento en el cual no se tenga certeza o pleno conocimiento de la
variabilidad espacial existente, o de la influencia de esta sobre las variables a analizar.
Además, puede ser empleada como una técnica alternativa al uso de modelos
espaciales estadísticos, los que para algunos investigadores pueden estar en duda de
algún tipo de sesgo o implementación, ya que esta metodología se realiza bajo el
diseño experimental originalmente planeado y no depende de otros resultados
estadísticos para ser agregada al análisis de varianza.
CME v/s Modelo
0
300
600
900
1200
1500
BCA
Lattice
Papad
akis AT EC
AT + E
C
BCA + 10 Z
Lattice
+ 12 Z
Modelo
CME
99
5. CONSIDERACIONES FINALES
En esta investigación se analizó la utilización de zonas geográfica homogéneas como
un modelo de interpretación de la heterogeneidad espacial, lo cual permite reducir la
influencia de la variabilidad espacial sobre la variable rendimiento de grano, lográndose
así una mejor estimación de las diferencias existentes entre híbridos de maíz.
De los resultados obtenidos para demostrar este objetivo se puede concluir y
considerar lo siguiente:
Variabilidad espacial
Existe una correlación positiva o negativa significativa de las propiedades químicas del
suelo con el rendimiento, las cuales afectan su respuesta a través del campo. Sin
embargo, es poco probable que estas variables sean las únicas que afectan la
respuesta del rendimiento o incorporar todas las variables potenciales existentes que
afectan un experimento. No obstante, es interesante notar que no todas las variables
perturban la expresión del rendimiento, y en consecuencia sería interesante identificar
aquellas que ejerzan mayor influencia sobre el rendimiento de grano u otra variable en
estudio, como también si estas varían geográficamente o son de naturaleza sitio
específico.
La variabilidad espacial se ve afectada por la acción antrópica. En este caso el
experimento de estrés hídrico provocó una mayor heterogeneidad espacial, la cual
afectó la respuesta de los híbridos; por esta razón el coeficiente de variación de los
rendimientos fue más alto en el experimento de estrés hídrico comparado con el de
riego normal. Esta observación es importante, porque en el planteamiento de un
experimento de campo donde la variable de respuesta sea el rendimiento de grano, la
acción antrópica afecta indirectamente la respuesta de la variable bajo un determinado
tratamiento, ya que si el cuadrado medio del error es seriamente inflado no se lograría
adecuadas estimaciones de la diferencia de los tratamientos o genotipos bajo estudio.
100
Diseño experimental
La elección de un adecuado diseño experimental permite obtener resultados
estadísticamente significativos. Sin embargo, los diseños experimentales pueden omitir
el control de la variabilidad espacial si la disposición u orientación espacial de los
bloques no es la correcta con respecto a la dirección de la variabilidad, produciendo
una alta variabilidad dentro del bloque y reduciendo la efectividad del análisis de
varianza. Al observar las figuras de distribución espacial de los rendimientos, se puede
predecir anticipadamente el modelo de variabilidad espacial, ubicando adecuadamente
los bloques, lo que resulta en un mejor control de la variabilidad dentro del bloque,
aunque esto sólo se lograría de realizar si se conociera anticipadamente la estructura
de la heterogeneidad espacial.
Dado esto, se puede concluir que si se conoce previamente el modelo de variación
espacial, la elección de un adecuado diseño es suficiente; de otro modo resulta útil la
incorporación de algún modelo de remoción de la heterogeneidad espacial.
El tamaño de los experimentos se puede ver influido por la correlación significativa
entre las propiedades del suelo y el rendimiento. Esto es debido a que el patrón de la
estructura espacial de las variables que influyen al rendimiento, determina en cierta
medida la estructura espacial de este último. Como se observó en los variogramas de
las propiedades del suelo, algunas presentaban dependencia espacial, con lo cual si
estas influyen en la respuesta del modelo espacial del rendimiento, estas
observaciones serían dependientes bajo un cierto rango, con lo cual el supuesto de
observaciones independientes del análisis de varianza no se cumple, aun cuando los
tratamientos estén aleatorizados dentro del bloque, implicando que para cumplir con
este supuesto se debería obtener observaciones sobre el rango determinado, lo que
aumentaría el tamaño del experimento. Esta solución puede no ser viable de
implementar en la práctica, por lo que es necesario incluir algún método de remoción
de la autocorrelación en el análisis final.
Supuestos del análisis de varianza
El supuesto de varianza constante no se cumple en ningún experimento, a pesar de
esto, existen autores que indican que si las muestras comparadas poseen el mismo
101
número de observaciones y este supuesto no se cumple, el nivel de significancia no es
mayormente afectado. La implicancia de no cumplirse este supuesto no está dentro de
los objetivos de esta tesis.
El supuesto de normalidad de los residuales de los distintos diseños experimentales,
bajo la prueba de normalidad Shapiro – Wilk, se cumple en todos los casos analizados.
En el caso del supuesto de errores independientes, la aleatorización dentro de los
diseños experimentales para obtener observaciones independientes, no es
completamente efectiva, ya que al observar los parámetros de los variograma indican
que existe dependencia espacial de los residuales, implicando que los resultados
obtenidos del análisis de varianza no sean válidos.
Variogramas e interpoladores
Si bien la elección entre modelos de variogramas no es compleja, el análisis
variográfico (estimación del variograma experimental) de los datos puede presentar
dificultades, debido a que la obtención del modelo de variograma depende del software
utilizado, la distancia máxima utilizada en el variograma, el número de pares de datos
utilizados, entre otros; estos factores determinan que esta etapa sea esencial en un
estudio geoestadístico, pudiendo obtenerse malos resultados en caso de realizar un
mal modelamiento. La solución y como se enfrenta este problema no esta dentro de los
objetivos de esta tesis, por lo que sería interesante considerarlo para un estudio futuro.
Los interpoladores, a excepción de la regresión polinomial, demostraron ser buenos
estimadores de la continuidad espacial de las variables estudiadas. Estos también
demostraron que no se afectan principalmente por la alta o baja variación de las
muestras, lo que implica que en la utilización de cualquiera de estos métodos se
obtendrán resultados semejantes. Sin embargo, kriging es el único interpolador que
incorpora la estructura espacial de la variable en su estimación de las áreas no
muestreadas y minimiza la media y la varianza del error, lo que le confiere cierta
ventaja sobre los otros interpoladores, no obstante esta característica también es una
debilidad, por que si se realiza un mal análisis variográfico se pueden obtener
resultados erróneos. Por lo tanto, la utilización de un determinado interpolador puede
depender de factores como densidad de muestreo, información redundante y distancia
de muestreo, entre otros.
102
Modelos espaciales
Se observó que el uso de los diferentes métodos lleva a resultados distintos, y que el
modelo óptimo depende de la naturaleza del experimento y no puede ser utilizado
frente a un experimento similar en otra localidad, aun cuando se repitiera el mismo
experimento en el mismo lugar en temporadas distintas, lo que demuestra que son sitio
específicos.
El uso del método de análisis de tendencia es de difícil implementación, ya que la
elaboración de una adecuada superficie de respuesta es complejo, a esto se suma la
posibilidad que la variable no pueda ser modelada por una regresión polinomial.
La utilización de los análisis errores correlacionados y el análisis de tendencia más
error correlacionado disminuyen considerablemente el cuadrado medio del error y por
consiguiente se logra aumentar el valor del estadístico F. Sin embargo, estos métodos
presentan el inconveniente de depender de los valores obtenidos de un análisis
variográfico, el cual se encuentra sujeto a un adecuado modelamiento del variograma
experimental, obteniéndose resultados erróneos si el modelo seleccionado no es el
apropiado.
El método de Papadakis resulta en una disminución del cuadrado medio del error y es
independiente de la obtención de datos de otros análisis; sin embargo, depende de la
elección del número de parcelas vecinas involucradas en el cálculo de la covariable,
como también del número de covariables utilizadas en el modelo, lo que
probablemente puede llevar a la obtención de resultados con pobres estimaciones de
los tratamientos o un sobre ajuste de los rendimientos. Sin embargo, un estudio previo
determinando el número de parcelas vecinas antes del análisis final resultaría valioso.
No obstante lo anterior, los distintos modelos espaciales no cumplen con el supuesto
de errores independientes, con lo cual los resultados obtenidos pueden no ser válidos.
Definición de las zonas geográficas homogéneas
En la definición de zonas geográficas homogéneas existen diversos métodos de
clasificación, dentro de estos métodos están el análisis de componentes principales,
fuzzy k – means, análisis de cluster, entre otros, los cuales están incorporados a
algunos programas como por ejemplo S – Plus o SAS.
103
En este estudio se utilizó el análisis de cluster, en el cual se deben definir las variables
relevantes para la conformación de las zonas; en esta tesis se incluyeron nueve
variables de propiedades químicas del suelo. Las propiedades físicas del suelo
deberían ser incluidas
Uso de zonas geográficas homogéneas
Los supuestos de distribución de los residuales con media igual a cero y varianza igual
a ó², e independencia de los residuales del análisis de varianza de los rendimientos de
grano en los distintos experimentos utilizando zonas geográficas homogéneas se
cumple. El supuesto de normalidad no se cumple, sin embargo el nivel de significancia
no es mayormente afectado, por lo que los resultados del análisis de varianza son
válidos.
El uso de zonas homogéneas resultó en una disminución del cuadrado medio del error,
la cual fue superior a la observada con los diseños experimentales y los modelos de
remoción de la variabilidad, por lo cual el valor del estadístico F se vio aumentado,
implicando que se logre una mejor estimación de la diferencia de la media de los
genotipos en estudio.
Sin embargo, es importante destacar que el uso de este método no es un nuevo diseño
experimental, mas bien cae en la clasificación de un experimento factorial, ya que el
objetivo de este método es explicar la variabilidad espacial presente en el rendimiento
por medio de la incorporación de zonas con características similares como factor que
influye sobre la expresión de los híbridos. Por este motivo, la selección de un adecuado
diseño experimental es importante, ya que este método depende del diseño
experimental implementado.
No obstante, si la heterogeneidad espacial es reducida, la implementación de este
método es innecesaria, puesto que los diseños experimentales son adecuados para
controlar la heterogeneidad espacial. Si la variabilidad espacial es elevada y la
selección del diseño es la adecuada, este procedimiento puede presentar resultados
muy beneficiosos.
Este método depende de las características del lugar en donde se implementa, lo que
significa que es sitio específico.
104
Aun cuando la metodología utilizada es compleja, es la adecuada en la obtención del
número de zonas, debido a que cumple con un proceso estadísticamente válido.
Este método resulta conveniente en un programa de mejoramiento genético, por las
implicancias de obtener mejores estimaciones de la diferencia entre genotipos en
estudio. Además, esta metodología puede ser utilizada para todo experimento en que
la variable de respuesta sea el rendimiento y obtener resultados estadísticamente
válidos, por lo que su uso es recomendable en presencia de heterogeneidad espacial.
105
6. BIBLIOGRAFIA
Akaike, H. 1973. Information theory and an extension of maximum likelihood principle.
In B.N. Petrov & F. Csáki (Eds). Second International Symposium on Information
Theory. Akadémia Kiadó, Budapest, Hungría. p. 267 – 281.
Amaro, R. y Cobo, M. 1994. La investigación agrícola y la aplicación del método
Papadakis. Rev. Fac. Agron. Maracay. Venezuela. 20: 35 – 45
Bailey, R., Azais, J. y Monod, H. 1995. Are neighbour methods preferable to analysis of
variance for completely systematic designs? “Silly designs are Silly”. Biometrika 82: 655
– 659
Ball, S., Mulla, D. y Konzak, C. 1993. Spatial heterogeneity affects variety trial
interpretation. Crop Sci. 33: 931 – 935
Barreto, H., Edmeades, G., Chapman, S. y Crossa, J. 1997. The alpha lattice design
in plant breeding and agronomy: generation and analysis. In: G.O. Edmeades, M.
Banzinger, H.R. Mickelson y C.B. Peña-Valdivia (Eds). Developing drought and low N-
tolerant maize. Proceedings of a Symposium, Marzo 25 – 29, 1996, CIMMYT, El Batán,
México, DF, Mexico
Bartlett, M. 1938. The approximate recovery of information from field experiments with
large blocks. J. Agric. Sci. 28: 418 – 427
Bartlett, M. 1978. Nearest neighbour models in the analysis of field experiments (with
discussion). J. R. Statist. Soc. B 47: 147 – 174
Belobrov, V. 1976. Variation in some chemical and morphological properties of sod-
podzolic soils within the boundaries of elementary soil areas and taxonomic groups. In
Fridman V. (Ed), Soil combinations and their genesis. Amerind, Nueva Delphin. p. 147
– 158
106
Besag, J. y Kempton, R. 1986. Statistical analysis of field experiments using
neighbouring plots. Biometrics 42: 231 – 251
Bhattacharyya, G. y Johnson, R. 1977. Statistical concepts and methods. John Wiley &
Sons Inc., Nueva York, NY, EUA. 639 pp.
Bhatti, A., Mulla, D., Koehler, F. y Gurmani, A. 1991. Identifying and removing spatial
correlation from yield experiments. Soil Sci. Soc. Am. J. 55: 1523 – 1528
Bowman, D. 1990. Trend analysis to improve efficiency of agronomic trials in flue-cured
tobacco. Agron. J. 82: 499 – 501
Brownie, C., Bowman, D. y Burton, J. 1993. Estimating spatial variation in analysis of
data from yield trials: a comparison of methods. Agron. J. 85: 1244 – 1253
Burgess, T. y Webster, R. 1980. Optimal interpolation and isarithmic mapping soil
properties. I. The semi-variogram and punctual kriging. J. Soil Sci. 31: 315 – 331
Cambardella, C., Moorma, T., Novak, J., Parkin, T., Karlen, D., Turco R. y Konopka A.
1994. Field-scale variability of soil properties in central Iowa soils. Soil Sci. Soc. Am. J.
58: 1501 – 1511
Campbell, J. 1978. Spatial variation of sand content and pH within single contiguous
delineations of two soil mapping units. Soil Sci. Soc. Am. J. 42: 460 – 464
Cobertera, E. 1993. Edafología aplicada. Cátedra S.A., Madrid, España. 326 pp.
Cochran, W. 1947. Some consequences when the assumptions for the analysis of
variance are not satisfied. Biometrics 3: 22 – 38
Cochran, W. y Cox, G. 1950. Experimental designs. John Wiley & Sons Inc., Nueva
York, NY, EUA. 454 pp.
107
Cressie, N. 1993. Statistics for spatial data. John Wiley & Sons Inc., Nueva York, NY,
EUA. 900 pp.
Dagnelie, P. 1989. The method of Papadakis in agricultural experimentation: An
overview. Biuletyn Oceny Odmian. p. 111 – 122
David, H. 1967. Resolvable cyclic designs. Sankhyâ A 29: 191 – 208
Davis, R. y Reich, R. 2000. Quantitative spatial analysis. Course notes for NR/ST
523, Colorado State University, Fort Collins, Colorado 80523, EUA.
De Oliveira, J. 1975. Factores de formación. In Moniz A. (Ed). Elementos de pedología.
Río de Janeiro, Brasil. p. 275 – 288
D’Hoore, J. 1970. Cours de pédogenèse. Louvain. Universitè Catholique. 224 pp.
Draper, N. y Faraggi, D. 1985. Role of Papadakis estimator in one and two dimensional
field trials. Biometrika 72: 223 – 226
Eisenhart, C. 1947. The assumptions underlying the analysis of variance. Biometrics 3:
1 – 21.
Emery, X. 2000. Geoestadística lineal. Departamento de Ingeniería de Minas de la
Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, Santiago,
Chile. 411 pp.
Eskridge, K. 2003. Field design and the search for quantitative trait loci in plants.
Department of Biometry.
http://www.stat.colostate.edu/~hari/graybillconference/ talks/Eskridge.ppt
Fagroud, M. y Van Meirvenne, M. 2002. Accounting for soil autocorrelation in the
design of experimental trials. Soil Sci. Soc. Am. J. 66: 1134 – 1142
108
Fisher, R. A. 1925. Statistical methods for research workers. Oliver and Boyd,
Edimburgo, Escocia. 350 pp.
Fisher, R. A. 1935. The design of experiments. Oliver and Boyd, Edimburgo, Escocia.
236 pp.
Fisher, R. y Yates, F. 1938. Statistical tables. Oliver and Boyd, Edimburgo, Escocia.
126 pp.
Gajem, Y., Warrick, A. y Myers, D. 1981. Spatial dependence of physical properties of a
typic torrifluvent soil. Soil Sci. Soc. Am. J. 45: 709 – 715
Gaucher, G. 1971. El suelo y sus características agronómicas. Omega S.A., Barcelona,
España. 647 pp.
Gil, R. 2001. El comportamiento físico – funcional del suelo.
http://cirn.inta.gov.ar
Golden Software Inc. 2001. Surfer 7.05 User’s guide. Surface mapping system. Golden
Software Inc., Golden, Colorado, EUA.
Gotway, C., Ferguson, R., Hergert, G. y Peterson, T. 1996. Comparison of kriging and
inverse-distance methods for mapping soil parameters. Soil Sci. Soc. Am. J. 60: 1237 –
1247
Gotway, C., Bullock, D., Pierce, F., Stroup, W., Herget, G. y Eskridge, K. 1997.
Experimental design issues and statistical evaluation techniques for site – specific
management. ASA – CSSA – SSSA. p. 301 – 331
Gotway, C. y Hergert, G. 1997. Incorporating spatial trends and anisotropy in
geostatistical mapping of soil properties. Soil Sci. Soc. Am. J. 61: 298 – 309
109
Grundy, P. y Healy, M. 1950. Restricted randomization and quasi-latin square. J. R.
Statist. Soc. B 12: 286 – 295
Gurovich, L. y Stern, J. 1983. Variabilidad espacial de la velocidad de infiltración en el
suelo. II. Análisis geoestadístico y estructura espacial. Cienc. Inv. Agr. 10: 271 – 278
Hardy, F. 1970. Edafología tropical. Herrero Hnos. S. A., México. 416 pp.
Hernández, J. y Mulla, D. 2002. Comparing classical and spatial statistical analysis
methods for landscape scale experimental designs. In P.C. Robert, R.H. Rust, y W.E.
Larson (Eds), Proceedings of the 6th International Conference on Precision Agriculture.
ASA – CSSA – SSSA. Madison, WI, EUA.
Honorato, R. 1993. Manual de edafología. Pontificia Universidad Católica de Chile,
Santiago, Chile. 195 pp.
Isaaks, E. y Srivastava, R. 1989. Applied geostatistics. Oxford University Press., Nueva
York, NY, EUA. 561 pp.
Jenny, H. 1941. Factors of soil formation – a system of quantitative pedology. McGraw
– Hill , Nueva York, NY, EUA. 281 pp.
Jorge, J. 1975. Materia orgánica. In Moniz A. (Ed). Elementos de pedología. Río de
Janeiro, Brasil. p. 169 – 178
Journel, A. y Huijbregts, Ch. 1978. Mining geostatistics. Academic Press Limited.,
Londres, Inglaterra. 600 pp.
Kempthorne, O. 1952. The design and analysis of experiments. John Wiley & Sons,
Inc., Nueva York, NY, EUA. 631 pp.
Kirk, H., Haynes, F. y Monroe, R. 1980. Application of trend analysis to horticultural field
trials. J. Amer. Soc. Hort. Sci. 105: 189 – 193
110
MapInfo Corporation. 1999. User’s guide version 5.5. MapInfo Corporation, Troy, Nueva
York, EUA.
McBratney, A. y Webster, R. 1986. Choosing functions for semi-variograms of soil
properties and fitting them to sampling estimates. J. Soil Sci. 37: 617 – 639
Mendenhall, W. y Ott, L. 1980. Understanding statistic. 3ª ed. Duxbury Press.,
California, EUA. 459 pp.
Mitchell, M. 1995. Using XLISP-STAT to explore new and unusual statistical paradigms.
Perspective 1: 28 – 32
Mulla D., Bhatti, A. y Kunkel, R. 1990. Methods for removing spatial variability from field
research trials. Adv. Soil Sci. 13: 201 – 213
Nelson, L. y Rawlings, J. 1983. Ten common misuses of statistics in agronomic
research and reporting. J. Agron. Educ. 12: 100 – 105
Neyman, J., Iwaszkiewicz, K. y Kolodziejczyk, S. 1953. Statistical problems in
agricultural experiments. J. R. Stat. Soc. Suppl. 2: 114 – 136
Ortega R., Westfall D., Gangloff W. y Peterson G. 1999. Multivariate approach to N and
P recommendations in variable rate fertilizer applications. Precision Agriculture ‘99. Part
1. 2nd Precision European Conference on Precision Agriculture. p. 387 – 396
Ortega, R. y Flores, L. 1999. Agricultura de precisión, Introducción al manejo sitio –
específico. Editorial INIA. Chile. 146 pp.
Papadakis, J. 1937. Méthode statistique pour des expériences sur champ. Institut
D’amélioration des plantes a Salonique (Grecia) Bull. Sci. Nº 23 p. 11 – 30
111
Papadakis, J. 1988. Further advances in the use of adjustment (Papadakis method) in
the field experiments. Proceeding of the Academy of Athens. 36: 1 – 11
Parodi, P. C. y Nebreda, I. 1997. Efecto del número de repeticiones y el tipo de
parcelas sobre la eficiencia experimental en la determinación del comportamiento
agronómico del trigo candeal. Cien. Inv. Agr. 24: 46 – 58
Patterson, H. y Williams, E. 1976. A new class of resolvable incomplete block designs.
Biometrika 63: 83 – 92
Patterson, H., Williams, E. y Hunter, E. 1978. Block designs for variety trials. J. Agric.
Sci., Camb. 90: 395 – 400
Pearce, S. y Moore, C. 1976. Reduction of experimental error in perennial crops, using
adjustment by neighbouring plots. Expl. Agric. 12: 267 – 272
Pearce, S. 1998. Field experimentation on rough land: the method of Papadakis
reconsidered. J. Agric. Sci., Camb. 131: 1 – 11
Red Hed Systems Inc., 1999. MapCalc User’s guide version 2.0. Red Hed Systems
Inc., Fort Collins Colorado, EUA.
Red Hed Systems Inc., 2000. FarmGPS User’s guide version 1.5. Red Hed Systems
Inc., Fort Collins Colorado, EUA.
Richey, F. 1924. Adjusting yields to their regression on a moving average, as a means
of correcting for soil heterogeneity. J. Agric. Res. 27: 79 − 90
SAS Institute Inc. 2001. SAS user’s guide. Version 8.02 ed. SAS Inst., Cary, NC, EUA
Sainato, C., Arrigo, N., Giuffré, L., Svidovsky, B., Orden, S. y Palma, M. 1996. Sistema
de labranza: Análisis geoestadístico de propiedades de un suelo. Agric. Tec. 56: 49 –
56
112
Schwarzbach, E. 1985. Weighted nearest-neighbour analysis. Biometrics 41: 1088
Shapiro, S. y Wilk, M. 1965. An Analysis of Variance Test for Normality (complete
samples). Biometrika 52: 591 – 611
Smith, F. 1938. An empirical law describing heterogeneity in the yields of agricultural
crops. J. Agric. Sci. 28: 1 – 23
Snedecor G. 1934. Analysis of variance and covariance. Editorial Ames, IA, EUA.
Snedecor, G. y Cochran, W. 1980. Statistical methods. The Iowa State University
Press. IA, EUA. 507 pp.
Statistical Sciences, 1994. S-Plus for windows version 4.5 supplement. Seattle,
Washington, EUA.
Steel, R. y Torrie, J. 1960. Principles and procedures of statistics. McGraw − Hill Book
Company, Inc. Nueva York, NY, EUA. 481 pp.
Stroup, W., Baenzinger, P. y Mulitze, D. 1994. Removing spatial variation from wheat
yield trials: A comparison of methods. Crop Sci. 86: 62 – 66
Tamura, R., Nelson, L. y Naderman, G. 1988. An investigation of validity and
usefulness of trend analysis for field plot data. Agron. J. 80: 712 – 718
Trangmar, B., Yost, R. y Uehara, G. 1985. Application of geostatistics to spatial studies
of soil properties. Adv. Agron. 38: 45 – 94
Trangmar, B., Yost, R., Wade, M., Uehara, G. y Sudjadi, M. 1987. Spatial variation of
soil properties and rice on recently cleared land. Soil Sci. Soc. Am. J. 51: 668 – 674
van Es, H., van Es, C. y Cassel, D. 1989. Application of regionalized variable theory to
large-plot field experiments. Soil Sci. Soc. Am. J. 53: 1178 – 1183
113
van Es, H. y van Es, C. 1993. Spatial nature of randomization and its effect on the
outcome of field experiments. Agron. J. 85: 420 – 428
Vieira, S., Nielsen, D. y Biggar, J. 1981. Spatial variability of field-measured infiltration
rate. Soil Sci. Soc. Am. J. 45: 1040 – 1048
Warren, J. y Mendez, I. 1982. Methods for estimating background variation in field
experiments. Agron. J. 74: 1004 – 1009
Wilding, L. y Smeck, N. 1983. Pedogenesis and soil taxonomy. Elsevier Science
Publisher B. V. New York, NY, EUA. 303 pp.
Wilkinson, G., Eckert, S., Hancock, T. y Mayo, O. 1983. Nearest neighbour (NN)
analysis of field experiments. J. R. Stat. Soc. B 45: 151 – 211
Williams, E. 1986. A neighbour model for field experiments. Biometrika 73: 279 – 287
Wonnacott, T. y Wonnacott, R. 1972. Introductory statistics. John Wiley & Sons, Inc.
Nueva York, NY, EUA. 510 pp.
Wu, T. y Dutilleul, P. 1999. Validity and efficiency of neighbor analyses in comparison
with classical complete and incomplete block analyses of field experiments. Agron. J.
91: 721 – 731
Yates, F. 1936. A new method of arranging variety trials involving a large number of
varieties. J. Agric. Sci., Camb. 26: 424 – 455
Ye, G., McNeil, D. y Hill, G. 2001. Methods for analysing multi-site plant variety trials. I
Estimating genotypic means at each site. Agron. N. Z. 31: 13 – 24
Yost, R., Uehara, G. y Fox, R. 1982. Geostatistical analysis of soil chemical properties
of large land areas. I. Semi-variograms. Soil Sci. Soc. Am. J. 46: 1028 – 1032
114
Zimmerman, D. y Harville, D. 1991. A random field approach to the analysis of field-plot
experiments and other spatial experiments. Biometrics 47: 223 – 239
115
7. ANEXOS
116
7.1 Anexo A: Modelamiento del variograma experimental
Es importante la elección de un adecuado modelo para estimar el variograma debido a
que cada modelo, para cada variable, entregan diferentes valores para el nugget,
umbral y rango, los cuales son importantes para la interpolación con kriging (Trangmar
et al., 1985).
Según Emery (2000), los modelos de variograma se pueden clasificar en:
7.1.1. Modelos con umbral y comportamiento en el origen.
− Discontinuo.
• Efecto de nugget puro:
0 para h = 0
γ(h) =
C para h > 0
− Lineal.
• Esférico:
C
−
3
3
21
23
ah
ah para 0 < h < a
γ(h) =
C para h > a
• Exponencial:
γ(h) =
−−
ah
C exp1
−− Parabólico.
• Gausiano:
117
γ(h) =
−−
2
2
exp1ah
C
• Cúbico:
−+−
743
27
4357 7
5
5
3
32
hh
ah
ah
ah
C para 0 < h < a
γ(h) =
C para h > a
Otros modelos con umbral y comportamiento en el origen son:
• Triangular.
• Cuadrático.
• Circular.
• Pentaesférico.
• Estable.
• Gamma.
• De Cauchy.
• De Bessel modificado.
7.1.2. Modelos con umbral y efecto de agujero (hole effect).
• Coseno, de periodo a y amplitud 2C (válido solamente en R):
γ(h) =
Π
−a
hC
2cos1
• Coseno amortiguado, de parámetros a, b, α y sill C (válido en R):
γ(h) = ( )
Π−−
ah
bhC2cosexp1 α con 0 < α < 2
118
Otros modelos:
• J de Bessel.
• Polinomiales truncados.
• Estable generalizado.
7.1.3. Modelo sin umbral, estos modelos sobrepasan el marco estacionario de segundo
orden. Corresponden funciones aleatorias intrínsecas estrictas.
• Potencia:
γ(h) = θϖh con 0 < θ < 2
• Lineal, se trata de un caso particular del modelo potencia, con exponente igual
a 1:
γ(h) = hϖ
• Logarítmico:
γ(h) = ( )hln3α
donde en los modelos C es la covarianza espacial, a es el rango de la dependencia
espacial y h es la distancia lag.
El estudio de variogramas relativos, como el variograma local relativo, el variograma
global relativo y el variograma pairwise relativo, al igual que el modelamiento de
anisotropía, está fuera del alcance de esta tesis.
119
7.2 Anexo B: Metodología de las interpolaciones
7.2.1 Polígonos de Thiessen
Este método asigna a cada punto de los datos un polígono de influencia y cada
muestra que está dentro de la zona de influencia tiene un valor cercano al del polígono
que cualquier muestra de otra zona (Davis y Reich, 2000).
Para la construcción de un polígono se designa un bisector perpendicular equidistante
a una línea que une dos puntos cercanos. El bisector perpendicular entre muestra y las
muestras vecinas forman los límites de un polígono, por lo que queda desigualmente
definido (Isaaks y Srivastava, 1989). (Figura B.1)
Figura B.1. Construcción de un polígono (Fuente: Isaaks y Srivastava, 1989).
7.2.2 Triangulación
El método de polígonos provee una estimación discontinua (Figura B.2), y la
discontinuidad en la estimación de los valores no es adecuada (Isaaks y Srivastava,
1989).
120
Figura B.2. Discontinuidad del método de polígonos (Fuente: Isaaks y Srivastava,
1989).
El método de triangulación no presenta este problema, ya que remueve las posibles
discontinuidades entre puntos adyacentes por medio del ajuste de un plano dado por
tres muestras que rodean el punto que se desea estimar (Davis y Reich, 2000). La
ecuación de un plano puede ser expresada como (Isaaks y Srivastava1989):
[B.1] z = ax + by + c
donde z es el valor de la variable a estimar, x es la coordenada del este (ó longitud) e y
es la coordenada del norte (ó latitud).
Al seleccionar las tres muestras cercanas se construye un sistema de ecuaciones:
z1 = ax1 + by1 + c
z2 = ax2 + by2 + c
z2 = ax2 + by2 + c
al resolver el sistema de ecuación se estima el valor de a, b y c:
ccybbaa ˆˆ,ˆ ===
121
donde cyba ˆˆ,ˆ son los parámetros estimados, con lo que la formula de estimación de
una variable no muestreada es (Figura B.3):
[B.2] cybxaz ˆˆˆˆ ++=
Figura B.3. Método de triangulación (Fuente: Isaaks y Srivastava, 1989).
7.2.3 Distancia Inversa
En el método de polígonos y el método de triangulación se ignora información de las
parcelas adyacentes (Isaaks y Srivastava, 1989). El método de la distancia inversa
entrega más peso a las muestras más cercanas y menos peso a las que se encuentran
más alejadas (Davis y Reich, 2000), esto se realiza mediante el peso entregado a cada
muestra es inversamente proporcional a la distancia desde donde el punto de la
variable aleatoria es estimado:
[B.3]
∑
∑
=
=
=n
i i
n
ii
i
d
yd
y
1
1
1
1
ˆ
donde � es el valor de la variable estimada, di es la distancia de las muestras cercanas
a la variable a estimar e yi es el valor de la variable vecina correspondiente a la
distancia di.
122
7.2.4 Kriging
Inicialmente, el procedimiento de kriging fue introducido por Krige en el año 1951 y
formalizado por Matheron en el año 1962 (Citados por Journel y Huijbregts, 1978).
Kriging se apoya en la interpretación de la variable regionalizada como una realización
de una función aleatoria, de la cual se obtiene un modelo de variograma. Se trata de
buscar, entre los estimadores formados por las combinaciones lineales ponderadas de
los datos, aquel que presente las mejores propiedades (Emery, 2000).
El método kriging es asociado con la sigla en inglés “B.L.U.E.” (best linear unbiased
estimator), ya que, es lineal, por que los estimadores se forman por la combinación
lineal de los datos disponibles, es el mejor por que minimiza la varianza del error, es
insesgado, por que intenta que la media del error sea cercana a cero (Journel y
Huijbregts, 1978).
Los métodos anteriormente descritos, también son lineales y teóricamente insesgados,
pero lo que distingue a kriging de los otros métodos es que minimiza la media y la
varianza del error (Isaaks y Srivastava, 1989).
Existen muchos métodos de kriging (Trangmar et al., 1985):
• Kriging puntual
• Kriging ordinario
• Kriging en bloques
• Kriging universal o de orden k
• Kriging disyuntivo
• Lognormal kriging
• Cokriging
Pero el kriging puntual es, probablemente, el método más utilizado en las ciencias del
suelo (Vieira et al., 1981; Burgess y Webster, 1980; Trangmar et al., 1985; Gotway et
al., 1996).
La estimación de las variables no muestreadas para el kriging, está dada por la
siguiente formula lineal (Emery, 2000):
Kriging Simple
123
[B.4] ( ) ( )i
n
i
xyxy ∑=
=1
0ˆ αλ
donde �(x0) es el valor de la variable estimada, xi (i =1,... n) son los puntos utilizados
para la estimación y los ponderadores λα son las incógnitas del problema de kriging.
Estos ponderadores dependerán a la vez de la estructura espacial de la
regionalización.
Los ponderadores o pesos son seleccionados, de tal manera que, el estimado �(x0) del
verdadero valor y(x0) carece de sesgo (Trangmar et al., 1985):
[B.5] ( ) ( )[ ] 0ˆ 00 =− xyxyE
y la varianza estimada 2σ̂ es minimizada:
[B.6] ( ) ( )[ ] mínimoxyxyVar =−= 002 ˆσ̂
Los pesos utilizados para cada muestra cercana suman uno, y su única combinación
para la cual 2σ̂ es minimizada puede ser obtenida cuando:
[B.7] ( ) ( )01
,, xxyxxy iji
n
j
=+∑=
µλα
Los valores y(xi, x j) y y(xi, x0) son las semi-varianzas entre las localidades observadas xi
y xj, y entre la localidad observada xi y la localidad interpolada x0, estos valores son
obtenidos del variograma de y(x).
Los supuestos de para la utilización de kriging son que las muestras son normalmente
distribuidos y estacionarias (Journel y Huijbregts, 1978).
Cuando no se cumplen adecuadamente los supuestos los otros métodos de kriging
pueden ser utilizados (Figura B.4).
124
Figura B.4. Métodos de kriging bajo diferentes condiciones de estacionaridad y
probabilidad de distribución de los datos (Adaptado de Trangmar et al., 1985).
125
7.3 Anexo C: Procedimientos SAS
Análisis de varianza de un diseño de bloques completos al azar y α - lattice.
Los datos originalmente utilizados correspondían a bloques incompletos con sus
correspondientes repeticiones. Las correspondientes abreviaciones son trt híbrido,
block bloque incompleto, rep la repetición o súper bloque y yld rendimiento.
7.3.1. Bloques completos al azar y análisis de normalidad de los residuales:
options nodate ls=75; data pioneer; input trt $ yld rep block; datalines; /*(datos)*/ proc glm; class trt rep; model yld= trt rep; output out=resdat r=res; Proc univariate data=resdat normal; Var res; title 'Análisis de Bloques Completos al Azar'; run;
7.3.2. α - lattice:
options nodate ls=75; data Pioneer; input trt $ yld rep block; datalines; /*(datos)*/ proc glm; class trt rep block; model yld= trt block rep; title 'Análisis de Lattice'; run;
126
7.3.3. Errores correlacionados, lon (longitud) y lat (latitud) corresponden a las
coordenadas geográficas de los híbridos:
options nodate ls=120; data pioneer; input lon lat trt $ yld; datalines; /*(datos)*/ proc mixed noprofile; class trt; model yld= trt; parms () ()/noiter; /*Parámetros del Variograma: sill range */ repeated / type=sp(sph)(lon lat); title 'Análisis de EC'; run;
7.3.4. Análisis de tendencia, los datos fueron dispuestos en filas (row) y columnas (col)
desde su diseño original, trend corresponde al polinomio de la superficie de respuesta:
options nodate ls=75; data pioneer; input row col trt $ yld; trend = /* formula del polinomio de la superficie de respuesta */ datalines; /*(datos)*/ proc glm; class trt; model yld= trt trend; title 'Análisis de Tendencia'; run;
7.3.5. Análisis de tendencia más error correlacionado, se utiliza la misma fórmula de la
superficie de respuesta utilizada en el análisis de tendencia y los parámetros del
variograma usado en el modelo de error correlacionado:
proc mixed noprofile; class trt; model yld = trt trend; parms () ()/noiter; /* Variogram param: sill range */ repeated / type=sp(sph)(lon lat); title 'Análisis de Tendencia + EC'; run;
127
7.3.6. Zonas incorporadas al diseño experimental:
options nodate ls=75; data pioneer; input trt $ yld rep block z(número de zona)$; datalines; /*(datos)*/
El siguiente paso varía dependiendo del diseño experimental:
Bloques completos al azar:
proc glm data = pioneer; class trt rep z(más el número de zona de interés); model yld = rep hibrido z hibrido*z; title 'Zonas'; run;
α - lattice:
proc glm data = pioneer; class trt block rep z; model yld= rep block hibrido z hibrido*z; title 'Zonas'; run;
7.3.7. Método de Papadakis, los datos fueron dispuestos en filas (row) y columnas (col)
desde su diseño original, este procedimiento permite a SAS obtener los residuales a
partir de un diseño completamente al azar y calcular la covariable:
options nodate ls=75; data pioneer; input row col trt $ yld rep; datalines; /*(datos)*/ data sub; set pioneer; row = row; col = col; keep row col yld trt rep; proc sort; by row col; title 'Residuales'; proc glm; class trt rep; model yld=trt; output out=new r=res; data left; set new;
128
col=col+1; if col <=36; left=res; keep left col row; data right; set new; col=col-1; if col >=1; right=res; keep right col row; data top; set new; row=row-1; if row >=1; top=res; keep top col row; data bott; set new; row=row+1; if row <=20; bott=res; keep bott col row; data tog; merge sub left right top bott; by row col; cov = mean(left, right, top, bott); title 'Análisis de Papadakis'; proc glm; class trt; model yld=trt cov; run;
129
7.4 Anexo D: Metodología del análisis de agrupamiento (cluster analysis)
utilizado por MapCalc.
El agrupamiento (cluster) es utilizado para identificar áreas con características
similares a partir de un grupo de capas de mapas. El proceso pasa a través de un
grupo de valores de un sinnúmero de capas, luego investiga el patrón de los datos, los
cuales esta formado por valores, para determinar otras ubicaciones que sean
similares. Las etapas del procedimiento son:
(1) Establecer arbitrariamente un centro de datos para cada agrupamiento, por
medio de asignar aleatoriamente valores a los datos. La similitud, o distancia de
los datos, es computada por un mapa de ubicación del centro de datos para
cada uno de los agrupamientos. La ubicación es asignada al agrupamiento que
se encuentre más cerca al centro de datos (el modelo de datos más similares)
El procedimiento es repetido hasta que todos los mapas de ubicación tengan
asignado un agrupamiento inicial.
(2) Calcular el promedio de los datos de las ubicaciones asignadas pertenecientes
al agrupamiento inicial. Los promedios forman un centro de datos actualizados,
el cual refleja el modelo de los datos de cada agrupamiento. Los valores
actualizados son utilizados para redistribuir los agrupamientos
correspondientes, por medio de comparar repetidamente cada modelo de datos
de ubicación con el modelo de datos actualizados de los agrupamientos.
(3) Iteración de estos pasos hasta que no cambie la asignación al agrupamiento, o
hasta que se cumpla un máximo de 30 iteraciones.
130
7.5 Anexo E: Metodología de selección de las zonas
La selección del número óptimo de zonas se realizó mediante el siguiente
procedimiento:
(4) Se comparó la eficiencia relativa de las zonas con respecto a los diseños
experimentales, eligiendo el número de zonas que presentara una eficiencia
relativa sobre uno y fuese mayor al de las otras zonas. (Cuadro E.1)
(5) Se observó la prueba de falta de ajuste para determinar bajo la hipótesis nula
de que no existe diferencia entre el diseño originalmente descrito y el
propuesto, la cual tiene que ser significativa. (Cuadro E.2)
(6) Si se cumplen estos requisitos se selecciona el correspondiente número de
zonas.
Cuadro E.1. Eficiencia relativa de las zonas con respecto a los distintos diseños bajo
los distintos experimentos.
Zonas BCA � - lattice Zonas BCA � - lattice2 Zonas 1,04 1,02 2 Zonas 0,95 0,883 Zonas 0,97 0,99 3 Zonas 0,94 0,854 Zonas 0,88 0,71 4 Zonas 1,14 1,055 Zonas 0,91 0,88 5 Zonas 1,06 0,906 Zonas 0,99 0,99 6 Zonas 1,15 1,057 Zonas 1,45 3,69 7 Zonas 0,87 0,678 Zonas 1,44 27,84 8 Zonas 0,91 1,069 Zonas 1,00 1,05 9 Zonas 1,18 1,16
10 Zonas 0,98 0,60 10 Zonas 1,59 1,5011 Zonas 1,41 N/D 11 Zonas 1,05 0,6812 Zonas 0,59 N/D 12 Zonas 0,84 4,8213 Zonas 1,75 N/D 13 Zonas 1,13 0,8314 Zonas 2,03 N/D 14 Zonas 1,78 3,0815 Zonas 0,68 N/D 15 Zonas 1,22 4,1516 Zonas 0,77 N/D 16 Zonas 1,51 N/D17 Zonas 1,51 N/D 17 Zonas 1,42 N/D18 Zonas 2,24 N/D 18 Zonas 1,02 0,8119 Zonas 2,18 N/D 19 Zonas 1,19 N/D20 Zonas 0,56 N/D 20 Zonas 0,81 15,18
Estrés hídrico Riego normalDiseño experimental Diseño experimental
N/D = no determinado
131
Cuadro E.2. Prueba de falta de ajuste de las zonas con respecto a los distintos
diseños y en los distintos experimentos.
Zonas F Pr > F F Pr > F Zonas F Pr > F F Pr > F2 Zonas 2,30*** 3,511E-08 3,53*** 2,84E-17 2 Zonas 0,93 0,666 0,88 0,8113 Zonas 1,50** 0,005 2,43*** 3,47E-07 3 Zonas 0,93 0,693 0,89 0,7494 Zonas 1,26 0,163 1,57 0,108 4 Zonas 1,22 0,116 1,17 0,2045 Zonas 1,30 0,090 1,94** 0,007 5 Zonas 1,10 0,305 0,99 0,5336 Zonas 1,43 0,058 2,24* 0,020 6 Zonas 1,22 0,170 1,20 0,2797 Zonas 2,15** 0,007 9,61** 0,004 7 Zonas 0,87 0,778 0,73 0,8948 Zonas 2,14* 0,013 84,11** 0,002 8 Zonas 0,93 0,649 1,28 0,3029 Zonas 1,49 0,140 4,19 0,375 9 Zonas 1,26 0,182 1,47 0,25910 Zonas 1,47 0,179 1,79 0,356 10 Zonas 1,74* 0,023 2,00 0,16611 Zonas 2,15* 0,038 N/D N/D 11 Zonas 1,10 0,368 0,92 0,63012 Zonas 0,90 0,648 N/D N/D 12 Zonas 0,88 0,715 8,54 0,11013 Zonas 2,75* 0,025 N/D N/D 13 Zonas 1,21 0,266 1,33 0,47914 Zonas 3,35* 0,034 N/D N/D 14 Zonas 1,98* 0,032 6,54 0,30415 Zonas 1,06 0,498 N/D N/D 15 Zonas 1,33 0,195 8,82 0,26416 Zonas 1,43 0,406 N/D N/D 16 Zonas 1,69 0,088 N/D N/D17 Zonas 2,61 0,110 N/D N/D 17 Zonas 1,58 0,113 N/D N/D18 Zonas 3,78* 0,033 N/D N/D 18 Zonas 1,15 0,399 1,71 0,55519 Zonas 3,92 0,063 N/D N/D 19 Zonas 1,33 0,253 N/D N/D20 Zonas 0,89 0,657 N/D N/D 20 Zonas 0,88 0,691 32,22 0,140
Prueba de falta de ajusteBCA � - lattice
Diseño experimentalEstrés hídrico
BCA � - latticePrueba de falta de ajuste
Diseño experimentalRiego normal
Significativo a un nivel de *** α = 0,001, ** α = 0,01 y * α = 0,05, N/D = no determinado
Las zonas seleccionadas en el experimento de estrés hídrico fueron:
• 18 zonas para el diseño experimental de BCA.
• 8 zonas para el diseño experimental de α - lattice.
Las zonas seleccionadas en el experimento de riego normal fueron:
• 10 zonas para el diseño experimental de BCA.
• No existe una zona que cumpla con la totalidad de los requisitos, pero se
seleccionó un número de 12 zonas para el diseño experimental α -lattice, por
presentar la eficiencia relativa de mas alto valor.
132
7.6 Anexo F: Variogramas de las propiedades del suelo bajo los distintos
experimentos
Figura F.1. Variograma y modelo esférico para la variable pH bajo estrés hídrico.
Figura F.2. Variograma y modelo esférico para la variable Conductividad Eléctrica bajo estrés hídrico.
133
Figura F.3. Variograma y modelo esférico para la variable Amonio bajo estrés hídrico.
Figura F.4. Variograma y modelo esférico para la variable Nitrógeno bajo estrés hídrico.
134
Figura F.5. Variograma y modelo esférico para la variable Fósforo bajo estrés hídrico.
Figura F.6. Variograma y modelo esférico para la variable Potasio bajo estrés hídrico.
135
Figura F.7. Variograma y modelo esférico para la variable Sodio bajo estrés hídrico.
Figura F.8. Variograma y modelo esférico para la variable Calcio bajo estrés hídrico.
136
Figura F.9. Variograma y modelo esférico para la variable Magnesio bajo estrés hídrico.
Figura F.10. Variograma y modelo esférico para la variable Conductividad Eléctrica bajo riego normal.
137
Figura F.11. Variograma y modelo esférico para la variable Materia Orgánica bajo riego normal.
Figura F.12. Variograma y modelo esférico para la variable Amonio bajo riego normal.
138
Figura F.13. Variograma y modelo gausiano para la variable Nitrato bajo riego normal.
Figura F.14. Variograma y modelo esférico para la variable Nitrógeno bajo riego normal.
139
Figura F.15. Variograma y modelo esférico para la variable Fósforo bajo riego normal.
Figura F.16. Variograma y modelo esférico para la variable Potasio bajo riego normal.
140
Figura F.17. Variograma y modelo esférico para la variable Sodio bajo riego normal.
Figura F.18. Variograma y modelo esférico para la variable Magnesio bajo riego normal.