validación de modelos mecanísticos · le dedico esta tesis a mi esposa teo y a mis hijos ricardo...

151
COLEGIO DE POSTGRADUADOS INSTITUCIÓN DE ENSEÑANZA E INVESTIGACIÓN EN CIENCIAS AGRÍCOLAS CAMPUS MONTECILLO SOCIOECONOMÍA, ESTADÍSTICA E INFORMÁTICA ESTADÍSTICA VALIDACIÓN DE MODELOS MECANÍSTICOS BASADA EN LA PRUEBA JI-CUADRADA DE FREESE, SU MODIFICACIÓN Y EXTENSIÓN SALVADOR MEDINA PERALTA T E S I S PRESENTADA COMO REQUISITO PARCIAL PARA OBTENER EL GRADO DE: M A E S T R O E N C I E N C I A S MONTECILLO, TEXCOCO, EDO. DE MÉXICO 2006

Upload: others

Post on 30-Apr-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

COLEGIO DE POSTGRADUADOS

INSTITUCIÓN DE ENSEÑANZA E INVESTIGACIÓN EN CIENCIAS AGRÍCOLAS

CAMPUS MONTECILLO

SOCIOECONOMÍA, ESTADÍSTICA E INFORMÁTICA

ESTADÍSTICA

VALIDACIÓN DE MODELOS MECANÍSTICOS BASADA EN LA PRUEBA JI-CUADRADA DE FREESE,

SU MODIFICACIÓN Y EXTENSIÓN

SALVADOR MEDINA PERALTA

T E S I S

PRESENTADA COMO REQUISITO PARCIAL PARA OBTENER EL GRADO DE:

M A E S T R O E N C I E N C I A S

MONTECILLO, TEXCOCO, EDO. DE MÉXICO 2006

AGRADECIMIENTOS

Le dedico esta tesis a mi esposa Teo y a mis hijos Ricardo y Daniela.

Al Colegio de Postgraduados, en especial al personal docente y administrativo

del Programa en Estadística.

A la Universidad Autónoma de Yucatán (UADY) por permitirme continuar con mi

formación académica.

Al Programa de Mejoramiento del Profesorado (PROMEP) por el apoyo

económico otorgado durante la estancia de mis estudios de Maestría.

A mi consejo particular:

Dr. Enrique Arjona Suárez, Dr. Jorge Navarro Alberto, Dr. Luís Vargas Villamil y Dr.

Germán Mendoza Martínez, por su disposición y aportaciones realizadas en el

desarrollo de este trabajo.

A Luís y Jorge por su amistad, entusiasmo, apoyo, disciplina, capacidad,

ejemplo... Gracias por su apoyo académico y personal en todos los proyectos

realizados.

I

ÍNDICE Página

ÍNDICE……………………………...……………………………………….………………. II

LISTA DE CUADROS……………………………………………………………………... V

LISTA DE FIGURAS……………………….………………………………………………. VII

RESUMEN…………………………………………………………………………………... IX

SUMMARY…………………………………………………..…………….………………... X

1. INTRODUCCIÓN……………...………………………………………………………… 1

2. OBJETIVOS……………………………………………………………………………… 3

2.1. Objetivo general……………………………………………………………….. 3

2.2. Objetivos específicos…………………………………………………………. 3

3. REVISIÓN DE LITERATURA………………………………………………………….. 5

3.1. Sistema y variable de estado………………………………………………… 5

3.2. Modelo matemático…………………………………………………………… 5

3.3. Modelación empírica y mecanística………………………………………… 7

3.4. Validación de modelos: conceptos y métodos…………………………….. 8

3.4.1. Conceptos…………………………………………………………… 8

3.4.2. Métodos para la validación de modelos………………………….. 12

3.5. Pruebas para el supuesto de normalidad…………………………………... 17

3.6. Transformaciones de datos………………………………………………….. 18

4. MATERIALES Y MÉTODOS…………………………………………………………… 20

4.1. Descripción del modelo mecanístico Wakax POS………………………… 20

4.2. Descripción de los datos experimentales empleados en la

validación…………………………..………………………………………….. 21

4.3. Procedimientos estadísticos para la validación de modelos basados en

el planteamiento de Freese…………………………………………………. 22

4.3.1. Conceptos básicos………………………………………………….. 23

4.3.2. Validación de modelos basada en el valor absoluto del error en

ausencia de sesgo…………………………………………………. 25

4.3.2.1. Pruebas estadísticas para la exactitud requerida…… 27

4.3.2.2. Prueba UMP(α’) para ……………………………….'0H 29

II

4.3.3. Validación de modelos basada en el porcentaje del error en

ausencia de sesgo…………………………………………………. 32

4.3.4. Validación por intervalo de confianza empleando el error crítico

en ausencia de sesgo……………………………………………… 34

4.3.5. Planteamiento para validar un modelo en predicción de varias

variables…………………………………………………................. 46

4.3.6. Planteamiento para la comparación de dos o más modelos en

predicción……………………………………………………........... 48

4.3.7. Validación de modelos basada en el valor absoluto del error en

presencia de sesgo constante……………………………………. 50

4.3.7.1. Pruebas estadísticas para la exactitud requerida…… 52

4.3.8. Validación por intervalo de confianza empleando el error crítico

en presencia de sesgo constante………………………………… 56

4.3.9. Validación de modelos basada en el valor absoluto del error en

presencia de sesgo proporcional….……………..………............ 61

4.3.9.1. Pruebas estadísticas para la exactitud requerida…… 63

4.3.10. Validación por intervalo de confianza empleando el error

crítico en presencia de sesgo proporcional….………………… 65

4.3.11. Análisis exploratorio e identificación del sesgo………………… 68

5. RESULTADOS Y DISCUSIÓN………………………………………………………… 70

5.1. Procedimientos estadísticos para la validación de modelos basados en

el planteamiento de Freese.………...………………………………………. 70

5.2. Validación de modelos basada en el valor absoluto del error en

ausencia de sesgo………………………………………………………….... 71

5.2.1. Pruebas estadísticas para la exactitud requerida……………….. 71

5.3. Validación de modelos basada en el porcentaje del error en ausencia

de sesgo…..…………………………………………………………………... 72

5.4. Validación por intervalo de confianza empleando el error crítico en

ausencia de sesgo…………………………………………………………… 73

5.5. Planteamiento para validar un modelo en predicción de varias

variables……………………………………………………………………….. 75

III

5.6. Planteamiento para la comparación de dos o más modelos en

predicción……………………………………………………………………… 76

5.7. Validación de modelos basada en el valor absoluto del error en

presencia de sesgo constante………………………………………………. 77

5.7.1. Pruebas estadísticas para la exactitud requerida……………….. 78

5.8. Validación por intervalo de confianza empleando el error crítico en

presencia de sesgo constante…….………………………………………… 79

5.9. Validación de modelos basada en el valor absoluto del error en

presencia de sesgo proporcional.………..…………………………………. 81

5.9.1. Pruebas estadísticas para la exactitud requerida……………….. 81

5.10. Validación por intervalo de confianza empleando el error crítico en

presencia de sesgo proporcional…………………………………………… 82

5.11. Planteamiento para validar un modelo en predicción de varias

variables y para la comparación de dos o mas modelos en predicción

cuando el modelo presenta sesgo………………………………………….. 83

5.12. Sesgo y supuestos………………………………………………………...... 84

5.13. Validación del modelo dinámico mecanístico Wakax POS en

predicción de la ganancia de peso……………………...………………….. 86

5.14. Validación del modelo dinámico mecanístico Wakax POS en

predicción de la materia seca, ácidos grasos volátiles, acetato,

propionato y butirato en el Rumen y Ciego……..…………………………. 95

6. CONCLUSIONES……………………………………………………………………….. 106

7. BIBLIOGRAFÍA………………………………………………………………………….. 108

ANEXO I…………………………………………………………………………………….. 116

ANEXO II…………………………………………………………...……………………….. 136

IV

LISTA DE CUADROS Página

Cuadro 1. Promedios observados de ganancia de peso (kg) de 34 experimentos

y sus correspondientes simulados con el modelo Wakax POS……..…. 86

Cuadro 2. Diferencia entre los valores observados y predichos, y la corrección

por sesgo constante……….………………………………………………... 90

Cuadro 3. Valores de DM, AGVs, Ac, Pr y Bu observados y predichos con el

modelo Wakax POS en el Rumen y Ciego……………...……………….. 96

Cuadro 4. Medidas descriptivas de las diferencias entre los valores observados

y predichos para las DM, Ac, Pr, Bu y AGVs en el Rumen y Ciego…… 99

Cuadro 5. Valores de las estadísticas MEF y CD para las variables DM, AGVs,

Ac, Pr y Bu en el Rumen y Ciego………………………………………….. 105

Anexo I Cuadro I.1. Símbolos usados en el diagrama del modelo Turix….………………... 116

Cuadro I.2. Notación y abreviaciones empleadas en el modelo Wakax POS con

excepción del submodelo de Crecimiento animal…………………..…. 117

Cuadro I.3. Notación y abreviaciones empleadas en el submodelo de

Crecimiento animal……………………………………………….……….. 119

Cuadro I.4. Submodelo Concentrado (Co).…………...…………………………..…. 126

Cuadro I.5. Submodelo Pasto (Pa).…..……….………………….………………..…. 128

Cuadro I.6. Submodelo Caña de azúcar (CZ).……………………………..……..…. 130

Cuadro I.7. Submodelo Melaza.………………………………………….……………. 132

Cuadro I.8. Ecuaciones descriptivas.………………………………….…………..….. 133

Cuadro I.9. Submodelo Crecimiento animal.…………………………………………. 133

Anexo II Cuadro II.1. Fuentes de los datos experimentales utilizados en la validación del

modelo Wakax POS en predicción de la GPP por día………………... 136

Cuadro II.2. Datos de los animales, cantidades de los alimentos suministrados y

la GPP por día observada y modelada con el modelo Wakax POS… 137

V

Cuadro II.3. Fuentes e información de los datos experimentales utilizados en la

validación del modelo Wakax POS en predicción en el Rumen y

Ciego de DM(%), AGVs(mM), Ac(%), Pr(%) y Bu(%)…………………. 139

VI

LISTA DE FIGURAS Página

Figura 1. Esquematización de la exactitud contra la precisión…………………….. 9

Figura 2. Comparación de las medidas de exactitud y precisión. La línea

punteada representa a la recta y=x……………………………………….. 10

Figura 3. Valores hipotéticos del error crítico (j=1,2,3) para cada variable…....*je 47

Figura 4. Valores hipotéticos de V(Dj) o εj (j=1,2,3) para cada variable…………... 48

Figura 5. Valores hipotéticos del error crítico (j=1,2) para la variable Y por

medio de los modelos 1 y 2 (M1 y M2)……………………………………

**je

49

Figura 6. Relación entre el sesgo (di) y los valores simulados (zi) para la GPP.

233.0d = kg es la media de las diferencias (di)…………………………. 88

Figura 7. Dispersión de los puntos (zi, yi) para la GPP. y=z es la recta que

representa la exactitud ideal.…………………………...………………….. 89

Figura 8. Relación entre los valores predichos (zi) y los observados (yi) para la

GPP. y=0.2798+0.6475z es la recta de regresión ajustada. y=z es la

recta de exactitud ideal…….....……………………………………………. 93

Figura 9. Dispersión de los puntos (zi, yi) para DM, Ac, Pr y Bu en el Rumen.

y=z es la recta que representa la exactitud ideal……………….……... 97

Figura 10. Dispersión de los puntos (zi, yi) para AGVs(mM) en el Rumen. y=z es

la recta que representa la exactitud ideal………………………………… 98

Figura 11. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos

(zi) para DM, Ac, Pr y Bu en el Rumen…………………………………… 98

Figura 12. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos

(zi) para AGVs(mM) en el Rumen…………………………………………. 99

Figura 13. Dispersión de los puntos (zi, yi) para DM, Ac, Pr y Bu en el Ciego. y=z

es la recta que representa la exactitud ideal……………………………... 100

Figura 14. Dispersión de los puntos (zi, yi) para AGVs(mM) en el Ciego. y=z es

la recta que representa la exactitud ideal………………………………… 101

Figura 15. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos

(zi) para DM, Ac, Pr y Bu en el Ciego……………………………………... 101

VII

Figura 16. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos

(zi) para AGVs(mM) en el Ciego…………………………………………… 102

Anexo I Figura I.1. Representación esquemática del modelo Turix….……………………… 116

VIII

RESUMEN

Una etapa fundamental en la construcción de un modelo es su validación, la cual presenta dificultades tanto conceptuales como prácticas. En este trabajo se presentó, modificó y extendió el procedimiento de validación de modelos desarrollado por Freese (1960). El método es una alternativa inferencial para determinar si las salidas del modelo están suficientemente próximas a los valores observados del sistema real. Permite analizar datos provenientes de modelos que presenten o no sesgo en sus pronósticos sin modificar la estructura del modelo. Se establecieron los supuestos, la estadística de prueba y el error crítico para el planteamiento original y alternativo del procedimiento de Freese cuando el modelo presenta o no sesgo. Para el caso de sesgo proporcional se presenta una modificación al método. Se expone un procedimiento alternativo al de Reynolds (1984) para determinar el intervalo de confianza bilateral (ICB) para el cuantil 1-α de la distribución de |D|. Se determinaron en términos del error crítico los ICB para el cuantil 1-α de la distribución de DD − y Rε , cuando el modelo presenta sesgo constante y proporcional respectivamente. Con base al error crítico se propone un método para validar un modelo en predicción de varias variables y otro para comparar dos o más modelos en predicción del mismo sistema. Para ilustrar la metodología basada en el planteamiento de Freese, se validó el modelo dinámico mecanístico Wakax POS en predicción de la ganancia de peso promedio por día de bovinos alimentados con caña de azúcar, maíz quebrado y/o melaza en una zona tropical de México. Adicionalmente se utilizaron métodos gráficos y medidas estadísticas para la validación en predicción de la materia seca (DM), ácidos grasos volátiles (AGVs), acetato (Ac), propionato (Pr) y butirato (Bu) en el Rumen y Ciego. El modelo Wakax POS puede usarse para predecir la ganancia de peso promedio por día, aunque requerirá un ajuste con base a la presencia de sesgo constante para incrementar su exactitud. El sesgo de las predicciones en el Rumen presenta mayor amplitud para los AGVs, seguido por Ac, Pr, Bu y DM. En el Ciego el sesgo tiene mayor amplitud para los AGVs, seguido por DM, Ac, Bu y Pr. A diferencia del coeficiente de determinación del modelo, la eficiencia de modelado proporciona resultados consistentes con los obtenidos de las técnicas visuales de validación. Palabras clave: Validación, modelo mecanístico, prueba ji-cuadrada de Freese, error crítico, corrección por sesgo.

IX

SUMMARY

A fundamental stage in the construction of a model is its validation, which presents difficulties both conceptual and practical. In this work a procedure of model validation developed by Freese (1960) is presented, and subsequently the procedure is modified and extended. The method is an inferential alternative used to determine whether the outputs of the model are sufficiently close to the observed values of the real system. It allows to analyze data coming from models with or without bias, and without modifying the structure of the model. The assumptions, the test statistic and the critical error were established for the original and the alternative settings of Freese's procedure for models possessing or not possessing bias. For the case of proportional bias a modification to the method is presented. An alternative procedure to that given in Reynolds (1984) is exposed in order to construct a two-sided confidence interval (TCI) for the 1-α quantile of the distribution of |D|. TCI's were established in terms of the critical error for the 1-α quantile of the distribution of DD − and Rε , when the model has constant and proportional bias, respectively. On the basis of the critical error, one method of model-validation that predicts several variables and another one for the comparison of two or more predictive models of the same system are proposed. To illustrate the methodology based on Freese's approach, the mechanistic dynamic model Wakax POS was validated for the prediction of the average weight gain per day of bovines fed with sugar cane, broken corn and/or molasses in a tropical area of Mexico. Additionally, graphical methods and statistical measures were used for the validation in prediction of dry matter (DM), volatile fatty acids (VFAs), acetate (Ac), propionate (Pr) and butirate (Bu) in Rumen and Cecum. The model Wakax POS can be used to predict the average weight gain per day, but it will require an adjustment taking into account the presence of constant bias in order to increase its accuracy. The bias of the predictions in the Rumen presents larger amplitude for the VFAs, followed by Ac, Pr, Bu and DM. In the Cecum the largest bias was attained for the VFAs, followed by DM, Ac, Bu and Pr. Contrary to the coefficient of model determination, the modeling efficiency provides consistent results with those obtained by the visual techniques of validation. Keywords: Validation, mechanistic model, Freese chi-squared test, critical error, bias correction.

X

1. INTRODUCCIÓN

En la construcción de un modelo se necesita tener conocimiento tanto de las

partes que conforman el sistema como de las interacciones existentes entre ellas,

aproximándose más el modelo a la realidad cuanto más detallado sea dicho

conocimiento. En el procedimiento de ajuste de modelos mecanísticos, se asumen

relaciones particulares entre las variables, llevando al modelador a aceptar alguna

desviación entre los datos y el modelo para obtener un modelo que explique

satisfactoriamente la situación bajo investigación (Giordano et al., 1997a).

En el proceso de modelación, los modeladores generalmente admiten que una

etapa fundamental es la validación de los modelos, sobre todo de aquellos que serán

utilizados para propósitos de predicción. La validación se define como la comparación

de las predicciones del modelo con los valores observados del sistema real para

determinar si el modelo es adecuado para el propósito establecido (Mayer y Buttler,

1993; Mitchell, 1997; Oberkampf y Trucano, 2002; Montgomery et al., 2002a; Halachmi

et al., 2004). Por su parte Reynolds (1984), señala que un método para determinar cuán

bien se comporta un modelo es comparar las predicciones del modelo con un modelo

existente o con valores observados del sistema real. Para Mayer y Buttler (1993), las

técnicas de validación se pueden agrupar en cuatro principales categorías: la

evaluación subjetiva, las técnicas visuales, las medidas de desviación y las pruebas

estadísticas.

En un buen modelo la realidad se simplifica lo suficiente para permitir los cálculos

matemáticos, pero incluso así debe ser bastante exacto para permitir conclusiones

valiosas respecto a la comprensión del fenómeno estudiado y a la predicción de su

comportamiento en el futuro. En consecuencia, si el modelo ajusta a los datos

observados, entonces dos de sus finalidades, quizás las más importantes, son

comprender el fenómeno y la predicción de su comportamiento. Por lo que en el

proceso de modelación matemática, la etapa de validación con datos observados

diferentes a los empleados en la obtención de los parámetros del modelo, juega un

papel fundamental para modelos que serán aplicados; donde las predicciones serán

1

empleadas en lugar de las mediciones del sistema real, las cuales pueden ser

demasiado costosas o difíciles de obtener.

Nuevos modelos son desarrollados y reportados en diferentes áreas del

conocimiento para usarse en predicción y estimación. Frecuentemente, el usuario del

modelo es una persona distinta de quien lo desarrolló y antes de que el modelo pase al

usuario debe hacerse una evaluación de su validez. En muchos casos los nuevos

modelos de simulación han sido presentados sin una adecuada validación (Reynolds,

1984; Barrales et al., 2004), o evaluación de las magnitudes de los errores que pueden

resultar de su uso (Reynolds, 1984). Las posibles razones son que: (a) en la literatura

científica ha habido relativamente poca discusión sobre la filosofía y procedimientos

para este tipo de investigación (Reynolds, 1984), (b) para efectuar una validación los

modeladores recurran a procedimientos simples, a su alcance, aparentemente

adecuados, incluyendo gráficos de dispersión de predicciones y observaciones, algunas

veces utilizando regresión, la cual es pensada como un método objetivo y cuantitativo

para medir cuán bueno es un modelo (Mitchell, 1997), (c) se utilizan diferentes términos

para referirse a la comparación de los valores predichos con los observados, y d) se

tienen una gran variedad de técnicas para validar modelos en las diferentes áreas del

conocimiento, en consecuencia no se cuenta con un sólo método o con un conjunto

único de técnicas aceptadas por la comunidad científica.

En el desarrollo de un modelo intervienen experimentadores, analistas de los

datos y modeladores; y un modelo es útil cuando captura los elementos adecuados de

la realidad con un grado aceptable de exactitud. En consecuencia, es importante hacer

cierta evaluación de su validez que permita contar con una medida de protección, tanto

para el modelador como para el usuario del modelo, cuando el modelo sea utilizado en

predicción del comportamiento del sistema. En este trabajo se presentó, modificó y

extendió el procedimiento estadístico inferencial de validación de modelos con o sin

sesgo desarrollado por Freese (1960), y se validó el modelo dinámico mecanístico de

“animal completo” Wakax POS en predicción de la ganancia de peso promedio por día,

materia seca, ácidos grasos volátiles, acetato, propionato y butirato de bovinos en

pastoreo suplementado con caña de azúcar, maíz quebrado y/o melaza en una zona

tropical de México.

2

2. OBJETIVOS

2.1. Objetivo general

Establecer la validación de modelos mecanísticos con base en la prueba ji-

cuadrada de Freese (1960), y validar el modelo Wakax POS en predicción de la

ganancia de peso promedio por día, materia seca, ácidos grasos volátiles, acetato,

propionato y butirato de bovinos en pastoreo suplementado con caña de azúcar, maíz

quebrado y/o melaza en una zona tropical de México.

2.2. Objetivos específicos

1. Desarrollar el método de validación para modelos mecanísticos de simulación de

sistemas basado en el procedimiento de Fresse (1960).

a) Establecer los supuestos, la estadística de prueba y el error crítico para la

versión original y alternativa del procedimiento de Freese cuando el

modelo presente o no sesgo en sus predicciones.

b) Proponer un procedimiento alternativo al de Reynolds (1984), para

obtener el intervalo de confianza bilateral para el cuantil 1-α de la

distribución de |D|.

c) Obtener en términos del error crítico, los intervalos de confianza bilateral

para el cuantil 1-α de la distribución correspondiente, cuando el modelo

presente sesgo constante o proporcional.

d) Plantear un método para validar un modelo en predicción de varias

variables.

e) Plantear un procedimiento para comparar dos o más modelos de

predicción del mismo sistema.

2. Aplicar el método de validación al modelo dinámico mecanístico Wakax POS en

predicción de la ganancia de peso promedio por día.

3

3. Validar el modelo Wakax POS en predicción de la materia seca, ácidos grasos

volátiles, acetato, propionato y butirato en el Rumen y Ciego.

4

3. REVISIÓN DE LITERATURA

3.1. Sistema y variable de estado

Un sistema es un conjunto de objetos o componentes relacionados entre si de

una manera regulada para formar un todo organizado (Harrington y Tumay, 2000). Se

tiene un sistema dinámico cuando se consideran los flujos como variables en función

del tiempo. Según Zill (2002), un sistema dinámico lo forma un conjunto de variables

dependientes del tiempo, que se llaman variables de estado, más una regla que permite

determinar el estado del sistema en términos de un estado especificado en cierto

momento t0. El estado del sistema en un tiempo t es el valor de las variables de estado

en ese instante; el estado especificado del sistema en el instante t0 es sólo el conjunto

de condiciones iniciales que acompañan al modelo matemático.

El valor de una variable de estado determina el estado del sistema en un punto

dado en el tiempo (France y Thornley, 1984a).

El modelador generalmente está interesado en entender como funciona un

sistema dinámico particular, que causa los cambios en sus variables de estado y en

predecir su comportamiento.

3.2. Modelo matemático

Un modelo matemático es una ecuación o un conjunto de ecuaciones que

representan el comportamiento de un sistema (France y Thornley, 1984b), o una

construcción matemática diseñada para estudiar un sistema del mundo real o fenómeno

(Giordano et al., 1997b). Los elementos estructurales básicos de un modelo son las

variables, los parámetros, las constantes y las funciones o relaciones funcionales de las

variables entre sí y de éstas con los parámetros.

En la construcción de un modelo se necesita tener conocimiento tanto de las

partes que forman el sistema como de las interacciones existentes entre ellas,

aproximándose más el modelo a la realidad cuanto más detallado sea dicho

conocimiento. Según Richter y Söndgerath (1990), la estimación de parámetros de un

5

modelo es un sinónimo de los procedimientos estadísticos y numéricos utilizados para

obtener valores numéricos razonables de los parámetros en los modelos (valores

basados en los datos observados). También según estos autores, la estimación de

parámetros proporciona la conexión entre los datos y el modelo, entre estadística y

simulación.

Csáki (1985) señala que en la construcción de modelos matemáticos se tienen

tres pasos: construcción del modelo, determinación de los parámetros (especificación

del modelo) y validación del modelo.

Fub et al. (2005) describen tres etapas en el proceso de modelación:

Etapa de diseño del modelo. Se define y formula el modelo matemático a partir de un

proceso biológico, sistema o problema bajo investigación. Esta etapa involucra

decisiones en las que se debe entender el sistema, sus requerimientos y componentes,

para determinar que tipo de interacciones se deberán incluir en la formulación del

modelo.

Etapa de análisis y aplicación del modelo. La implementación computacional del modelo

es utilizada para simular y estudiar el desarrollo dinámico del modelo bajo diferentes

condiciones en relación al estudio biológico del sistema o proceso.

Etapa de validación del modelo. El comportamiento y los datos generados por la

simulación computacional del modelo son comparados contra datos obtenidos de

experimentos similares en un sistema biológico real, o valorados epistemológicamente

sobre la base del conocimiento existente.

Si el modelo ajusta a los datos observados entonces dos de sus finalidades,

quizás las más importantes, son comprender el fenómeno y la predicción de su

comportamiento. Así, en un buen modelo la realidad se simplifica lo suficiente para

permitir los cálculos matemáticos, pero incluso así es bastante exacto para permitir

conclusiones valiosas respecto a la comprensión del fenómeno estudiado y a la

predicción de su comportamiento en el futuro.

6

3.3. Modelación empírica y mecanística

A los modelos que estudian las relaciones biológicas o los mecanismos

relacionados con el comportamiento del sistema, como por ejemplo el comportamiento

animal, se les denominan modelos mecanísticos, estos modelos son diferentes de los

modelos empíricos que describen las relaciones matemáticas entre los datos, es decir,

se basan por completo en los datos experimentales que se reúnen (France y Thornley,

1984b; Box et al., 1999a; Box et al., 1999b). En los modelos mecanísticos se describe

el sistema integrando las variables determinantes o causales de la dinámica del mismo

y contrastan con los modelos empíricos donde lo que se realiza es una descripción

matemática (con base biológica o no) de datos observados (Chilibroste, 2002).

En el procedimiento de ajuste de modelos mecanísticos, se asumen relaciones

particulares entre las variables, llevando al modelador a aceptar alguna desviación

entre los datos y el modelo para obtener un modelo que explique satisfactoriamente la

situación bajo investigación (Giordano et al., 1997a).

Box et al. (1999a) señalan que un modelo empírico puede ser útil,

particularmente si sólo se desea una respuesta aproximada en una región de interés en

que las variables tienen rangos de valores limitados.

Al enfoque general para ajustar modelos empíricos se le llama análisis de

regresión. En general, suponga que se tiene una sola variable dependiente o de

respuesta (y) que depende de k variables independientes, por ejemplo x1, x2,…,xk. La

relación que existe entre estas variables se caracteriza por un modelo matemático

llamado modelo de regresión (modelo empírico) y dicho modelo se ajusta a un conjunto

de datos muestreados. Montgomery (2004a) indica que en ocasiones el experimentador

conoce la forma exacta de la verdadera relación funcional entre y y x1, x2,…,xk, por

ejemplo y=φ(x1, x2,…,xk), sin embargo, en la mayoría de los casos no se conoce la

verdadera relación funcional, y el experimentador elige una función apropiada para

aproximar φ.

Para Box et al. (1999b), un modelo mecanístico resulta justificado siempre que

para progresar sea esencial el conocimiento básico del sistema o cuando los

conocimientos previos son suficientes para construir fácilmente un modelo mecanístico

7

útil. Estos autores también opinan que los modelos mecanísticos pueden proporcionar

más comprensión científica del sistema, una mejor base para la extrapolación, y

frecuentemente, una representación con menos parámetros.

Una ecuación polinómica, aunque puede representar adecuadamente lo que

pasa en la región de estudio, no proporciona una base sólida para extrapolar. En un

modelo mecanístico lo que se extrapola es el mecanismo y no una mera curva empírica,

así, incluso un modelo mecanístico debe ser preferentemente utilizado para sugerir

regiones donde puede ser beneficioso desarrollar nuevas investigaciones (Box et al.,

1999b).

Si no contamos con la teoría física o mecanística que nos ayude a expresar un

modelo, construimos un modelo empírico, el cual se basa por completo en los datos

que se reúnen, generalmente usando metodología estadística, y lo que se busca es una

curva que se ajuste a los datos, en el sentido que capture la tendencia básica de las

observaciones muestreadas, es decir, mediante una ecuación derivada de los datos

que exprese la relación entre la respuesta y los factores importantes del diseño.

3.4. Validación de modelos: conceptos y métodos

3.4.1. Conceptos

Barrales et al. (2004) señalan que en la modelación de sistemas, una etapa

esencial y que presenta dificultades tanto conceptuales como prácticas, es la validación

de los modelos.

Según Freese (1960), si la diferencia (observados-predichos) es una constante o

alguna función matemática de los valores observados, el modelo es sesgado, la falta de

precisión ocurre cuando el modelo es no sesgado y proporciona valores que fluctúan

ampliamente alrededor de los valores reales u observados; y la inexactitud puede

deberse al sesgo, a la falta de precisión o a una combinación de éstos.

La exactitud se refiere a que tan cerca están los valores predichos por el modelo

de los valores reales (Loague y Green, 1991; Ramakrishnan y Mountain, 2004;

Tedeschi, 2006). La precisión se refiere a que tan cerca están entre ellos los valores

8

predichos por el modelo (Ramakrishnan y Mountain, 2004; Tedeschi, 2006). La

precisión es el grado en que los valores predichos por el modelo se aproximan a una

función lineal de los valores observados (Loague y Green, 1991). En otras palabras, la

exactitud es la capacidad del modelo para predecir correctamente los valores y

precisión es la capacidad del modelo para predecir valores similares consistentemente

(Tedeschi, 2006). En la Figura 1 se ilustra la diferencia entre la exactitud y precisión de

un modelo de simulación. El caso 1 es inexacto e impreciso, el caso 2 es inexacto y

preciso, el caso 3 es exacto e impreciso y el caso 4 es exacto y preciso. En un modelo

de predicción lo ideal es que cumpla que sea exacto y preciso (caso 4).

Fuente: Tedeschi (2006)

Figura 1. Esquematización de la exactitud contra la precisión.

Tedeschi (2006), indica que en el análisis de regresión lineal simple de los

valores observados (eje Y) sobre los valores predichos (eje X), el coeficiente de

determinación (r2) es buen indicador de precisión (un valor alto de r2 precisión alta), y

que los parámetros estimados del intercepto y la pendiente son buenos indicadores de

exactitud, así, cuando son simultáneamente cercanos a cero y a uno respectivamente,

9

la exactitud es más alta. En la Figura 2 se comparan las medidas de precisión y

exactitud de un modelo a través del coeficiente de determinación y de los parámetros

estimados del modelo de regresión. El caso 1 es inexacto e impreciso, el caso 2 es

inexacto y preciso, el caso 3 es exacto e impreciso, y el caso 4 es exacto y preciso. En

un modelo de predicción lo ideal es que cumpla el caso 4.

Fuente: Tedeschi (2006)

Figura 2. Comparación de las medidas de exactitud y precisión. La línea punteada

representa a la recta y=x.

Oberkampf y Trucano (2002) diferencian verificación y validación: (i) la

verificación es la valoración de la exactitud de la solución de un modelo computacional

por comparación con soluciones conocidas, su estrategia fundamental es la

identificación y cuantificación del error en el modelo computacional y su solución; es

principalmente una cuestión matemática, y (ii) la validación es la valoración de la

exactitud de la simulación computacional por comparación con datos experimentales,

su estrategia fundamental es calcular la exactitud de los resultados computacionales al

10

ser comparados con datos experimentales y estimar el error generado por ambos; es

principalmente una cuestión física.

Oreskes et al. (1994) discuten la confusión de los conceptos de verificación,

validación, confirmación y calibración de modelos. Indican que los conceptos de

validación o verificación son criticados porque es filosóficamente imposible probar que

todos los componentes del modelo del sistema real son verídicos o correctos.

Determinar si el comportamiento de un modelo iguala suficientemente bien el

comportamiento del sistema, siempre ha sido un asunto de gran interés y señalado en

muchos documentos durante muchos años (Beck, 2002). La frase contemporánea

empleada para resolver esta cuestión es “evaluación” (Oreskes, 1998). Según Beck

(2002), las preguntas fundamentales a contestar en la evaluación de un modelo son: (1)

¿El modelo ha sido construido de materiales aprobados, es decir, las hipótesis que lo

constituyen son aprobados (en términos científicos)?, (2) ¿Su comportamiento se

aproxima bien a lo observado en el sistema real?, y (3) ¿Funciona, es decir, cumple con

su tarea indicada, o sirve a su propósito establecido?. Por su parte Tedeschi (2006),

señala que la evaluación del modelo consiste en determinar si el modelo es una

representación adecuada del proceso para el que fue diseñado antes que el

establecimiento en cualquier sentido de la verdad del modelo, y que un modelo

matemático no puede ser probado si es válido, solamente si éste es apropiado para su

propósito establecido con las condiciones dadas.

Para Mayer y Buttler (1993) la validación es un paso necesario para la

aceptación de un modelo, y se define como la comparación de las predicciones del

modelo con los valores observados del mundo real para determinar si el modelo es

adecuado para el propósito establecido.

Según Mitchell (1997), la validación de modelos consiste en comprobar la

estructura del modelo o si sus salidas están suficientemente próximas a los valores

observados del sistema real; el énfasis sobre la estructura del modelo o de las salidas

depende si el modelo es principalmente para explorar el mecanismo o funcionamiento

del sistema e incrementar su comprensión, o si las predicciones obtenidas remplazarán

las observaciones del sistema real, las cuales pueden ser demasiado costosas o

difíciles de obtener. Para este autor, la comparación de las predicciones del modelo con

11

observaciones del mundo real, junto con una evaluación del comportamiento del

modelo, es la validación empírica.

En el contexto de los modelos empíricos, Montgomery et al. (2002a) señalan que

la comprobación de la adecuación del modelo incluye análisis internos que investigan el

ajuste de un modelo de regresión a los datos disponibles y que la validación del modelo

se concentra en la determinación de si el modelo funcionará bien en su ambiente

pretendido de operación, por ejemplo, si el modelo se empleará para pronosticar

nuevas observaciones, la validación se debe concentrar en la determinación de la

exactitud del modelo. Mitchell (1997), coincide en que la validación debe demostrarle al

usuario del modelo, que el modelo es adecuado para el propósito de su desarrollo.

Para Halachmi et al. (2004), la validación determina si el modelo matemático es

una representación exacta del sistema real, y una forma de validación es comparando

los datos reales con los predichos del sistema.

Hamilton (1991) recopiló una extensa lista de publicaciones (316) con respecto a

la validación de modelos con énfasis en artículos de potencial interés para estadísticos,

e incluye para cada una un breve comentario acerca de que tratan y sus palabras clave.

Menciona que la validación es la valoración del alcance para la cual un modelo es

fundamentado o racional y de que cumple el propósito para el cual fue construido. Esta

comprende tres tareas: 1) la verificación, la cual incluye el diseño, programación y la

revisión de los procesos en el programa de cómputo, 2) el análisis de sensibilidad, que

es la determinación del comportamiento del modelo por cambios en sus parámetros

(comportamiento de cada componente del modelo), y 3) la evaluación, que consiste en

la comparación de las salidas del modelo con datos reales.

3.4.2. Métodos para la validación de modelos

Para Mayer y Buttler (1993), las técnicas de validación se pueden agrupar en

cuatro principales categorías: la evaluación subjetiva (involucra a un número de

expertos en el campo de interés), las técnicas visuales (gráficas comparativas), las

medidas de desviación (basadas en las diferencias entre valores observados y

12

simulados) y las pruebas estadísticas. Proponen la eficiencia de modelado (EF) como la

mejor medida de concordancia entre los valores observados y los simulados.

Freese (1960) presenta un método de tres pasos para comparar los valores

pronosticados y observados: i) establecer la exactitud requerida por el modelador o

usuario del modelo, ii) cuantificar la exactitud alcanzada por el modelo, y iii) aplicar una

prueba estadística para decidir si el modelo cumple con la exactitud requerida. Dicho

método se explicará en detalle en el capítulo de materiales y métodos.

Reynolds (1984) señala que un método para determinar cuán bien se comporta

un modelo es comparar las predicciones del modelo con un modelo existente o con

valores observados del sistema real. También, señala que la información acerca de la

capacidad predictiva del modelo puede obtenerse por comparación de los valores

observados y predichos en diferentes ensayos del modelo.

Para cuantificar la concordancia entre las observaciones y las predicciones,

Reckhow et al. (1990) utiliza y discute la prueba t, la prueba de Wilcoxon, el análisis de

regresión y la prueba de Kolmogorov-Smirnov para dos muestras.

Mitchell (1997) señala que muchos libros sobre modelación dan una pequeña

guía sobre la validación empírica, y que no es sorprendente que para efectuar la

validación, los modeladores recurran a procedimientos simples a su alcance,

aparentemente adecuados, incluyendo gráficos de dispersión de predicciones y

observaciones, algunas veces utilizando regresión, la cual es pensada como un método

objetivo y cuantitativo para medir cuán bueno es un modelo. Propuso un método que no

requiere de los supuestos necesarios de los métodos estadísticos, en donde se grafica

en el eje de las abscisas los valores predichos y en el eje de las ordenadas las

desviaciones (predicho menos observado) y el porcentaje de puntos que caen dentro de

un rango o precisión aceptable con centro en cero, es usado como un criterio de

adecuación del modelo. El rango de aceptación lo establece el modelador de acuerdo a

su criterio y propósitos.

Analla (1998) propone el cuadrado medio del error (CME) de la regresión de los

valores observados (Y) sobre los predichos (Z) para efectuar una validación, así como

para comparar dos o más modelos en predicción del sistema. Por su parte Kobayashi y

13

Salam (2000) proponen la media de las desviaciones al cuadrado (MSD) y sus

componentes para validar modelos y para comparar dos o más modelos.

Chilibroste (2002) utiliza la raíz del cuadrado medio del error (MSPE) para

evaluar modelos (comparación entre valores observados y predichos). Considera que

un valor aceptable de la MSPE es que se encuentre en torno al 10% de la media

observada.

Según Hayirli et al. (2003) la validación de modelos se efectúa en tres fases: la

primera es la significancia de los coeficientes de regresión de los modelos ajustados, la

segunda es la regresión entre los valores predichos y los actuales, y la tercera son

pruebas t para determinar si el sesgo (B; predichos-actuales) es diferente de cero, si el

intercepto es diferente de cero y si la pendiente es diferente de uno. También usan el

coeficiente de correlación entre los valores predichos y actuales para determinar la

exactitud de la predicción e indicar la cercanía de dichos valores; y para medir exactitud

y precisión emplean el error de predicción relativa (RPE) y la media del cuadrado de los

errores de predicción (MSPE).

Halachmi et al. (2004) indican que el modelo será valido si y solo si los valores

reales y predichos tienen: (i) medias iguales, (ii) varianzas iguales, y (iii) correlación

positiva entre los valores reales y las respuestas del modelo.

Collao-Saenz et al. (2005) utilizan la media del cuadrado de los errores de

predicción (MSPE) para evaluar los resultados predichos (comparación entre valores

observados y predichos).

Tedeschi (2006) discute y compara varias técnicas para evaluar modelos

matemáticos diseñados para propósitos predictivos. En su revisión expone las

siguientes técnicas: análisis de regresión lineal, análisis de los errores ajustados,

coeficiente de correlación de concordancia, diversas medidas para evaluación, el error

cuadrado medio de predicción, análisis no paramétricos y la comparación de la

distribución de los datos.

En la práctica es común que para validar modelos en predicción del sistema se

utilice la regresión lineal (RL) entre la variable dependiente Y (observados) y la variable

independiente Z (predichos) (Reckhow et al., 1990; Flavelle, 1992; Mayer y Butler,

1993; Mayer et al., 1994; Analla, 1998; Yang et al., 2000; Hayirli et al., 2003; Tedeschi,

14

2006), así como diferentes medidas estadísticas para comparar a Y y Z (Loague y

Green, 1991; Mayer y Butler, 1993; Analla, 1998; Kobayashi y Salam, 2000; Yang et al.,

2000; Chilibroste, 2002; Collao-Saenz et al., 2005; Tedeschi, 2006). Los resultados de

la RL que en general se incluyen son: (i) el gráfico de dispersión de los valores

predichos (zi) vs. los observados (yi), junto con la recta de regresión estimada y la recta

y=z, la cual permite visualizar que tan alejados están los puntos de la recta y=z que

representa la exactitud ideal, (ii) el coeficiente de determinación como indicador de

precisión, y (iii) los parámetros estimados del intercepto y la pendiente como

indicadores de exactitud y las pruebas estadísticas acerca de si son simultáneamente

cercanos a cero y a uno respectivamente.

Frecuentemente la validación de modelos en predicción del sistema es realizado

mediante la prueba F simultánea de intercepto cero y pendiente uno. En cuanto a la

discusión acerca de si es apropiada para efectuar validación, Harrison (1990) señala

que sesgo en los parámetros estimados puede conducir al rechazo de modelos

“válidos” y concluye que no es apropiada. Posteriormente Mayer et al. (1994), concluye

que es apropiada excepto cuando los errores están autocorrelacionados. Por su parte

Analla (1998), concluye que no es apropiada ya que la significancia de esta prueba es

inversamente proporcional a la bondad del ajuste del modelo evaluado. En su lugar

propone el cuadrado medio del error (CME) de la regresión del modelo o modelos a

validar.

Otra prueba estadística que ha sido cuestionada para efectuar validación es la

prueba de t para muestras dependientes u observaciones pareadas entre los valores

observados y los predichos (Freese, 1960; Reynolds et al., 1981; Harrison, 1990;

Mitchell, 1997). Por su parte Mayer et al. (1994), señalan que la prueba de t y la prueba

de Wilcoxon no pueden ser recomendadas para propósitos de validación.

Respecto a las técnicas o medidas estadísticas basadas en la RL para efectuar

validación, Mitchell (1997) señala que es pensada como un método objetivo y

cuantitativo para medir cuán bueno es un modelo. Lo anterior puede atribuirse a que la

RL es relativamente sencilla de aplicar y prácticamente todos los paquetes estadísticos

comerciales lo incluyen entre sus opciones. Algunas desventajas en la aplicación de la

RL y que se presentan frecuentemente en la práctica son: (i) que sea aplicable, es

15

decir, que los puntos (zi, yi) tengan cierta tendencia lineal, (ii) garantizar el cumplimiento

de que los errores son independientes y provengan de una distribución normal con

media cero y varianza constante, y (iii) su aplicación cuando el tamaño de muestra es

muy pequeño o cuando los datos se encuentran concentrados en una pequeña región,

la cual no permitiría visualizar si tienen una tendencia lineal. En consecuencia es

pertinente tener un rango amplio y creciente de los valores observados yi para poder

visualizar si los puntos (zi, yi) efectivamente siguen una tendencia lineal. Reckhow et al.

(1990) discute el cumplimiento de los supuestos de la regresión. Para Harrison (1990),

la regresión no debe usarse para validación por las dificultades para satisfacer los

supuestos y la ambigüedad cuando no se rechaza la hipótesis nula. Flavelle (1992)

discute las ventajas y limitaciones del uso de la regresión para validación. Por su parte

Mitchell (1997), da cinco argumentos en contra de la regresión y la considera

inapropiada para efectuar validación. Kobayashi y Salam (2000) indican que no es

garantía el supuesto de que Y se relacione linealmente con Z y que es innecesario para

comparar a Y y Z. Montgomery et al. (2002c) señalan varios abusos comunes en la

aplicación de la regresión.

Para Mayer y Butler (1993) la complejidad de los modelos y del tipo de datos,

origina que no haya un conjunto combinado de técnicas de validación aplicable en

todas las situaciones de modelación, y señalan que en la mayoría de los casos, un

número de medidas de validación son necesarias para apreciar “la foto completa”. Por

su parte Tedeschi (2006), indica que la valoración de la adecuación de un modelo

solamente es posible por medio de una combinación de varios análisis estadísticos y

propios al propósito para la cual el modelo matemático fue inicialmente conceptualizado

y desarrollado. Para Barrales et al. (2004), los índices o medidas para efectuar

validación no presentan el carácter objetivo que se demanda de las pruebas o métodos

estadísticos en el sentido que para un mismo conjunto de datos, todos los modeladores,

usando el mismo procedimiento, lleguen a las mismas conclusiones.

16

3.5. Pruebas para el supuesto de normalidad

Una gran variedad de métodos estadísticos suponen normalidad para poder

utilizarlos, por lo que existen variados métodos gráficos e inferenciales para verificarlo.

Estos métodos (pruebas de bondad de ajuste), comprueban si los datos que se

observan concuerdan en efecto con el modelo probabilístico de la distribución normal

que se ha supuesto para esos datos.

El problema de bondad de ajuste es como sigue: dada una muestra aleatoria

d1,d2,…,dn de la variable aleatoria D se quiere probar H0: D tiene función de distribución

, o bien, la muestra proviene de una población con función de distribución .

La H1 es que no es la función de distribución verdadera de D. La prueba clásica

es la prueba ji-cuadrada de bondad de ajuste.

)d(FD )d(FD

)d(FD

En las pruebas de bondad de ajuste para el supuesto D~ , se presentan

las siguientes situaciones para la función de distribución normal : (i) y son

completamente especificados y (ii)

),(N 2DD σµ

)d(FD Dµ2Dσ

Dµ y/o deben ser estimados. 2Dσ

Stephens (1974), analizó cinco de las principales estadísticas de pruebas de

bondad de ajuste basadas en la función de distribución empírica [KS (Kolmogorov-

Smirnov), W2 (Cramér-von Mises), V (Kuiper), U2 (Watson) y A2 (Anderson-Darling)] y

tres situaciones importantes: la distribución hipotetizada es completamente

especificada y la representa la distribución normal o exponencial con uno o más

parámetros que son estimados de los datos. Indica que las pruebas de Cramér-von

Mises y de Anderson-Darling son: (a) más potentes que la prueba de Kolmogorov-

Smirnov cuando es la distribución normal con

)d(FD

)d(FD

)d(FD Dµ y estimados por 2Dσ d y

respectivamente, y (b) en general son consideradas como dos de las mejores pruebas

de bondad de ajuste, esto también es señalado por Reynolds (1984). En Stephens

(1974) se dan los valores críticos para las cinco pruebas bajo las tres situaciones

mencionadas anteriormente.

21ns −

Conover (1980) señala que la prueba para normalidad de Shapiro-Wilk ( Dµ y

estimados) es más potente que muchas pruebas para la hipótesis compuesta de

2Dσ

17

normalidad, incluyendo la prueba de Lilliefors ( Dµ y estimados) y la prueba ji-

cuadrada.

2Dσ

Una prueba de bondad de ajuste para normalidad basada en el gráfico de

probabilidad normal (gráfico Q-Q) se presenta en Johnson y Wichern (2002), y es

llamada la prueba de normalidad del coeficiente de correlación del gráfico Q-Q. Indican

al igual que Filliben (1975) que tiene buena propiedad de potencia. Dicha prueba es

para el caso en donde la media y la varianza de la distribución normal hipotetizada son

estimados.

3.6. Transformaciones de datos

Cuando la variable de estudio no se distribuye normal, generalmente se emplea

algún tipo de transformación para aproximar los datos a la distribución normal y el

método estadístico se aplica a la variable transformada.

Montgomery (2004c) señala que las transformaciones se usan para tres

propósitos: estabilizar la varianza de la respuesta, hacer que la distribución de la

variable de respuesta esté más cerca de la distribución normal y mejorar el ajuste del

modelo a los datos.

Las transformaciones más comunes para lograr la normalidad y/o la

homogeneidad de varianzas son la raíz cuadrada, la logarítmica y la angular o

transformación arco seno (Steel y Torrie, 1988; Zar, 1999; Sokal y Rohlf, 2000;

Montgomery, 2004b). En las tres primeras referencias citadas, se discute en detalle bajo

que condiciones se recomienda utilizar cada una de las transformaciones mencionadas.

Una clase útil de transformaciones es la de la transformación de potencia yλ

(método de Box-Cox) para corregir la no normalidad y/o la varianza no constante en

modelos de regresión y análisis de varianza (Montgomery, et al., 2002b; Montgomery,

2004c). Johnson y Wichern (2002), indican que cuando la elección de la transformación

que aproxime a la distribución normal no es obvia, es conveniente que los datos

sugieran una transformación, y esto puede lograrse con la familia de transformaciones

de potencia (yλ). También, presentan un método analítico relativamente práctico para

elegir la transformación de potencia.

18

Una transformación es simplemente una reexpresión de los datos en diferente

unidad de medida. Cuando no hay una transformación obvia, generalmente se realiza

una búsqueda empírica de una transformación que aproxime a la distribución normal a

través de observar el efecto de cada una de las transformaciones, por ejemplo, en el

gráfico de probabilidad normal.

19

4. MATERIALES Y MÉTODOS

4.1. Descripción del modelo mecanístico Wakax POS

El modelo dinámico mecanístico de “animal completo” Wakax POS (inédito), fue

desarrollado por el Dr. Luís Vargas Villamil del Colegio de Postgraduados campus

Tabasco en una estancia posdoctoral en el Departamento de Ciencia Animal de la

Universidad de California, Davis (UCD).

En la construcción del modelo Wakax POS la representación del sistema es en

términos de variables de estado y de tasas de cambio las cuales se especifican por

medio de ecuaciones diferenciales de primer orden. Las ventajas en su desarrollo son:

el sistema completo se separa en sus partes fundamentales, se representan los flujos

de entradas y salidas entre sus partes, y sobre todo se establecen las relaciones dentro

y entre sus partes por los mecanismos o teoría física que las gobiernan.

El modelo Wakax POS fue desarrollado para describir las relaciones biológicas

(digestión, crecimiento bacteriano, fermentación y absorción) durante la nutrición de

bovinos alimentados con caña de azúcar (CZ) y para predecir la ganancia de peso

promedio (GPP) por día de bovinos en pastoreo suplementado con CZ, maíz quebrado

y/o melaza en una zona tropical de México. El modelo esta compuesto por 119

variables de estado que describen el sistema compuesto por cinco submodelos:

Concentrado, Pasto, Caña de azúcar, Melaza y Crecimiento animal (Anexos I.B y I.C).

Los tres primeros están divididos en tres secciones: Rumen, Intestino y Digestión en

Ciego. Cada sección fue derivada de un modelo de crecimiento bacteriano, previamente

publicado, llamado Turix (Vargas-Villamil et al., 2004) y cuya descripción puede

consultarse en el Anexo I.A. El submodelo de Melaza describe la ración o entrada de

melaza. Finalmente el submodelo de Crecimiento animal proporciona la ganancia de

peso. Las variables de entrada del modelo Wakax POS son: a) peso vivo; b) consumo

de materia seca de maíz, melaza y pasto; c) fracción soluble de pasto y CZ; d) fracción

degradable de pasto y CZ; y e) razón de degradación de pasto y CZ.

El submodelo Concentrado describe el sistema de nutrimento de materia seca de

maíz y es descrito por 34 variables de estado. El submodelo Pasto describe el sistema

20

de nutrimento de materia seca de pasto y es descrito por 40 variables de estado. El

submodelo Caña de azúcar describe el sistema de nutrimento de materia seca de CZ y

melaza, y es descrito por 40 variables de estado. El submodelo Melaza describe la

entrada de melaza y el flujo dentro del submodelo de Caña de azúcar y es descrito por

una variable de estado. El submodelo Crecimiento animal proporciona la salida de GPP

por día y es descrito por cuatro variables de estado. Las constantes y parámetros

involucrados en los submodelos (Anexo I.C) son valores tomados, calculados, ajustados

o aproximados de la literatura científica. Las secciones de los submodelos describen los

procesos de digestión, crecimiento bacteriano, fermentación, absorción, y los flujos en

el Rumen-Reticulo (Sección Rumen, R) y en el Ciego (Sección Ciego, C); así como la

digestión, absorción y flujo en el omaso, abomaso e intestino delgado (Sección

Intestino, D).

4.2. Descripción de los datos experimentales empleados en la validación

El método de validación basado en el planteamiento de Freese se aplicó a la

diferencia entre los datos experimentales de la GPP por día y los simulados con el

modelo Wakax POS. Los valores de la GPP corresponden a las medias de los

experimentos obtenidos de la literatura (Anexo II, Cuadros: II.1 y II.2) con bovinos en

pastoreo suplementado con caña de azúcar, maíz quebrado y/o melaza en una zona

tropical de México.

En el Cuadro II.3 del Anexo II se indican las fuentes e información de los datos

experimentales utilizados en la validación del modelo Wakax POS en predicción en el

Rumen y Ciego de la materia seca (DM), ácidos grasos volátiles (AGVs), acetato (Ac),

propionato (Pr) y butirato (Bu). En el Cuadro 3 se muestran los valores observados y

predichos para cada una de dichas variables en el Rumen y Ciego. En este caso la

validación se efectúo por medio de métodos gráficos y medidas estadísticas para

comparar a los valores observados y predichos.

Los datos experimentales utilizados en la validación del modelo Wakax POS en

predicción de la GPP, DM, AGVs, Ac, Pr y Bu fueron distintos a los empleados en el

ajuste de sus parámetros.

21

4.3. Procedimientos estadísticos para la validación de modelos basados en el planteamiento de Freese

En este trabajo se considera:

(i) La validación de un modelo en predicción del sistema, como la comparación

por medio de algún método de las predicciones del modelo con

observaciones del sistema real para determinar su capacidad predictiva, es

decir, la validación se concentra en la determinación de la exactitud del

modelo.

(ii) La evaluación de un modelo, como un procedimiento más general y que

incluye la validación del modelo en predicción del sistema. La evaluación de

un modelo comprende: el estudio de su estructura, el proceso de ajuste de

sus parámetros, el análisis de sensibilidad de sus componentes, la

comparación de las salidas del modelo con observaciones del sistema real y

si funciona para su propósito en diferentes escenarios.

En esta sección se presentan procedimientos estadísticos basados en el

planteamiento de Freese (1960) para determinar si la exactitud de un modelo o técnica

de estimación es adecuada para cumplir los requerimientos del modelador o usuario del

modelo. Básicamente el planteamiento de Freese para comparar los valores

pronosticados y observados consiste de tres pasos: establecer la exactitud requerida

por el modelador o usuario del modelo, cuantificar la exactitud alcanzada por el modelo,

y finalmente aplicar una prueba estadística para decidir si el modelo cumple con la

exactitud requerida.

En los procedimientos presentados se detallan desarrollos omitidos por Freese

(1960), Rennie y Wiant (1978), Reynolds (1984) y Barrales et al. (2004), y se incorporan

modificaciones y extensiones a sus planteamientos. En el capítulo de resultados y

discusión, donde se resumirán los métodos de validación se indicarán cuales son las

modificaciones y extensiones incorporadas.

22

4.3.1. Conceptos básicos

Dos de los objetivos, quizás los más importantes en la construcción de un

modelo, son la comprensión y predicción del sistema usando la información contenida

en los valores de las variables de entrada al modelo. Frecuentemente en modelos

dinámicos mecanísticos conformados por muchas variables de estado, el interés se

centra en alguna de ellas sin descuidar el comportamiento de las restantes ya que

juntas proporcionan información del sistema.

Sea el caso de predecir el valor de alguna variable de estado. Siguiendo la

notación de Reynolds (1984), sea Y el valor actual u observado de la variable a

predecir, sea el vector correspondiente a las p variables de entrada al

modelo y sea Z=Z( ) el valor predicho por el modelo basado en . Suponga que se

tienen n pares para comparar (Yi, Zi) i=1,2,…,n donde para el i-ésimo par, Yi es el valor

observado, Zi el valor predicho y

)X,...,X,X(X p21=−

−X

−X

)X,...,X,X(X ip2i1ii =−

los valores de las variables de

entrada.

A menos que el modelo matemático sea considerado estocástico (o

probabilístico) los valores predichos o simulados Zi son fijos (determinísticos). Así, los

valores observados de alguna variable de estado fueron considerados aleatorios ya que

contienen una variabilidad natural, y los valores predichos fueron considerados

determinísticos.

Freese (1960), plantea para la comparación de Yi y Zi que el valor observado Yi o

µi en su notación, es una constante y que Zi o Xi en su notación se distribuye normal

con media µi.

Las inferencias para determinar cuán bien el modelo predice el sistema real

fueron basadas en las n diferencias Di=Yi–Zi para i=1, 2,…,n.

Si Y1, Y2,…,Yn es una muestra aleatoria de N(Zi, σ2), es decir, si las n variables

aleatorias Yi son independientes normalmente distribuidas con media Zi y varianza σ2

[Yi~NI(Zi, σ2) i=1,2,…,n] entonces Di=(Yi–Zi)~NI(0,σ2), ya que

)Zd(F)ZdY(P)dZY(P)dD(P)d(F iiYiiiiiiiiiD ii+=+≤=≤−=≤=

23

[ ] [ ] ( ) )Zd(fZddd)Zd(f)Zd(F

dd)d(F

dd)d(f iiYii

iiiYiiY

iiD

iiD iiiii

+=++=+==

)d(Ie2

1e2

1)d(f i),(

)d(2

1)ZZd(2

1

iD

2i2

2iii2

i ∞−∞σ

−−+σ

πσ=

πσ=

por lo que

Di=(Yi–Zi)~NI(0,σ2) (1)

Si Di~NI(0,σ2) entonces la estandarización de Di es

σ=

σ− ii D0D ~NI(0,1) (2)

[Ver sección 3.2 pp. 103-104 de Casella y Berger (1990)].

Si σ

iD ~NI(0,1) entonces:

a) 2

iD⎟⎠⎞

⎜⎝⎛σ

~ (3) 21χ

[Ver ejemplo 6 capítulo V de Mood et al. (1974a)].

b) ∑=

⎟⎠⎞

⎜⎝⎛σ

n

1i

2iD ~ (3a) 2

[Ver Teorema 7 capítulo VI de Mood et al. (1974b)].

Freese (1960), señala que 2n

1i

ii2

2ii

n

1i X)X(

∑∑

=

= ⎟⎠⎞

⎜⎝⎛

σµ−

µ−~ con Xi~N(µi,σ2). Ahora,

si se pide que µi~N(Xi, σ2) entonces

2nχ

Di=(µi–Xi)~N(0,σ2) (4)

y σ−µ ii X ~N(0, 1) por lo que

2n

1i

i2n

1i

ii2n

1i

ii DXX ∑∑∑===

⎟⎠⎞

⎜⎝⎛σ

=⎟⎠⎞

⎜⎝⎛

σµ−

=⎟⎠⎞

⎜⎝⎛

σ−µ ~ . 2

De (1) y (4) el supuesto de normalidad se cumple para las diferencias, es decir,

las n diferencias D1, D2,…, Dn constituyen una muestra aleatoria de la distribución

normal con media cero [E(D)=0] y varianza =Var(D) donde D=Y-Z. 2Dσ

Cabe señalar que en los desarrollos anteriores el supuesto de normalidad se

pide para los valores observados a diferencia de lo que exponen Freese (1960), Rennie

y Wiant (1978) y Barrales et al. (2004); aunque al trasladarse dicho supuesto a la

24

población de las diferencias entre los valores observados y predichos, los resultados

son básicamente los mismos.

4.3.2. Validación de modelos basada en el valor absoluto del error en ausencia de sesgo

En el planteamiento de Freese (1960), para la determinación de la exactitud

requerida se necesita que los valores e y α especificados por el modelador o usuario del

modelo satisfagan

( ) α−≥≤ 1eDP (5)

( ) α≤>⇔ eDP

para que la exactitud del modelo sea aceptable. Así, un modelo es considerado

suficientemente confiable para predicción si la probabilidad (exactitud) establecida en

(5) se cumple, donde D es la diferencia (error) entre las observaciones y predicciones

de la variable de respuesta del modelo a validar, e es el máximo error admitido y 1-α

represente el nivel de exactitud requerida. Si α es pequeño entonces la diferencia entre

el valor observado y el predicho sería menor que e con alta probabilidad. Barrales et al.

(2004), señalan que el valor e (E en su notación) es la discrepancia aceptada entre la

predicción zi y el valor real yi, es decir, el valor máximo admisible de las desviaciones

|yi–zi|=|di|.

Los siguientes resultados ayudaran al planteamiento de pruebas de hipótesis e

intervalos de confianza, con la finalidad de decidir si el modelo cumple con la exactitud

requerida por el modelador o usuario del modelo.

Si D~N(0, ) por (2) 2Dσ 2

DD

DDσ

~N(0,1) y por (3) 2D

22

D

DDσ

=⎟⎟⎠

⎞⎜⎜⎝

⎛σ

~ . Por lo que el

cuantil 1-α de la distribución ji-cuadrada con 1 grado de libertad (g.l.), , es tal que

21χ

21,1 α−χ

α−=⎟⎟⎠

⎞⎜⎜⎝

⎛χ≤

σ α− 1DP 21,12

D

2

(6)

De (5) se tiene que

( ) α−≥≤ 1eDP

25

( ) α−≥≤ 1eDP 22

( ) α−≥≤ 1eDP 22

α−≥⎟⎟⎠

⎞⎜⎜⎝

⎛σ

≤σ

1eDP 2D

2

2D

2

(7)

Por lo tanto de (6) y (7) se tiene que

21,12

D

2eα−χ≥

σ (8)

La igualdad en (8) se tiene cuando la probabilidad asociada en (7) es igual a 1-α.

Ahora se probará que 2

21

21,1 z α

−α− =χ donde

21

z α−

es el cuantil 2

1 α− de la

distribución normal estándar, es decir, la 2

1zZP2

1

α−=⎟⎟

⎞⎜⎜⎝

⎛≤ α

−. Para ello note que

( ) ( ) α−=χ≤=χ≤χ α−α− 1ZPP 21,1

221,1

21 , así

( ) ( )21,1

221,1

21 ZPP α−α− χ≤=χ≤χ

( )21,1

2ZP α−χ≤=

( )21,1ZP α−χ≤=

( ) α−=χ≤≤χ−= α−α− 1ZP 21,1

21,1

entonces ( )2

1ZP 21,1

α−=χ≤ α− y por

21zZP

21

α−=⎟⎟

⎞⎜⎜⎝

⎛≤ α

− se sigue que

21

21,1 z α

−α− =χ , es

decir, 2

21

21,1 z α

−α− =χ (9)

Así, el resultado (8) puede escribirse también como 2

212

D

2

zeα

−≥

σ, o bien,

2

21

2

2D

z1

e α−

≤σ

26

21,1

2

2

21

22D

eze

α−α−

χ=≤σ (10)

la cual corresponde a la forma dada por Freese en su notación Var(D)=σ2 y 22

21

z τ=α−

.

Por lo tanto, si D~N(0, ) donde 2Dσ 0D =µ significa predicción insesgada y denota la

varianza de los errores de predicción (precisión), entonces la técnica o modelo será

aceptable o suficientemente confiable para predicción cuando se cumpla (10). Así, los

valores e y α especificados por el modelador o usuario del modelo son tales que

satisfacen la exactitud requerida

2Dσ

( ) α−≥≤ 1eDP que se traduce en 21,1

22D

eα−χ

≤σ , o sea,

la varianza de las diferencias tendrá como cota superior a 21,1

2eα−χ

cuando la exactitud

requerida se satisfaga.

4.3.2.1. Pruebas estadísticas para la exactitud requerida

Hasta ahora se ha determinado que si D~N(0, ) y 2Dσ ( ) α−≥≤ 1eDP entonces la

Var(D)= debe satisfacer 2Dσ 2

1,1

22D

eα−χ

≤σ para que el modelo sea considerado aceptable o

suficientemente confiable para predicción. El siguiente paso es probar la hipótesis:

H0: 21,1

22D

eα−χ

≤σ vs. H1: 21,1

22D

eα−χ

>σ (11)

Reynolds (1984), señala que bajo los supuestos D~N(0, ) con 2Dσ 2

1,1

22D

e0

α−χ=σ entonces

la estadística de prueba es ∑∑== σ

=⎟⎟⎠

⎞⎜⎜⎝

σ

n

1i2D

2i

n

1i

2

D

i

00

DD ~ y que la H0 será rechazada con un

nivel de significación α’ si la estadística de prueba (12) excede a . La distribución

de

2nχ

2'1,n α−χ

∑= σ

n

1i2D

2iD se determinó en páginas anteriores y puede consultarse en el resultado (3a).

27

Bajo los supuestos anteriormente señalados la estadística de prueba puede escribirse

como

∑χ

=

χ

==

α−

=

α−

=∑∑

n

1i

2i2

21,1

n

1i2

1,1

2

2i

n

1i2D

2i D

eeDDV

0

~ (12) 2nχ

y la H0 se rechazará con un nivel de significación α’ si donde Vc es el valor

de la estadística de prueba V que se obtendría al usar la información contenida en la

muestra d1,d2,…,dn y los valores e y α especificados por el modelador o usuario del

modelo. En la sección 4.2 pp. 431-432 del capítulo IX de Mood et al. (1974c) se puede

consultar la obtención de la prueba uniformemente más potente de tamaño α [UMP(α)]

de H0: vs. H1: cuando se tiene una muestra aleatoria de tamaño n de

una distribución normal con media µ conocida y varianza σ2. Cuando µ es desconocida

se trata de una prueba de razón de verosimilitudes generalizada de tamaño α. La

prueba ( ) especificada para las hipótesis en (11) corresponde a la prueba

UMP(α’) ya que D~N(0, ), es decir, E(D)=µD=0 es conocida (supuesta).

2'1,ncV α−χ>

20

2 σ≤σ 20

2 σ>σ

2'1,ncV α−χ>

2Dσ

Freese (1960), señala que el valor de (exactitud requerida) lo establece

previamente el usuario y que la hipótesis H0, que no expuso explícitamente, puede

rechazarse cuando el valor esperado de Xi no es µi, es decir, E(D)≠0 (sesgo) o cuando

la varianza no es como se hipotetizó o por una combinación de ambas razones.

Reynolds (1984), coincide con Freese al indicar que esta prueba tenderá a rechazar H0

si es grande o si |E(D)| es grande, o si ambas son grandes de modo que es sensible

a éstas dos cantidades que afectan la exactitud. Así, si H0 no se rechaza entonces se

asume que el modelo es adecuado bajo los valores e, α y α’ especificados por el

modelador o usuario del modelo, es decir, el modelo proporciona la exactitud requerida

y se estaría tentado a concluir con un nivel de significación α’ que H0:

2Dσ

2Dσ

2Dσ

21,1

22D

eα−χ

≤σ se

cumple, o bien, que ( ) α−≥≤ 1eDP . Aunque cabe la posibilidad de que H0 sea falsa

(error tipo II) y se tendría que calcular la potencia de la prueba [η(.)] para un valor de H1

de importancia particular que sea considerado de significado práctico, digamos tal 21Dσ

28

que 21,1

22

1De

α−χ>σ y determinar η( )=1-P(Error tipo II)=1-β para decidir si H0 es

verdadera cuando realmente es . Es decir, la probabilidad β de un error de tipo II

tendría que calcularse para este valor alternativo. Si β es suficientemente “pequeño”

[η( ) grande] se aceptaría H0 y se haría conociendo exactamente el riesgo de una

decisión errónea. Así, si H0 no se rechaza lo que se puede concluir es que los datos no

proporcionan suficiente evidencia para rechazarla, que los datos no apoyan

suficientemente a H1 y no que se acepte la declaración establecida en H0.

21Dσ

21Dσ

21Dσ

La H0 en (11) indica que el beneficio de la duda es dado al modelo en el sentido

de que el modelo es juzgado en ser adecuado a menos que haya suficiente evidencia

de lo contrario. Desde el punto de vista práctico y de que la hipótesis de investigación

se plantea en la H1, las hipótesis en (11) fueron intercambiadas quedando

21,1

22D

'0

e:Hα−χ

>σ vs. 21,1

22D

'1

e:Hα−χ

≤σ (13)

de modo que si es rechazada, se sabe de antemano con que probabilidad (α’) se le

estaría rechazando cuando es verdadera. Las hipótesis en (13) coinciden prácticamente

con el planteamiento alternativo de Reynolds (1984), ya que para él la hipótesis nula es

'0H

21,1

22D

'0

e:Hα−χ

≥σ . Por lo tanto, si la en (13) es rechazada con un nivel de significación

α’ entonces se asume que el modelo es adecuado bajo los valores e y α especificados

por el modelador o usuario del modelo.

'0H

4.3.2.2. Prueba UMP(α’) para '0H

Para la determinación de la prueba UMP(α’) para las hipótesis en (13), se

utilizaron los siguientes resultados:

(R1) Sea la familia exponencial donde λ(θ) es monótona y θ )x(T)(e)x(r)(h);x(f θλθ=θ ∈

(a, b) con -∞≤a<b≤∞, (i) si λ(θ) es creciente en θ entonces la familia tiene razón de

verosimilitudes monótona en T(x) y (ii) si λ(θ) es decreciente en θ entonces la familia

tiene razón de verosimilitudes monótona en -T(x).

29

(R2) Sea con densidad −X ( )θ

−−

;xfX , θ ∈ Ω ⊂ ℜ la cual conforma una familia con razón

de verosimilitudes monótona en ( )−xT . Para probar H0: θ>θ0 vs. H1: θ≤θ0 con θ0

conocida, existe la prueba UMP(α) la cual es dada por:

( ) 1x =φ−

si ( ) kxT <−

(se rechaza H0)

( ) cx =φ−

si ( ) kxT =−

(c una constante)

( ) 0x =φ−

si ( ) kxT >−

con k tal que satisface ( )( )−θ φ=α XE

0.

[Los resultados (R1), (R2) y variantes (con otra notación), pueden consultarse en las pp.

422-425 capítulo IX de Mood et al. (1974c)].

El supuesto para las hipótesis en (13) es que D1, D2,…, Dn son una muestra

aleatoria de la distribución N(0, ). Se tiene que la función de densidad conjunta de

es:

2Dσ −

D

( ) ( ) )d(Ie2

1;df;df i),(

)d(2

1

2D

n

1i

2Di

n

1i

2DD

2i2

D∞−∞

σ−

==− πσΠ=σΠ=σ

( )

∑⎥⎦⎤

⎢⎣⎡Π

σπ= =

⎟⎟⎠

⎞⎜⎜⎝

σ−

∞−∞=

n

1i

2i2

D)d(

21

i),(

n

1i2n

2D

e)d(I2

1

donde ( )

( ) ( ) ∑=σ

−=σλΠ=σπ

=σ=−∞−∞=−

n

1i

2i2

D

2Di),(

n

1i2n

2D

2D )d(dTy

21)(,)d(Idr,

2

1)(h . Por lo

que la familia ( ) +−

ℜ∈σσ−

2D

2DD ,;df pertenece a la clase exponencial indicada en (R1)

para y como −D 2

D

2D 2

1)(σ

−=σλ es monótona creciente en entonces por (i) de (R1) la

familia tiene razón de verosimilitudes monótona en

2Dσ

( ) ∑ µ−∑ ====−

n

1i

2Di

n

1i

2i )d()d(dT . Por lo

tanto, por (R2) la prueba UMP(α’) es dada por:

( ) 1d =φ−

si k)d(n

1i

2i ≤∑

=

( ) 0d =φ−

si k)d(n

1i

2i >∑

=

30

Note que c=0 y que la igualdad en k puede establecerse en cualquiera de las dos

condiciones ya que es una variable aleatoria continua. La constante k es tal que

satisface

−D

( )( )−σ

φ=α DE 20D

' donde 21,1

22D

e0

α−χ=σ , por lo que

⎟⎟⎠

⎞⎜⎜⎝

⎛σ=σ≤=α ∑

=

2D

n

1i

2D

2i

'0

|kDP

⎟⎟⎠

⎞⎜⎜⎝

⎛σ=σ

σ≤

σ= ∑

=

2D

n

1i

2D2

D2D

2i

0|kDP

⎟⎟⎠

⎞⎜⎜⎝

σ≤

σ= ∑

=

n

1i2D

2D

2i

00

kDP

⎟⎟⎠

⎞⎜⎜⎝

σ≤χ= 2

D

2n

0

kP [por el resultado (3a): ∑= σ

n

1i2D

2iD ~ ] 2

la cual implica que 2',n2

D0

kαχ=

σ donde es el cuantil α’ de la distribución ji-cuadrada

con n g.l., es decir,

2',n αχ

( )2',n

2n

' P αχ≤χ=α , así, 21,1

2',n

22

',n2D

ek

0α−

αα χ

χ=χσ= . Por lo tanto, la prueba

UMP(α’) es:

( ) 1d =φ−

si 2',n2

21,1

n

1i

2i

21,1

2',n

2n

1i

2i e

)d(e)d( α

α−=

α−

α

=χ≤

χ∑⇔

χχ

≤∑ (14)

( ) 0d =φ−

si 2',n2

21,1

n

1i

2i

e

)d(α

α−= χ>

χ∑

Con D~N(0, ) y por (14), la estadística de prueba bajo verdadera puede escribirse

como

2Dσ

'0H

∑χ

=χ∑

==

α−α−

=n

1i

2i2

21,1

2

21,1

n

1i

2i

' Dee

DV ~ (15) 2

y se rechazará con un nivel de significación α’, si donde es el valor de

la estadística de prueba que se obtendría al usar la información contenida en la

muestra d1,d2,…,dn y los valores e y α especificados por el modelador o usuario del

'0H 2

',n'cV αχ≤ '

cV

'V

31

modelo. Así, si se rechaza con un nivel de significación α’ entonces el modelo será

considerado aceptable.

'0H

Las estadísticas de prueba V y correspondientes a las hipótesis en (11) y

(13), son iguales.

'V

4.3.3. Validación de modelos basada en el porcentaje del error en ausencia de sesgo

En esta sección se trata el caso cuando el modelador o usuario del modelo está

más interesado en el porcentaje del error que en el valor absoluto del error.

Según Reynolds (1984), el porcentaje de error puede ser manejado de la

siguiente manera: si el usuario especifica p y α tal que el porcentaje de error YD 100 no

sea más que p100 con probabilidad 1-α entonces, como en (5), el requisito es que

α−≥⎟⎟⎠

⎞⎜⎜⎝

⎛≤ 1p

YDP (16)

y señala que si YDQ = ~N(0, ) entonces por los mismos argumentos utilizados para la

variable aleatoria D, el resultado (10), las hipótesis en (13) y la estadística de prueba en

(15) corresponden respectivamente a:

2Qσ

21,1

22Q

pα−χ

≤σ (17)

21,1

22Q

''0

p:Hα−χ

>σ vs. 21,1

22Q

''1

p:Hα−χ

≤σ (18)

2

n

1i i

i2

21,1n

1i

2i2

21,1

2

21,1

n

1i

2i

''

YD

pQ

pp

QV ∑ ⎟⎟

⎞⎜⎜⎝

⎛χ=∑

χ=

χ∑=

=

α−

=

α−α−

= ~ (19) 2nχ

y se rechazará con un nivel de significación α’ si donde es el valor de

la estadística de prueba que se obtendría al usar la información contenida en la

muestra q1, q2,…,qn

''0H 2

',n''

cV αχ≤ ''cV

''V

⎟⎟⎠

⎞⎜⎜⎝

n

n

2

2

1

1

yd,...,

yd,

yd y los valores p y α especificados por el modelador o

32

usuario del modelo. Por lo tanto, el modelo será considerado aceptable si se rechaza

. ''0H

Al usar el error absoluto o el porcentaje de error, es necesario probar normalidad

para la apropiada variable aleatoria D o YD respectivamente. Si Y~N(Z, ) entonces

D~N(0, ) donde . Para la determinación de la distribución de

2Yσ

2Dσ

2D

2Y σ=σ

YDQ = es

necesario pedir que , de lo contrario Q=1. La función de distribución de 0ZY ≠=µ

⎟⎠⎞

⎜⎝⎛−=

−==

Y1Z1

YZY

YDQ es

⎟⎟⎠

⎞⎜⎜⎝

⎛−≥⎟

⎠⎞

⎜⎝⎛=⎟⎟

⎞⎜⎜⎝

⎛−≤⎟

⎠⎞

⎜⎝⎛−=⎟⎟

⎞⎜⎜⎝

⎛≤⎟

⎠⎞

⎜⎝⎛−=≤= q1

Y1ZP1q

Y1ZPq

Y1Z1P)qQ(P)q(FQ

⎟⎟⎠

⎞⎜⎜⎝

⎛−

=⎟⎟⎠

⎞⎜⎜⎝

⎛−

≤=⎟⎠⎞

⎜⎝⎛ −

≥=q1

ZFq1

ZYPZ

q1Y1P Y

así, la función de densidad de YDQ = está dada por

( ) [ ] ⎟⎟⎠

⎞⎜⎜⎝

⎛−−

=−−−⎟⎟⎠

⎞⎜⎜⎝

⎛−

=−⎟⎟⎠

⎞⎜⎜⎝

⎛−

= −−

q1Zf

)q1(Z)1()q1(Z

q1Zf)q1(Z

dqd

q1Zf)q(f Y2

2Y

1YQ

⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛−

−σ−

σπ−=

2

2YY

2 Zq1

Z2

1exp2

1)q1(

Z

⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛−σ

−σπ−

=2

2DD

2 q1Zq

21exp

21

)q1(Z

)q(Iq1

q2Zexp

)q1(1

2Z

1

2

2D

2

22D

−ℜ⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛−σ

−−πσ

=

La forma de la función de densidad de probabilidad (fdp) depende de los

parámetros Z y de la distribución de Y~N(Z, ). Cuando Z= la fdp de Q es

)q(fQ2D

2Y σ=σ 2

Yσ Dσ

)q(Iq1

q21exp

)q1(1

21)q(f 1

2

2Q −ℜ⎥⎥⎦

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛−

−−π

=

y por lo tanto no depende de dichos parámetros.

33

Bajo los supuestos establecidos la distribución de YD tiene soporte 1−ℜ ,

i

i

yd no

es estrictamente un porcentaje y YD no tiene distribución normal. Así, el porcentaje de

error bajo los supuestos Y~N(Z, ) entonces D~N(0, ), es un enfoque confuso para

medir exactitud en predicción comparado con el error absoluto.

2Yσ

2Dσ

Freese (1960), señala que si Xi~N(µi,σ2) entonces 2n

1i

ii2

2ii

n

1i X)X(

∑∑

=

= ⎟⎠⎞

⎜⎝⎛

σµ−

µ−~

donde Xi es el valor estimado por la nueva técnica para la i-ésima unidad experimental,

µi es el valor “verdadero o correcto” medido con la técnica estándar para la i-ésima

unidad experimental, n es el número de unidades experimentales y σ2 es la exactitud

requerida, es decir,

2nχ

21,1

22 e

α−χ≤σ o 2

1,1

22 p

α−χ≤σ para el caso del error absoluto o del

porcentaje del valor verdadero o correcto respectivamente. Por lo tanto, la expresión del

error como un porcentaje del valor verdadero o correcto i

ii

i

i XDµµ−

~⎟⎟

⎜⎜

⎛⎥⎦

⎤⎢⎣

⎡µσ

2

i

,0N , tiene

una interpretación práctica como la exactitud requerida expresada en términos relativos

del valor real en vez de unidades absolutas del valor real, y los resultados (16), (17),

(18), (19) se cumplen con Di=Xi-µi y Yi=µi.

De aquí en adelante los resultados obtenidos sólo se relacionan a cuando la

exactitud requerida es expresada en unidades absolutas del valor real u observado (Yi),

es decir, con el valor absoluto del error ( )[ ]α−≥≤ 1eDP .

4.3.4. Validación por intervalo de confianza empleando el error crítico en ausencia de sesgo

En esta sección se estudia el enfoque de intervalos de confianza, esto es

motivado debido a que en el planteamiento de Freese, diferentes usuarios del modelo

34

pueden tener distintas necesidades de exactitud, la cual conduce a diferentes valores

de e. Autores como Rennie y Wiant (1978) y Ek y Monserud (1979), han tratado este

problema calculando un error máximo anticipado o error crítico (e*) la cual es el valor

más pequeño de e que conducirá al no rechazo de H0 en (11). Reynolds (1984), señala

que si el usuario del modelo especifica un valor de e tal que e>e* entonces el modelo es

adecuado y si e<e* entonces el modelo no es adecuado. El error crítico e* puede

determinarse de la región de rechazo de H0 en (11):

2'1,ncV α−χ>

2'1,n2

n

1i

2i

21,1

e

dα−

=α−

χ>χ ∑

2'1,n

n

1i

2i

21,1

2 1

d

eα−

=α−

χ<

χ ∑

2'1,n

n

1i

2i

21,1

2d

eα−

=α−

χ

χ<

21

2'1,n

n

1i

2i

21,1 d

e⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ<

α−

=α− ∑

(20)

En páginas anteriores se indicó, con base en el planteamiento de Freese, que si

la H0 en (11) no se rechaza entonces el modelo es considerado aceptable o adecuado

bajo los valores e, α y α’ especificados por el modelador o usuario del modelo, así, de

(20)

21

2'1,n

n

1i

2i

21,1 d

*e⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α−

=α− ∑

Por lo tanto, H0 se rechazará si e<e* y no se rechazará si e≥e*, es decir, si el modelador

o usuario del modelo especifica un valor de e tal que e≥e* entonces el modelo es

considerado aceptable y si e<e* el modelo no es aceptable. Cabe señalar que Rennie y

35

Wiant (1978) y Reynolds (1984), no indicaron cual es la decisión cuando e=e*, aunque

al señalar que H0 se rechaza cuando entonces la región de no rechazo es

por lo que si e=e* la decisión será que el modelo es aceptable.

2'1,ncV α−χ>

2'1,ncV α−χ≤

El error crítico

21

2'1,n

n

1i

2i

21,1 D

*E⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α−

=α− ∑

es una estadística que Ek y Monserud (1979) usaron como un índice para comparar

dos modelos, de modo que el modelo con el menor error crítico es el mejor modelo.

El error crítico también puede determinarse de la región de rechazo de en

(13), es decir,

'0H

2',n

'cV αχ≤

2',n2

n

1i

2i

21,1

e

=α−

χ≤χ ∑

2',n

n

1i

2i

21,1

2 1

d

=α−

χ≥

χ ∑

2',n

n

1i

2i

21,1

2d

=α−

χ

χ≥

21

2',n

n

1i

2i

21,1 d

e⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ≥

α

=α− ∑

(21)

Por lo tanto, de (21) sea

21

2',n

n

1i

2i

21,1 d

**e⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α

=α− ∑

36

Así, se rechazará si el modelador o usuario del modelo especifica un valor de e tal

que e≥e**, es decir, el modelo será aceptable y si e<e** el modelo no será aceptable.

Análogamente al uso como un índice que Ek y Monserud (1979) le dieron a E*, el error

crítico

'0H

21

2',n

n

1i

2i

21,1 D

**E⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α

=α− ∑

también es una estadística para comparar dos modelos, de tal manera que el modelo

con el menor error crítico es el mejor modelo.

Los errores críticos e* y e** son similares, su diferencia se debe sólo a sus

denominadores y respectivamente. Si 2'1,n α−χ 2

',n αχ21' =α entonces y e*=e**.

Si

2',n

2'1,n αα− χ=χ

21' <α entonces

2',n

2'1,n αα− χ>χ

2',n

2'1,n

11αα− χ

2',n

n

1i

2i

21,1

2'1,n

n

1i

2i

21,1 dd

α

=α−

α−

=α−

χ

χ<

χ

χ ∑∑

(e*)2 < (e**)2

e* < e** (22)

Si para un valor 21' <α , e y α especificados por el modelador o usuario del modelo se

tiene que e*< e <e** entonces el modelo es aceptable empleando la estadística E* y no

lo es con la estadística E**. Esto indica que las hipótesis en (13)

21,1

22D

'0

e:Hα−χ

>σ vs. 21,1

22D

'1

e:Hα−χ

≤σ

representan un planteamiento alternativo para decidir si un modelo cumple con la

exactitud requerida que el planteamiento original de Freese (1960), además de la

37

implicación práctica para la mayoría de los usuarios al tener la hipótesis de

investigación en la hipótesis alternativa.

A continuación se determina y expone la interpretación del error crítico que hizo

Reynolds (1984), a través de un intervalo de confianza (IC) bilateral.

Con el supuesto D~N(0, ), considere el parámetro 2Dσ ε definido como

( )21

21,1

2D α−χσ=ε

el cual corresponde al cuantil 1-α de la distribución de |D| o equivalentemente es el

cuantil 1-α de la distribución de D2, ya que por el resultado (6) se tiene que

⎟⎟⎠

⎞⎜⎜⎝

⎛χ≤

σ=α− α−

21,12

D

2DP1

( )21,1

2D

2DP α−χσ≤=

( )22DP ε≤=

( )22DP ε≤=

( )ε≤= DP

La variable aleatoria pivote para el parámetro ε es ∑= σ

n

1i2D

2iD ~ , la estadística de

prueba empleada en las pruebas de hipótesis establecidas en (11) y (13). Por lo tanto,

2nχ

⎟⎟⎟⎟

⎜⎜⎜⎜

χ≤σ

=α− α−=∑

2'1,n2

D

n

1i

2i

'D

P1

despejando de ε se tiene que 2Dσ 2

1,1

22D

α−χε

=σ y por consiguiente

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ≤

χε

=α− α−

α−

=∑

2'1,n

21,1

2

n

1i

2i

'D

P1

38

⎟⎟⎟⎟

⎜⎜⎜⎜

χ≤ε

χ= α−

=α− ∑

2'1,n2

n

1i

2i

21,1 D

P

⎟⎟⎟⎟

⎜⎜⎜⎜

ε≤χ

χ=

α−

=α− ∑

22

'1,n

n

1i

2i

21,1 D

P

( )22*)E(P ε≤=

( )ε≤= *EP

Por lo que (E*, ∞) es un IC unilateral del (1-α’)100% para ( )21

21,1

2D α−χσ=ε . En el IC

estimado (e*, ∞), e* es el límite inferior de confianza del cuantil 1-α de la distribución de

|D|.

El error crítico E** también puede interpretarse en términos de un IC para el

parámetro ε, ya que

⎟⎟⎟⎟

⎜⎜⎜⎜

χ≤σ

=α α=∑

2',n2

D

n

1i

2i

'D

P

⎟⎟⎟⎟

⎜⎜⎜⎜

χ≥σ

−=α α=∑

2',n2

D

n

1i

2i

'D

P1

⎟⎟⎟⎟

⎜⎜⎜⎜

χ≥σ

=α− α=∑

2',n2

D

n

1i

2i

'D

P1

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ≥

χε

= α

α−

=∑

2',n

21,1

2

n

1i

2iD

P

39

⎟⎟⎟⎟

⎜⎜⎜⎜

χ≥ε

χ= α

=α− ∑

2',n2

n

1i

2i

21,1 D

P

⎟⎟⎟⎟

⎜⎜⎜⎜

ε≥χ

χ=

α

=α− ∑

22

',n

n

1i

2i

21,1 D

P

( )22*)*E(P ε≥=

( )ε≥= **EP

Por lo que (0, E**) es un IC unilateral del (1-α’)100% para ( )21

21,1

2D α−χσ=ε . En el IC

estimado (0, e**), e** es el límite superior de confianza del cuantil 1-α de la distribución

de |D|.

Reynolds (1984) combinó los dos IC unilaterales para formar ( ), un

intervalo de confianza bilateral (ICB) del (1-2α’)100% para ε. Si se reemplaza α’ por

∗IE , ∗∗

IE

2

en las expresiones para E* y E** se obtiene un ICB del (1-α’)100% para ε. Así, en el ICB

estimado ( ∗Ie , ∗∗

Ie )

21

2

2'1,n

n

1i

2i

21,1

I

de

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α−

=α−

∗∑

y

21

2

2',n

n

1i

2i

21,1

I

de

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α

=α−

∗∗∑

(23)

son los límites de confianza inferior y superior respectivamente del (1-α’)100% para el

cuantil 1-α de la distribución de |D| bajo el supuesto de que D~N(0, ). El intervalo de

confianza estimado significa que se tiene confianza en un (1-α’)100% que el punto de la

distribución |D| que tiene debajo el (1-α)100% de los errores absolutos está localizado

en alguna parte en el intervalo

2Dσ

( )**I

*I e,e . Del resultado (22) se tiene que si

21' <α

entonces e*<e**.

La función de distribución de T=|D| con D~N(0, ) es 2Dσ

40

( ) ( ) ( ) ( tDPtDPtDtPtDP)tT(P)t(FT −≤−≤=≤≤−=≤=≤= )

1)t(F2))t(F1()t(F)t(F)t(F DDDDD −=−−=−−=

por lo que la función de densidad de T=|D| está dada por

[ ] )t(f21)t(F2dtd)t(F

dtd)t(f DDTT =−==

)t(Ie2

2)t(f ),0(

t2

1

DT

22D

∞σ

σπ=

El soporte de T=|D| es (0, ∞) ya que -∞<d<∞ y |d|≥0. Su gráfica corresponde a la mitad

derecha de D~N(0, ) en donde cada imagen de la función densidad de D es

multiplicada por 2.

2Dσ

A continuación se deduce por otro camino el ICB ( ) del (1-α’)100% para ε

que determinó Reynolds (1984). Básicamente el procedimiento consistirá en obtener un

ICB del (1-α’)100% para y a partir de éste se determinará el ICB del (1-α’)100% para

ε.

∗IE , ∗∗

IE

2Dσ

Con el supuesto D~N(0, ), una variable aleatoria pivote para es 2Dσ

2Dσ

2D

n

1i

2i

2D

D)(H

σ=σ∑= ~ 2

Para 1-α’ dado se pueden determinar h1 y h2 de la distribución tales que 2nχ

( )22D1

' h)(HhP1 <σ<=α−

⎟⎟⎟⎟

⎜⎜⎜⎜

<=α−∑=

22D

n

1i

2i

1' h

DhP1

⎟⎟⎟⎟

⎜⎜⎜⎜

<σσ

<=α−∑∑==

22D

n

1i

2i

2D

n

1i

2i

1' h

D,

DhP1

41

⎟⎟⎟⎟

⎜⎜⎜⎜

σ<<σ=α−∑∑== 2

D2

n

1i

2i

1

n

1i

2i

2D

'

h

D,

h

DP1

⎟⎟⎟⎟

⎜⎜⎜⎜

<σ<=α−∑∑==

1

n

1i

2i

2D

2

n

1i

2i

'

h

D

h

DP1

Por lo tanto

⎟⎟⎟⎟

⎜⎜⎜⎜

⎛ ∑∑==

1

n

1i

2i

2

n

1i

2i

h

D,

h

D

es un ICB del (1-α’)100% para . Una manera de obtener h1 y h2 es tal que se tenga

igual probabilidad en las colas de la distribución , es decir,

2Dσ

2nχ

2h

DPh

DP

'

22D

n

1i

2i

12D

n

1i

2i α

=

⎟⎟⎟⎟

⎜⎜⎜⎜

=

⎟⎟⎟⎟

⎜⎜⎜⎜

∑∑==

por lo que 2

2',n1h αχ= y 2

2'1,n2h α

−χ= . Así, el ICB del (1-α’)100% para es 2

⎟⎟⎟⎟

⎜⎜⎜⎜

χχ α

=

α−

=∑∑

2

2',n

n

1i

2i

2

2'1,n

n

1i

2i D

,D

(24)

y es referido a veces como el IC de colas iguales para la varianza.

Otra manera de determinar h1 y h2 es tal que minimicen la amplitud esperada del

intervalo, E(A), sujeta a la restricción ( )22D1

' h)(HhP1 <σ<=α− . Se tiene que

)h(F)h(F1 1H2H' −=α− (25)

y

42

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛−=

⎟⎟⎟⎟

⎜⎜⎜⎜

−= ∑∑∑

=

==n

1i

2i

212

n

1i

2i

1

n

1i

2i

DEh1

h1

h

D

h

DE)A(E

∑=

⎟⎟⎠

⎞⎜⎜⎝

⎛−=

n

1i

2i

21

)D(Eh1

h1 (26)

Derivando (25) y (26) respecto a h1 se tiene que

[ ])h(F)h(Fdhd)1(

dhd

1H2H1

'

1

−=α−

)h(fdhdh)h(f0 1H

1

22H −=

1

22H1H dh

dh)h(f)h(f =

)h(f)h(f

dhdh

2H

1H

1

2 = (27)

0h1

h1

dhd)D(E

dh)A(dE

211

n

1i

2i

1

=⎟⎟⎠

⎞⎜⎜⎝

⎛−= ∑

=

0dhdh

h1

h1

1

222

21

=+−

211

222 h

1dhdh

h1

=

21

22

1

2

hh

dhdh

= (28)

Igualando (27) y (28) se obtiene

21

22

2H

1H

hh

)h(f)h(f=

)h(fh)h(fh 2H221H

21 = (29)

Por lo tanto, h1 y h2 se seleccionan de modo que cumplan (29) y sujetos a la restricción

( ) '2

2D1 1h)(HhP α−=<σ< .

43

Ahora se determinará un ICB del (1-α’)100% para ( )21

21,1

2D α−χσ=ε , el cuantil 1-α de

la distribución de |D|, a partir del ICB del (1-α’)100% para obtenido en (24). Para

esto se utilizó el siguiente resultado que puede ser consultado en el capítulo VIII página

378 de Mood et al. (1974d): Si

2Dσ

(.)τ es una función monótona creciente y (T1=t1(X1,

X2,…,Xn), T2=t2(X1, X2,…,Xn)) es un IC del %100γ para θ entonces ( es un IC

del

))T(),T( 21 ττ

%100γ para ya que )(θτ

( ) ( ) γ=<θ<=τ<θτ<τ θθ 2121 TTP)T()()T(P

Del IC del (1-α’)100% para obtenido en (24) y de que la función 2Dσ

( ) ( ) ε=χσ=στ α−21

21,1

2D

2D es monótona creciente, entonces por el resultado antes

mencionado

( )⎟⎟⎟⎟

⎜⎜⎜⎜

χτ<στ<

⎟⎟⎟⎟

⎜⎜⎜⎜

χτ

α

=

α−

=∑∑

2

2',n

n

1i

2i

2D2

2'1,n

n

1i

2i DD

21

2

2',n

21,1

n

1i

2i

21

2

2'1,n

n

1i

21,1

2i DD

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ<ε<

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ

α

α−=

α−

=α− ∑∑

∗∗∗ <ε< II EE

Así, ( ) es un ICB del (1-α’)100% para ε, el cual coincide con el obtenido por

Reynolds (1984), empleando un procedimiento diferente. Cabe señalar que del análisis

efectuado para la obtención del resultado e*<e**, es necesario especificar un valor

∗IE , ∗∗

IE

21' <α .

Probablemente para la mayoría de los usuarios de un modelo, sea relativamente

más práctico y sencillo trabajar con el IC para que para el IC del cuantil 1-α de la

distribución de |D|. Por lo que se expone, respecto a la adecuación del modelo, un

posible uso del ICB del (1-α’)100% para .

2Dσ

2Dσ

44

Para e y α especificados por el modelador o usuario del modelo considere las

hipótesis

21,1

22D0

e:Hα−χ

=σ vs. 21,1

22D1

e:Hα−χ

≠σ

las cuales constituyen el planteamiento de una prueba de hipótesis de dos colas con

nivel de significación, digamos α’. También, considere el ICB del (1-α’)100% para 2Dσ

2

2',n

n

1i

2i

2D2

2'1,n

n

1i

2i DD

α

=

α−

=

χ<σ<

χ

∑∑

Con un nivel de significación α’, no se rechazará 21,1

22D0

e:Hα−χ

=σ a favor de

21,1

22D1

e:Hα−χ

≠σ si el valor 21,1

2eα−χ

está en el IC del (1-α’)100% para . Se rechazará H0

si

2Dσ

21,1

2eα−χ

está fuera del intervalo. El ICB del (1-α’)100% se puede interpretar como el

conjunto de valores de 21,1

2eα−χ

para los cuales 21,1

22D0

e:Hα−χ

=σ es “aceptable” en el nivel

de significación α’. No hay un valor aceptable para el parámetro sino un número

infinito de valores dentro del intervalo, es por esto que, por lo general, “no se acepta” la

H0 de que tome un valor particular

2Dσ

2Dσ 2

1,1

2eα−χ

, aun si el valor 21,1

2eα−χ

está dentro del IC.

Como diversos valores de son aceptables, se evita aceptar un solo valor de

como el valor real.

2Dσ

2Dσ

Una posible utilidad del ICB del (1-α’)100% para es que proporciona una idea

de los valores de e y α para los cuales el modelo será considerado aceptable

2Dσ

⎥⎥⎦

⎢⎢⎣

χ≤σ

α−2

1,1

22D

eenigualdadlacaso , y éstos serán los que hagan que 21,1

2eα−χ

se encuentre

en dicho IC. Esto es debido a que un modelo es aceptable si se cumple que 21,1

22D

eα−χ

≤σ .

45

Otra utilidad más práctica es que proporciona información acerca de la amplitud de los

valores de . 2Dσ

4.3.5. Planteamiento para validar un modelo en predicción de varias variables

Con base a los resultados obtenidos, se plantea un procedimiento gráfico para

visualizar cuando un modelo satisface la exactitud requerida para varias variables que

sean salidas de un modelo o submodelo.

Sea el caso de validar un modelo en predicción para tres variables de estado

observadas Y1, Y2, Y3 con Z1, Z2, Z3 sus correspondientes valores predichos por el

modelo, así, se tienen tres pares de conjuntos (Yjk, Zjk) con j=1,2,3; k=1,2,…,nj, los

mismos valores de exactitud e y α especificados por el modelador o usuario del modelo

y la misma α’ empleada en las inferencias para la determinación de o con j=1,2,3.

Se tendrá que el modelo satisface la exactitud requerida

*je **

je

21,1

22D

eα−χ

≤σ para la variable Yj

con un nivel de significación α’ si o . Un gráfico de líneas o barras con los

letreros Y1, Y2 y Y3 en el eje de las abscisas y los valores o en el eje de las

ordenadas, permitiría visualizar para cuales variables el modelo es adecuado o

aceptable en predicción. Por ejemplo, si entonces el modelo sólo es

aceptable en predicción de la variable Y2. Aunque también se tendría que el modelo es

más adecuado en predicción para Y2, luego para Y1 y finalmente para Y3 (Figura 3).

*jee ≥ **

jee ≥

*je **

je

*3

*1

*2 eeee <<≤

46

0

12

3

45

6

7

89

10

Y1 Y2 Y3

e*

Figura 3. Valores hipotéticos del error crítico (j=1, 2, 3) para cada variable. *

je

Otros gráficos que contribuirían a completar la percepción de la adecuación de

un modelo analizando varias variables, sería un gráfico de los ICB del (1-α’)100% para

la j=1,2,3 y un gráfico de los ICB del (1-α’)100% para 2Dj j

)D(V σ= ( )2121,1

2Dj j α−χσ=ε , el

cuantil 1-α de la distribución de |Dj| j=1,2,3. El primero indicaría la amplitud de los

valores para cada , un intervalo angosto implicaría que la distribución de Dj es

menos variable. El segundo, con los IC

2Dj

σ

( )**Ij

*Ij e,e graficados, significaría que se tiene

confianza en un (1-α’)100% que el punto de la distribución |Dj| que tiene debajo el (1-

α)100% de los errores absolutos está localizado en alguna parte en el intervalo ( )**Ij

*Ij e,e .

Un intervalo con menor límite superior de confianza para ( )2121,1

2Dj j α−χσ=ε implicaría que

para la variable Yj el modelo es más adecuado ya que contiene el cuantil 1-α de los

valores |djk| antes que las otras variables, y si el IC es angosto mucho mejor. Ambos

gráficos serían como la Figura 4, con la diferencia de los valores en el eje de las

ordenadas, es decir, para el ICB de la varianza y 2Dj j

)D(V σ= ( )2121,1

2Dj j α−χσ=ε para los

valores del cuantil 1-α de la distribución de |Dj|.

47

V(Dj)

Y1 Y2 Y36

7

8

9

10

11

Figura 4. Valores hipotéticos de V(Dj) o εj (j=1, 2, 3) para cada variable.

Se requiere que las variables sean medidas en las mismas unidades para que

las comparaciones sean justas. En caso contrario se tendría que establecer diferentes

valores de e, una para cada variable Yj y mantener los mismos valores de α y α’ en las

inferencias. También para evitar trabajar con parejas de datos que tienen unidades de

medida diferentes, se puede estandarizar cada columna de datos, de modo que cada

columna transformada tendrá media cero y desviación estándar uno, además de que no

tendrán unidades de medida.

4.3.6. Planteamiento para la comparación de dos o más modelos en predicción

Un problema frecuentemente dado en la construcción de un nuevo modelo M2,

para un sistema particular cuando ya se tiene un modelo M1 de dicho sistema, es

decidir cuál modelo es mejor en cuanto a la exactitud en predicción de los valores del

sistema real (Y). En páginas anteriores se trató este problema cuando se determinaron

los errores críticos E* y E**. Ahora, se plantea analíticamente la situación y una solución

por medio del error crítico E**. Análogamente la comparación puede hacerse utilizando

E*.

Sea (Yi, Zij) i=1,2,…,n y j=1,2 donde para el i-ésimo par y modelo j (Mj), Yi es el

valor observado de la variable de interés y Zij el correspondiente valor predicho

mediante el modelo j. Usando los conjuntos (Yi, Zi1) y (Yi, Zi2) para i=1,2,…,n se pueden

48

obtener y que son respectivamente los errores críticos basados en el

planteamiento alternativo para los modelos M1 y M2. Si el modelador o usuario del

modelo especifica un valor de e tal que para alguna (j=1,2) donde es un

valor de la estadística

**1e **

2e

**jee ≥ **

je

21

2',n

n

1i

2ij

21,1

**j

DE

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α

=α− ∑

para el modelo j entonces dicho modelo es aceptable. Así, en la comparación de dos

modelos, el modelo con el menor error crítico será el mejor modelo. Por ejemplo, si

entonces el mejor modelo es M1 (Figura 5). Por supuesto que en la

determinación de se emplean los mismos valores de α y α’. Este procedimiento

permite comparar m modelos (j=1,2,…,m) bajo las mismas consideraciones planteadas

para el caso de dos modelos.

**2

**1 eee <≤

**je

0

12

3

45

6

7

89

10

M1 M2

e**

Figura 5. Valores hipotéticos del error crítico (j=1, 2) para la variable Y por medio de

los modelos 1 y 2 (M1 y M2).

**je

49

4.3.7. Validación de modelos basada en el valor absoluto del error en presencia de sesgo constante

En la obtención de todos los resultados del procedimiento para determinar si un

modelo satisface los requerimientos de exactitud, el supuesto fue D~N(0, ), es decir,

que no hay sesgo en el modelo. El objetivo en esta sección es obtener un

procedimiento cuando el modelo presente sesgo en sus pronósticos Zi para el

correspondiente valor observado Yi.

2Dσ

Del supuesto D~N(0, ) se tiene que µD=E(D)=E(Y-Z)=E(Y)-Z=0, es decir,

E(Y)=Z la cual indica que la esperanza de la variable aleatoria de los datos observados

(Y) es igual al correspondiente valor predicho por el modelo (Z), y es en este sentido de

que se dice que el modelo no presenta sesgo.

2Dσ

Aunque en sus planteamientos Freese (1960), no indica explícitamente la

traducción de la exactitud requerida ( ) α−≥≤ 1eDP en 21,1

22D

eα−χ

≤σ , asume como indica

también Reynolds (1984) que D~N(0, ), es decir, que el modelo no presenta sesgo

[E(D)=0]. Reynolds (1984) no presentó un planteamiento basado en el procedimiento de

Freese cuando el modelo presenta sesgo.

2Dσ

Si el modelo presenta sesgo constante (SC) B, Freese (1960) aunque señala que

si el sesgo B es el mismo para todos los valores Yi (µi en su notación), y que su

magnitud puede estimarse por la media de las diferencias entre los valores observados

y los predichos

ZYn

)ZY(

n

DDB

n

1iii

n

1ii

−=−

===∑∑==

no indica explícitamente las razones de utilizar DB =∧

y de la traducción de la exactitud

requerida en . 2Dσ

El uso de DB =∧

se debe a las siguientes razones: Si D1, D2,…,Dn es una

muestra aleatoria de D~ , es decir, Di~ ) i=1,2,…,n entonces ),(N 2DD σµ ,(NI 2

DD σµ

50

)Y(SZ)Y(SZZ)Y(E)ZY(E)D(E iiiiiiiii =−+=−=−=

B)Y(S)D(E iDi ==µ=

donde denota el sesgo de Yi. Por lo tanto, un estimador insesgado de )Y(S i BD =µ es

DBD ==µ∧∧

, y

)D(E)D(E)DD(E)BD(E iii −=−=−∧

0DDDD =µ−µ=µ−µ= (30)

ya que si D~ entonces ),(N 2DD σµ D ~ ⎟⎟

⎞⎜⎜⎝

⎛ σµ

n,N

2D

D [ver teorema 6 página 241 del capítulo VI

de Mood et al. (1974b)]. Por (30) DDBD ii −=−∧

es la corrección por SC o fijo B, el

mismo para todos los valores Yi.

Sea DDW ii −= entonces

( )n1ii1i1ii D...DDD...Dn1DDD ++++++−=− +−

n1ii1i1 Dn1...D

n1D

n11D

n1...D

n1

⎟⎠⎞

⎜⎝⎛−++⎟

⎠⎞

⎜⎝⎛−+⎟

⎠⎞

⎜⎝⎛ −+⎟

⎠⎞

⎜⎝⎛−++⎟

⎠⎞

⎜⎝⎛−= +−

es una combinación lineal de variables aleatorias independientes con distribución

y por el teorema 6.3 pp. 305-306 capítulo 6 de Wackerly (2002) [Sean Y1,

Y2,…,Yn variables aleatorias independientes que tienen distribución normal con E(Yi)=µi

y var(Yi)= i=1,2,…,n y a1,a2,…,an constantes. Si entonces

U~ ], Wi se distribuye normal con media

),(N 2DD σµ

2iσ ∑

=

=n

1iiiYaU

⎟⎟⎠

⎞⎜⎜⎝

⎛σµ ∑∑

==

n

1i

2i

2i

n

1iii a,aN 0)DD(E)W(E ii =−= [ver

resultado (30)] y varianza

)DD(Var)W(Var ii −=

⎥⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛−++⎟

⎠⎞

⎜⎝⎛−+⎟

⎠⎞

⎜⎝⎛ −+⎟

⎠⎞

⎜⎝⎛−++⎟

⎠⎞

⎜⎝⎛−= +− n1ii1i1 D

n1...D

n1D

n11D

n1...D

n1Var

2D2

2D2

2D

22D2

2D2 n

1...n1

n11

n1...

n1

σ++σ+σ⎟⎠⎞

⎜⎝⎛ −+σ++σ=

51

)1n1(n

1nn

1nn

1n 2D2

2D

22D2 −+σ⎟

⎠⎞

⎜⎝⎛ −

=σ⎟⎠⎞

⎜⎝⎛ −

+σ⎟⎠⎞

⎜⎝⎛ −

=

2Dn

1nσ⎟⎠⎞

⎜⎝⎛ −

= n≥2

Por lo que, )DD(W ii −= ~ ⎟⎟⎠

⎞⎜⎜⎝

⎛σ⎟⎠⎞

⎜⎝⎛ − 2

Dn1n,0N . Así, para D~ se sigue que ),(N 2

DD σµ

)DD(W −= ~ ⎟⎟⎠

⎞⎜⎜⎝

⎛σ⎟⎠⎞

⎜⎝⎛ − 2

Dn1n,0N .

4.3.7.1. Pruebas estadísticas para la exactitud requerida

Sea W1,W2,…,Wn una muestra aleatoria de la distribución ⎟⎟⎠

⎞⎜⎜⎝

⎛σ⎟⎠⎞

⎜⎝⎛ −

=σ 2D

2W n

1n,0N

entonces por los mismos argumentos utilizados para la variable aleatoria D cuando

D~ , la exactitud requerida traducida en la varianza indicada en (10), las

hipótesis con el planteamiento original en (11), alternativo en (13) y la estadística de

prueba en (15) corresponden respectivamente a (31), (32), (32a) y (33):

),0(N 2Dσ

21,1

22W

eα−χ

≤σ (31)

donde los valores e y α especificados por el usuario del modelo satisfacen la exactitud

requerida ( ) α−≥≤ 1eDP que se traduce en 21,1

22D

eα−χ

≤σ una vez que es removido el SC

mediante la corrección DDi − .

21,1

22W

SCW0

e:Hα−χ

≤σ vs. 21,1

22W

SCW1

e:Hα−χ

>σ (32)

21,1

22W

'SCW0

e:Hα−χ

>σ vs. 21,1

22W

'SCW1

e:Hα−χ

≤σ (32a)

∑χ

=

χ

==

α−

=

α−

=∑∑

n

1i

2i2

21,1

n

1i2

1,1

2

2i

n

1i2W

2iSCW W

eeWWV

0

52

( ) ( ) ⎥⎦

⎤⎢⎣

⎡∑ −

χ=∑ −

χ=

=

α−

=

α−2n

1i

2i2

21,1

2n

1ii2

21,1 DnD

eDD

e~ (33) 2

1n−χ

La hipótesis nula para SC , se rechazará con un nivel de

significación α’ si o las cuales son pruebas de razón de

verosimilitudes generalizada de tamaño α’ [ver pp. 431-432 capítulo IX de Mood et al.

(1974c)]. es el valor de la estadística de prueba que se obtendría al usar la

información contenida en la muestra w1,w2,…,wn (

SCW0H o 'SCW

0H

2'1,1n

SCWcV α−−χ> 2

',1nSCWcV α−χ≤

SCWcV SCWV

ddw ii −= ) y los valores e y α

especificados por el modelador o usuario del modelo como se indicó arriba. Por lo tanto,

si no se rechaza o se rechaza con un nivel de significación α’ entonces el

modelo será considerado aceptable bajo los valores e, α.

SCW0H 'SCW

0H

Los resultados (31), (32), (32a) y (33) pueden formularse en (34), (35), (35a) y

(36) respectivamente cuando se considera D~ y el modelo presenta SC. Esto

se debe a que:

),(N 2DD σµ

21,1

22W

eα−χ

≤σ

21,1

22D

en

1nα−χ

≤σ⎟⎠⎞

⎜⎝⎛ −

21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ (34)

donde e y α satisfacen ( ) α−≥≤− 1eDDP . El resultado (34), también puede obtenerse

con el mismo procedimiento empleado en la determinación del resultado (10). Así, si

D~ entonces ),(N 2DD σµ

)DD(W −= ~ ⎟⎟⎠

⎞⎜⎜⎝

⎛σ⎟⎠⎞

⎜⎝⎛ − 2

Dn1n,0N (a)

2Dn

1nDD

σ⎟⎠⎞

⎜⎝⎛ −

− ~N(0,1) (b)

53

( )2D

2

2D

2

2

2D n

1nW

n1nDD

n1nDD

σ⎟⎠⎞

⎜⎝⎛ −

=σ⎟⎠⎞

⎜⎝⎛ −

−=

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

σ⎟⎠⎞

⎜⎝⎛ −

− ~ (c) 21χ

( ) α−=χ≤χ=⎟⎟⎟⎟

⎜⎜⎜⎜

χ≤σ⎟⎠⎞

⎜⎝⎛ − α−α− 1P

n1n

WP 21,1

21

21,1

2D

2

(d)

De ( ) α−≥≤ 1eWP se tiene que

( ) α−≥≤ 1eWP 22

( ) α−≥≤ 1eWP 22

α−≥⎟⎟⎟⎟

⎜⎜⎜⎜

σ⎟⎠⎞

⎜⎝⎛ −

≤σ⎟⎠⎞

⎜⎝⎛ −

1

n1n

e

n1n

WP2D

2

2D

2

α−≥⎟⎟⎟⎟

⎜⎜⎜⎜

σ⎟⎠⎞

⎜⎝⎛ −

≤χ 1

n1n

eP2D

221 (e)

Por lo tanto, de (d) y (e) se obtiene el resultado (34)

21,1

2D

2

n1n

eα−χ≥

σ⎟⎠⎞

⎜⎝⎛ −

21,1

2

2D 1

en

1n

α−χ≤

σ⎟⎠⎞

⎜⎝⎛ −

21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ

El siguiente paso es probar la hipótesis con el planteamiento original o alternativo:

21,1

22D

SCD0

e1n

n:Hα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ vs. 2

1,1

22D

SCD1

e1n

n:Hα−χ

⎟⎠⎞

⎜⎝⎛

−>σ (35)

54

21,1

22D

'SCD0

e1n

n:Hα−χ

⎟⎠⎞

⎜⎝⎛

−>σ vs. 2

1,1

22D

'SCD1

e1n

n:Hα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ (35a)

Con D~ , el modelo presenta SC, e y α tales que satisfacen la exactitud

requerida

),(N 2DD σµ

( ) ( ) α−≥≤−=≤ 1eDDPeWP que se traduce en 21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ , implican

que la estadística de prueba bajo ) verdadera es: SCD0H ( 'SCD

0H

( )∑= σ

−=

n

1i2D

2iSCD

0

DDV ~ 21n−χ donde 2

1,1

22D

e1n

n0

α−χ⎟⎠⎞

⎜⎝⎛

−=σ .

( ) ( )∑ −χ

⎟⎠⎞

⎜⎝⎛ −

=

χ⎟⎠⎞

⎜⎝⎛

−=

=

α−

=

α−

∑n

1i

2i2

21,1

n

1i2

1,1

2

2i DD

en1n

e1n

nDD

( ) ⎥⎦

⎤⎢⎣

⎡∑ −

χ⎟⎠⎞

⎜⎝⎛ −

==

α−2n

1i

2i2

21,1 DnD

en1n ~ (36) 2

1n−χ

SCD0H o se rechazará con un nivel de significación α’ si 'SCD

0H

( ) 2'1,1n

2n

1i

2i2

21,1SCD

c dnden

1nV α−−=

α− χ>⎥⎦

⎤⎢⎣

⎡∑ −

χ⎟⎠⎞

⎜⎝⎛ −

= o las cuales son pruebas de

razón de verosimilitudes generalizada de tamaño α’ [ver pp. 431-432 capítulo IX de

Mood et al. (1974c)]. Por lo tanto, si no se rechaza o se rechaza con un nivel

de significación α’ entonces el modelo será considerado aceptable bajo los valores e y

α.

2',1n

SCDcV α−χ≤

SCD0H 'SCD

0H

La distribución de puede obtenerse del teorema 8 pp. 243-245 capítulo VI

de Mood et al. (1974b) [Si X1, X2,…,Xn es una muestra aleatoria de la distribución

normal con media µ y varianza entonces

SCDV

2σ( )∑

= σ−n

1i2

2i XX ~ ]. Como Di~

entonces

21n−χ ),(NI 2

DD σµ

( )∑= σ

−n

1i2D

2i DD ~ . También Montgomery (2004d), señala que 2

1n−χ ( )∑=

−=n

1i

2i DDSS

es la suma de cuadrados corregida de las observaciones Di y si Di~ ) entonces ,(NI 2σµ

( )∑= σ

−=

σ

n

1i2

2i

2DDSS ~ . 2

1n−χ

55

Cuando el modelo presenta SC y D~ , coincidiendo con Freese (1960),

los valores e y α son tales que satisfacen la exactitud requerida

),(N 2DD σµ

( ) α−≥≤ 1eDP que se

traduce en 21,1

22D

eα−χ

≤σ una vez que es removido el sesgo, y bajo verdadera la

estadística de prueba se distribuye ji-cuadrada con n-1 g.l. Ahora, si el modelo

presenta SC, D~ , e y α son tales que satisfacen la exactitud requerida

SCW0H

SCWV

),(N 2DD σµ

( ) ( ) α−≥≤−=≤ 1eDDPeWP que se traduce en 21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ , implica que bajo

verdadera la estadística de prueba a utilizar sería , la cual también se

distribuye ji-cuadrada con n-1 g.l.

SCD0H SCDV

4.3.8. Validación por intervalo de confianza empleando el error crítico en presencia de sesgo constante

Freese (1960), Rennie y Wiant (1978), Reynolds (1984) y Barrales et al. (2004)

no presentaron el error crítico cuando el modelo tiene SC o proporcional.

Con D~ y el modelo presenta SC, se tiene que ),(N 2DD σµ

)DD(W −= ~ ⎟⎟⎠

⎞⎜⎜⎝

⎛σ⎟⎠⎞

⎜⎝⎛ − 2

Dn1n,0N . Por los mismos argumentos empleados en la obtención

de los errores críticos E* y E** cuando el modelo no presenta sesgo [D~ ], los

errores críticos para el planteamiento original y alternativo después de remover el SC

corresponden respectivamente a:

),0(N 2Dσ

( ) ( )21

2'1,1n

2n

1i

2i

21,1

21

2'1,1n

n

1i

2i

21,1

21

2'1,1n

n

1i

2i

21,1

SCW

DnDDDWE

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ

⎥⎦

⎤⎢⎣

⎡∑ −χ

=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−χ=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α−−

=α−

α−−

=α−

α−−

=α−

∗∑∑

56

( ) ( )21

2',1n

2n

1i

2i

21,1

21

2',1n

n

1i

2i

21,1

21

2',1n

n

1i

2i

21,1

SCW

DnDDDWE

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ

⎥⎦

⎤⎢⎣

⎡∑ −χ

=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−χ=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ=

α−

=α−

α−

=α−

α−

=α−

∗∗∑∑

Si el usuario del modelo especifica un valor de e tal que entonces

el modelo es considerado aceptable. Los valores e y α son tales que satisfacen la

exactitud requerida

∗≥ SCWee o ∗∗≥ SCWee

( ) α−≥≤ 1eDP que se traduce en 21,1

22D

eα−χ

≤σ una vez que es

removido el SC.

Si D~ , el modelo presenta SC, e y α tales que satisfacen la exactitud

requerida

),(N 2DD σµ

( ) ( ) α−≥≤−=≤ 1eDDPeWP que se traduce en 21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ , entonces

el error crítico para el planteamiento alternativo puede obtenerse de la región de

rechazo de , es decir, 'SCD0H

2',1n

SCDcV α−χ≤

( ) 2',1n

n

1i

2i2

21,1 dd

en1n

α−=

α− χ≤∑ −χ

⎟⎠⎞

⎜⎝⎛ −

( ) 2',1n

n

1i

2i

21,1

2 1

dd

11n

neα−

=α− χ

≥∑ −

⎟⎠⎞

⎜⎝⎛

−χ

( )2

',1n

n

1i

2i

21,1

2dd

n1ne

α−

=α−

χ

∑ −χ⎟⎠⎞

⎜⎝⎛ −

( ) 21

2',1n

n

1i

2i

21,1 dd

n1ne

⎥⎥⎥

⎢⎢⎢

χ

∑ −χ⎟⎠⎞

⎜⎝⎛ −

≥α−

=α−

(37)

Por lo tanto, de (37) el error crítico corresponde a

( ) 21

2',1n

n

1i

2i

21,1

SCD

DD

n1nE

⎥⎥⎥

⎢⎢⎢

χ

∑ −χ⎟⎠⎞

⎜⎝⎛ −

=α−

=α−

∗∗

57

Análogamente de puede determinarse 2'1,1n

SCDcV α−−χ>

( ) 21

2'1,1n

n

1i

2i

21,1

SCD

DD

n1nE

⎥⎥⎥

⎢⎢⎢

χ

∑ −χ⎟⎠⎞

⎜⎝⎛ −

=α−−

=α−

Si el modelador o usuario del modelo especifica un valor de e tal que

entonces el modelo es considerado aceptable.

∗≥ SCDee o

∗∗≥ SCDee

El ICB del (1-α’)100% para con D~ y variable aleatoria pivote 2Dσ ),(N 2

DD σµ

( )2D

n

1i

2i

2D

DD)(H

σ

−=σ∑= ~ es 2

1n−χ

( ) ( )

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ

α−

=

α−−

=∑∑

2

2',1n

n

1i

2i

2

2'1,1n

n

1i

2i DD

,DD

⎟⎟⎟

⎜⎜⎜

χ−

χ−

α−

α−−

2

2',1n

2D

2

2'1,1n

2D S)1n(,S)1n( (38)

y puede obtenerse de la misma manera como se determinó en páginas anteriores el

ICB del (1-α’)100% para con D~ . De (38) se tiene que 2Dσ ),0(N 2

( ) ( )

'1DDDD

P 2

2',1n

n

1i

2i

2D2

2'1,1n

n

1i

2i

α−=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−<σ<

χ

α−

=

α−−

=∑∑

( ) ( )'1

DD

n1n

n1n

DD

n1nP 2

2',1n

n

1i

2i

2D2

2'1,1n

n

1i

2i

α−=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−⎟⎠⎞

⎜⎝⎛ −

<σ⎟⎠⎞

⎜⎝⎛ −

−⎟⎠⎞

⎜⎝⎛ −

α−

=

α−−

=∑∑

( ) ( )'1

DD

n1n

DD

n1nP 2

2',1n

n

1i

2i

2W2

2'1,1n

n

1i

2i

α−=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−⎟⎠⎞

⎜⎝⎛ −

<σ<χ

−⎟⎠⎞

⎜⎝⎛ −

α−

=

α−−

=∑∑

58

Por lo que el ICB del (1-α’)100% para es: 2Wσ

( ) ( )

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−⎟⎠⎞

⎜⎝⎛ −

χ

−⎟⎠⎞

⎜⎝⎛ −

α−

=

α−−

=∑∑

2

2',1n

n

1i

2i

2

2'1,1n

n

1i

2i DD

n1n,

DD

n1n

⎟⎟⎟

⎜⎜⎜

χ−

⎟⎠⎞

⎜⎝⎛ −

χ−

⎟⎠⎞

⎜⎝⎛ −

α−

α−−

2

2',1n

2D

2

2'1,1n

2D S)1n(

n1n,S)1n(

n1n (39)

Considere el parámetro definido por SCε

( ) 21

21,1

2D

21

21,1

2WSC n

1n⎟⎟⎠

⎞⎜⎜⎝

⎛χσ⎟

⎠⎞

⎜⎝⎛ −

=χσ=ε α−α−

el cual es el cuantil 1-α de la distribución de DDW −= o equivalentemente ( )2SCε es el

cuantil 1-α de la distribución de ( )22 DDW −= ya que

⎟⎟⎠

⎞⎜⎜⎝

⎛χ≤

σ=α− α−

21,12

W

2WP1

[Si )DD(W −= ~ ⎟⎟⎠

⎞⎜⎜⎝

⎛σ⎟⎠⎞

⎜⎝⎛ − 2

Dn1n,0N entonces ( )

2D

2

2D

2

n1nDD

n1n

W

σ⎟⎠⎞

⎜⎝⎛ −

−=

σ⎟⎠⎞

⎜⎝⎛ −

~ ] 21χ

⎟⎟⎟⎟

⎜⎜⎜⎜

χ≤σ⎟⎠⎞

⎜⎝⎛ −

=α− α−2

1,12D

2

n1n

WP1

⎟⎟⎠

⎞⎜⎜⎝

⎛χσ⎟

⎠⎞

⎜⎝⎛ −

≤= α−2

1,12D

2

n1nWP

( )2SC

2 )(WP ε≤=

( )2SC

2 )(WP ε≤=

( ) ( )SCSC DDPWP ε≤−=ε≤=

59

Note que ( ) ( ) ε⎟⎠⎞

⎜⎝⎛ −

=χσ⎟⎠⎞

⎜⎝⎛ −

=⎟⎟⎠

⎞⎜⎜⎝

⎛χσ⎟

⎠⎞

⎜⎝⎛ −

=στ=ε α−α−

21

21

21,1

2D

21

21

21,1

2D

2DSC n

1nn

1nn

1n . Un ICB del (1-

α’)100% para a partir del ICB del (1-α’)100% para [resultado (38)] y con SCε 2Dσ

( ) SC2D ε=στ función monótona creciente, está dado por

( )

( )( )

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−τ<στ<

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−τ

α−

=

α−−

=∑∑

2

2',1n

n

1i

2i

2D2

2'1,1n

n

1i

2i DDDD

( ) ( ) 2

1

2

2',1n

21,1

n

1i

2i

SC

21

2

2'1,1n

21,1

n

1i

2i DD

n1n

DD

n1n

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ−⎟⎠⎞

⎜⎝⎛ −

<ε<

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ−⎟⎠⎞

⎜⎝⎛ −

α−

α−=

α−−

α−=

∑∑

∗∗∗ <ε< ISCSCISC EE

Por lo tanto, ( , ) es un ICB del (1-α’)100% para ∗ISCE ∗∗

ISCE21

21,1

2DSC n

1n⎟⎟⎠

⎞⎜⎜⎝

⎛χσ⎟

⎠⎞

⎜⎝⎛ −

=ε α− , el

cuantil 1-α de la distribución de DD − . son los límites de confianza inferior y

superior del intervalo para cuando el modelo presenta SC, y corresponden a los

errores críticos que se obtienen de las regiones de rechazo para las hipótesis nulas

∗ISCE y ∗∗

ISCE

SCε

21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ y 2

1,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−>σ respectivamente, con la diferencia de que α’

corresponde a 2

'α en sus expresiones.

Pueden emplearse, con el error crítico correspondiente, el mismo tipo de gráficas

propuestas para visualizar la validación de un modelo en predicción de varias variables.

En la comparación de dos o más modelos en predicción del mismo sistema, se

emplearía el error crítico correspondiente según el modelo presente SC o no tenga

sesgo.

60

4.3.9. Validación de modelos basada en el valor absoluto del error en presencia de sesgo proporcional

Sea el caso cuando el modelo presenta sesgo en sus pronósticos zi para los

correspondientes valores observados yi y el sesgo es proporcional (SP), es decir, la

magnitud del sesgo (di=yi-zi) crece o decrece directamente con los valores predichos zi.

También para este caso Freese (1960), no indica explícitamente la traducción de la

exactitud requerida en la y las razones de emplear los residuos de una

regresión lineal de los valores yi sobre los valores zi (en su notación xi sobre µi) para la

corrección por SP.

2D)D(Var σ=

Sea Yi~ ) i=1,2,…,n donde S(Yi) denota el sesgo de Yi y es

proporcional como se indico. Así,

),Y(SZ(NI 2ii σ+

)Y(SZ)Y(E iii +=

)Y(SZ)Y(E iii =−

)Y(S)ZY(E iii =−

R)Y(S)D(E iDi i==µ=

Para el caso en que el sesgo (di=yi-zi) crece o decrece directamente con los valores

predichos (zi), un estimador de R)Y(S iDi==µ es . Esto se debe a

que para el conjunto (Di, Zi) i=1,2,…,n relacionados por y Var(Di)=σ2

con Di~ ) , es decir,

i10D ZRi

∧∧∧∧

β+β==µ

i10i Z)D(E β+β=

,Z(NI 2i10 σβ+β Rii10i ZD ε+β+β= donde 0)(E Ri =ε y

, se sigue que 2R

2Ri )(Var σ=σ=ε [ ])D(ED)Z(D iii10iRi −=β+β−=ε ~ . Si y

son los estimadores por mínimos cuadrados de los parámetros β0 y β1, entonces

. Por lo tanto, es la corrección por

SP (di crece o decrece directamente con zi). La esperanza de s

),0(NI 2Rσ

β0

β1

i10iD ZDRi

∧∧∧∧∧

β+β===µ )Z(DDDRD i10iiii

∧∧∧∧

β+β−=−=−

− ii DD e

⎟⎠⎞

⎜⎝⎛ β+β−β+β=⎟

⎠⎞

⎜⎝⎛−=⎟

⎠⎞

⎜⎝⎛ −

∧∧∧∧

i10i10iiii ZEZDE)D(EDDE

61

i10i10 ZEEZ ⎟⎠⎞

⎜⎝⎛β−⎟

⎠⎞

⎜⎝⎛β−β+β=

∧∧

0ZZ i10i10 =β−β−β+β=

[Los estimadores por mínimos cuadrados y son estimadores insesgados de los

parámetros β0 y β1 del modelo. Ver pp. 19-20 de Montgomery et al. (2002c)].

β0

β1

Para el caso de que el modelo presente SP se requiere que los residuales

que son los estimaciones de los errores del modelo y que se obtienen de

, provengan de una distribución normal con media cero y varianza de los

errores constante, es decir, ~ ) . Cada valor di es corregido al restársele

, es decir, los residuales representan la corrección cuando el sesgo (di)

crece o decrece directamente con los valores zi.

−= iiRi dde∧∧

−=ε iiRi DD∧

εRi ,0(NI 2R

2 σ=σ

id∧

−= iiRi dde

Si ~ entonces Rε ),0(N 2R

2 σ=σ

2R

R

σ

ε ~N(0,1) [a]

2R

2R

2

2R

R

σε

=⎟⎟

⎜⎜

σ

ε ~ [b] 21χ

( ) α−=χ≤χ=⎟⎟⎠

⎞⎜⎜⎝

⎛χ≤

σε

α−α− 1PP 21,1

21

21,12

R

2R [c]

Para e y α tales que satisfacen ( ) α−≥≤ε 1eP R se tiene que

( ) α−≥≤ε 1eP 22R

( )( ) α−≥≤ε 1eP 22R

α−≥⎟⎟⎠

⎞⎜⎜⎝

⎛σ

≤σε 1eP 2

R

2

2R

2R

α−≥⎟⎟⎠

⎞⎜⎜⎝

⎛σ

≤χ 1eP 2R

221 [d]

Por lo tanto, por [c] y [d] se tiene que

62

21,12

R

2eα−χ≥

σ

21,1

2

2R 1

e α−χ≤

σ

21,1

22R

eα−χ

≤σ

4.3.9.1. Pruebas estadísticas para la exactitud requerida

El siguiente paso es probar la hipótesis con el planteamiento original o alternativo:

21,1

22R

SP0

e:Hα−χ

≤σ vs. 21,1

22R

SP1

e:Hα−χ

21,1

22R

'SP0

e:Hα−χ

>σ vs. 21,1

22R

'SP1

e:Hα−χ

≤σ (40)

Note que con ~ ) , e y α tales que satisfacen la exactitud requerida Riε ,0(NI 2R

2 σ=σ

( ) α−≥≤ε 1eP R que se traduce en 21,1

22R

eα−χ

≤σ , coincide con los supuestos:

~ ) , e y α tales que satisfacen la exactitud requerida Riε ,0(NI 2R

2 σ=σ ( ) α−≥≤ 1eDP que

se traduce en 21,1

22D

eα−χ

≤σ una vez que es removido el SP mediante la corrección

. Así, con los últimos supuestos y bajo ) verdadera,

la estadística de prueba es:

)Z(DDD i10iiiRi

∧∧∧∧

β+β−=−=ε SP0H ( 'SP

0H

( )20

n

1i

2

ii

20

2SP

DD)2n(

1)2n()2n(V

σ

⎟⎠⎞

⎜⎝⎛ −

−−

σ−=

∑=

∧∧

~ donde 22n−χ

21,1

220

e

α−χ=σ

( )

21,1

2D

20

n

1i

2

Ri

20

n

1i

2

ii

eSCE

DD

α−

=

=

χ

⎟⎠⎞

⎜⎝⎛ε

⎟⎠⎞

⎜⎝⎛ −

=∑∑

63

( ) ( )D2

21,1

D2

21,1 CME)2n(

eSCE

e−

χ=

χ= α−α− ~ (41) 2

2n−χ

donde (SCE)D y 2n)SCE()CME( D

D −= corresponden respectivamente a la suma de

cuadrados del error y al cuadrado medio del error cuando la variable dependiente es D

con variable regresora Z, es decir, del modelo Rii10i ZD ε+β+β= con ~ .

La distribución de

Riε ),0(NI 2R

2 σ=σ

( )2R

2)2n(σ

σ−∧

puede consultarse en el Apéndice C (C.3.2) pp. 537-538

de Montgomery et al. (2002d), en las pp. 487-494 del capítulo X de Mood et al. (1974e)

o en las pp. 204-205 del capítulo 6 de Graybill (1976). SP0H o se rechazará con un nivel de significación α’ si o

, donde es el valor de la estadística de prueba que se obtendría al usar

la información de la muestra (Di, Zi) i=1,2,…,n. Por lo tanto, si no se rechaza o

se rechaza con un nivel de significación α’ entonces el modelo será considerado

aceptable bajo los valores e y α.

'SP0H 2

'1,2nSPcV α−−χ>

2',2n

SPcV α−χ≤ SP

cV

SP0H

'SP0H

Si el modelo presenta SP, Freese (1960) en la determinación de la estadística de

prueba ( ), utilizó SPV 21,1

22 e

α−χ≤σ para la exactitud requerida ( ) α−≥≤ 1eDP que se

traduce precisamente en 21,1

22 e

α−χ≤σ una vez que es removido el sesgo, la cual coincide

con los supuestos ~ ) , e y α tales que satisfacen Riε ,0(NI 2R

2 σ=σ ( ) α−≥≤ε 1eP R .

Note que para este caso (SCE)D es la suma de cuadrados del error del modelo

estimado . Freese (1960) señala que si el modelo presenta SP, es decir, la

magnitud del sesgo (en su notación di=xi-µi) crece o decrece directamente con los

valores reales (en su notación µi), la estadística de prueba con Xi~ es

i10i ZD∧∧∧

β+β=

),(N 2i σµ

2SCEσ

~ donde la SCE se obtiene del modelo estimado . Por los 22n−χ i10iX µβ+β=

∧∧∧

64

resultados obtenidos en esta sección, la SCE corresponde a la obtenida del modelo

estimado (en su notación). Si se emplea la SCE del modelo estimado

debe tomarse en cuenta lo siguiente:

i1101iD µβ+β=∧∧∧

i10iX µβ+β=∧∧∧

ii1101iii XD ε+µβ+β=µ−=

iii1101iX ε+µ+µβ+β=

ii1101i )1(X ε+µ+β+β=

Por lo que , 010 β=β 1111 +β=β y la SCE al emplear como variable dependiente Xi con

variable regresora µi corresponde al modelo estimado . i110i 1X µ⎟⎠⎞

⎜⎝⎛ +β+β=

∧∧∧

4.3.10. Validación por intervalo de confianza empleando el error crítico en presencia de sesgo proporcional

Freese (1960), Rennie y Wiant (1978), Reynolds (1984) y Barrales et al. (2004)

no presentaron el error crítico cuando el modelo tiene SC o SP.

Si la magnitud del sesgo (di=yi-zi) crece o decrece directamente con los valores

predichos (zi) y se cumple el supuesto Riε ~ ) entonces por los mismos

argumentos empleados en la obtención de los errores críticos E* y E** cuando el

modelo no presenta sesgo [D~ ], los errores críticos después de remover el SP

corresponden respectivamente a:

,0(NI 2R

2 σ=σ

),0(N 2Dσ

( ) ( ) 21

2'1,2n

D2

1,121

2'1,2n

D2

1,1

21

2'1,2n

n

1i

2

ii2

1,1

SP

CME)2n(SCEDDE ⎟

⎟⎠

⎞⎜⎜⎝

χ−χ

=⎟⎟⎠

⎞⎜⎜⎝

χχ

=

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ

⎟⎠⎞

⎜⎝⎛ −χ

=α−−

α−

α−−

α−

α−−

=

α−∗

( ) ( ) 21

2',2n

D2

1,121

2',2n

D2

1,1

21

2',2n

n

1i

2

ii2

1,1

SP

CME)2n(SCEDDE ⎟

⎟⎠

⎞⎜⎜⎝

χ−χ

=⎟⎟⎠

⎞⎜⎜⎝

χχ

=

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ

⎟⎠⎞

⎜⎝⎛ −χ

=α−

α−

α−

α−

α−

=

α−∗∗

65

donde .y denotan los errores críticos basados en el planteamiento original y

alternativo respectivamente cuando el modelo presenta SP. Si el usuario del modelo

especifica un valor de e tal que entonces el modelo es considerado

aceptable. Los valores e y α son tales que satisfacen la exactitud requerida

∗SPE ∗∗

SPE

∗≥ SPee o ∗∗≥ SPee

( ) α−≥≤ 1eDP que se traduce en 21,1

22D

eα−χ

≤σ una vez que es removido el SP mediante

la corrección . )Z(DDD i10iiiRi

∧∧∧∧

β+β−=−=ε

El ICB del (1-α’)100% para con 2Rσ Riε ~ ) y variable aleatoria pivote ,0(NI 2

R2 σ=σ

( )2R

D2R

n

1i

2

ii

2R

22D

)SCE(DD

)2n()(Hσ

⎟⎠⎞

⎜⎝⎛ −

σ−=σ

∑=

∧∧

~ es 22n−χ

⎟⎟⎟

⎜⎜⎜

χχ α−

α−−

2

2',2n

D2

2'1,2n

D )SCE(,)SCE(

2

2',2n

D2R2

2'1,2n

D )SCE()SCE(α

−α

−−χ

<σ<χ

(42)

y puede obtenerse de la misma manera como se determinó el resultado (24), el ICB del

(1-α’)100% para con D~ . 2Dσ ),0(N 2

Considere el parámetro SPε definido por

( )21

21,1

2RSP α−χσ=ε

el cual corresponde al cuantil 1-α de la distribución de Rε o equivalentemente ( )2SPε es

el cuantil 1-α de la distribución de ya que 2Rε

⎟⎟⎠

⎞⎜⎜⎝

⎛χ≤

σε

=α− α−2

1,12R

2RP1

[Si ~ entonces Rε ),0(N 2R

2 σ=σ2R

R

σ

ε ~N(0,1) y 2R

2R

2

2R

R

σε

=⎟⎟

⎜⎜

σ

ε ~ ] 21χ

( )21,1

2R

2RP1 α−χσ≤ε=α−

66

( )2SP

2RP ε≤ε=

( )2SP

2R ||P ε≤ε=

( )SPR ||P ε≤ε=

Un ICB del (1-α’)100% para SPε a partir del ICB del (1-α’)100% para con 2Rσ

( ) ( ) SP21

21,1

2R

2R ε=χσ=στ α− función monótona creciente, está dado por

( )⎟⎟⎟

⎜⎜⎜

χτ<στ<

⎟⎟⎟

⎜⎜⎜

χτ

α−

α−−

2

2',2n

D2R2

2'1,2n

D )SCE()SCE(

2

2',2n

D2

1,1SP2

2'1,2n

D2

1,1 )SCE()SCE(

α−

α−

α−−

α−

χχ

<ε<χ

χ

∗∗∗ <ε< ISPSPISP EE

Por lo tanto, ( ) es un ICB del (1-α’)100% para ∗ISPE , ∗∗

ISPE ( )21

21,1

2RSP α−χσ=ε , el cuantil 1-α

de la distribución de Rε . son los límites de confianza inferior y superior del

intervalo para cuando el modelo presenta SP y corresponden a los errores críticos

que se obtienen de las regiones de rechazo para las hipótesis nulas

∗ISPE y ∗∗

ISPE

SPε

21,1

22D

eα−χ

≤σ y

21,1

22D

eα−χ

>σ respectivamente, con la diferencia de que α’ corresponde a 2

'α en sus

expresiones. Para distinguirlos se utilizó la notación , de modo que

denota al error crítico obtenido de la región de rechazo de la prueba estadística y l

error crítico empleado en el ICB. La diferencia entre es que en el

denominador se tienen respectivamente y

∗∗SPE y ∗∗

ISPE ∗∗SPE

∗∗ISPE e

∗SPE y ∗

ISPE

2'1,2n α−−χ 2

2'1,2n α

−−χ . Para la diferencia

se debe a que en el denominador tienen respectivamente y

∗∗SPE y ∗∗

ISPE

2',2n α−χ 2

2',2n α

−χ .

67

Pueden utilizarse, con el error crítico correspondiente, el mismo tipo de gráficas

propuestas para visualizar la validación de un modelo en predicción de varias variables.

En la comparación de dos o más modelos en predicción del mismo sistema, se

emplearía el error crítico correspondiente según el modelo presente sesgo proporcional,

constante o no tenga sesgo.

4.3.11. Análisis exploratorio e identificación del sesgo

Un análisis gráfico exploratorio de los valores predichos contra los observados y

de los predichos contra el sesgo, resulta fundamental para visualizar la exactitud,

precisión e identificación del tipo de sesgo.

Similarmente al procedimiento empleado por Barrales et al. (2004) para

identificar la presencia de sesgo, éste puede identificarse por la magnitud de DB =∧

y

por la forma en que se distribuyen los puntos provenientes de graficar en un plano de

coordenadas los puntos (zi, di) i=1,2,…,n. El SC es reconocido por un valor de DB =∧

muy diferente de cero y al graficar los puntos (zi, di) se forme una banda horizontal

centrada alrededor de D , con una distribución sistemática a ser positivos o negativos

(puntos arriba y debajo de la recta dd = ). El SP es reconocido cuando los puntos del

gráfico formen una banda con una tendencia lineal positiva o negativa.

Adicionalmente para verificar que D es “muy diferente de cero”, con D distribuida

aproximadamente normal, puede calcularse un ICB del (1-α)100% para la E(D):

n

StD)D(En

StD D

21,1n

D

21,1n ⎟⎟

⎞⎜⎜⎝

⎛+<<⎟⎟

⎞⎜⎜⎝

⎛− α

−−α

−−

donde n

DD

n

1ii∑

== , ( )

1n

DDS

n

1i

2i

2D −

−=∑= y

21,1n

t α−−

es el cuantil 2

1 α− de la distribución t con n-

1 g.l. ⎥⎥⎦

⎢⎢⎣

⎡ α−=⎟⎟

⎞⎜⎜⎝

⎛≤ α

−−− 2

1ttP2

1,1n1n .

Un análisis de regresión lineal simple del sesgo sobre los simulados

( ), contribuiría a determinar SP de una manera más objetiva en cuanto Rii10i ZD ε+β+β=

68

a la percepción de que los puntos (zi, di) del gráfico de dispersión formen una banda

con una tendencia lineal positiva o negativa.

69

5. RESULTADOS Y DISCUSIÓN

Una vez expuestos y justificados los desarrollos estadísticos para la validación

de modelos en el capítulo anterior, es este capítulo se presenta y discute la

metodología para aplicar el procedimiento de Freese con sus modificaciones y

extensiones, así como un ejemplo de su aplicación a la validación del modelo Wakax

POS en predicción de la ganancia de peso promedio por día. Adicionalmente se

presenta la validación para la predicción de la materia seca, ácidos grasos volátiles,

acetato, propionato y butirato en el Rumen y Ciego. Esta validación se hizo por medio

de métodos gráficos y de medidas basadas en la comparación entre los valores

observados y los predichos.

5.1. Procedimientos estadísticos para la validación de modelos basados en el planteamiento de Freese

La validación de modelos mecanísticos basada en: (i) el procedimiento original

de Freese (1960), (ii) los planteamientos de Rennie y Wiant (1978), Reynolds (1984), y

(iii) las modificaciones y extensiones presentadas en este trabajo, constituyen un

método estadístico formado por pruebas de hipótesis e intervalos de confianza, las

cuales representan una alternativa inferencial para determinar si las salidas del modelo

están suficientemente próximas a los valores observados del sistema real, es decir,

cuán bien el modelo se comporta en predicción del sistema. Coincidiendo con Barrales

et al. (2004), estos procedimientos inferenciales permiten determinar cuán bien un

modelo se comporta en predecir los valores observados del sistema real, así mismo,

permiten estudiar datos provenientes de modelos que presenten o no sesgo en sus

pronósticos, y donde el máximo error admisible es expresado en las mismas unidades

del valor real.

La validación de modelos mediante el planteamiento de Freese (1960) y las

extensiones presentadas en este trabajo no requieren el supuesto de que Y se

relacione linealmente con Z, además de que no es necesario para la comparación entre

Y y Z. Adicionalmente, no se ha reportado con regresión una prueba estadística para la

70

exactitud requerida ( )( α−≥≤ 1eDP ) por el modelador o usuario del modelo en

presencia o no de SC o SP.

5.2. Validación de modelos basada en el valor absoluto del error en ausencia de sesgo

Freese (1960), no indicó explícitamente la traducción de la exactitud requerida

( ) α−≥≤ 1eDP en 21,1

22D

eα−χ

≤σ , aunque asume como señala también Reynolds (1984)

que D~N(0, ). Es decir, el modelo presenta predicción insesgada 2Dσ ( 0D )=µ y la

precisión de los errores de predicción ( )2Dσ debe cumplir 2

1,1

22D

eα−χ

≤σ para que la

exactitud requerida se satisfaga y el modelo sea considerado aceptable o

suficientemente confiable para predicción.

5.2.1. Pruebas estadísticas para la exactitud requerida

El siguiente paso es probar las hipótesis con el planteamiento original 2

1,122

D0 e:H α−χ≤σ (Freese, 1960) o alternativo 21,1

22D

'0 e:H α−χ>σ (Reynolds, 1984). Si

D~N(0, ) la estadística de prueba bajo o verdadera es 2Dσ 0H '

0H ∑χ

==

α− n

1i

2i2

21,1 D

eV ~ . La

o se rechazará con un nivel de significación α’ si

2nχ

0H '0H 2

'1,n

n

1i

2i2

21,1

c de

V α−=

α− χ>∑χ

= o

, la cual corresponde a la prueba uniformemente más potente de tamaño α’.

Por lo tanto, si no se rechaza o se rechaza entonces el modelo es considerado

aceptable para predicción.

2',ncV αχ≤

0H '0H

Como el denominador de la estadística de prueba (V) es e2 y cuando

, se sigue que al incrementar los valores de e la estadística de prueba

disminuye conduciendo al rechazo de , por lo que el planteamiento alternativo es

2',n

2'1,n αα− χ>χ

5.0' <α'0H

71

más conservador en el sentido que permite un valor más grande de e para rechazar .

Reynolds (1984), señala que la prueba estadística de es más conservadora y

probablemente preferible al planteamiento original por más modeladores quienes

necesitan estar razonablemente seguros que el modelo cumplirá con sus

requerimientos de exactitud. El inconveniente de aplicar el planteamiento original es la

ambigüedad que se presenta al no rechazar a H0, ya que lo que se puede inferir es que

los datos no proporcionan suficiente evidencia para rechazarla, que los datos no

apoyan suficientemente a H1 y no que se acepte la declaración establecida en H0. Una

opción es presentar los resultados de la prueba a través del valor P para tener el nivel

de significación alcanzado en la prueba.

'0H

'0H

5.3. Validación de modelos basada en el porcentaje del error en ausencia de sesgo

El porcentaje de error 100YD que señala Reynolds (1984), no es estrictamente

un porcentaje y puede observarse en los valores posibles de i

i

yd . También bajo los

supuestos Y~N(Z, ) entonces D~N(0, ), la distribución de 2Yσ

2D

2Y σ=σ

YD tiene soporte

y no se distribuye normal. Por lo que, el “porcentaje de error” bajo los supuestos

señalados, es un enfoque no apropiado para medir exactitud en comparación con el

error absoluto |D|. En el caso del planteamiento original de Freese, si tiene sentido

hablar del “porcentaje de error”. Freese (1960) señala que si Xi~N(µi,σ2) entonces

1−ℜ

2n

1i

ii2

2ii

n

1i X)X(

∑∑

=

= ⎟⎠⎞

⎜⎝⎛

σµ−

µ−~ , donde Xi es el valor estimado por la nueva técnica para

la i-ésima unidad experimental, µi es el valor “verdadero o correcto” medido con la

técnica estándar para la i-ésima unidad experimental y σ2 es la exactitud requerida, es

decir,

2nχ

21,1

22 e

α−χ≤σ o 2

1,1

22 p

α−χ≤σ para el caso del error absoluto o del “porcentaje del valor

verdadero o correcto” respectivamente. Por lo tanto, la expresión del error como un

72

porcentaje del valor verdadero o correcto i

ii

i

i XDµµ−

~⎟⎟

⎜⎜

⎛⎥⎦

⎤⎢⎣

⎡µσ

2

i

,0N , tiene una

interpretación práctica como la exactitud requerida expresada en términos relativos del

valor real en vez de unidades absolutas del valor real.

De aquí en adelante la discusión de los resultados obtenidos sólo se relaciona a

cuando la exactitud requerida es expresada en unidades absolutas del valor real u

observado (Yi), es decir, con el valor absoluto del error ( )[ ]α−≥≤ 1eDP .

5.4. Validación por intervalo de confianza empleando el error crítico en ausencia de sesgo

En el planteamiento de Freese diferentes usuarios del modelo pueden tener

distintas necesidades de exactitud, la cual conduce a diferentes valores de e. Rennie y

Wiant (1978) y Ek y Monserud (1979), han tratado este problema calculando un error

máximo anticipado o error crítico (e*) el cual es el valor más pequeño de e que

conducirá al no rechazo de H0. Reynolds (1984), planteó un enfoque conservador y

determinó otro error crítico (e**) el cual es el valor más pequeño de e que conducirá al

rechazo de , y dio una interpretación del error crítico en términos de un ICB. '0H

Los errores críticos e* y e** se determinaron de la región de rechazo para H0 y

respectivamente, '0H

212

'1,n

n

1i

2i

21,1 d*ee ⎟⎟

⎞⎜⎜⎝

⎛χχ=< α−

=α− ∑ y

212

',n

n

1i

2i

21,1 d**ee ⎟⎟

⎞⎜⎜⎝

⎛χχ=≥ α

=α− ∑ . Por

lo tanto, si el modelador o usuario del modelo especifica un valor de e tal que e≥e* o

e≥e** entonces el modelo es considerado adecuado.

Rennie y Wiant (1978) y Reynolds (1984), no indicaron cual es la decisión

cuando e=e*, aunque al señalar que H0 se rechaza cuando entonces la

región de no rechazo es por lo que si e=e* la decisión será que el modelo es

adecuado.

2'1,ncV α−χ>

2'1,ncV α−χ≤

73

Análogamente al uso como un índice que le dieron al error crítico (E*) Ek y

Monserud (1979), el error crítico 21

2',n

n

1i

2i

21,1 D**E ⎟⎟

⎞⎜⎜⎝

⎛χχ= α

=α− ∑ también es una estadística

para comparar dos modelos, de tal manera que el modelo con el menor error crítico

(e**) es el mejor modelo.

Cuando los errores críticos e* o e** se utilizan para determinar si un modelo

satisface la exactitud requerida o para comparar dos o más modelos, la validación se

reduce a calcular el error máximo anticipado o error crítico, en donde el modelador

decide si el modelo es aceptable en predicción del sistema o que un modelo es mejor

que otro, al comparar el error crítico con la exactitud requerida (e) bajo los valores α y α’

especificados con anticipación. Lo anterior implica una buena comprensión del sistema

por parte del modelador o usuario del modelo para establecer la exactitud requerida.

Barrales et al. (2004), señalan que conceptualmente el error límite (e) y el error crítico

(e*) representan lo mismo, pero con la diferencia de que e se establece a priori por el

modelador, mientras que e* se calcula a posteriori.

Los errores críticos e* y e** son similares con excepción de sus denominadores

y respectivamente. Si 2'1,n α−χ 2

',n αχ 21' =α entonces y e*=e**. Si 2',n

2'1,n αα− χ=χ 21' <α

entonces e*<e**. Así, para un valor 21' <α y e tal que e*<e<e** se sigue que el modelo

es adecuado empleando la estadística E* y no lo es con la estadística E**. Esto indica

que la prueba estadística para y por consiguiente E** representan un planteamiento

más conservador que el planteamiento original de Freese (1960), en el sentido que

permite un valor más grande de e para inferir que el modelo es aceptable, la cual desde

el punto de vista de los modeladores o usuarios del modelo no es muy práctico, ya que

lo que se quiere es tener un valor de e suficientemente pequeño tal que cumpla

'0H

( ) α−≥≤ 1eDP con una probabilidad alta.

Reynolds (1984) determinó en términos de los errores críticos un ICB (E*, E**)

del (1-2α’)100% para el parámetro ( ) 2121,1

2D α−χσ=ε , el cuantil 1-α de la distribución de |D|

o equivalentemente ε2 corresponde al cuantil 1-α de la distribución de D2. Para ello

combinó dos intervalos de confianza unilaterales para ε. Si se reemplaza α’ por α’/2 en

74

las expresiones para E* y E** se obtiene ( , ) un ICB del (1-α’)100% para ε. El ICB

estimado

∗IE ∗∗

IE

( )**I

*I e,e significa que se tiene confianza en un (1-α’)100% que el punto de la

distribución |D| que tiene debajo el (1-α)100% de los errores absolutos está localizado

en alguna parte de dicho intervalo.

En este trabajo se presentó un procedimiento alternativo al Reynolds (1984) para

obtener el ICB ( ) del (1-α’)100% para ε. Con el supuesto D~N(0, ), ∗IE , ∗∗

IE 2Dσ

⎟⎟⎠

⎞⎜⎜⎝

⎛χχ α

−=∑∑ 2

2',n

n

1i

2i

2

2'1,n

n

1i

2i D,D es un ICB del (1-α’)100% para . Del ICB del (1-α’)100%

para y de que la función

2Dσ

2Dσ ( ) ( ) ε=χσ=στ α−

21

21,1

2D

2D es monótona creciente, se sigue que:

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛χτ<στ<⎟⎟

⎞⎜⎜⎝

⎛χτ α

−=∑∑ 2

2',n

n

1i

2i

2D

2

2'1,n

n

1i

2i DD

212

2',n

21,1

n

1i

2i

212

2'1,n

n

1i

21,1

2i DD ⎟⎟

⎞⎜⎜⎝

⎛χχ<ε<⎟⎟

⎞⎜⎜⎝

⎛χχ αα−

−=α− ∑∑ o ∗∗∗ <ε< II EE

es el ICB del (1-α’)100% para ( ) ε=στ 2D (Mood et al., 1974d). Del análisis efectuado en

la obtención del resultado e*<e**, es necesario especificar un valor . 5.0' <α

Aunque para la mayoría de los usuarios de un modelo sea relativamente más

práctico y sencillo trabajar con un IC de que para un IC del cuantil 1-α de la

distribución de |D|, el ICB del (1-α’)100% de sólo indica la amplitud de los valores de

(un intervalo angosto implicaría que la distribución de D es menos variable), por lo

que para determinar si un modelo satisface la exactitud requerida, no es práctico y no

aporta suficiente información para dicho fin que el que proporciona los errores críticos o

el ICB ( ) del (1-α’)100% para ε, el cuantil 1-α de la distribución de |D|.

2Dσ

2Dσ

2Dσ

∗IE , ∗∗

IE

5.5. Planteamiento para validar un modelo en predicción de varias variables

Para el caso de tres variables de salida del modelo y en consecuencia tres pares

de conjuntos (Yjk, Zjk) j=1,2,3; k=1,2,…,nj, los mismos valores de exactitud (e y α), y la

misma α’ empleada en las inferencias para la determinación de o , un gráfico de *je **

je

75

líneas o barras con los letreros Y1, Y2 y Y3 en el eje de las abscisas y los valores o

en el eje de las ordenadas, permitiría visualizar para cuales variables el modelo es

más adecuado en predicción. Por ejemplo, si entonces el modelo sólo

es adecuado en predicción de la variable Y2. También se tendrá que el modelo es más

adecuado en predicción para Y2, luego para Y1 y finalmente para Y3. Del gráfico de los

ICB

*je

**je

*3

*1

*2 eeee <<≤

( )**Ij

*Ij e,e del (1-α’)100% para εj el cuantil 1-α de la distribución de |Dj|, el intervalo

con el menor valor implicaría que para la variable Yj el modelo es más adecuado ya

que contiene el cuantil 1-α de los valores |djk| antes que las otras variables, además de

que primero se cumpliría que para las restantes variables. En caso de tener

unidades de medida diferentes entre las variables, éstas pueden estandarizarse. El

procedimiento puede emplearse para validar un submodelo en predicción de varias

variables que serán consideradas entradas de otro submodelo.

**Ije

**Ijee ≥

5.6. Planteamiento para la comparación de dos o más modelos en predicción

Un problema frecuentemente dado en la construcción de un nuevo modelo M2,

para un sistema particular cuando ya se tiene un modelo M1, es decidir cuál modelo es

mejor en cuanto a la exactitud en predicción de los valores del sistema real (Y). Usando

los conjuntos (Yi, Zi1) y (Yi, Zi2) i=1,2,…,n y los mismos valores de α y α’, se pueden

obtener y que son respectivamente los errores críticos basados en el

planteamiento alternativo para los modelos M1 y M2. Análogamente al uso como un

índice para comparar dos modelos que le dieron al error crítico (E*) Ek y Monserud

(1979), el error crítico E** también puede emplearse para el mismo fin, de tal manera

que el modelo con el menor error crítico ( ) será considerado el mejor modelo. Si el

usuario del modelo especifica un valor de e tal que para alguna j (j=1,2)

entonces el modelo j es adecuado. Un gráfico de barras con los letreros M1 y M2 en el

eje de las abscisas y los valores en el eje de las ordenadas, visualizaría cual es el

mejor modelo en predicción del sistema real (Y). Este procedimiento permite comparar

**1e **

2e

**je

**jee ≥

**je

76

dos o más modelos bajo las mismas consideraciones planteadas para el caso de dos

modelos.

De la sección 5.4 se tiene que la comparación por medio del error crítico basado

en el planteamiento original (e*), exige menor error máximo admisible (e) de las

desviaciones |yi–zi|=|di|.

Mayer y Butler (1993) señalan que medidas de desviación como la media de los

errores absolutos (MAE), la media porcentual de los errores (MA%E) y la raíz cuadrada

de la media del cuadrado de los errores (RMSE), han sido utilizadas para comparar

diferentes modelos o técnicas. Analla (1998), propone el cuadrado medio del error

(CME) de la regresión de Y sobre Z para efectuar una validación y para la comparación

de dos o más modelos en predicción del sistema. Por su parte Kobayashi y Salam

(2000), proponen la media de las desviaciones al cuadrado (MSD) y sus componentes

para validar modelos y para comparar dos o más modelos. Para Tedeschi (2006), el uso

de solamente algunas técnicas puede ser engañoso en la elección de un modelo

apropiado para un escenario determinado. Por su parte Chilibroste (2002), indica que

es importante que al evaluar o comparar modelos, la consideración de los objetivos con

que han sido construidos sea especialmente considerada, a los efectos de poder

extraer conclusiones valederas.

5.7. Validación de modelos basada en el valor absoluto del error en presencia de sesgo constante

Reynolds (1984) no presentó un planteamiento basado en el procedimiento de

Freese cuando hay sesgo en el modelo, sino que propuso utilizar un ICB del (1-α’)100%

para la E(D) la cual sólo da una idea de la discrepancia entre el parámetro µD=E(D) y su

estimador D . También, propuso utilizar un intervalo de predicción cuando el usuario

está interesado en una predicción futura y un intervalo de tolerancia cuando el usuario

está interesado con la población de errores de un número grande de predicciones.

Menciona que estos dos intervalos no son muy robustos al supuesto de normalidad y

que pueden usarse en presencia o no de sesgo en el modelo.

77

Freese (1960) aunque señala que si el sesgo B es el mismo para todos los

valores Yi (µi en su notación), y que su magnitud puede estimarse por la media de las

diferencias entre los valores observados y los predichos ⎟⎠⎞

⎜⎝⎛ −==∧

ZYDB , no indicó

explícitamente las razones. Si Di~ ) entonces ,(NI 2DD σµ

B)Y(SZ)Y(SZZ)Y(E)D(E iiiiiii ==−+=−= , donde denota el sesgo de Yi. Como )Y(S i

DBD ==µ∧∧

y se sigue que 0)BD(E i =−∧

iii WDDBD =−=−∧

es la corrección por SC B.

Cuando D~ y el modelo presenta SC, coincidiendo con Freese (1960),

los valores e y α especificados por el usuario del modelo son tales que satisfacen la

exactitud requerida

),(N 2DD σµ

( ) α−≥≤ 1eDP que se traduce en 21,1

22D e α−χ≤σ , una vez que es

removido el SC mediante la corrección DDi − .

5.7.1. Pruebas estadísticas para la exactitud requerida

El siguiente paso es probar las hipótesis con el planteamiento original 2

1,122

WSCW0 e:H α−χ≤σ (Freese, 1960) o alternativo 2

1,122

W'SCW

0 e:H α−χ>σ . Si D~

entonces

),(N 2DD σµ

)DD(W −= ~ ( )( )2Dn]1n[,0N σ− , y la estadística de prueba bajo

verdadera es

SCW0H o 'SCW

0H

( ) ⎥⎦

⎤⎢⎣

⎡∑ −

χ=

=

α−2n

1i

2i2

21,1SCW DnD

eV ~ . La se rechazará con un

nivel de significación α’ si

21n−χ SCW

0H o 'SCW0H

( ) 2'1,1n

2n

1i

2i2

21,1SCW

c dnde

V α−−=

α− χ>⎥⎦

⎤⎢⎣

⎡∑ −

χ= o , las cuales

corresponden a pruebas de razón de verosimilitudes generalizada de tamaño α’ (Mood

et al., 1974c). Por lo tanto, si no se rechaza o se rechaza entonces el

modelo es considerado aceptable para predicción.

2',1n

SCWcV α−χ≤

SCW0H 'SCW

0H

Si el modelo presenta SC, D~ , e y α son tales que satisfacen la

exactitud requerida

),(N 2DD σµ

( ) ( ) α−≥≤−=≤ 1eDDPeWP que se traduce en 21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ ,

entonces: (i) las hipótesis con el planteamiento original y alternativo son

78

21,1

22D

SCD0

e1n

n:Hα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ y 2

1,1

22D

'SCD0

e1n

n:Hα−χ

⎟⎠⎞

⎜⎝⎛

−>σ , y (ii) la estadística de prueba bajo

) verdadera es SCD0H ( 'SCD

0H ( ) ⎥⎦

⎤⎢⎣

⎡∑ −

χ⎟⎠⎞

⎜⎝⎛ −

==

α−2n

1i

2i2

21,1SCD DnD

en1nV ~ . La e

rechazará con un nivel de significación α’ si

21n−χ SCD

0H o 'SCD0H s

( ) 2'1,1n

2n

1i

2i2

21,1SCD

c dnden

1nV α−−=

α− χ>⎥⎦

⎤⎢⎣

⎡∑ −

χ⎟⎠⎞

⎜⎝⎛ −

= o

[pruebas de razón de verosimilitudes generalizada de tamaño α’, Mood et

al. (1974c)]. Por lo tanto, si no se rechaza o se rechaza entonces el modelo

es considerado aceptable para predicción.

2',1n

SCDcV α−χ≤

SCD0H 'SCD

0H

Establecer e como el valor máximo admisible de las desviaciones |yi–zi|=|di|, es

quizás más práctico que como el valor máximo admisible de las desviaciones ddi − .

5.8. Validación por intervalo de confianza empleando el error crítico en presencia de sesgo constante

Freese (1960), Rennie y Wiant (1978), Reynolds (1984) y Barrales et al. (2004)

no presentaron el error crítico cuando el modelo tiene SC o SP en sus predicciones.

Cuando el modelo presenta SC y D~ , los errores críticos

correspondientes al planteamiento original y alternativo son:

),(N 2DD σµ

( )21

2'1,1n

2n

1i

2i

21,1

SCW

DnDE

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ

⎥⎦

⎤⎢⎣

⎡∑ −χ

=α−−

=α−

∗ y ( )

21

2',1n

2n

1i

2i

21,1

SCW

DnDE

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

χ

⎥⎦

⎤⎢⎣

⎡∑ −χ

=α−

=α−

∗∗

Si el modelador o usuario del modelo especifica un valor de e tal que o

entonces el modelo es considerado aceptable. Los valores e y α son tales que

satisfacen la exactitud requerida

∗≥ SCWee

∗∗≥ SCWee

( ) α−≥≤ 1eDP que se traduce en 21,1

22D

eα−χ

≤σ una vez

que es removido el SC mediante la corrección DDi − .

79

Si el modelo presenta SC, D~ , e y α son tales que satisfacen la

exactitud requerida

),(N 2DD σµ

( ) ( ) α−≥≤−=≤ 1eDDPeWP que se traduce en 21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ ,

entonces los errores críticos con base al planteamiento original y alternativo son

( ) 21

2'1,1n

n

1i

2i

21,1

SCD

DD

n1nE

⎥⎥⎥

⎢⎢⎢

χ

∑ −χ⎟⎠⎞

⎜⎝⎛ −

=α−−

=α−

∗ y ( ) 2

1

2',1n

n

1i

2i

21,1

SCD

DD

n1nE

⎥⎥⎥

⎢⎢⎢

χ

∑ −χ⎟⎠⎞

⎜⎝⎛ −

=α−

=α−

∗∗ . Si el modelador o

usuario del modelo especifica un valor de e tal que o entonces el

modelo es considerado aceptable.

∗≥ SCDee ∗∗≥ SCDee

Reynolds (1984) y Barrales et al. (2004) no presentaron un ICB para

( ) ε⎟⎠⎞

⎜⎝⎛ −

=⎟⎟⎠

⎞⎜⎜⎝

⎛χσ⎟

⎠⎞

⎜⎝⎛ −

=χσ=ε α−α−

21

21

21,1

2D

21

21,1

2WSC n

1nn

1n , el cuantil 1-α de la distribución de

DDW −= o equivalentemente el cuantil 1-α de la distribución de D corregido por el

factor 21

n1n⎟⎠⎞

⎜⎝⎛ − . Un ICB del (1-α’)100% para SCε a partir del ICB del (1-α’)100% para

y con

2Dσ

( )2DSC στ=ε función monótona creciente es:

( ) ( ) 21

2

2',1n

21,1

n

1i

2i

SC

21

2

2'1,1n

21,1

n

1i

2i DD

n1n

DD

n1n

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ−⎟⎠⎞

⎜⎝⎛ −

<ε<

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ−⎟⎠⎞

⎜⎝⎛ −

α−

α−=

α−−

α−=

∑∑ o ∗∗∗ <ε< ISCSCISC EE

∗ISCE y corresponden a los errores críticos que se obtienen de las regiones de

rechazo para , con la diferencia de que α’ corresponde a

∗∗ISCE

SCD0H y 'SCD

0H 2'α en sus

expresiones. El intervalo de confianza estimado significa que se tiene confianza en un

(1-α’)100% que el punto de la distribución DDW −= que tiene debajo el (1-α)100% de

los errores absolutos está localizado en alguna parte en el intervalo ( )**ISC

*ISC e,e .

80

5.9. Validación de modelos basada en el valor absoluto del error en presencia de sesgo proporcional

También para este caso Reynolds (1984), no presentó un planteamiento basado

en el procedimiento de Freese cuando el modelo presenta SP en sus predicciones.

Freese (1960) no indicó explícitamente la traducción de la exactitud requerida

( ) α−≥≤ 1eDP en 21,1

22D e α−χ≤σ , así como las razones de emplear los residuos de una

regresión lineal de los valores yi sobre los valores zi (en su notación xi sobre µi) para la

corrección por SP. Con Yi~ ) i=1,2,…n se tiene que ),Y(SZ(NI 2ii σ+ R)Y(S)D(E ii == y si

el sesgo (di=yi-zi) crece o decrece directamente con los valores predichos (zi), un

estimador de R es . Esto se debe a que para el conjunto (Di, Zi)

i=1,2,…,n relacionados por

i10D ZRi

∧∧∧∧

β+β==µ

Rii10i ZD ε+β+β= donde Riε ~ ) , y los

estimadores por mínimos cuadrados de los parámetros β0 y β1 se sigue que

y . Por lo tanto, es la

corrección por SP.

,0(NI 2R

2 σ=σ∧

β0

β1

i10iD ZDRi

∧∧∧∧∧

β+β===µ 0DDE ii =⎟⎠⎞

⎜⎝⎛ −

)Z(DDD i10iiiRi

∧∧∧∧

β+β−=−=ε

Si el modelo presenta SP, Freese (1960) en la determinación de la estadística de

prueba utilizó, sin indicarlo explícitamente, 21,1

22 e α−χ≤σ para la exactitud requerida

( ) α−≥≤ 1eDP que se traduce precisamente en 21,1

22R e α−χ≤σ una vez que es

removido el SP mediante la corrección indicada antes, la cual coincide con los

supuestos ~ ) , e y α tales que satisfacen Riε ,0(NI 2Rσ ( ) α−≥≤ε 1eP R .

5.9.1. Pruebas estadísticas para la exactitud requerida

El siguiente paso es probar las hipótesis con el planteamiento original 2

1,122

RSP0 e:H α−χ≤σ (Freese, 1960) o alternativo 2

1,122

R'SP

0 e:H α−χ>σ . La estadística de

prueba con ~ ) y bajo o verdadera es Riε ,0(NI 2R

2 σ=σ SP0H 'SP

0H

( ) ( )D221,1

SP CME)2n(eV −χ= α− ~ . La se rechazará con un nivel de 22n−χ SP

0H o 'SP0H

81

significación α’ si ( ) ( ) 2'1,2nD

221,1

SPc CME)2n(eV α−−α− χ>−χ= o donde (CME)D

corresponde al cuadrado medio del error del modelo estimado . Por lo

tanto, si no se rechaza o se rechaza entonces el modelo es considerado

aceptable.

2',2n

SPcV α−χ≤

i10i ZD∧∧∧

β+β=

SP0H 'SP

0H

Freese (1960) señala que si el modelo presenta SP, es decir, la magnitud del

sesgo (en su notación di=xi-µi) crece o decrece directamente con los valores reales (en

su notación µi), la estadística de prueba con Xi~ es ),(N 2i σµ 2

SCEσ

~ donde la SCE

se obtiene del modelo estimado . Sin embargo, por los resultados

obtenidos la SCE corresponde al modelo estimado (en su notación),

donde el supuesto a verificar es que los residuales estimados on

independientes y provienen de una distribución normal con media cero y varianza

constante. Si se utiliza como variable dependiente Xi con variable regresora µi, la SCE

corresponde al modelo estimado .

22n−χ

i10iX µβ+β=∧∧∧

i1101iD µβ+β=∧∧∧

−= iiRi dde s

i110i 1X µ⎟⎠⎞

⎜⎝⎛ +β+β=

∧∧∧

5.10. Validación por intervalo de confianza empleando el error crítico en presencia de sesgo proporcional

También para este caso Freese (1960), Rennie y Wiant (1978), Reynolds (1984)

y Barrales et al. (2004) no presentaron el error crítico cuando el modelo tiene SP en sus

pronósticos.

Si la magnitud del sesgo (di=yi-zi) crece o decrece directamente con los valores

predichos (zi) y se cumple el supuesto Riε ~ ) para el modelo estimado

, los errores críticos correspondientes al planteamiento original y

alternativo son

,0(NI 2R

2 σ=σ

i10i ZD∧∧∧

β+β=

( ) 21

2'1,2n

D2

1,1SP

CME)2n(E ⎟

⎟⎠

⎞⎜⎜⎝

χ−χ

=α−−

α−∗ y ( ) 2

1

2',2n

D2

1,1SP

CME)2n(E ⎟

⎟⎠

⎞⎜⎜⎝

χ−χ

=α−

α−∗∗ . Si el usuario

82

del modelo especifica un valor de e tal que o entonces el modelo es

considerado aceptable. Los valores e y α son tales que satisfacen la exactitud requerida

∗≥ SPee ∗∗≥ SPee

( ) α−≥≤ 1eDP que se traduce en 21,1

22D

eα−χ

≤σ una vez que es removido el SP mediante

la corrección . )Z(DDD i10iiiRi

∧∧∧∧

β+β−=−=ε

Reynolds (1984) y Barrales et al. (2004), no presentaron un ICB para

( )21

21,1

2RSP α−χσ=ε , el cuantil 1-α de la distribución de Rε . Un ICB del (1-α’)100% para SPε

a partir del ICB del (1-α’)100% para con 2Rσ ( ) ( ) SP

21

21,1

2R

2R ε=χσ=στ α− función monótona

creciente, está dado por 2

2',2n

D2

1,1SP2

2'1,2n

D2

1,1 )SCE()SCE(

α−

α−

α−−

α−

χχ

<ε<χ

χ, es decir, .

corresponden a los errores críticos con la diferencia de que α’ se

sustituye por α’/2. El intervalo de confianza estimado significa que se tiene confianza en

un (1-α’)100% que el punto de la distribución

∗∗∗ <ε< ISPSPISP EE

∗ISPE y ∗∗

ISPE ∗SPE y ∗∗

SPE

Rε que tiene debajo el (1-α)100% de los

errores absolutos está localizado en alguna parte en el intervalo ( )**ISP

*ISP e,e .

5.11. Planteamiento para validar un modelo en predicción de varias variables y para la comparación de dos o más modelos en predicción cuando el modelo presenta sesgo

Con los errores críticos para SC o SP, pueden emplearse el mismo tipo de

gráficas propuestas para visualizar la validación de un modelo en predicción de varias

variables cuando el modelo no presenta sesgo. En la comparación de dos o más

modelos en predicción del mismo sistema, se emplearía el error crítico correspondiente

según el modelo no presente sesgo, tenga sesgo constante o proporcional. El modelo

con el menor error crítico es el mejor modelo.

83

5.12. Sesgo y supuestos

En los procedimientos tratados se supone básicamente que D~ para el

caso en el que el modelo no presenta sesgo, y D~ cuando el modelo presenta

SC o SP, aunque para este último, el supuesto se traduce en ~ ) para el

modelo . En el procedimiento de validación cuando el modelo no

presenta sesgo, la suposición D~N(0, ) significa que el modelo presenta predicción

insesgada

),0(N 2Dσ

),(N 2DD σµ

Riε ,0(NI 2Rσ

Rii10i ZD ε+β+β=

2Dσ

( 0D = )µ y la precisión de los errores de predicción ( )2Dσ debe cumplir

21,1

22D

eα−χ

≤σ para que la exactitud requerida se satisfaga y modelo sea considerado

aceptable o suficientemente confiable para predicción.

Un análisis gráfico exploratorio de los valores predichos contra los observados y

de los predichos contra el sesgo, es básico para visualizar la exactitud, precisión e

identificación del tipo de sesgo y así, utilizar el procedimiento apropiado para determinar

si el modelo cumple con la exactitud requerida; por lo que en la aplicación de los

procedimientos, ya sea una prueba de hipótesis, un intervalo de confianza o el error

crítico, es necesario y fundamental establecer la exactitud requerida la cual implica una

comprensión del sistema por parte del modelador o usuario del modelo. Por su parte

Barrales et al. (2004), señalan que se requiere de un compromiso por parte del usuario,

que es decidir el nivel de exactitud asignado al modelo para su aceptación y

adicionalmente, un estudio de la información generada por el modelo, que le permita

seleccionar de las metodologías propuestas, aquella más adecuada a las

características de los datos.

Los procedimientos para validar modelos en presencia de SC o SP se aplican sin

que el modelo sea modificado en su estructura, sino que se remueve el tipo de sesgo a

los datos disponibles (zi, yi) a través de los valores del sesgo (di), es decir, DDi − es la

corrección por SC y es la corrección por SP. )Z(D i10i

∧∧

β+β−

Identificar el tipo de sesgo permitiría corregir al modelo en su estructura y

evaluación a través de cuestionar: (a) las hipótesis que se emplearon en la construcción

84

del modelo, (b) los datos experimentales utilizados en el ajuste de los parámetros, (c)

los métodos para el ajuste de los parámetros, (d) los parámetros tomados de la

literatura, (e) los datos experimentales empleados en la validación del modelo, (f) el

comportamiento en predicción del modelo para diferentes escenarios, y (g) el tipo de

corrección a utilizar en el modelo y en que etapa del diseño del modelo debe realizarse.

Bendell (1986), indica que sólo la validación no es suficiente y que hay que insistir para

un cambio de énfasis en la práctica de la modelación hacia el conocimiento de los datos

y al análisis exploratorio en la etapa de formulación del modelo. Para Barrales et al.

(2004), detectar en el modelo la presencia de un sesgo, ya sea constante o

proporcional, en función de los valores del sistema real, le permitiría al usuario

identificar en su modelo, la o las causas que lo producen, corregir deficiencias en el

comportamiento predictivo, que llevaría a disminuir las discrepancias entre lo estimado

por el modelo y los valores proporcionados por el escenario real, permitiendo que las

conclusiones que se obtengan acerca de la confiabilidad del modelo cumplan con los

objetivos establecidos.

La validación de modelos mediante el planteamiento de Freese (1960) y las

extensiones presentadas en este trabajo no requieren el supuesto de que Y se

relacione linealmente con Z, además de que no es necesario para la comparación entre

Y y Z. Por su parte Kobayashi y Salam (2000) indican que no es garantía el supuesto

de que Y se relacione linealmente con Z y que es innecesario para compararlos.

Reynolds (1984), señala que las predicciones de un simulador estocástico son

por lo general basadas sobre el promedio de varias corridas de simulación, y aplica el

procedimiento de validación para un ejemplo en donde el modelo no presenta sesgo en

sus pronósticos y es un simulador estocástico. Por lo que los procedimientos tratados

en este trabajo pueden utilizarse para modelos o simuladores estocásticos, de modo

que cada predicción sea generada como la media aritmética de varias corridas de

simulación. Así, la varianza de las predicciones promedio es menor que la varianza de

las observaciones usadas para generarlas, ya que si X1,X2,…,Xn es una muestra

aleatoria de una función de densidad de probabilidad f(.) la cual tiene media µ y

varianza finita σ2 entonces µ=)X(E y n)X(V 2σ= .

85

La aplicación de cualquier método inferencial para validar modelos se encuentra

principalmente sujeto a las dificultades para satisfacer sus supuestos. Una gran

variedad de métodos estadísticos suponen normalidad para poder utilizarlos, por lo que

existen variados métodos gráficos e inferenciales para verificarlo. Si la variable de

estudio no se distribuye normal, generalmente se emplea algún tipo de transformación

para aproximar los datos a la distribución normal y el método estadístico se aplica a la

variable transformada. Una transformación es simplemente una reexpresión de los

datos en diferente unidad de medida. Harrison (1990) señala que cuando no se

satisfacen los supuestos del método inferencial, se debe recurrir a métodos descriptivos

y a expertos en el área de estudio para que proporcionen una opinión acerca de la

validación del modelo, o lo adecuado del modelo sea calificado por el modelador de

acuerdo a su criterio y propósitos (Mitchell, 1997). Adicionalmente se pueden utilizar

medidas estadísticas descriptivas basadas en las diferencias entre los valores

observados y simulados.

5.13. Validación del modelo dinámico mecanístico Wakax POS en predicción de la ganancia de peso

La metodología de validación desarrollada se aplicó a la diferencia entre los

datos experimentales de ganancia de peso promedio (GPP) por día y los simulados con

el modelo Wakax POS. Los valores de la GPP corresponden a las medias de los

experimentos obtenidos de la literatura (Anexo II, Cuadros: II.1 y II.2) con bovinos en

pastoreo suplementado con caña de azúcar, maíz quebrado y/o melaza en una zona

tropical de México. En el Cuadro 1 se muestran las GPP observadas (yi), simuladas o

predichas (zi) y sus diferencias (di=yi-zi).

Cuadro 1. Promedios observados de ganancia de peso (kg) de 34 experimentos y sus

correspondientes simulados con el modelo Wakax POS.

Indentificador Observado (yi)

Modelado (zi)

Diferencia (di=yi-zi)

V09 0.366 0 0.366 V10 0.398 0 0.398 V11 0.493 0.39 0.103 V12 0.63 0.43 0.2

86

V16 0.43 0.13 0.3 V17 0.4 0.28 0.12 V18 0.49 0.23 0.26 V19 0.6 0.29 0.31 V20 0 0.28 -0.28 V21 0.43 0.09 0.34 V22 0.7 0.32 0.38 V23 0.69 0.33 0.36 V24 0.5 0.02 0.48 V25 0.68 0 0.68 V26 0.62 0 0.62 V27 0.52 0.26 0.26 V28 0.64 0 0.64 V29 0.45 0 0.45 V30 0.43 0.33 0.1 V31 0.76 0.39 0.37 V32 0.036 0 0.036 V33 0.019 0 0.019 V35 0.412 0 0.412 V36 0.052 0 0.052 V37 0.414 0 0.414 V38 0.05 0 0.05 V39 0.292 0.35 -0.058 V40 0.054 0 0.054 V41 0.308 0.39 -0.082 V42 0.054 0 0.054 V48 0.037 0 0.037 V49 0.051 0 0.051 V50 0.062 0 0.062 V51 0.364 0 0.364

La media y desviación estándar de las n=34 diferencias del Cuadro 1 son

kg233.0d = y . De observar las diferencias y el valor de la media se

espera que estadísticamente, es decir, el modelo presente algún tipo de

sesgo.

kg223.0SD =

0)D(E D ≠µ=

Para probar el supuesto D~ con varianza no especificada, se utilizaron

las pruebas de bondad de ajuste de Cramér-von Mises (W2=2.172, P<0.003) y

Anderson-Darling (A2=10.733, P<0.003). Ambas pruebas con nivel de significación del

5% (α=0.05) rechazan la hipótesis D~ . El siguiente paso es probar si

),0(N 2Dσ

),0(N 2Dσ

87

D~ con media y varianza no especificadas e identificar el tipo de sesgo

presente en el modelo. Los valores de las estadísticas de prueba de Cramér-von Mises,

Anderson-Darling, Shapiro-Wilks, Kolmogorov-Smirnov y sus correspondientes P-

valores son: W2=0.118, P=0.065; A2=0.655, P=0.084; W=0.961, P=0.254; KS=0.135,

P=0.115. Con éstas cuatro pruebas la hipótesis D~ no puede ser rechazada

con α=0.05 (P>0.05). La distribución normal ajustada tiene media y desviación estándar

estimadas

),(N 2DD σµ

),(N 2DD σµ

kg233.0d = y [D~kg223.0SD = [ ]( )2kg223.0,kg233.0N ].

La prueba t para la hipótesis 0)D(E D =µ= determinó que 0D ≠µ (P<0.05)

[t=6.092, g.l.=33, P=7.361 x 10-7], la cual sugiere que el modelo presenta algún tipo de

sesgo. Para determinar la presencia de SC o SP se obtuvo un gráfico de dispersión de

los valores pronosticados (zi) vs. el sesgo correspondiente (di), con la media de las

diferencias indicada (Figura 6). El gráfico de dispersión de los valores predichos (zi) vs.

los observados (yi) (Figura 7), permite visualizar que tan alejados están los puntos de la

recta y=z, y de posibles tendencias de los puntos respecto a dicha recta.

-0.46

-0.23

0

0.23

0.46

0.69

0.92

0 0.1 0.2 0.3 0.4 0.5

Zi

di

d

Figura 6. Relación entre el sesgo (di) y los valores simulados (zi) para la GPP.

233.0d = kg es la media de las diferencias (di).

88

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

Zi

Yi

y=z

Figura 7. Dispersión de los puntos (zi, yi) para la GPP. y=z es la recta que representa la

exactitud ideal.

La distribución de los puntos en la Figura 6 muestra un SC, ya que: (i) la

estimación de DB =∧

es muy diferente de cero, la cual fue verificado con la prueba t

( ), y (ii) los puntos (zi, di) forman prácticamente una banda horizontal centrada

alrededor de

0D ≠µ

d , con una distribución sistemática a ser positivos o negativos, es decir,

los puntos se localizan arriba y debajo de la recta dd = .

La distribución de los puntos en la Figura 7 muestra que éstos se encuentran

“alejados” de la exactitud ideal (y=z), aunque si se trasladan una cierta cantidad

perpendicularmente al eje de las abscisas, la exactitud mejorará. Lo anterior refuerza la

percepción de que el modelo presenta SC en sus pronósticos.

Debido a que el modelo presenta SC se procedió a aplicar los procedimientos de

validación correspondientes a este tipo de sesgo. En el Cuadro 2 se presentan los

valores de la corrección por SC ( )233.0dddw iii −=−= .

89

Cuadro 2. Diferencia entre los valores observados y predichos, y la corrección por

sesgo constante.

Indentificador Diferencia (di=yi-zi)

Corrección por SC ( )233.0dddw iii −=−=

V09 0.366 0.133 V10 0.398 0.165 V11 0.103 -0.13 V12 0.2 -0.033 V16 0.3 0.067 V17 0.12 -0.113 V18 0.26 0.027 V19 0.31 0.077 V20 -0.28 -0.513 V21 0.34 0.107 V22 0.38 0.147 V23 0.36 0.127 V24 0.48 0.247 V25 0.68 0.447 V26 0.62 0.387 V27 0.26 0.027 V28 0.64 0.407 V29 0.45 0.217 V30 0.1 -0.133 V31 0.37 0.137 V32 0.036 -0.197 V33 0.019 -0.214 V35 0.412 0.179 V36 0.052 -0.181 V37 0.414 0.181 V38 0.05 -0.183 V39 -0.058 -0.291 V40 0.054 -0.179 V41 -0.082 -0.315 V42 0.054 -0.179 V48 0.037 -0.196 V49 0.051 -0.182 V50 0.062 -0.171 V51 0.364 0.131

La media y desviación estándar de las n=34 correcciones por SC (wi) del Cuadro

2 son kg0w = y e indican que en promedio las desviaciones (di=yi-

zi) de cero son 0.223 (0 ± 0.223).

kg223.0SS WD ==

90

Para probar el supuesto ( )DDW −= ~ ) con varianza no especificada, se

utilizaron las pruebas de bondad de ajuste de Cramér-von Mises (W2=0.122, P>0.25) y

Anderson-Darling (A2=0.675, P>0.25). Ambas pruebas con α=0.05 no rechazan la

hipótesis W~ .

,0(N 2Wσ

),0(N 2Wσ

En este ejemplo se aplicó el método de calcular los errores máximos anticipados

o errores críticos del planteamiento original ( ) y alternativo ( ) del

procedimiento de Freese. Con este enfoque el modelador o usuario del modelo, decide

si el modelo es aceptable en predicción del sistema al comparar el error crítico con la

exactitud requerida (e) bajo los valores α y α’ especificados con anticipación.

Adicionalmente se calculó el ICB del (1-α’)100% para

∗SCWe ∗∗

SCWe

( ) 21

21,1

2D

21

21,1

2WSC n

1n⎟⎟⎠

⎞⎜⎜⎝

⎛χσ⎟

⎠⎞

⎜⎝⎛ −

=χσ=ε α−α− , el cuantil 1-α de la distribución de DDW −= .

Con α=α’=0.05 los errores críticos son:

( ) ( )kg365.0

)kg(641274.1dde

21

295.0,33

2295.0,1

21

2'1,1n

n

1i

2i

21,1

SCW =⎟⎟⎠

⎞⎜⎜⎝

χχ

=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−χ=

α−−

=α−

∗∑

( ) ( )kg550.0

)kg(641274.1dde

21

205.0,33

2295.0,1

21

2',1n

n

1i

2i

21,1

SCW =⎟⎟⎠

⎞⎜⎜⎝

χχ

=

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

−χ=

α−

=α−

∗∗∑

Por lo tanto, si el modelador o usuario del modelo especifica una exactitud e

( )( )95.0eDP ≥≤ tal que o entonces el modelo

será considerado suficientemente confiable en predicción del sistema con base en el

planteamiento original y alternativo respectivamente. Lo anterior implica una buena

comprensión del sistema por parte del modelador o usuario del modelo para establecer

la exactitud requerida (e).

kg365.0ee SCW =≥ ∗ kg550.0ee SCW =≥ ∗∗

El ICB del 1-α’=95% para SCε esta dado por:

91

( ) ( ) 21

2

2',1n

21,1

n

1i

2i

SC

21

2

2'1,1n

21,1

n

1i

2i DD

n1n

DD

n1n

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ−⎟⎠⎞

⎜⎝⎛ −

<ε<

⎟⎟⎟⎟

⎜⎜⎜⎜

χ

χ−⎟⎠⎞

⎜⎝⎛ −

α−

α−=

α−−

α−=

∑∑

( ) ( ) 21

2025.0,33

295.0,1

2

SC

21

2975.0,33

295.0,1

2 )kg(641274.13433)kg(641274.1

3433

⎟⎟⎠

⎞⎜⎜⎝

χχ

⎟⎠⎞

⎜⎝⎛<ε<⎟

⎟⎠

⎞⎜⎜⎝

χχ

⎟⎠⎞

⎜⎝⎛

kg567.0kg347.0 SC <ε<

Por lo tanto, se tiene confianza en un 1-α’=95% de que el punto de la distribución

DDW −= que tiene debajo el 1-α=95% de los errores absolutos ( )dd − está

localizado en alguna parte en el intervalo (0.347 kg, 0.567 kg), es decir, con

probabilidad del 95% la magnitud del error ( )dd− no es más de 0.567 kg.

A pesar de las objeciones señaladas a la regresión para validar modelos (sección

3.4.2.), se procedió a efectuar esta metodología entre la variable dependiente Y y la

variable independiente Z, con la finalidad de establecer alguna similitud con los

resultados previamente obtenidos de la metodología de validación de modelos

mecanísticos basada en el procedimiento de Freese (1960).

El gráfico de dispersión de los valores predichos (zi) vs. observados (yi), junto

con la recta de regresión estimada y la recta y=z (Figura 8), permite visualizar que tan

alejados están los puntos de la recta y=z, de posibles tendencias de los puntos respecto

a dicha recta y de una percepción acerca de la precisión y exactitud basadas según

Tedeschi (2006) en el coeficiente de determinación (r2) como buen indicador de

precisión (un valor alto de r2 precisión alta), y en que los parámetros estimados del

intercepto y la pendiente son buenos indicadores de exactitud; simultáneamente

cercanos a cero y a uno respectivamente, la exactitud es más alta.

Del ajuste por mínimos cuadrados al modelo lineal Rii10i ZY ε+β+β= i=1,2,…,34

para describir la relación entre Y y Z, se obtuvo la ecuación del modelo ajustado o

estimado y=0.280+0.648z. Antes de dar una interpretación a dicho modelo se procedió

a verificar los supuestos básicos del método. Las pruebas de bondad de ajuste de

Cramér-von Mises (W2=0.190, P>0.25) y de Anderson-Darling (A2=1.109, P=0.24),

92

indican con α=0.05 que los errores estimados provienen de una distribución normal con

media cero y varianza constante. De los resultados del ANOVA (F1,32=7.64, P=0.009)

existe relación estadísticamente significativa (P<0.05) entre Y y Z. En la Figura 8 se

muestra la recta de regresión ajustada, el coeficiente de determinación y la recta de

exactitud ideal y=z.

y=0.2798+0.6475z R2=0.1927

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

Zi

Yi

y=z

Figura 8. Relación entre los valores predichos (zi) y los observados (yi) para la GPP.

y=0.2798+0.6475z es la recta de regresión ajustada. y=z es la recta de exactitud ideal.

La distribución de los puntos en la Figura 7 y 8 muestran que éstos se

encuentran “alejados” de la exactitud ideal (y=z), aunque si se trasladan una cierta

cantidad perpendicularmente al eje de las abscisas, la exactitud mejorará. En la Figura

8 se observa que la recta de regresión estimada y=0.280+0.648z es “casi paralela” a la

recta y=z que representa la exactitud ideal. Las dos observaciones anteriores refuerzan

la percepción de que el modelo presenta SC en sus pronósticos. Esto concuerda con el

análisis exploratorio realizado en la Figura 6 la cual corresponde al gráfico

recomendado para identificar SC o SP.

Los IC estimados del 95% para los parámetros 0β (ordenada en el origen o

intercepto) y 1β (pendiente) son 379.0180.0 0 <β< y 125.1170.0 1 <β< . Estos indican

que con una probabilidad del 95% el intercepto es estadísticamente diferente de cero y

la pendiente es estadísticamente uno. El enfoque de intervalos de confianza para

93

determinar si el intercepto es cero y la pendiente uno es más informativo que las

pruebas t para el mismo propósito, ya que proporcionan la amplitud de los posibles

valores de dichos parámetros y no son tan categóricos como las pruebas de hipótesis.

De nuevo, con base en los IC estimados para los parámetros del modelo

, se refuerza la percepción de que el modelo presenta SC ya que el

intercepto es estadísticamente diferente de cero y la pendiente es estadísticamente

uno, es decir, la recta de regresión ajustada es “casi paralela” a la recta determinística

y=z que representa la exactitud ideal. Por su parte Gauch et al. (2003), señalan que

cuando estadísticamente la pendiente es igual a uno y el intercepto es diferente de

cero, se dice que la falta de exactitud es conocida como discrepancia por traslación; en

cambio Tedeschi (2006) le llama un caso inexacto y preciso. Para Flavelle (1992), si se

rechaza la hipótesis de pendiente igual a uno entonces hay algún sesgo en el modelo, y

si no se rechazan las hipótesis de pendiente uno e intercepto cero no significa que el

modelo esta libre de sesgo, únicamente que el análisis de regresión fracasa en

identificarlo. Mayer y Butler (1993), presentaron un ejemplo en donde no resultaron

significativas las pruebas t para las hipótesis de pendiente uno e intercepto cero y sin

embargo, la prueba F simultánea de pendiente uno e intercepto cero sí resultó

significativa. Por su parte Tedeschi (2006), presentó un ejemplo en donde las pruebas t

para pendiente uno e intercepto cero resultaron no significativa y significativa

respectivamente, la cual concordó con la significancia de la prueba F simultánea de

pendiente uno e intercepto cero.

Rii10i ZY ε+β+β=

En cuanto al coeficiente de determinación (r2=19.27%), llamado con frecuencia la

proporción de la variación explicada por el regresor (z); indica que el 19.27% de la

variabilidad de los valores observados (y) es explicada por el modelo de regresión

ajustado. Montgomery et al. (2002c), señalan respecto al coeficiente de determinación

en una regresión rectilínea que: (a) un valor grande de r2 puede ser tan sólo el resultado

de que z se haya variado en forma no realista dentro de un intervalo grande. La r2

puede ser pequeña porque el intervalo de las z sea demasiado pequeño como para

permitir detectar su relación con la variable dependiente (y), y (b) un valor grande de r2

no implica que la pendiente sea grande, además, r2 no mide la adecuación del modelo

lineal, porque con frecuencia r2 es grande aunque z y (y) no tengan relación lineal. Una

94

r2 grande no necesariamente implica que el modelo de regresión sea un predictor

exacto.

De los análisis estadísticos realizados se tiene que el modelo Wakax POS puede

usarse para predecir la GPP diaria de bovinos alimentados con caña de azúcar, maíz

quebrado y/o melaza en una zona tropical de México, aunque requerirá un ajuste con

base a la presencia de SC para incrementar la exactitud en sus pronósticos. Desde la

perspectiva de la regresión el modelo presenta discrepancia por traslación, es decir, es

un caso inexacto y preciso.

Determinar comportamientos extraños entre los pronósticos de un modelo y los

valores observados del sistema real, como por ejemplo el tipo de sesgo, es fundamental

para el mejoramiento del modelo a través de cuestionar desde su estructura hasta los

datos y métodos empleados en todos los procesos. Según McCarthy et al. (2001),

probar un modelo ayuda a identificar sus debilidades para que sea mejorado su

desempeño predictivo por medio de un proceso iterativo de desarrollo del modelo,

probarlo, modificarlo y probarlo nuevamente. Para Tedeschi (2006), la identificación y

aceptación de inexactitudes de un modelo es un paso hacia la evolución de un modelo

más exacto y de más confianza.

5.14. Validación del modelo dinámico mecanístico Wakax POS en predicción de la materia seca, ácidos grasos volátiles, acetato, propionato y butirato en el Rumen y Ciego

A continuación se validará el modelo Wakax POS en predicción de la materia

seca (DM), ácidos grasos volátiles (AGVs), acetato (Ac), propionato (Pr) y butirato (Bu)

en el Rumen y Ciego.

En el Cuadro II.3 del Anexo II se indican las fuentes e información de los datos

experimentales utilizados en la validación. En el Cuadro 3 se muestran los valores

observados (yi) y predichos (zi) para cada una de dichas variables en el Rumen y Ciego.

Debido al tamaño de muestra pequeño (Cuadro 3) [Rumen: n=3 DM, n=5 AGVs, y n=8

Ac, Pr, Bu; Ciego: n=3 DM, AGVs, Ac, Pr, Bu], se utilizaran métodos gráficos o visuales

de validación como los gráficos de dispersión de Z vs. Y junto con la recta y=z y el

95

gráfico propuesto por Mitchell (1997), en donde se grafica en el eje de las abscisas los

valores predichos, en el eje de las ordenadas las desviaciones (predicho menos

observado) y el porcentaje de puntos que caen dentro de un rango o precisión

aceptable con centro en cero, es usado como un criterio de adecuación del modelo. El

rango de aceptación lo establece el modelador de acuerdo a su criterio y propósitos.

Este gráfico es similar al que se emplea para la determinación de sesgo (zi vs. di), con

la diferencia de que en el eje de las ordenadas se gráfica el sesgo o desviaciones di=yi-

zi (observado menos predicho), la cual no causa ningún problema técnico en cuanto a

visualizar las desviaciones al comparar los observados con los predichos. Aquí se

utilizará la gráfica empleada para determinar sesgo. Adicionalmente se emplearán dos

medidas para efectuar validación que se basan en la comparación entre los valores

observados y los predichos. Estas serán la eficiencia de modelado (MEF) (Loague y

Green, 1991; Mayer y Butler, 1993; Tedeschi, 2006) y el coeficiente de determinación

del modelo (CD) (Tedeschi, 2006).

Cuadro 3. Valores de DM, AGVs, Ac, Pr y Bu observados y predichos con el modelo

Wakax POS en el Rumen y Ciego. Rumen

Ind DM(%) DM(%)P AGVs(mM) AGVs(mM)P Ac(%) Ac(%)P Pr(%) Pr(%)P Bu(%) Bu(%)P V32 59.9 60 21.9 35 17.9 5 V42 64 60 23 35 13 5 V43 14.3 6 149 40.960 58 60 28 35 14 5 V44 15.3 9 176 67.074 54 60 26 33 20 8 V45 17.3 11 161 94.341 56 60 27 31 17 9 V46 116.667 63.428 73.333 60 18.333 35 7.667 5 V47 157.333 61.440 76.667 60 17 35 6.333 5 V51 76.9 60 17.6 35 5.1 5

Ciego

Ind DM(%) DM(%)P AGVs(mM) AGVs(mM)P Ac(%) Ac(%)P Pr(%) Pr(%)P Bu(%) Bu(%)P V43 14 55 63 99.377 73 79 21 16 6 5 V44 10.5 74 82 137.103 71 78 22 16 7 6 V45 10 89 88 167.709 73 78 22 16 5 6 Ind denota Identificador. Una P al final de cada variable denota sus correspondientes predichos con el modelo Wakax POS.

En las Figuras 9 y 10 se describe la exactitud de las predicciones de Wakax POS

en el Rumen para DM, Ac, Pr, Bu y AGVs respecto a la recta y=z. Las Figuras 11 y 12

describen la relación entre el sesgo (di=yi-zi) y los valores simulados (zi) para dichas

96

variables en el Rumen. De proyectar los puntos de las Figuras 9 y 10 en cada uno de

los ejes y de observar la magnitud del sesgo para cada predicción en las Figuras 11 y

12, se tiene en términos generales que las predicciones para: (a) DM fueron menores a

los observados, (b) Ac fue única (60%) para valores de entre 54% y 76.9%, siendo

mejor para valores intermedios a dichos extremos, (c) Pr fueron mayores a los

observados, (d) Bu fueron mayores a los observados, siendo mejor para valores

observados bajos, y (e) AGVs fueron menores a los observados, quedando

prácticamente cada predicción a la mitad de cada observación del sistema real.

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50 60 70 80

Zi

Yi

DM(%)

Ac(%)

Pr(%)

Bu(%)

y=z

Figura 9. Dispersión de los puntos (zi, yi) para DM, Ac, Pr y Bu en el Rumen. y=z es la

recta que representa la exactitud ideal.

97

0

20

4060

80

100

120

140160

180

200

0 20 40 60 80 100 120 140 160 180 200

Zi

Yi

y=z

Figura 10. Dispersión de los puntos (zi, yi) para AGVs(mM) en el Rumen. y=z es la recta

que representa la exactitud ideal.

-20

-15

-10

-5

0

5

10

15

20

0 10 20 30 40 50 60 70

Zi

DM(%)PAc(%)PPr(%)PBu(%)P

di

Figura 11. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos (zi) para

DM, Ac, Pr y Bu en el Rumen.

98

0

20

40

60

80

100

120

0 10 20 30 40 50 60 70 80 90 100

Zi

di

Figura 12. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos (zi) para

AGVs(mM) en el Rumen.

Del rango de las diferencias (di) para DM, Ac, Pr, Bu y AGVs en el Rumen, se

tiene que el sesgo (di=yi-zi) presenta mayor amplitud para los AGVs, seguido por Ac, Pr,

Bu y DM (Cuadro 4). Esto también puede observarse en las Figuras 11 y 12.

Cuadro 4. Medidas descriptivas de las diferencias entre los valores observados y

predichos para las DM, Ac, Pr, Bu y AGVs en el Rumen y Ciego.

Rumen Medidas descriptivas

DDM(%) DAc(%) DPr(%) DBu(%) DAGVs(mM)

n 3 8 8 8 5 Media ( d ) 6.967 4.85 -11.896 6.75 86.551 Desviación estándar ( dS )

1.155 9.449 5.373 4.837 25.274

Rango (máx-mín)

2 22.9 14 12.8 55.687

Ciego

Medidas descriptivas

DDM(%) DAc(%) DPr(%) DBu(%) DAGVs(mM)

n 3 3 3 3 3 Media ( d ) -61.167 -6 5.667 0.333 -57.063

99

Desviación estándar ( dS )

19.107 1 0.577 1.155 21.732

Rango (máx-mín)

38 2 1 2 43.332

Una D al inicio de cada variable denota sus diferencias (di=yi-zi).

En las Figuras 13 y 14 se describe la exactitud de las predicciones de Wakax

POS en el Ciego para DM, Ac, Pr, Bu y AGVs respecto a la recta y=z. Las Figuras 15 y

16 describen la relación entre el sesgo (di=yi-zi) y los valores simulados (zi) para dichas

variables en el Ciego. De proyectar los puntos de las Figuras 13 y 14 en cada uno de

los ejes y de observar la magnitud del sesgo para cada predicción en las Figuras 15 y

16, se tiene en términos generales que las predicciones para: (a) DM fueron bastante

mayores a los observados y decrecen conforme crecen los observados, (b) Ac y Pr

fueron relativamente exactos, siendo mayores para Ac y menores para Pr, (d) Bu fueron

bastante exactos a los observados, y (e) AGVs fueron mayores a los observados y

decrecen conforme decrecen los observados. En las Figuras 15 y 16 se observa sesgo

proporcional para DM y AGVs.

010

2030

405060

7080

90100

0 10 20 30 40 50 60 70 80 90 100

Zi

Yi

DM(%)Ac(%)Pr(%)Bu(%)

y=z

Figura 13. Dispersión de los puntos (zi, yi) para DM, Ac, Pr y Bu en el Ciego. y=z es la

recta que representa la exactitud ideal.

100

0

20

40

60

80

100

120

140

160

180

0 20 40 60 80 100 120 140 160 180

Zi

Yi

y=z

Figura 14. Dispersión de los puntos (zi, yi) para AGVs(mM) en el Ciego. y=z es la recta

que representa la exactitud ideal.

-90

-80

-70

-60

-50

-40

-30

-20

-10

0

10

20

0 10 20 30 40 50 60 70 80 90 100

Zi

di

DM(%)PAc(%)PPr(%)PBu(%)P

Figura 15. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos (zi) para

DM, Ac, Pr y Bu en el Ciego.

101

-90

-80

-70

-60

-50

-40

-30

-20

-10

00 20 40 60 80 100 120 140 160 180

Zi

di

Figura 16. Relación entre el sesgo (di=yi-zi) y los valores simulados o predichos (zi) para

AGVs(mM) en el Ciego.

Del rango de las diferencias (di) para DM, Ac, Pr, Bu y AGVs en el Ciego, se

tiene que el sesgo (di=yi-zi) presenta mayor amplitud para los AGVs, seguido por DM,

Ac y Bu con igual rango y Pr (Cuadro 4). Esto también puede observarse en las Figuras

15 y 16.

Ahora se describirán la eficiencia de modelado (MEF) y el coeficiente de

determinación del modelo (CD), así como, los resultados obtenidos.

La estadística MEF es similar al coeficiente de correlación de Pearson (r), el cual

es interpretado como la proporción de la variación explicada por la recta de regresión

ajustada, mientras que la MEF es la proporción de la variación explicada por la recta

y=z, y en un ajuste perfecto ambas estadísticas tendrían un valor igual a uno (Tedeschi,

2006). Sustituyendo por zi en la expresión de r se obtiene MEF: ∧

iy

( )∑

=

=

⎟⎠⎞

⎜⎝⎛ −

−= n

1i

2i

n

1i

2

ii

yy

yy1r

102

( )

( )

( )

( )∑

=

=

=

=

−−=

−−= n

1i

2i

n

1i

2i

n

1i

2i

n

1i

2ii

yy

d1

yy

zy1MEF

donde yi es el i-ésimo valor observado, es el i-ésimo valor predicho por la recta de

regresión ajustada,

iy

y es la media aritmética de los valores observados y zi es el i-ésimo

valor simulado o predicho por el modelo a validar. La cota superior de MEF es uno

(Loague y Green, 1991; Tedeschi, 2006), pero puede ser negativo (Loague y Green,

1991) y su cota inferior (teórica) es menos infinito (Tedeschi, 2006). Si MEF<0 los

valores predichos por el modelo son peor que sencillamente usar la media observada y

(Loague y Green, 1991). La MEF puede usarse como un buen indicador de la bondad

del ajuste entre los valores observados y simulados (Mayer y Butler, 1993).

El coeficiente de determinación del modelo (CD) es el cociente de la variación

total de los datos observados entre el total de las diferencias al cuadrado de los valores

simulados respecto a la media de los datos observados.

( )

( )∑

=

=

−= n

1i

2i

n

1i

2i

yz

yyCD

En un ajuste perfecto CD valdría uno. La estadística CD indica la proporción de la

variación total de los datos observados explicada por los datos simulados (Loague y

Green, 1991). Un valor de CD cercano a uno indica una mejora en las predicciones del

modelo, CD>1 es un indicador de baja predicción y si CD<1 de sobrepredicción

(Tedeschi, 2006).

Debido a que todos los valores de MEF resultaron menores que cero (Cuadro 5),

se tiene que sería mejor usar la media de los valores observados para cada variable

que las predicciones por el modelo, ya sea en el Rumen o en el Ciego. Los dos valores

más grandes de MEF para las variables consideradas en el Rumen corresponden a Ac

(-0.301) y a Bu (-1.357), los cuales indican una mejor exactitud respecto a la recta y=z

para dichas variables (Figura 9). Para el Ciego, el valor más grande de MEF

103

corresponde a Bu (-0.5), la cual indica una mejor exactitud respecto a la recta y=z para

dicha variable (Figura 13).

Según Tedeschi (2006) un valor de CD cercano a uno indica una mejora en las

predicciones del modelo, CD>1 es un indicador de baja predicción y si CD<1 de

sobrepredicción. Por lo tanto de los valores de CD para las variables consideradas en el

Rumen se tiene que el modelo: (a) predice mejor para Bu (0.585), (b) sobrepredice las

variables DM (0.029), AGVs (0.05), Pr (0.117) y Bu (0.585), y (c) proporciona baja

predicción para Ac (3.321) (Cuadro 5). Aunque de las Figuras 9-12 se observó que las

predicciones para: (a) DM fueron menores a los observados, la cual es contrario a lo

indicado con el CD, (c) Pr fueron mayores a los observados, (d) Bu fueron mayores a

los observados, siendo mejor para valores observados bajos, y (e) AGVs fueron

menores a los observados, siendo contrario a lo señalado con el CD. Así, algunas

veces con el CD se obtienen resultados contrarios a lo observado en las técnicas

gráficas de validación y en otras ocasiones resultados coincidentes. Esto se debe a que

con el CD se comparan las distancias al cuadrado de los valores observados y

predichos respecto a la media de los valores observados ( y ), y por consiguiente

depende de que tan lejos se encuentran dichos valores de y . Respecto a los valores de

CD para las variables consideradas en el Ciego se tiene que el modelo: (a)

sobrepredice las variables DM (0.001), AGVs (0.028), Ac (0.025) y Pr (0.007), y (b)

proporciona baja predicción para Bu (2) (Cuadro 5). Aunque de las Figuras 13-16 se

observó que las predicciones para: (a) DM fueron bastante mayores a los observados

(coincide con CD) y decrecen conforme crecen los observados, (b) Ac y Pr fueron

relativamente exactos, siendo mayores para Ac (coincide con CD) y menores para Pr

(contrario a CD), (d) Bu fueron bastante exactos a los observados, y (e) AGVs fueron

mayores a los observados (coincide con CD) y decrecen conforme decrecen los

observados.

104

Cuadro 5. Valores de las estadísticas MEF y CD para las variables DM, AGVs, Ac, Pr y

Bu en el Rumen y Ciego.

Rumen Estadística DM

n=3 AGVs n=5

Ac n=8

Pr n=8

Bu n=8

MEF -30.772 -19.593 -0.301 -8.896 -1.357 CD 0.029 0.050 3.321 0.117 0.585 y 15.633% 152mM 64.85% 22.354% 12.625%

Ciego (n=3) MEF -1257.342 -30.448 -40.25 -144.5 -0.5 CD 0.001 0.028 0.025 0.007 2 y 11.5% 77.667mM 72.333% 21.667% 6% y denota la media aritmética de los valores observados

De los resultados obtenidos por medio de la eficiencia de modelado (MEF) y del

coeficiente de determinación del modelo (CD), se sigue que la MEF proporciona

resultados consistentes con los obtenidos de las técnicas visuales de validación que el

CD.

105

6. CONCLUSIONES

La validación de modelos mecanísticos basada en: (i) el procedimiento original

de Freese (1960), (ii) los planteamientos de Rennie y Wiant (1978), Reynolds (1984), y

(iii) las modificaciones y extensiones presentadas en este trabajo, constituyen un

método estadístico formado por pruebas de hipótesis e intervalos de confianza, las

cuales representan una alternativa inferencial para determinar si las salidas del modelo

están suficientemente próximas a los valores observados del sistema real. El método

permite analizar datos provenientes de modelos que presenten o no sesgo en sus

pronósticos sin modificar la estructura del modelo, y donde el máximo error admisible es

expresado en las mismas unidades del valor real.

Se establecieron los supuestos, la estadística de prueba y el error crítico para el

planteamiento original y alternativo del procedimiento de Freese cuando el modelo

presenta o no sesgo en sus predicciones.

El establecimiento de la exactitud requerida con D~ y en presencia de

SC puede formularse de dos maneras para e y α especificadas: (i)

),(N 2DD σµ

( ) α−≥≤ 1eDP se

traduce en 21,1

22D

eα−χ

≤σ , y (ii) ( ) ( ) α−≥≤−=≤ 1eDDPeWP se traduce en

21,1

22D

e1n

nα−χ

⎟⎠⎞

⎜⎝⎛

−≤σ . Siendo (i) el más práctico de establecer.

En los procedimientos para el caso en que el modelo presenta SP, se supone

D~ que se traduce en ),(N 2DD σµ Riε ~ ) para el modelo ,0(NI 2

Rσ Rii10i ZD ε+β+β= . La SCE

en el numerador de la estadística de prueba corresponde a la del modelo estimado

y no a como presentó Freese (1960). i10i ZD∧∧∧

β+β= i1101i ZY∧∧∧

β+β=

106

Se presentó un procedimiento alternativo al de Reynolds (1984) para determinar

el ICB para ε, el cuantil 1-α de la distribución de |D|. Se obtuvo a partir de un ICB del (1-

α’)100% para y de que la función 2Dσ ( ) ( ) ε=χσ=στ α−

21

21,1

2D

2D es monótona creciente.

Se determinaron en términos del error crítico para el planteamiento original y

alternativo, los ICB para el cuantil 1-α de la distribución de DD − y Rε , cuando el

modelo presenta SC o SP respectivamente.

Las pruebas estadísticas y errores críticos para el planteamiento alternativo

representan un enfoque más conservador que el original en el sentido que permite un

valor más grande del máximo error admisible (e) para inferir que el modelo es aceptable

en predicción del sistema.

El error crítico a partir del planteamiento original o alternativo, puede emplearse

para comparar dos o más modelos y para validar un modelo en predicción de varias

variables.

El modelo Wakax POS puede usarse para predecir la GPP por día de bovinos

alimentados con caña de azúcar, maíz quebrado y/o melaza en una zona tropical de

México, aunque requerirá un ajuste con base a la presencia de SC para incrementar la

exactitud en sus pronósticos. Desde la perspectiva de la regresión el modelo presenta

discrepancia por traslación, es un caso inexacto y preciso.

El sesgo de las predicciones en el Rumen presenta mayor amplitud para los

AGVs, seguido por Ac, Pr, Bu y DM. En el Ciego el sesgo tiene mayor amplitud para los

AGVs, seguido por DM, Ac y Bu con igual rango y Pr.

A diferencia del coeficiente de determinación del modelo (CD), la eficiencia de

modelado (MEF) proporciona resultados consistentes con los obtenidos de las técnicas

visuales de validación.

107

7. BIBLIOGRAFÍA

Analla, M. (1998). Model validation through the linear regression fit to actual versus

predicted values. Agric. Syst. 57:115-119.

Barrales, V.L.; Peña, R.I.; Fernández, R.B. (2004). Model validation: an applied

approach. Agric. Téc. 64(1):66-73.

Beck, B. (2002). Model evaluation and performance. Encyclopedia of Environmetrics.

John Wiley & Sons Chichester. 3:1275-1279.

Bendell, T. (1986). Minimising misconceived models. The Statistician. 35(3):303-309.

Box, G.E.P.; Hunter, W.G.; Hunter, J.S. (1999a). Modelado empírico. En: Estadística

para investigadores. Introducción al diseño de experimentos, análisis de datos y

construcción de modelos. Editorial Reverté. Barcelona, España. pp. 301-315.

Box, G.E.P.; Hunter, W.G.; Hunter, J.S. (1999b). Construcción mecanicista de modelos.

En: Estadística para investigadores. Introducción al diseño de experimentos, análisis de

datos y construcción de modelos. Editorial Reverté. Barcelona, España. pp. 555-570.

Casella, G.; Berger, R.L. (1990). Common Families of Distributions. En: Statistical

inference. Wadsworth & Brooks/Cole. California, USA. pp. 85-127.

Chilibroste, P. (2002). Evaluación de modelos detallados de rumen para predecir

disponibilidad de nutrientes en sistemas intensivos de producción de leche bajo

pastoreo. Arch. Latinoam. Prod. Anim. 10(3):232-240.

Collao-Saenz, E.A.; Dijkstra, J.; Aguiar, P.P.C.; Bannink, A.; Arcuri, P.B.; Teixeira, J.C.;

Olalquiaga, P.J.R.; David, F.M. (2005). Simulation model for particle dynamics in rumen

of cattle fed sugarcane diet. Sci. Agric. (Piracicaba, Braz.). 62(2):102-110.

108

Conover, W.J. (1980). Statistics of the Kolmogorov-Smirnov type. En: Practical

nonparametric statistics. 2a Ed. John Wiley & Sons. New York, USA. pp. 344-393.

Csáki, C. (1985). Constructing the Mathematical Model. En: Simulation and systems

analysis in agriculture. Elsevier. Amsterdam. pp. 43-48.

Ek, A.R.; Monserud, R.A. (1979). Performance and comparison of stand growth models

based on individual tree and diameter-class growth. Canada Journal Forest Research.

9:231-244.

Filliben, J.J. (1975). The probability plot correlation coefficient test for normality.

Technometrics. 17(1):111-117.

Flavelle, P. (1992). A quantitative measure of model validation and its potential use for

regulatory purpose. Advances in Water Resources. 15:5-13.

France, J.; Thornley, J.H.M. (1984a). Techniques: dynamic deterministic modellig. En:

Mathematical Models in Agriculture. Butterworth & Co (Publishers) Ltd. London. pp. 15-

36.

France, J.; Thornley, J.H.M. (1984b). Role of mathematical models in agriculture and

agricultural research. En: Mathematical Models in Agriculture. Butterworth & Co

(Publishers) Ltd. London. pp. 1-14.

Freese, F. (1960). Testing accuracy. Forest Sci. 6(2):139-145.

Fub, H.; Dubitzky, W.; Downes, C.S.; Kurth, M.J. (2005). Mathematical models of cell

cycle regulations. Briefings In Bioinformatics. 6(2):163-177.

109

Giordano, F.R.; Weir, M.D.; Fox, W.P. (1997a). Model fitting. En: A First Course in

Mathematical Modeling. 2a Ed. Brooks/Cole Publishing Company, Pacific Grove. USA.

pp. 134-165.

Giordano, F.R.; Weir, M.D.; Fox, W.P. (1997b). The modeling process. En: A First

Course in Mathematical Modeling. Brooks/Cole Publishing Company, Pacific Grove.

USA. pp. 31-50.

Graybill, F.A. (1976). General Linear Model. En: Theory and application of the linear

model. Duxbury Press. USA. pp. 171-228.

Gauch, H.G.; Hwang, J.T.G.; Fick, G.W. (2003). Model evaluation by comparison of

model-based predictions and measured values. Agronomy Journal. 95:1442-1446.

Hamilton, M.A. (1991). Model validation: an annotated bibliography. Communications in

Statistics: Theory & Methods. 20:2207-2266.

Harrington, H.J.; Tumay, K. (2000). Introduction to process simulation. En: Simulation

Modeling Methods. The McGraw-Hill Companies, Inc. pp. 1-32.

Harrison, S.R. (1990). Regression of a model on real-system output: an invalid test of

model validity. Agric. Syst. 34:183-190.

Halachmi, I.; Edan, Y.; Moallem, U.; Maltz, E. (2004). Predicting feed intake of the

individual dairy cow. Journal of Dairy Science. 87:2254-2267.

Hayirli, A.; Grummer, R.R.; Nordheim, E.V.; Crump, P.M. (2003). Models for predicting

dry matter intake of Holsteins during the prefresh transition period. Journal of Dairy

Science. 86:1771-1779.

110

Johnson, R.A.; Wichern, D.W. (2002). The multivariate normal distribution. En: Applied

multivariate statistical analysis. 5a Ed. Prentice Hall. New Jersey, USA. pp. 149-209.

Kobayashi, K.; Salam, M.U. (2000). Comparing simulated and measured values using

mean squared deviation and its components. Agronomy Journal. 92:345-352.

Loague, K.; Green, R.E. (1991). Statistical and graphical methods for evaluating solute

transport models: Overview and applications. Journal of Contaminant Hydrology. 7:51-

73.

McCarthy, M.A.; Possingham, H.P.; Day, J.R.; Tyre, A.J. (2001). Testing the accuracy of

population viability analysis. Conservation Biology. 15(4):1030-1038.

Mayer, D.G.; Butler, D.G. (1993). Statistical validation. Ecological Modelling. 68:21-32.

Mayer, D.G.; Stuart, M.A.; Swain, A.J. (1994). Regression of real world data on model

output: an appropriate overall test of validity. Agric. Syst. 45:93-104.

Mitchell, P.L. (1997). Misuse of regression for empirical validation of models. Agric. Syst.

54(3):313-326.

Montgomery, D.C. (2004a). Ajuste de modelos de regresión. En: Diseño y análisis de

experimentos. 2ª Ed. Limusa Wiley, México, D.F. pp. 392-426.

Montgomery, D.C. (2004b). Experimentos con un sólo factor: el análisis de varianza. En:

Diseño y análisis de experimentos. 2ª Ed. Limusa Wiley, México, D.F. pp. 60-125.

Montgomery, D.C. (2004c). Otros tópicos de diseño y análisis. En: Diseño y análisis de

experimentos. 2ª Ed. Limusa Wiley, México, D.F. pp. 590-629.

111

Montgomery, D.C. (2004d). Experimentos comparativos simples. En: Diseño y análisis

de experimentos. 2ª Ed. Limusa Wiley, México, D.F. pp. 21-59.

Montgomery, D.C.; Peck, E.A.; Vining, G.G. (2002a). Validación de los modelos de

regresión. En: Introducción al análisis de regresión lineal. 3ª Ed. CECSA. México, D.F.

pp. 477-494.

Montgomery, D.C.; Peck, E.A.; Vining, G.G. (2002b). Transformaciones y ponderación

para corregir inadecuaciones del modelo. En: Introducción al análisis de regresión

lineal. 3ª Ed. CECSA. México, D.F. pp. 155-184.

Montgomery, D.C.; Peck, E.A.; Vining, G.G. (2002c). Regresión lineal simple. En:

Introducción al análisis de regresión lineal. 3ª Ed. CECSA. México, D.F. pp. 13-60.

Montgomery, D.C.; Peck, E.A.; Vining, G.G. (2002d). Apéndice C. Material

suplementario. En: Introducción al análisis de regresión lineal. 3ª Ed. CECSA. México,

D.F. pp. 529-566.

Mood, A.M.; Graybill, F.A.; Boes, D.C. (1974a). Distributions of Functions of Random

Variables. En: Introduction to the Theory of Statistics. 3a. Ed. McGraw-Hill. New York,

USA. pp. 175-218.

Mood, A.M.; Graybill, F.A.; Boes, D.C. (1974b). Sampling and Sampling Distributions.

En: Introduction to the Theory of Statistics. 3a. Ed. McGraw-Hill. New York, USA. pp.

219-270.

Mood, A.M.; Graybill, F.A.; Boes, D.C. (1974c). Tests of Hypotheses. En: Introduction to

the Theory of Statistics. 3a. Ed. McGraw-Hill. New York, USA. pp. 401-481.

112

Mood, A.M.; Graybill, F.A.; Boes, D.C. (1974d). Parametric Interval Estimation. En:

Introduction to the Theory of Statistics. 3a. Ed. McGraw-Hill. New York, USA. pp. 372-

400.

Mood, A.M.; Graybill, F.A.; Boes, D.C. (1974e). Linear Models. En: Introduction to the

Theory of Statistics. 3a. Ed. McGraw-Hill. New York, USA. pp. 482-503.

Oberkampf, W.L.; Trucano, T.G. (2002). Verification y validation in computacional fluid

dynamics. Progress in Aerospace Sciences. 38:209-272.

Oreskes, N.; Shrader-Frechette, K.; Belitz, K. (1994). Verification, validation, and

confirmation of numerical models in the earth sciences. Science. 263:641-646.

Oreskes, N. (1998). Evaluation (not validation) of quantitative models for assessing the

effects of environmental lead exposure. Environmental Health Perspectives. 106:1453-

1460.

Ramakrishnan, U.; Mountain, J.L. (2004). Precision and accuracy of divergence time

estimates from STR and SNPSTR variation. Molecular Biology and Evolution. 21:1960-

1971.

Reckhow, K.H.; Clements, J.T.; Dodd, R.C. (1990). Statistical evaluation of mechanistic

water-quality models. Journal Environmental Engineering. 116(2):250-268.

Rennie, J.C.; Wiant, H.V.Jr. (1978). Modification of Freese’s chi-square test of accuracy.

USDI Bureau of Land Management, Denver Colorado. Resource Inventory Notes. Note

BLM 14:1-3.

Reynolds, M.R.Jr.; Burkhart, H.E.; Daniels, R.F. (1981). Procedures for statistical

validation of stochastic simulations models. Forest Sci. 27(2):349-364.

113

Reynolds, M.R.Jr. (1984). Estimating the error in model predictions. Forest Sci.

30(2):454-469.

Richter, O.; Söndgerath, D. (1990). Introducción. En: Parameter Estimation in Ecology.

VCH Verlagsgesellschaft mbH. Germany. pp. 1-9.

Stephens, M.A. (1974). EDF statistics for goodness of fit and some comparisons.

Journal of the American Statistical Association. 69(347):730-737.

Sokal, R.R.; Rohlf, F.J. (2000). Assumptions of analysis of variance. En: Biometry, the

principles and practice of statistics in biological research. 3a Ed. W.H. Freeman and

Company. New York, USA. pp 392-450.

Steel, R.G.D.; Torrie, J.H. (1988). Análisis de la varianza II: clasificaciones múltiples. En:

Bioestadística: principios y procedimientos. 2ª Ed. McGraw-Hill/Interamericana. México,

D.F. pp 188-230.

Tedeschi, L.O. (2006). Assessment of the adequacy of mathematical models. Agric.

Syst. 89:225–247.

Vargas-Villamil, L.M. (2003). Desarrollo de un modelo dinámico mecanístico para la

estimación de parámetros de crecimiento bacteriano ruminal mediante una técnica de

doble ajuste. Tesis de Doctorado. Universidad Autónoma de Yucatán. México. 275 pp.

Vargas-Villamil, L.M.; Ku-Vera, J.; Vargas-Villamil, F.; Medina-Peralta, S. (2004).

Modelo para la estimación de tres parámetros ruminales biológico. Interciencia.

29(6):296-302.

Vargas-Villamil, L.M.; Ku-Vera, J.; Vargas-Villamil, F.; Medina-Peralta, S. (2005).

Evaluación de un sistema ruminal basado en caña de azúcar mediante un modelo

dinámico mecanístico. Interciencia. 30(7):424-430.

114

Wackerly, D.D.; Mendenhall, W.; Scheaffer, R.L. (2002). Funciones de variables

aleatorias. En: Estadística matemática con aplicaciones. 6a Ed. Thomson Learning.

México, D.F. pp. 279-329.

Yang, J.; Greenwood, D.J.; Rowell, D.L.; Wadsworth, G.A.; Burns, I.G. (2000). Statistical

methods for evaluating a crop nitrogen simulation model, N_ABLE. Agric. Syst. 64:37–

53.

Zar, J.H. (1999). Data transformations. En: Biostatistical analysis. 4a Ed. Prentice Hall.

New Jersey, USA. pp 273-281.

Zill, D.G. (2002). Introducción a las ecuaciones diferenciales. En: Ecuaciones

diferenciales con aplicaciones de modelado. 7ª ed. Thomson Learning. México, D.F. pp.

1-38.

115

ANEXO I

I.A. Descripción del modelo mecanístico del sistema crecimiento bacteriano, Turix

El modelo dinámico mecanístico Turix fue desarrollado para la estimación de dos

parámetros cinéticos y uno de rendimiento de ácidos grasos volátiles en un sistema

cerrado de crecimiento bacteriano ruminal. El modelo esta compuesto por 11 variables

de estado que describen el sistema (degradación del alimento, crecimiento y

fermentación bacteriana) (Vargas-Villamil et al., 2004). En la Figura I.1 y Cuadro I.1 se

presentan respectivamente un diagrama del modelo Turix y los símbolos usados. Su

desarrollo, descripción, evaluación matemática y evaluación de un sistema ruminal

basado en caña de azúcar por medio de Turix, se presenta con más detalle en Vargas-

Villamil (2003), Vargas-Villamil et al. (2004) y Vargas-Villamil et al. (2005).

Fuente: Vargas-Villamil et al. (2004)

Figura I.1. Representación esquemática del modelo Turix.

Cuadro I.1. Símbolos usados en el diagrama del modelo Turix.

ND Fracción o fase lentamente degradable del alimento NS Fracción o fase rápidamente degradable del alimento SC Fracción o fase inmediatamente degradable del alimento Sm Sustrato microbiano L Sustrato intermedio M Biomasa bacteriana AGV Ácidos grasos volátiles AGV + CO2 Productos de la fermentación Vargas-Villamil et al. (2004)

116

I.B. Notación empleada en el modelo Wakax POS Cuadro I.2. Notación y abreviaciones empleadas en el modelo Wakax POS con excepción del submodelo de Crecimiento animal.

General ( )Sup

SubCbD C Compartimiento o submodelo b Proceso D Descripción Sup Sección Sub Sustrato o tamaño de partícula

Entrada (CD) C Co, Pa, ZC, Z, O D In, We (mg/h o g)

Parámetro ajustado ( )SupSubCbD

C Co, Pa, ZC, O b c, y, f (ml/h*mg o g/g) D C Sup R, C Sub Sm, AGV, Ac, Pr, Bu, Va

Parámetro ( )SupSubCbD

C Co, Pa, ZC, Z, O b i, b, d, p, a (g/g o 1/h) D C Sup R, C, D Sub Sm, p, g, l, MS

Constante (D) D InVoRu, InVoCi, SiBa, DiPa, DiZC (ml/g o 1/h)

Variable de estado ( )SupSubCD

C Co, Pa, ZC D C, Q (mg o mg/ml, ) Sup R, C, D Sub Sm, L, M, Ac, Pr, Bu, Va, CO2, MS, U, W, V, Fi

Flujo ( )SupCD C Co, Pa, ZC, Z, O D Descripción del proceso de la variable de estado x a y, Ex, In, D (mg/ml*h) Sup R, C, D, A

117

Variable auxiliar (D) D Descripción de la variable Compartimiento o submodelo Proceso Co Concentrado c Substrato de salida Pa Pasto y Rendimiento de AGV ZC Caña de azúcar f Coeficiente de fermentación Z Melaza i Entrada de substrato en fracción de MS O No relacionado a un d Tasa de degradación compartimiento o p Tasa de pasaje submodelo específico a Tasa de absorción b Digestibilidad

Descripción¥ In Ingreso al sistema Ex Salida del sistema D Substrato degradado We Peso del animal C Concentración del substrato x ( ) Sup

xCbCQ Cantidad del substrato x ( ) Sup

xCbQSiBa Síntesis microbial InVon Índice de volumen en n. Dii Tasa de reducción de la partícula de i Von Volumen en n in Entrada en n de substrato en proporción de volumen en n relacionado con i ipCnm Tasa de pasaje en n de la partícula media relacionado a i ismCn Concentración en n de MS relacionado con i iFluCSmMpn Flujo de la concentración de Sm y M a través de n relacionado con i iFluQSmMpn Flujo de la cantidad de Sm y M a través de n relacionado con i Uni Fracción no degradable de i iCnj Concentration de j dentro de n relacionado con i ijFlu Fracción de j en el flujo a Ciego relacionado con i Sección R Rumen D Intestino C Ciego Substrato p Partícula pequeña g Partícula grande l líquido Sm Substrato microbial AGV Ácidos grasos volátiles Ac Acetato M Biomasa MS Materia seca V Partícula reducida L Metabolito intermedio U Fracción no degradable Bu Butirato CO2 Dióxido de carbono Va Valerato Fi Fibra W Biomasa ruminal dentro del Ciego Pr Propionato ¥ i = Co (Concentrado), Pa (Pasto), ZC (Caña de azúcar), Z (Melaza)

118

n = Ru (Rumen), D (Intestino), Ci (Ciego), O (Compartimiento o submodelo no definido) j = M (Biomasa), Ac (Acetato), Pr (Propionato), Butirato (Bu), Sm (Substrato microbial), MS (Materia seca). Cuadro I.3. Notación y abreviaciones empleadas en el submodelo de Crecimiento animal.

General ( )SupSubCD

C Compartimiento o submodelo D Descripción Sup Sección Sub Sustrato

Entrada (CD) C O D We (g)

Constante (D) D Descripción de la constante

Variable de estado ( )SupSubCD

C O D Q (molo o g) Sup A Sub aa, ACA, Pal, Fa

Flujo ( )SupCD C O D Descripción del proceso de la variable de estado x a y, Ex, In, D (mol o g/h) Sup A

Variable auxiliar (D) D Descripción de la variable Compartimiento o submodelo O No relacionado a un compartimiento o submodelo específico

Descripción de constantes Ex Salida del sistema In Ingreso al sistema We Peso del animal Q Cantidad del substrato x ( ) Sup

xCbQIndxy Índice de conversión de y a x xy Proporción de x dentro de y PMx Peso molecular de x Retx Eficiencia de retención de x

119

Reqxsy Requerimiento de x durante la síntesis de y Forxoy Formación de x durante la oxidación de y IndMan Energía para “mantenimiento” en relación a su peso metabólico (kg^.75)

Descripción de variables auxiliares MxA Moles de x absorbidos xi Cantidad de x dentro del compartimiento i xsy Gasto de x por mol de y sintetizada xdy x formada por mol de y degradada xty x equivalente en mol de y Indxy Índice de conversión de y a x xMan Moles (o equivalente) de x utilizado para “mantenimiento” Retx Eficiencia de retención de x xDa Incremento promedio diario de x Sección Substrato A Animal aa aminoácido ACA Acetil Coenzima A Pal Palmitato x o y: Glu = Glucosa, Pro = Proteína, M = Biomasa, MS = Materia Seca, aa = aminoácido, ATP = Trifosfato de Adenosina, ACA = Acetil Coenzima A, Ac = Acetato, Pr = Propionato, Bu = Butirato, Pal = Palmitato, Fa = Grasa, Ga = Ganancia de peso i: A = Animal

120

I.C. Descripción del modelo Wakax POS

A continuación se definen cinco “funciones” llamadas Turix (T), fSup, fD,

que serán referidas en los submodelos.

R1f y

C2f

Sea la “función” Turix definida por:

⎟⎟⎟

⎜⎜⎜

Glu,VaGlu,Bu

GluPr,Glu,AcSF,PAGVLMSmL,MCOLVaBuPrAcMSm

c,c

,c,c,Y,k,k;dtCd

,dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

T2

donde las ocho expresiones diferenciales corresponden a las variables de estado del

modelo Turix (Vargas-Villamil et al., 2004). Las siete constantes y parámetros

localizados después del punto y coma, se reescriben en notación según el submodelo y

sección correspondiente del modelo Wakax POS. En general para el submodelo C (Co,

Pa, CZ) sección Sup (R, C): SupSmSmL,M cCk C= , , , , ,

, .

siBakLM = SupAGVSF,PAGV yCY C= Sup

AcGlu,Ac fCc C= SupPrGluPr, fCc C=

SupBuGlu,Bu fCc C= Sup

VaGlu,Va fCc C=

Sea la “función” definida por: Supf

⎟⎟⎟

⎜⎜⎜

SupSupVa

SupBu

SupPr

SupAc

SupM

SupVa

SupBu

SupPr

SupAc

SupM

Sup

)CP(;)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCC

CCCCCCCC

donde las cinco expresiones diferenciales corresponden a las variables de estado M,

Ac, Pr, Bu y Va para el submodelo C (Co, Pa, CZ) sección Sup (R, C). con

Sub=M, Ac, Pr, Bu, Va, denota la(s) variable(s) auxiliar(es) para la variable de estado

Sub y sección Sup en el submodelo C. denota las constantes y parámetros en

el submodelo C sección Sup.

SupSub)VA(C

Sup)CP(C

Ecuaciones diferenciales para las variables de estado M, Ac, Pr, Bu y Va en el

submodelo C sección Rumen (Sup=R):

RRM MM

dtCd CC

−=

RRRAc AcABAcAc

dtCd CCC

−−=

121

RRRPr GluPrPrPr

dtCd CCC

−−=

RRRBu BuABBuBu

dtCd CCC

−−=

RRRVa VaExVaVa

dtCd CCC

−−=

Variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va en el submodelo C

sección Rumen (Sup=R): RMm

RRM C*pCRMM:)VA( CCCC =

RAc

RAc

RRAc

Rl

RRAc C*aCAcAB;C*pCAcAc:)VA( CCCCCCC ==

RPr

RPr

RRPr

Rl

RRPr C*aCGluPr;C*pCPrPr:)VA( CCCCCCC ==

RBu

RBu

RRBu

Rl

RRBu C*aCBuAB;C*pCBuBu:)VA( CCCCCCC ==

RVa

RVa

RRVa

Rl

RRVa C*aCVaEx;C*pCVaVa:)VA( CCCCCCC ==

R)CP(C se especifican al final de la descripción de cada submodelo C sección Rumen

(Sup=R).

Ecuaciones diferenciales para las variables de estado M, Ac, Pr, Bu y Va en el

submodelo C sección Ciego (Sup=C):

CCM MEx

dtCd CC

−=

CCCAc AcABAcAc

dtCd CCC

−−=

CCCPr GluPrPrPr

dtCd CCC

−−=

CCCBu BuABBuBu

dtCd CCC

−−=

CCCVa VaExVaVa

dtCd CCC

−−=

Variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va en el submodelo C

sección Ciego (Sup=C): CMm

CCM C*pCRMEx:)VA( CCCC =

122

CAc

CAc

CCAc

Cl

CCAc C*OaCAcAB;C*OpCAcAc:)VA( CCCCC ==

CPr

CPr

CCPr

Cl

CCPr C*OaCGluPr;C*OpCPrPr:)VA( CCCCC ==

CBu

CBu

CCBu

Cl

CCBu C*OaCBuAB;C*OpCBuBu:)VA( CCCCC ==

CVa

CVa

CCVa

Cl

CCVa C*OaCVaEx;C*OpCVaVa:)VA( CCCCC ==

C)CP(C se especifican al final de la descripción de cada submodelo C sección Ciego

(Sup=C).

Sea la “función” definida por: Df

⎟⎟⎟

⎜⎜⎜

DDVa

DBu

DPr

DAc

DM

DMS

DSm

DVa

DBu

DPr

DAc

DM

DMS

DSm

D

)CP();RMTP(,)VA(,)VA(,)VA(,)VA(,)VA(

)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCCCCCC

CCCCCCCCC

donde las siete expresiones diferenciales corresponden a las variables de estado Sm,

MS, M, Ac, Pr, Bu y Va para el submodelo C (Co, Pa, CZ) sección Intestino (Sup=D).

CRMTP denota la razón media del tamaño de la partícula en el submodelo C.

con Sub=Sm, MS, M, Ac, Pr, Bu, Va, denota la(s) variable(s) auxiliar(es) para la variable

de estado Sub y sección D en el submodelo C. denota las constantes y

parámetros para el submodelo C sección D.

DSub)VA(C

D)CP(C

Ecuaciones diferenciales para las variables de estado Sm, MS, M, Ac, Pr, Bu y Va en el

submodelo C sección Intestino (Sup=D):

DCDDDSm SmSmSmGluSmSm

dtCd CCCC

−−=

DCDDDMS MSMSMSGluMSMS

dtCd CCCC

−−=

DCDDDM MSmMaaMM

dtCd CCCC

−−=

DCDDDAc AcAcAcABAcAc

dtCd CCCC

−−=

DCDDDPr PrPrGluPrPrPr

dtCd CCCC

−−=

DCDDDBu BuBuBuABBuBu

dtCd CCCC

−−=

123

DCDDDVa VaVaVaExVaVa

dtCd CCCC

−−=

Variables auxiliares para las variables de estado Sm, MS, M, Ac, Pr, Bu y Va en el

submodelo C sección Intestino (Sup=D):

;bC*pC*CSmGlu;SmSmSmSm:)VA( DSm

Dl

DSm

DRDDSm CCCCCCC ==

)bC1(*pC*CSmSm DSm

Dl

DSm

DC CCCC −=

;C*bC*pCMSGlu;VMSMSMSUMSMSMS:)VA( DMS

DM

Dm

DRRRDDMS CCCCCCCCC =++=

)bC1(*pC*CMSMS DMS

Dm

DMS

DC CCCC −=

;bC*pC*CMaa;MMMM:)VA( DM

Dm

DM

DRDDM CCCCCCC ==

)bC1(*pC*CMSm DM

Dm

DM

DC CCCC −= DAc

Dl

DCDAc

DAc

DRDDAc C*pCAcAc;C*aCAcAB;AcAcAcAc:)VA( CCCCCCCCC ===

DPr

Dl

DCDPr

DPr

DRDDPr C*pCPrPr;C*aCGluPr;PrPrPrPr:)VA( CCCCCCCCC ===

DBu

Dl

DCDBu

DBu

DRDDBu C*pCBuBu;C*aCBuAB;BuBuBuBu:)VA( CCCCCCCCC ===

DVa

Dl

DCDVa

DVa

DRDDVa C*pCVaVa;C*aCVaEx;VaVaVaVa:)VA( CCCCCCCCC ===

( ) 2/pCpCpCDm:RMTP Dg

Dp CCCC +=

D)CP(C se especifican al final de la descripción de cada submodelo C sección Intestino

(Sup=D).

Sea la “función” definida por: R1f

⎟⎟⎠

⎞⎜⎜⎝

⎛ R1

RU

RV

RMS

RU

RV

RMSR

1 )CP(;)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCdf CCCCCCC

donde las tres expresiones diferenciales corresponden a las variables de estado MS, V

y U para el submodelo C (Pa, CZ) sección Rumen (Sup=R). con Sub=MS, V,

U denota la(s) variable(s) auxiliar(es) para la variable de estado Sub y sección R en el

submodelo C. denota las constantes y parámetros en el submodelo C sección

R.

RSub)VA(C

R1)CP(C

Ecuaciones diferenciales para las variables de estado MS, V y U en el submodelo C

sección Rumen (Sup=R):

124

RRRRRMS MSMSMSVMSSmInMS

dtCd CCCCC

−−−=

RRRRV VMSmVSmMSV

dtCd CCCC

−−=

RRRU UMSInU

dtCd CCC

−=

Variables auxiliares para las variables de estado MS, V y U en el submodelo C sección

Rumen (Sup=R):

;C*dCMSSm;24/)VoRu/In(Ru;iC*RuInMS:)VA( RMS

RMS

RRMS

RRMS CCCCCCCCC ===

RMS

Rg

RRMS

R C*pCMSMS;C*DiMSV CCCCCC ==

RV

Rp

RRV

RMS

RRV C*pCVMS;C*dCVSm:)VA( CCCCCCC ==

RU

Rg

RRSm

RMS

RRU C*pCUMS;iCiC1Un;Un*RuInU:)VA( CCCCCCCCCC =−−==

2/)pCpC(pCRm Rp

Rg CCC +=

R1)CP(C se especifican al final de la descripción de cada submodelo C sección Rumen

(Sup=R).

Sea la “función” definida por: C2f

⎟⎟⎠

⎞⎜⎜⎝

⎛ C2

CW

CMS

CW

CMSC

2 )CP(;)VA(,)VA(;dtCd,

dtCdf CCCCC

donde las dos expresiones diferenciales corresponden a las variables de estado MS y

W para el submodelo C (Pa, CZ) sección Ciego (Sup=C). con Sub=MS, W

denota la(s) variable(s) auxiliar(es) para la variable de estado Sub y sección C en el

submodelo C. denota las constantes y parámetros en el submodelo C sección

C.

CSub)VA(C

C2)CP(C

Ecuaciones diferenciales para las variables de estado MS y W en el submodelo C

sección Ciego (Sup=C).

CCCCMS MSExMSSmMSMS

dtCd CCCC

−−=

DCCCCW WExWSmMWC

dtCd CCCC

−−=

125

Variables auxiliares para las variables de estado MS y W en el submodelo C sección

Ciego (Sup=C):

;VoCi/FluQSmMpCCi;MSFlu*CiMSMS:)VA( CCMS CCCCCC ==

;VoRu*FluCSmMpCFluQSmMpC;FluCSmMpC/MSMSMSFlu DC CCCCC ==

;SmSmMSMSMSmFluCSmMpC;InVoCi*WeVoCi DCDCDC CCCC ++== CMS

Cp

CCMS

CMS

C C*pCMSEx;C*dCMSSm CCCCCC ==

;FluCSmMpC/MSmMFlu;MFlu*CiMWC:)VA( DCCCW CCCCCCC ==

2/)OpCpC(pCCm;C*pCWEx;C*dCWSm Cl

Cp

CW

Cp

CCW

CW

C +=== CCCCCCCC

C2)CP(C se especifican al final de la descripción de cada submodelo C sección Ciego

(Sup=C).

En los siguientes cuadros se describe cada submodelo con sus secciones.

Cuadro I.4. Submodelo Concentrado (Co). Sección Rumen

Variable de estado Sm: RRR

RSm CoSmGluCoSmSmSmlnCo

dtdCoC

−−=

Variables auxiliares: RSm

R CoiC*CoRuSmlnCo = CoRu = (CoIn/VoRu)/24 VoRu = InVoRu*We

2/)CopCCopC(CopCRm Rp

Rg +=

RSm

Rl

R CoC*CopCCoSmSm = RSm

RSm

R CoC*CoaCCoSmGlu = Las ecuaciones diferenciales y variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va del submodelo Concentrado sección Rumen se obtienen de las “funciones” Turix y fSup:

⎟⎟⎟

⎜⎜⎜

Glu,VaGlu,Bu

GluPr,Glu,AcSF,PAGVLMSmL,MCOLVaBuPrAcMSm

c,c

,c,c,Y,k,k;dtCd

,dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

T2

⎟⎟⎟

⎜⎜⎜

SupSupVa

SupBu

SupPr

SupAc

SupM

SupVa

SupBu

SupPr

SupAc

SupM

Sup

)CP(;)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCC

CCCCCCCC

al sustituir C=Co y Sup=R.

126

Constantes y parámetros : R)CP(CRVa

RBu

RPr

RAc

RSm

Rl

Rp

Rg

RSm CoaC,CoaC,CoaC,CoaC,CoaC,CopC,CopC,CopC,CoiC,InVoRu

Entradas: Modelo: CoIn, We.

Sección Ciego Variable de estado Sm:

CCCSm CoSmExCoSrSm

dtdCoC

−=

Variable auxiliar: CoCiCoSrSmC =

CoCi = CoFluQSmMpC/VoCi CoFluQSmMpC = CoFluCSmMpC*VoRu

DCDC CoSmSmCoMSmCCoFluCSmMp += VoCi = We*InVoCi

2/)CopCCopC(CopCRm Cl

Cp +=

CSm

Cl

C CoC*OpCCoSmEx = Las ecuaciones diferenciales y variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va del submodelo Concentrado sección Ciego se obtienen de las “funciones” Turix y fSup:

⎟⎟⎟

⎜⎜⎜

Glu,VaGlu,Bu

GluPr,Glu,AcSF,PAGVLMSmL,MCOLVaBuPrAcMSm

c,c

,c,c,Y,k,k;dtCd

,dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

T2

⎟⎟⎟

⎜⎜⎜

SupSupVa

SupBu

SupPr

SupAc

SupM

SupVa

SupBu

SupPr

SupAc

SupM

Sup

)CP(;)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCC

CCCCCCCC

al sustituir C=Co y Sup=C: Constantes y parámetros : C)CP(C C

VaCBu

CPr

CAc

Cl

Cp OaC,OaC,OaC,OaC,OpC,CopC,InVoCi

Entradas: Otro submodelo o sección: , VoRu DCDC CoSmSm,CoMSm

Sección Intestino Las ecuaciones diferenciales y variables auxiliares para las variables de estado Sm, M, Ac, Pr, Bu y Va del submodelo Concentrado sección Intestino se obtienen de la “función” fD:

⎟⎟⎟

⎜⎜⎜

DDVa

DBu

DPr

DAc

DM

DSm

DVa

DBu

DPr

DAc

DM

DSm

D

)CP();RMTP(,)VA(,)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCCCC

CCCCCCCCC

127

al sustituir C=Co, Sup=D y de no tomar en cuenta las que corresponden a MS. Constantes y parámetros : D)CP(C

DVa

DBu

DPr

DAc

DM

DSm

Dl

Dp CoaC,CoaC,CoaC,CoaC,CobC,CobC,CopC,CopC

Entradas: Otro submodelo o sección:

RRRRRR CoBuBu,PrPrCo,CoVaVa,CoAcAc,CoMM,CoSmSm Cuadro I.5. Submodelo Pasto (Pa).

Sección Rumen Variable de estado Sm:

RRRRRRSm PaSmGluPaSmSmPaVSmSmlnPaPaMSSm

dtdPaC

−−++=

Variable auxiliar: RSm

R PaiC*PaRuSmlnPa = RSm

Rl

R PaC*PapCPaSmSm = RSm

RSm

R PaC*PaaCPaSmGlu = 2/)PapCPapC(PapCRm R

pRg +=

Las ecuaciones diferenciales y variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va del submodelo Pasto sección Rumen se obtienen de las “funciones” Turix y fSup:

⎟⎟⎟

⎜⎜⎜

Glu,VaGlu,Bu

GluPr,Glu,AcSF,PAGVLMSmL,MCOLVaBuPrAcMSm

c,c

,c,c,Y,k,k;dtCd

,dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

T2

⎟⎟⎟

⎜⎜⎜

SupSupVa

SupBu

SupPr

SupAc

SupM

SupVa

SupBu

SupPr

SupAc

SupM

Sup

)CP(;)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCC

CCCCCCCC

al sustituir C=Pa y Sup=R. Constantes y parámetros : R)CP(C

RVa

RBu

RPr

RAc

RSm

RSm

Rl

Rp

Rg PaaC,PaaC,PaaC,PaaC,PaiC,PaaC,PapC,PapC,PapC

Entradas: Otro submodelo o sección: , PaRu RPaMSSm Las ecuaciones diferenciales y variables auxiliares para las variables de estado MS, V y U del submodelo Pasto sección Rumen se obtienen de la “función” R

1f :

⎟⎟⎠

⎞⎜⎜⎝

⎛ R1

RU

RV

RMS

RU

RV

RMSR

1 )CP(;)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCdf CCCCCCC

128

al sustituir C=Pa y Sup=R. Donde a la primera variable auxiliar en se le suma CoInMSR.

RMS)VA(C

Constantes y parámetros : R

1)CP(C Rp

Rg

RFi PapC,PapC,Dipa,CoiC

Entradas: Modelo: PaIn, R

SmRMS PaiC,PaiC

Otro submodelo o sección: CoRu, , CoInMSR, VoRu RMS

R PadC,CoInMS

Sección Ciego Variable de estado Sm:

CCCCCSm PaSmExPaSmSmPaWSSmPaMSSm

dtdPaC

−++=

Variable auxiliar: PaSmFluPaSmSmC =

CSm

Cl

C PaC*OpCPaSmEx = 2/)PapCPapC(PapCRm C

lCp +=

Las ecuaciones diferenciales y variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va del submodelo Pasto sección Ciego se obtienen de las “funciones” Turix y fSup:

⎟⎟⎟

⎜⎜⎜

Glu,VaGlu,Bu

GluPr,Glu,AcSF,PAGVLMSmL,MCOLVaBuPrAcMSm

c,c

,c,c,Y,k,k;dtCd

,dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

T2

⎟⎟⎟

⎜⎜⎜

SupSupVa

SupBu

SupPr

SupAc

SupM

SupVa

SupBu

SupPr

SupAc

SupM

Sup

)CP(;)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCC

CCCCCCCC

al sustituir C=Pa y Sup=C. Constantes y parámetros : C)CP(C C

VaCBu

CPr

CAc

Cl

Cp OaC,OaC,OaC,OaC,OpC,PapC

Entradas: Otro submodelo o sección : PaSmFlu Las ecuaciones diferenciales y variables auxiliares para las variables de estado MS y W del submodelo Pasto sección Ciego se obtienen de la “función” C

2f :

⎟⎟⎠

⎞⎜⎜⎝

⎛ C2

CW

CMS

CW

CMSC

2 )CP(;)VA(,)VA(;dtCd,

dtCdf CCCCC

al sustituir C=Pa y Sup=C. Constantes y parámetros : C

2)CP(C CW

Cl

Cp

CMS PadC,OpC,PapC,PadC

129

Entradas: Modelo: We Otro submodelo o sección: InVoCi, VoRu, , PaFluCSmMpC

DCDCDC PaMSMS,PaSmSm,PaMSSm

Sección Intestino

Las ecuaciones diferenciales y variables auxiliares para las variables de estado Sm, MS, M, Ac, Pr, Bu y Va del submodelo Pasto sección Intestino se obtienen de la “función” fD:

⎟⎟⎟

⎜⎜⎜

DDVa

DBu

DPr

DAc

DM

DMS

DSm

DVa

DBu

DPr

DAc

DM

DMS

DSm

D

)CP();RMTP(,)VA(,)VA(,)VA(,)VA(,)VA(

)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCCCCCC

CCCCCCCCC

al sustituir C=Pa y Sup=D. Constantes y parámetros : D)CP(C

DVa

DBu

DPr

DAc

Dl

Dp

Dg

DMS

DSm

DM PaaC,PaaC,PaaC,PaaC,PapC,PapC,PapC,PabC,PabC,PabC

Entradas: Otro submodelo o sección:

RDBu

DVa

RRRRR PaBuBu,PaaC,PaaC,PaVaVa,PaSmSm,PaMM,PaAcAc,PrPrPa Cuadro I.6. Submodelo Caña de azúcar (CZ).

Sección Rumen Variable de estado Sm:

RRRRRRSm CZSmGluCZSmSmCZVSmCZInSmCZMSSm

dtdCZC

−−++=

Variable auxiliar: RSm

R CZiC*CZRuCZInSm = RSm

Rl

R CZCCZpCCZSmSm += RSm

RSm

R CZC*CZaCCZSmGlu = 2/)CZpCCZpC(CZpCRm R

pRg +=

Las ecuaciones diferenciales y variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va del submodelo Caña de azúcar sección Rumen se obtienen de las “funciones” Turix y fSup:

⎟⎟⎟

⎜⎜⎜

Glu,VaGlu,Bu

GluPr,Glu,AcSF,PAGVLMSmL,MCOLVaBuPrAcMSm

c,c

,c,c,Y,k,k;dtCd

,dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

T2

⎟⎟⎟

⎜⎜⎜

SupSupVa

SupBu

SupPr

SupAc

SupM

SupVa

SupBu

SupPr

SupAc

SupM

Sup

)CP(;)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCC

CCCCCCCC

130

al sustituir C=CZ y Sup=R. Constantes y parámetros : R)CP(C

RVa

RBu

RPr

RAc

RSm

RSm

Rl

Rp

Rg CZaC,CZaC,CZaC,CZaC,CZiC,CZaC,CZpC,CZpC,CZpC

Entradas: Otro submodelo o sección: CZMSSmR, ZCRu Las ecuaciones diferenciales y variables auxiliares para las variables de estado MS, V y U del submodelo Caña de azúcar sección Rumen se obtienen de la “función” R

1f :

⎟⎟⎠

⎞⎜⎜⎝

⎛ R1

RU

RV

RMS

RU

RV

RMSR

1 )CP(;)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCdf CCCCCCC

al sustituir C=CZ y Sup=R. Constantes y parámetros : DiZC, R

1)CP(C Rp

Rg CZpC,CZpC

Entradas: Modelo: R

SmRMS

RMS CZiC,CZiC,CZIn,CZdC

Otro submodelo o sección: VoRu

Sección Ciego Variable de estado Sm:

CCCCCSm CZSmExCZSmSmCZWSmCZMSSm

dtdCZC

−++=

Variable auxiliar: CZSmFlu*CZCiCZSmSmC =

CSm

Cl

C CZC*OpCCZSmEx = 2/)CZpCCZpC(CZpCRm C

lCp +=

Las ecuaciones diferenciales y variables auxiliares para las variables de estado M, Ac, Pr, Bu y Va del submodelo Caña de azúcar sección Ciego se obtienen de las “funciones” Turix y fSup:

⎟⎟⎟

⎜⎜⎜

Glu,VaGlu,Bu

GluPr,Glu,AcSF,PAGVLMSmL,MCOLVaBuPrAcMSm

c,c

,c,c,Y,k,k;dtCd

,dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

T2

⎟⎟⎟

⎜⎜⎜

SupSupVa

SupBu

SupPr

SupAc

SupM

SupVa

SupBu

SupPr

SupAc

SupM

Sup

)CP(;)VA(,)VA(

,)VA(,)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCC

CCCCCCCC

al sustituir C=CZ y Sup=C. Constantes y parámetros : C)CP(C C

VaCBu

CPr

CAc

Cl

Cp OaC,OaC,OaC,OaC,OpC,CZpC

131

Entradas: Otro submodelo o sección: CZSmFlu, CZCi, CZSmFlu Las ecuaciones diferenciales y variables auxiliares para las variables de estado MS y W del submodelo Caña de azúcar sección Ciego se obtienen de la “función” C

2f :

⎟⎟⎠

⎞⎜⎜⎝

⎛ C2

CW

CMS

CW

CMSC

2 )CP(;)VA(,)VA(;dtCd,

dtCdf CCCCC

al sustituir C=CZ y Sup=C. Constantes y parámetros : C

2)CP(C Cl

Cp

CW

CMS OpC,CZpC,CZdC,CZdC

Entradas: Modelo: We Otro submodelo o sección: , InVoCi, VoRu, PaFluCSmMpC

DCDCDC PaSmSm,PaMSm,CZMSMS

Sección Intestino

Las ecuaciones diferenciales y variables auxiliares para las variables de estado Sm, MS, M, Ac, Pr, Bu y Va del submodelo Caña de azúcar sección Intestino se obtienen de la “función” fD:

⎟⎟⎟

⎜⎜⎜

DDVa

DBu

DPr

DAc

DM

DMS

DSm

DVa

DBu

DPr

DAc

DM

DMS

DSm

D

)CP();RMTP(,)VA(,)VA(,)VA(,)VA(,)VA(

)VA(,)VA(;dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd,

dtCd

fCCCCCCC

CCCCCCCCC

al sustituir C=CZ y Sup=D. Constantes y parámetros : D)CP(C

Dl

Dp

Dg

DVa

DBu

DPr

DAc

DM

DMS

DSm CZpC,CZpC,CZpC,CZaC,CZaC,CZaC,CZaC,CZbC,CZbC,CZbC

Entradas: Otro submodelo o sección:

RRRRRR CZSmSm,CZMM,CZAcAc,PrPrCZ,CZBuBu,CZVaVa Cuadro I.7. Submodelo Melaza. Variable de estado Sm:

RDSm ZInSm

dtdZC

=

Variable auxiliar: ZRu*ZiCZInSm R

SmR =

ZRu = (ZIn / VoRu) / 24 Constantes y parámetros: R

SmZiC Entradas: Modelo: ZIn Otro submodelo o sección: VoRu

132

Cuadro I.8. Ecuaciones descriptivas. OsmCR = CosmCR + PasmCR + ZCsmCR OsmCC = CosmCC + PasmCC + ZCsmCC OCRM = CoCRM + PaCRM + ZCCRM OCRAc = CoCRAc + PaCRAc + ZCCRAc OCRPr = CoCRPr + PaCRPr + ZCCRPr OCRBu = CoCRBu + PaCRBu + ZCCRBu OCRVa = CoCRVa + PaCRVa + ZCCRVa OCCM = CoCCM + PaCCM + ZCCCM OCCAc = CoCCAc + PaCCAc + ZCCCAc OCCPr = CoCCPr + PaCCPr + ZCCCPr OCCBu = CoCCBu + PaCCBu + ZCCCBu OCCVa = CoCCVa + PaCCVa + ZCCCVa

RVa

RBu

RPr

RAc

RSm

RM CoCCoCCoCCoCCoCCoCCosmCR +++++=

CVa

CBu

CPr

CAc

CSm

CM CoCCoCCoCCoCCoCCoCCosmCC +++++=

RVa

RBu

RPr

RAc

RM

RSm

RV

RMS

RU PaCPaCPaCPaCPaCPaCPaCPaCPaCPasmCR ++++++++=

CVa

CBu

CPr

CAc

CM

CSm

CMS PaCPaCPaCPaCPaCPaCPaCPasmCC ++++++=

RVa

RBu

RPr

RAc

RM

RSm

RV

RMS

RU CZCCZCCZCCZCCZCCZCCZCCZCCZCCZsmCR ++++++++=

CVa

CBu

CPr

CAc

CM

CSm

CMS CZCCZCCZCCZCCZCCZCCZCCZsmCC ++++++=

RFi

R CoiC*CoRuCoInMS = Cuadro I.9. Submodelo Crecimiento animal.

Proteína ProA = (((CoMaaD+PaMaaD+ZCMaaD)*VoRu)*ProM)+(MSA*ProMS)

Ácidos grasos volátiles AcA = AcR+AcD+AcC AcR = (CoAcABR+PaAcABR+ZCAcABR)*VoRu AcD = (CoAcABD+PaAcABD+ZCAcABD)*VoRu AcC = (CoAcABC+PaAcABC+ZCAcABC)*VoCi PrA = PrC+PrD+PrR PrR = (CoPrGluR+PaPrGluR+ZCPrGluR)*VoRu PrD = (CoPrGluD+PaPrGluD+ZCPrGluD)*VoRu PrC = (CoPrGluC+PaPrGluC+ZCPrGluC)*VoCi PrBu = BuR+BuD+BuC BuR = (CoBuABR+PaBuABR+ZCBuABR)*VoRu BuD = (CoBuABD+PaBuABD+ZCBuABD)*VoRu BuC = (CoBuABC+PaBuABC+ZCBuABC)*VoCi VaA = VaR+VaD+VaC VaR = (CoVaExR+PaVaExR+ZCVaExR)*VoRu VaD = (CoVaExD+PaVaExD+ZCVaExD)*VoRu VaC = (CoVaExCa+PaVaExCa+ZCVaExCa)*VoCi

133

Entrada: Del modelo Ruminal: CoMaaD, PaMaaD, ZCMaaD, VoRu, ProM, MSA, ProMS, CoAcABR, PaAcABR, ZCAcABR, CoAcABD, PaAcABD, ZCAcABD, CoAcABC, PaAcABC, ZCAcABC, CoPrGluR, PaPrGluR, ZCPrGluR, CoPrGluD, PaPrGluD, ZCPrGluD, CoPrGluC, PaPrGluC, ZCPrGluC, CoBuABR, PaBuABR, ZCBuABR, CoBuABD, PaBuABD, ZCBuABD, CoBuABC, PaBuABC, ZCBuABC, CoVaExD, PaVaExD, ZCVaExD, CoVaExCa, PaVaExCa, ZCVaExCa Variable de estado aa:

AAAAaa OaaExoPrOaaOMaa

dtdOQ

−−=

Variable auxiliar: aaAOMaaA =

tPCRe*OMaaoPrOaa AA = aaA = ((ProA*aaPC)/1000)/PMaa

AAA oPrOaaOMaaOaaEx −= Entrada: Otro submodelo o sección: ProA Constantes y parámetros: aaPC, PMaa, RetPC Variable de estado ACA:

AAAAAACA OACAExOACAManOACAACAOInACA

dtdOQ

−−−=

Variable auxiliar: OInACAA = ACAtAcBu+ACAtGlu+ACAtPr+ACAtaa ACAtAcBu = (((AcA/1000)/PMAc)*IndACAAc)+ (((BuA/1000)/PMBu)*IndACABu) ACAtGlu = ((SmA/1000)/PMGlu)*IndACAGlu ACAtPr = IndACAPr * mPrA IndACAPr = ForATPoPr/ForATPoACA mPrA = (PrA/1000)/PMPr ACAtaa = ATPdeaa/ForATPoACA ATPdeaa = ATPdaa-ATPsPro ATPdaa = OaaExA * ForATPoaa ATPsPro = ReqATPsaa*OaaProA

tPalRe*)OACAManOInACA(OACAACA AAA −= RetPal = 1-(ACAsPal/(ACAsPal+ReqACAsPal)) ACAsPal = ReqATPsPal/ForATPoACA OACAManA = ACAMan ACAMan = ATPMan/ForATPoACA ATPMan = (((IndMan*(OWe/1000)^.75)/IndCalATP)/24)*cC

)tPalRe1(*)OACAManOInACA(OACAEx AAA −−= Entrada: Otro submodelo o sección: AcA, BuA, SmA, para, cC Constantes y parámetros: PMAc, IndACAAc, PMBu, IndACABu, PMGlu, IndACAGlu,

134

ForATPoPr, ForATPoACA, PMPr, ForATPoaa, ReqATPsaa, ForATPoACA, ReqATPsPal, ForATPoACA, ReqACAsPal, OWe, IndMan, IndCalATP Variable de estado Pal:

AAAAPal OPalExOPalPalOACAPal

dtdOQ

−−=

qACAsPalRe/OACAACAOACAPal AA = OPalPalA = OACAPalA - OPalExA OPalExA = PalNo PalNo = ACAsFa/ReqACAsPal ACAsFa = ATPsFa/ForATPoACA ATPsFa = OACAPalA * ReqATPsFa Entrada: Otro submodelo o sección: OACAACAA Constantes y parámetros: ReqATPsFa Variable de estado Fa:

AAAFa OGliFaOPalFa

dtdOQ

+=

OPalFaA = RetFa * OPalPalA * PMPal RetFa = 1-(PalsFa/(PalsFa+ReqPalsFa)) PalsFa = GlusFa/ReqACAsPal GlusFa = ReqGlusFa/ForATPoACA OGliFaA = (OPalPalA * RetFa/3)*PMGli Entrada: Otro submodelo o sección: OPalPalA, PMGli Constantes y parámetros: ReqGlusFa, ForATPoACA, ReqACAsPal, ReqPalsFa, PMPal

Ganancia de peso GaDa = ProDa + FaDa ProDa = ((OaaProACorregido*PMaa)/.2201)*24 OaaProACorregido = OaaProA Difaa = DifATP/ForATPoaa DifATP = DifACA * ForATPoACA DifACA = ACAMan-OInACAA FaDa = O3Pal1GliFaA * 24 O3Pal1GliFaA = OPalFaA + OGliFaA Entrada: Otro submodelo o sección: OaaProA, ACAMan, OInACAA, OPalFaA, OGliFaA Constantes y parámetros: PMaa, ForATPoACA, ForATPoaa

135

136

ANEXO II Cuadro II.1. Fuentes de los datos experimentales utilizados en la validación del modelo Wakax POS en predicción de la GPP por día. Indentificador Bibliografía

V09-V12 M Ferreira and T R Preston (1976) Effect of different concentrations of urea in final molasses given as a supplement to chopped sugarcane for fattening cattle. Trop Anim Prod. 1(2)66-71.

V16-V31 R Silvestre, NA MacLeod and TR Preston (1976) Supplementation of sugar cane/urea for growing cattle: levels of maize grain and a protein concentrate. Trop Anim Prod. 1:206-214.

V32 FJ Alvarez, A Priego and TR Preston (1977) Comportamiento animal en caña de azúcar ensilada. Prod Anim Trop. 2:27-33.

V33 y V35 HM Ferreiro, TR Preston and TM Sutherland (1977) Limitaciones dietéticas de raciones basadas en caña de azúcar. Prod Anim Trop. 2:58-63.

V36-V41 R Silvestre, NA MacLeod and TR Preston (1977) Suplementación de caña de azúcar con urea para engorde de ganado: efecto del maíz y diferentes niveles y fuentes de proteínas. Prod Anim Trop. 2:84-92.

V42 R Silvestre, NA MacLeod and TR Preston (1977) Effect of meal, dried cassava root and groundnut oil in diets based on sugar cane/urea, or molasses/urea. Trop Anim Prod. 2:151-157.

V48 y V49 HM Ferreiro, TM Sutherland, A Wilson and TR Preston (1977) Engorde de ganado con caña de azúcar: comparación de diferentes suplementos. Prod Anim Trop. 2:319-324.

V50 R Silvestre and FD DeB Hovell (1978) Growth of fattening cattle given chopped sugar cane supplement with different levels of wheat bran. Trop Anim Prod. 3:148-151.

V51 A Fernandez, JB Rowe ant TR Preston (1980) Effect of a methane inhibitor on growth performance and rumen VFA of steers fed sugar cane and molasses. Trop Anim Prod. 5:172-176.

Cuadro II.2. Datos de los animales, cantidades de los alimentos suministrados y la GPP por día observada y modelada con el modelo Wakax POS. Indentificador Peso (kg) Raza CZI (kg) Tipo Suplemento Maíz Melaza Observado Modelado

V09 281.5 Cebú (toro) 3.3823 CZP Melaza con 4% urea 0 2.6967 0.366 0V10 280 Cebú (toro) 4.2588 CZP Melaza con 6% urea 0 1.7622 0.398 0V11 244 Cebú (toro) 4.6297 CZP Melaza con 8% urea 0 1.4863 0.493 0.39V12 246.5 Cebú (toro) 4.9254 CZP Melaza con 10% urea 0 1.3706 0.63 0.43V16 179 Cebú (novillo) 3.682 CZP Maíz+urea 0.348 0 0.43 0.13V17 199 Cebú (novillo) 3.948 CZP Maíz+urea 0.522 0 0.4 0.28V18 214.5 Cebú (novillo) 3.944 CZP Maíz+urea 0.696 0 0.49 0.23V19 207 Cebú (novillo) 3.8 CZP Maíz+urea 0.87 0 0.6 0.29V20 228.5 Cebú (novillo) 3.826 CZP Maíz+urea 1.044 0 0 0.28V21 248 Cebú (novillo) 3.822 CZP Maíz+urea 1.218 0 0.43 0.09V22 229.5 Cebú (novillo) 3.788 CZP Maíz+urea 1.392 0 0.7 0.32V23 226 Cebú (novillo) 3.644 CZP Maíz+urea 1.566 0 0.69 0.33V24 208 Cebú (novillo) 3.4617 CZP Maíz+ Melaza+urea 0.348 1.1303 0.5 0.02V25 221.5 Cebú (novillo) 3.3664 CZP Maíz+ Melaza+urea 0.522 1.2816 0.68 0V26 238 Cebú (novillo) 2.739 CZP Maíz+ Melaza+urea 0.696 1.335 0.62 0V27 225 Cebú (novillo) 3.3966 CZP Maíz+ Melaza+urea 0.87 0.9434 0.52 0.26V28 228 Cebú (novillo) 2.7007 CZP Maíz+ Melaza+urea 1.044 1.5753 0.64 0V29 248 Cebú (novillo) 2.8341 CZP Maíz+ Melaza+urea 1.218 0.9879 0.45 0V30 229.5 Cebú (novillo) 3.2923 CZP Maíz+ Melaza+urea 1.392 1.1357 0.43 0.33V31 226 Cebú (novillo) 3.3783 CZP Maíz+ Melaza+urea 1.566 1.0057 0.76 0.39V32 305 Cebú (toro) 3.84798 CZP Miel final 0 0.46102 0.036 0V33 221.1 Cebú (novillo) 2.18 CZP Urea 0 0 0.019 0V35 208.5 Cebú (novillo) 4.17 CZP Urea 0 0 0.412 0V36 163.5 Cebú (novillo) 3.083 CZP Urea+amonio 0 0 0.052 0V37 222.5 Cebú (novillo) 3.4636 CZP Maíz+urea 0.87 0 0.414 0V38 169.5 Cebú (novillo) 3.467 CZP Urea+amonio 0 0 0.05 0V39 212 Cebú (novillo) 4.154 CZP Maíz +urea+amonio 0.87 0 0.292 0.35V40 188 Cebú (novillo) 3.342 CZP Urea+amonio 0 0 0.054 0V41 197 Cebú (novillo) 4.212 CZP Maíz+urea+amonio 0.87 0 0.308 0.39

137

V42 243 Cebú (novillo) 3.502 CZP Urea+amonio 0 0 0.054 0V48 214 Cebú (toro) 3.1009 CZP Miel+urea 0 1.0591 0.037 0V49 276.5 Cebú (toro) 3.149 CZP Maíz+urea 0.435 0 0.051 0V50 227.5 Cebú (toro) 3.39 CZP 0 0 0.062 0V51 225 Cebú (toro) 1.5394 CZP Melaza+urea 0 3.1836 0.364 0

CZI=Caña de azúcar sin raíz, CZP=Caña de azúcar picada

138

Cuadro II.3. Fuentes e información de los datos experimentales utilizados en la validación del modelo Wakax POS en predicción en el Rumen y Ciego de DM(%), AGVs(mM), Ac(%), Pr(%) y Bu(%). Indentificador Bibliografía Peso (kg) Raza CZI (kg) Tipo Suplemento

V32 FJ Alvarez, A Priego and TR Preston (1977) Comportamiento animal en caña de azúcar ensilada. Prod Anim Trop. 2:27-33.

305 Cebú (toro) 3.84798 CZP Miel final

V42 R Silvestre, NA MacLeod and TR Preston (1977) Effect of meal, dried cassava root and groundnut oil in diets based on sugar cane/urea, or molasses/urea. Trop Anim Prod. 2:151-157.

243 Cebú (novillo) 3.502 CZP Urea+amonio

V43-V45

S Minor, NA MacLeod, TR Preston and RA Leng (1977) Studies on digestion in different sections of the intestinal tract of bulls fed sugar cane/urea with different supplements. Trop Anim Prod. 2(2):163-174.

325 Cebú (toro) 3.315 CZP Urea

V44 396 Cebú (toro) 5.4264 CZP Maíz+ureaV45 346 Cebú (toro) 5.699 CZP Maíz+urea

V46 y V47 A Priego, A Wilson and TM Sutherland (1977) Efecto de la caña de azúcar picada y suplementada con pulidura de arroz o harina de yuca sobre los parámetros de fermentación ruminal y tasa de líquido ruminal en toros cebu. Prod Anim Trop. 2:301-308.

300 Cebú (toro) 4.74 CZP Urea

V47 300 Cebú (toro) 4.59 CZP UreaV51 A Fernandez, JB Rowe ant TR Preston (1980)

Effect of a methane inhibitor on growth performance and rumen VFA of steers fed sugar cane and molasses. Trop Anim Pro. 5:172-176.

225 Cebú (toro) 1.5394 CZP Melaza+urea

CZI=Caña de azúcar sin raíz, CZP=Caña de azúcar picada

139