anexo a2.1.1c memoria hasta junio 2015mittic.gobex.es/upload/web/publico/nirs_dehesa_uid3.pdf ·...

27
ANEXO A2.1.1c: Memoria de Actividades de la Tarea 2.1.1 desde enero a junio de 2015. Actividad 2.1.1: Uso de la Tecnología espectroscópica NIRS como herramienta de predicción de parámetros de calidad de los principales productos que ofrece la dehesa-montado: bellotas, pastos y corcho.

Upload: others

Post on 26-Jan-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • ANEXO A2.1.1c:

    Memoria de Actividades de la Tarea 2.1.1 desde enero a junio de 2015.

    Actividad 2.1.1: Uso de la Tecnología espectroscópica NIRS como herramienta de predicción de

    parámetros de calidad de los principales productos que ofrece la dehesa-montado: bellotas,

    pastos y corcho.

  • 2

    MEMORIA DE ACTIVIDADES DE LA TAREA 2.1.1 DE ENERO A JUNIO DE 2015

    Tarea 2.1.1: Uso de la tecnología espectroscópica N IRS como herramienta de predicción de parámetros de calidad de los principa les productos que ofrece la dehesa-montado: bellotas, pastos y corcho

    • Coordinador o investigador responsable

    o Dr. David Tejerina Barrado (CICYTEX. Gobierno de Extremadura).

    • Equipo Técnico

    CICYTEX-Finca La Orden. Gobierno de Extremadura:

    o Dra. Susana García Torres.

    CICYTEX- IPROCOR. Gobierno de Extremadura.

    o Dr. Manuel A. Martínez Cañas.

    o Ldo. Francisco Javier Yuste Córdoba.

    Universidad de Évora/ICAAM. Portugal

    o Dra. Mª Isabel Ferraz de Oliveira.

    o Dr. Fernando Capela e Silva.

    o Dra. Elvira Sales Baptista.

    o Lda. Maria da Graça Machado.

    • Socios participantes

    o CICYTEX- Finca La Orden. Gobierno de Extremadura.

    o CICYTEX- IPROCOR. Gobierno de Extremadura.

    o Universidad de Évora/ ICAAM (Portugal).

    • Periodo al que se refiere el informe: de Enero a junio de 2015

  • 3

    Objetivo de la Tarea

    El objetivo principal de este trabajo, es dar a conocer al ganadero y al gestor de la dehesa la

    composición de los recursos naturales que los cerdos consumen durante la época de Montanera, así

    como categorizar los productos procedentes del corcho a tiempo real, a través de la obtención de

    modelos predictivos fiables, con el mínimo error, mediante tecnología NIRS. A su vez, poder sustituir las

    técnicas analíticas convencionales por otras que sean más económicas, rápidas, no destructivas,

    respetuosas con el medio ambiente y con menor procesado de muestras (menos recursos humanos).

    De este modo se pretende establecer una relación directa entre el uso de las TICs (en este caso el

    NIRs) con un sistema tradicional, como la dehesa; a través del estudio de la calidad de sus recursos

    naturales con mayor importancia económica (bellotas, pasto y corcho).

    Tradición

    TICs

    Recursos Naturales

    Figura 1. Uso de las TICs en la caracterización de los recursos naturales de la dehesa

    El éxito en la ejecución de esta tarea radica en la realización de una serie de actividades secuenciales

    que nos permitan la obtención de los modelos de predicción de las muestras objeto de estudio con

    tecnología NIRs que sean suficientemente sólidos, fiables y eficaces, en colaboración con las entidades

    implicadas y los medios técnicos y humanos disponibles. De este modo las actividades a realizar se han

    dividido en los siguientes grupos:

    1. Actividades de coordinación entre los socios implicados.

    2. Muestreos, para la obtención de la materia prima objeto de estudio.

    3. Determinaciones analíticas, a través de los métodos de referencia para la

    caracterización de los principales parámetros de calidad de interés tanto de bellotas y

    pastos, como de corcho.

    4. Obtención de los datos físico-químicos de dichos parámetros. Procesado y

    tratamiento estadístico de los mismos.

    5. Análisis NIRs.

    • Recogida de espectros.

  • 4

    • Análisis quimiométrico de la matriz de datos espectrales y valores químicos de

    referencia

    • Obtención de las mejores ecuaciones de calibración para cada uno de los

    parámetros propuestos.

    • Validación de las ecuaciones con muestras externas, para la obtención de los

    modelos predictivos, tanto cuantitativos como cualitativos.

    6. Transferencia de resultados al sector.

    Durante el periodo de ejecución al que se refiere este informe se han abordado las tareas que se

    describen a continuación, conforme a lo establecido en el cronograma de tareas adscrito a la memoria

    científica del proyecto (Tabla 1).

    Tabla 1. Cronograma de actividades

    Tras haber realizado los muestreos correspondientes, procesado y almacenamiento de muestras, se

    continuó con las siguientes tareas:

    1.- Actividades de Coordinación

    Desde el momento de la aprobación de proyecto, coincidiendo con el inicio del periodo de Montanera

    (noviembre de 2013), nos coordinamos para la realización de los muestreos de bellotas y pastos en la

    zona del Alentejo portugués y la CCAA de Extremadura en España.

  • 5

    Durante el periodo al que se refiere este informe (de enero a abril de 2015), se han realizado acciones

    de coordinación con los integrantes de los diferentes Centros e Instituciones que integran esta tarea, a

    través de medios telemáticos, como correos webs, videoconferencias y llamadas telefónicas.

    3.- Determinaciones analíticas

    - Bellotas y pastos:

    Se comenzaron los análisis del perfil de ácidos grasos, tanto de bellotas como de pastos, por parte de

    los socios portugueses (Uévora/Icaam), de este modo se cubre el objetivo de las pruebas

    interlaboratorios entre España-Portugal.

    Determinación del perfil de ácidos grasos: El fraccionamiento de la grasa subcutánea se realizará en

    columnas de aminopropil mediante disolventes de polaridad creciente de acuerdo al método de García-

    Regueiro et al., (1995).

    La cuantificación de los ácidos grasos de la grasa y fracciones lipídicas se llevará a cabo por

    cromatografía gaseosa y detección mediante detector de ionización de llama (CG-FID) de los ésteres

    metílicos de los ácidos grasos obtenidos por metilación en medio ácido.

    5.- Análisis NIRS. 5.2.- Obtención de las mejores ecuaciones de calibración para cada uno de los parámetros propuestos.

    � BELLOTAS

    El análisis quimiométrico de los datos espectrales y químicos se realizó mediante el método de

    regresión multivariante por mínimos cuadrados parciales (PLS), usando el software Unscrambler de

    CAMO® (2013).

    Se evaluaron diferentes pretratamientos espectrales a partir de los datos de origen (log 1/R): 1ª y 2ª

    derivada (con varios intervalo de sustracción o GAP y segmento de suavizado), corrección multiplicativa

    de la señal extendido (EMSC), corrección dispersiva desviación estándar normalizada (SNV) y

    combinación de derivadas con EMSC y SNV.

    Para la determinación del número de factores o componentes se utilizó como criterios de decisión el

    análisis de la ganancia en varianza explicada al añadir un nuevo componente al modelo y a través de la

    comparación de la representación gráfica del error cuadrático medio (RMSE= Root Mean Square Error)

    frente al número de componentes, tanto para calibración (RMSEC) como para validación (RMSEP),

    tratando de obtener el modelo más simple con la mejor capacidad predictiva.

    La validación del modelo predictivo se realizó, inicialmente, mediante validación cruzada seleccionando

    aleatoriamente muestras del conjunto de calibración, con un número de segmento de 9 y un número

    de muestras por segmento de 8.

    La habilidad predictiva del modelo se analizó en base al mayor valor del coeficiente de determinación

    (1-VR), el menor error estándar de validación cruzada (EEVC) (Osborne et al., 1993) y la relación entre

  • 6

    desviación estándar y el error estándar de la validación cruzada (DE/EEVC), conocido como índice RPD

    (Williams, 2001), ya que son considerados los estadísticos de mayor peso en la precisión de una

    ecuación NIRS

    - Grasa:

    - Valores químicos de referencia de las muestras de calibración:

    Debido a que un requisito indispensable para las regresiones multivariantes PLS es la

    normalidad de los datos químicos de referencia, lo primero que se hizo fue comprobar ésta.

    Posteriormente se calcularon los estadísticos descriptivos del conjunto de muestras de

    calibración de los valores químicos de la variable que estamos estudiando, el porcentaje de

    grasa, los cuales se muestran en la Tabla 4.

    Tabla 4. Estadísticos descriptivos del conjunto de calibración de bellotas del parámetro grasa.

    N Mínimo Máximo Media DE CV (%)

    Grasa (g·100g-1 MS) 80 0.99 11.25 7.33 1.96 0.27

    Se observa que el rango de valores es bastante amplio entre el conjunto de muestras a

    analizar (0.99-11.25 g·100g-1 MS), lo que va a ofrecer una gran variabilidad al modelo y

    permitir que muestras externas estén dentro de ese rango.

    - Calibración y validación cruzada:

    Los estadísticos correspondientes de los modelos de predicción de la variable grasa con

    diferentes pretratamientos se muestran en la Tabla 5. Se muestra en negrita el modelo que

    presenta los mejores estadísticos de predicción.

    Tabla 5. Estadísticos de predicción del análisis PLS del conjunto de muestras de calibración para el porcentaje en

    grasa en bellota liofilizada.

    PLS n CP

    CALIBRACIÓN VALIDACIÓN CRUZADA RPD (DE/EEvc) Tratamiento R2 EEC 1-VR EEvc DE

    Absorbancia 75 5 0.935 0.481 0.920 0.540 1.810 3.35

    EMSC 76 3 0.875 0.668 0.861 0.711 1.747 2.46

    SNV 76 3 0.877 0.663 0.859 0.717 1.746 2.43

    1,11,15 76 4 0.937 0.476 0.923 0.538 1.792 3.33

    1,11,15+EMSC 75 2 0.909 0.573 0.899 0.609 1.768 2.90

    1,11,15+SNV 75 3 0.924 0.524 0.911 0.569 1.810 3.18

    2,10,15 75 3 0.937 0.423 0.920 0.538 1.803 3.35

    2,10,15 + EMSC 76 2 0.897 0.606 0.879 0.662 1.747 2.64

  • 7

    2,10,15 + SNV 76 2 0.899 0.599 0.889 0.639 1.766 2.76

    EMSC: corrección mutiplicativa extensivas de la señal; SNV: corrección dispersiva desviación

    estándar normalizada; (1,10,15) y (2, 10, 15): el primer término es el orden de la derivada

    aplicada, el segundo el intervalo de sustracción o GAP y el tercero la longitud del segmento de

    suavizado, n: número de muestras, CP. número de términos en la ecuación, R2: coeficiente de

    determinación en calibración, EEC: error estándar de calibración, 1-VR: coeficiente de

    determinación en validación cruzada, EEvc: error estándar de validación cruzada, DE:

    desviación estándar, RPD: coeficiente entre la DE del grupo de validación y el EEvc.

    Si existe un elevado coeficiente de determinación (R2), un bajo error estándar de predicción

    (EEP) y valor RPD>3 (Williams, 2001), se puede considerar como adecuado. Es importante

    que el EEP no sea muy superior al EEL, para considerarlo como método alternativo de análisis

    químico. Cuanto mayor sea el coeficiente de determinación, menor el error estándar de

    predicción y mayor el RPD mejor será el modelo.

    En la Tabla anterior se puede observar que el modelos que presenta mejor comportamiento

    predictivo es en el que se ha aplicado el pretratamiento 2,10,15.

    En la Figura 18 se observa el conjunto de espectros después de aplicar el pretratamiento que

    genera mejores resultados.

    Figura 18. Conjunto de espectros con tratamiento 2,10,15 de las muestras de bellota para la predicción del

    porcentaje en grasa.

    En la Figura 19 se muestra gráficamente el buen ajuste lineal logrado entre los datos

    predichos por el NIRS y los valores reales del método de referencia y se observa una

    distribución homogénea a lo largo de todo el rango de la propiedad.

  • 8

    Figura 19. Relación entre el valor real del laboratorio y el valor predicho en NIRS para el porcentaje en grasa con

    pretatamiento 2,10,15 en calibración y validación cruzada.

    En la Figura 20 se observan las zonas espectrales más importantes, según su coeficiente de

    regresión para la cuantificación del contenido de proteínas.

    Figura 20. Coeficientes de regresión para la determinación del porcentaje en grasa con pretratamiento

    2,10,15.

    Se observa que las longitudes de onda más influyentes están entre los 2300 y los 2500 nm

    que coincide con las longitudes de onda de vibración de los enlaces de la grasa.

    Se ha obtenido un modelo de calibración bastante bueno, por ello para asegurar su fiabilidad

    se realizó una validación externa para asegurar que el valor predicho por el modelo es similar

    al valor químico de refencia.

    - Validación externa:

    Para la validación externa se utilizaron 20 muestras similares a las utilizadas para la

    calibración.

    En la Tabla 6 se muestran los estadísticos descriptivos de este conjunto de muestras, así

    como los valores de R2VE y EEP obtenidos tras la predicción con el modelo seleccionado.

  • 9

    Tabla 6. Estadísticos de predicción de la validación externa del modelo para el porcentaje de grasa.

    N Media DE R2VE EEP

    Grasa (g·100g-1 MS) 20 6.713 1.887 0.821 0.611

    Figura 21. Relación entre el valor real del laboratorio y el valor predicho del porcentaje en grasa 2,10,15 en

    validación externa.

    Se obtiene un alto coeficiente de correlación entre el valor predicho por el modelo y el valor

    real, por lo tanto el modelo propuesto puede ser utilizado con gran fiabilidad para la

    predicción del porcentaje en grasa en bellotas.

    � PASTOS

    • Espectros NIRS:

    El conjunto de espectros NIRS de las muestras de pasto liofilizadas y registrados como se

    indicó anteriormente se muestran en la Figura 22.

  • 10

    Figura 22. Conjunto de espectros NIRS (1000-2500 nm) de las muestras de pasto liofilizadas.

    Del total de las muestras se seleccionaron aleatoriamente el 80% de las muestras para

    calibración y 20% para la validación externa.

    � Análisis de Componentes principales (PCA)

    Se realizó un PCA de las muestras de calibración con el objetivo de ver cómo se comportan las

    muestras, identificar el número óptimo de componentes principales e identificar posibles

    muestras anómalas.

    Se empleó la metodología cross validation para la validación, empleando el método random con

    10 segmentos y 8 muestras por segmento.

    - Gráficos de scores:

    En el gráfico de score vamos a tratar de ver si existen agrupamientos en la variable categórica

    país de recogida de las muestras. En la Figura 23 se muestra el gráfico de score del

    componente principal 2 (PC2) frente al componente principal 1 (PC1) en el que se representan

    en rojo las muestras portuguesas y en azul las muestras españolas. Se puede observar que la

    mayoría de las muestras de Portugal se sitúan en la parte derecha del gráfico y la mayoría de

    las muestras de España se sitúan en la parte izquierda.

    En el gráfico se ha señalado las posibles muestras outliers o muestras que se alejan del

    conjunto de muestras que justamente coinciden con los cuatro espectros que aparecen más

    alejados del conjunto total de espectros.

  • 11

    Figura 23. Representación espacial de las muestras de calibración en base a la información de los PC 1 y 2. Se

    muestran en rojo las muestras de Portugal y en azul las muestras de España.

    - Grafico de influencia:

    Este gráfico también es muy útil para detectar outliers, outliers peligrosos o muestras

    influyentes. En la Figura 24 podemos observar el gráfico de influencia del conjunto de

    calibración para el PC 1.

    Figura 24. Gráfico de influencia del conjunto de muestras de calibración para el PC 1.

    Se observa que las muestras P15, P16 y P18 posee un alto Leverage, lo que significa que es

    una muestra influyente y que deberá ser analizado si es conveniente eliminarla del modelo o

    no.

    Las muestras P45 y E30 poseen una alta varianza residual por lo que las podemos considerar

    como posibles outliers.

    - Porcentaje de la varianza explicada: El gráfico de la varianza explicada de este conjunto de muestras es el que se muestra en la

    siguiente Figura.

  • 12

    Figura 25. Porcentaje de la varianza explicada del conjunto de muestras de calibración.

    En este gráfico se observa que para 3 PC se explicaría el 99.7 % de los datos, por lo tanto

    éste será el número óptimo.

    � Calibración de la composición química con los espectros NIRS.

    - Grasa:

    - Valores químicos de referencia de las muestras de calibración:

    Debido a que un requisito indispensable para las regresiones multivariantes PLS es la

    normalidad de los datos químicos de referencia, lo primero que se hizo fue comprobar ésta.

    Se observó que presentan un comportamiento muy cercano a la normalidad.

    Los estadísticos descriptivos del conjunto de muestras de calibración de los valores químicos

    de la variable grasa se muestran en la Tabla 9.

    Tabla 9. Estadísticos descriptivos del conjunto de calibración de bellotas del parámetro grasa.

    N Mínimo Máximo Media DE CV (%)

    Grasa (g·100g-1 MS) 80 2.90 7.17 4.68 0.90 0.19

    El rango de valores de esta variable de las muestras usadas en la calibración es bastante

    amplio lo que va a ofrecer una gran variabilidad al modelo.

    - Calibración y validación cruzada:

    Los estadísticos correspondientes de los modelos de predicción de la variable grasa se

    muestran en la Tabla 10. Se muestra en negrita el modelo que presenta los mejores

    estadísticos de predicción: 2,10,15 + EMSC.

  • 13

    Tabla 10. Estadísticos de predicción del análisis PLS del conjunto de muestras de calibración para el

    porcentaje en grasa.

    PLS n CP

    CALIBRACIÓN VALIDACIÓN CRUZADA RPD (DE/EEvc) Tratamiento R2 EEC 1-VR EEvc DE

    Absorbancia 80 2 0.3169 0.7365 0.2981 0.755 0.6281 0.8319

    EMSC 80 2 0.3859 0.5983 0.3316 0.7438 0.6281 0.8444

    SNV 80 2 0.3849 0.6989 0.3168 0.7407 0.6281 0.8479

    1,11,15 80 2 0.3392 0.7244 0.3113 0.7546 0.6281 0.8324

    1,11,15 + EMSC 80 4 0.4624 0.6534 0.3409 0.7438 0.6281 0.8444

    1,11,15 + SNV 80 1 0.3257 0.7318 0.3056 0.7545 0.6281 0.8325

    2,10,15 80 2 0.3308 0.7290 0.2904 0.7605 0.6281 0.8259

    2,10,15 + EMSC 80 4 0.4967 0.6322 0.4134 0.6915 0.6281 0.9083

    2,10,15 + SNV 80 2 0.3981 0.6914 0.3008 0.7492 0.6281 0.8383

    EMSC: corrección mutiplicativa extensivas de la señal; SNV: corrección dispersiva desviación

    estándar normalizada; (1,10,15) y (2, 10, 15): el primer término es el orden de la derivada

    aplicada, el segundo el intervalo de sustracción o GAP y el tercero la longitud del segmento de

    suavizado, n: número de muestras, CP. número de términos en la ecuación, R2: coeficiente de

    determinación en calibración, EEC: error estándar de calibración, 1-VR: coeficiente de

    determinación en validación cruzada, EEvc: error estándar de validación cruzada, DE:

    desviación estándar, RPD: coeficiente entre la DE del grupo de validación y el EEvc.

    En la siguiente Figura se puede observar el conjunto de datos espectrales cuando se le aplica

    el pretratamiento con mejor comportamiento predictivo (2,10,15 + EMSC). Se observa la

    simplificación espectral que se produce al realizar este tratamiento.

    Figura 26. Conjunto de espectros con tratamiento 2,10,15 + EMSC de las muestras de pasto para la predicción del

    porcentaje de grasa.

  • 14

    La reducción de variables a través del análisis de componentes principales (PCA) pone de

    manifiesto que para la variable grasa con 4 factores se explica el 87.7 % de la variabilidad

    del modelo. Además se puede observar que en esta distribución de las muestras en el nuevo

    espacio vectorial conformado por los CP1 y 2, se puede observar una diferenciación entre las

    muestras procedentes de España y las muestras procedentes de Portugal.

    Figura 27. Distribución de las muestras en el espacio vectorial conformados por los CP1 (eje x) y CP 2 (eje y) para

    el porcentaje de grasa.

    En la Figura 28 se muestra gráficamente el ajuste lineal logrado entre los datos predichos por

    el NIRS y los valores reales del método de referencia, aunque se observa que no existe una

    muy buena correlación.

    Figura 28. Relación entre el valor real del laboratorio y el valor predicho en NIRS para el porcentaje de

    grasa con pretatamiento 2,10,15 + EMSC en validación cruzada.

  • 15

    En la Figura 29 se observan las zonas espectrales más importantes, según su coeficiente de

    regresión. Valores absolutos altos en los coeficientes de regresión significan zonas

    espectralmente relevantes en la ecuación de predicción.

    Figura 29. Coeficientes de regresión para la determinación del porcentaje de grasa con pretratamiento

    2,10,15+EMSC.

    Se observan que las longitudes de onda más influyentes están entre los 2200 y 2500 nm,

    longitudes características de la vibración de los enlaces de la grasa.

    - Proteina:

    - Valores químicos de referencia de las muestras de calibración:

    Se trata de una variable normal y por tanto se le puede aplicar la regresión PLS.

    Por otra parte, los estadísticos descriptivos del conjunto de calibración para la variable

    contenido de proteínas se muestran en la Tabla 11.

    Tabla 11. Estadísticos descriptivos del conjunto de calibración de bellotas del parámetro grasa.

    N Mínimo Máximo Media DE CV (%)

    Grasa (g·100g-1 MS) 80 7.07 37.39 19.95 6.45 0.32

    El rango de valores de esta variable de las muestras usadas en la calibración es bastante

    amplio lo que va a ofrecer una gran variabilidad al modelo.

    - Calibración y validación cruzada:

    Los estadísticos correspondientes a los modelos de predicción para el contenido de proteina

    de las muestras de pasto para cada pretratamiento espectral realizado se muestran en la

    Tabla 12.

  • 16

    Tabla 12. Estadísticos del conjunto de muestras de calibración para proteínas.

    PLS n CP

    CALIBRACIÓN VALIDACIÓN CRUZADA RPD

    (DE/EEvc) Tratamiento R2 EEC 1-VR EEvc DE

    Absorbancia 80 5 0.9337 1.6501 0.9056 1.9862 6.19 3.11

    EMSC1 78 4 0.9115 1.8387 0.8821 2.1533 5.90 2.74

    SNV 79 4 0.9301 1.6703 0.9134 1.8757 6.09 3.25

    1,11,15 80 5 0.9423 1.5386 0.9206 1.8520 6.22 3.36

    1,11,15 + EMSC 80 3 0.9488 1.4497 0.9382 1.6277 6.24 3.83

    1,11,15 + SNV 80 0.9486 1.5430 0.9335 1.6702 6.24 3.74

    2,10,15 80 7 0.9579 1.3155 0.9261 1.7649 6.27 3.55

    2,10,15 + EMSC 80 3 0.9346 1.6388 0.9157 1.8810 6.19 3.29

    2,10,15 + SNV 80 3 0.9380 1.5284 0.9184 1.7675 5.95 3.37

    EMSC: corrección mutiplicativa extensivas de la señal; SNV: corrección dispersiva desviación

    estándar normalizada; (1,10,15) y (2, 10, 15): el primer término es el orden de la derivada

    aplicada, el segundo el intervalo de sustracción o GAP y el tercero la longitud del segmento de

    suavizado, n: número de muestras, CP. número de términos en la ecuación, R2: coeficiente de

    determinación en calibración, EEC: error estándar de calibración, 1-VR: coeficiente de

    determinación en validación cruzada, EEvc: error estándar de validación cruzada, DE:

    desviación estándar, RPD: coeficiente entre la DE del grupo de validación y el EEvc.

    El conjunto de datos espectrales al aplicar el pretratamiento que genera mejor

    comportamiento predictivo (1, 11, 15 + EMSC) es el que se muestra en la Figura 30.

    Figura 30. Conjunto de espectros con tratamiento 1,11,15 + EMSC de las muestras de pasto para la

    predicción del contenido en proteína.

  • 17

    En el caso de las proteínas la reducción de variables a través de componentes principales

    (PCA) pone de manifiesto que para esta variable con 3 componentes principales se explica el

    93.6 % de la variabilidad del modelo. En la Figura 31 observamos la distribución de las

    muestras en el nuevo espacio vectorial formado por CP1 y CP2.

    Figura 31. Distribución de las muestras en el espacio vectorial conformados por los CP1 (eje x) y CP 2 (eje

    y) para el contenido en proteínas.

    Por otra parte, en la Figura 32 se muestra gráficamente el buen ajuste lineal logrado entre los

    datos predichos por el NIRS y los valores reales del método de referencia y se observa una

    distribución homogénea a lo largo de todo el rango de la propiedad.

    Figura 32. Relación entre el valor real del laboratorio y el valor predicho en NIRS para el contenido en

    proteínas con pretatamiento 1,11,15 + EMSC en calibración y validación cruzada.

    En la Figura 33 se observan las zonas espectrales más importantes, según su coeficiente de

    regresión para la cuantificación del contenido de proteínas.

  • 18

    Figura 33. Coeficientes de regresión para la determinación del contenido en proteína con pretratamiento

    1,11,15+EMSC.

    Se observa que una de las longitudes de onda más influyentes es sobre los 2100 nm, que

    coincide con la longitud de onda de las bandas de combinación del grupo RNH2 característico

    de las proteínas.

    - Validación externa:

    Como se ha obtenido un buen modelo de calibración, posteriormente se realizó una validación

    con muestras externas similares a las utilizadas en la calibración (n=20).

    En la Tabla 10 se pueden observar los estadísticos descriptivos de este conjunto de muestras

    así como los valores de R2VE y EEP obtenido tras la predicción con el modelo seleccionado.

    Tabla 13. Estadísticos de predicción de la validación externa del modelo para el porcentaje de grasa.

    N Media DE R2VE EEP

    Proteína (g·100g-1 MS) 20 18.8 6.19 0.8901 1.99

  • 19

    Figura 34. Relación entre el valor real del laboratorio y el valor predicho del contenido en proteína con

    pretratamiento 1, 11,15 + EMSC en validación externa.

    - Fibra:

    - Valores químicos de referencia de las muestras de calibración.

    Los estadísticos descriptivos de los datos químicos del conjunto de calibración se muestran en

    la Tabla 15.

    Tabla 15.Estadísticos descriptivos para la fibra del conjunto de muestras de calibración.

    N Mínimo Máximo Media DE CV (%)

    Fibra neutro detergente

    (g·100g-1 MS) 80 28.41 86.69 49.70 12.17 0.24

    - Calibración y validación cruzada:

    En la Tabla 16 se muestran los estadísticos descriptivos de los modelos de regresión para el

    contenido en fibra de las muestras de pasto de calibración.

  • 20

    Tabla 16. Estadísticos del conjunto de muestras de calibración para fibra.

    PLS n CP

    CALIBRACIÓN VALIDACIÓN CRUZADA RPD

    (DE/EEvc) Tratamiento R2 EEC 1-VR EEvc DE

    Absorbancia 80 6 0.863 4.470 0.814 5.270 11.302 2.14

    EMSC1 80 10 0.921 3.382 0.844 4.821 11.726 2.43

    SNV 80 10 0.910 3.619 0.838 4.897 11.761 2.40

    1,11,15 80 5 0.889 4.017 0.845 4.816 11.546 2.39

    1,11,15 + EMSC 80 5 0.888 4.039 0.853 4.679 11.358 2.42

    1,11,15 + SNV 80 5 0.889 4.039 0.849 4.748 11.394 2.40

    2,10,15 80 4 0.890 4.007 0.863 4.513 11.333 2.51

    2,10,15 + EMSC 80 4 0.892 3.966 0.849 4.741 11.340 2.39

    2,10,15 + SNV 80 4 0.892 3.972 0.854 4.645 11.318 2.43

    EMSC: corrección mutiplicativa extensivas de la señal; SNV: corrección dispersiva desviación

    estándar normalizada; (1,10,15) y (2, 10, 15): el primer término es el orden de la derivada

    aplicada, el segundo el intervalo de sustracción o GAP y el tercero la longitud del segmento de

    suavizado, n: número de muestras, CP. número de términos en la ecuación, R2: coeficiente de

    determinación en calibración, EEC: error estándar de calibración, 1-VR: coeficiente de

    determinación en validación cruzada, EEvc: error estándar de validación cruzada, DE:

    desviación estándar, RPD: coeficiente entre la DE del grupo de validación y el EEvc.

    Se observa que el modelo que genera mejores estadísticos es aquel en el que se realizó el

    pretratamiento 2,10,15

    En la Figura 35 se observa la simplificación espectral que genera este pretratamiento.

    Figura 35. Conjunto de espectros con tratamiento 2,10,15 de las muestras de pasto para la predicción de

    la fibra.

  • 21

    Con 4 componentes principales (PC) se explica el 86.33% de la variabilidad del modelo. En la

    Figura 26 se observa la distribución de las muestras en el nuevo espacio vectorial formado por

    el CP1 y el CP2.

    Figura 36. Distribución de las muestras en el espacio vectorial conformados por los CP1 (eje x) y CP 2 (eje y) para

    la fibra en pasto.

    Posteriormente en la Figura 37 se muestra el buen ajuste lineal logrado entre los datos

    predichos por el NIRS y los valores reales del método de referencia.

    Figura 37. Relación entre el valor real del laboratorio y el valor predicho por NIRS para el contenido en fibra con

    pretatamiento 2,10,15 en calibración y validación cruzada.

    Las zonas espectrales más importantes para la fibra serán las que presenten coeficientes de

    regresión mayores en valor absoluto. Como se puede observar en la Figura 38, en este caso

    las longitudes de onda de 1400 nm y de 2200 a 2400 nm son las más influyentes.

  • 22

    Figura 38. Coeficientes de regresión para la determinación de la fibra en pasto con pretratamiento 2,10,15.

    - Validación externa:

    Finalmente, una vez seleccionado el mejor modelo se realizó una validación con muestras

    externas similares a las utilizadas en la calibración (n=20).

    En la Tabla 17 se pueden observar los estadísticos descriptivos de este conjunto de muestras,

    así como los valores de R2VE y EEP obtenidos después de la predicción con el modelo

    seleccionado.

    Tabla 17. Estadísticos de predicción de la validación externa del modelo para la fibra.

    N Media DE R2VE EEP

    Fibra (g·100g-1 MS) 20 48.10 14.25 0.95 3.06

    Figura 39. Relación entre el valor real del laboratorio y el valor predicho del contenido en fibra con pretratamiento

    2, 10,15 en validación externa.

  • 23

    - α-tocoferol:

    - Valores químicos de referencia de las muestras de calibración:

    Los estadísticos descriptivos de los datos químicos del conjunto de calibración se muestran en

    la Tabla 18.

    Tabla 18. Estadísticos descriptivos para el α-tocoferol del conjunto de muestras de calibración.

    N Mínimo Máximo Media DE CV (%)

    α-tocoferol (µg·g-1 MS) 80 6.40 161.48 56.45 38.23 0.67

    - Calibración y validación cruzada:

    Como en los casos anteriores se realizó una calibración por mínimos cuadrados parciales con

    distintos pretratamientos. En la Tabla 19 se muestran los estadísticos descriptivos de los

    modelos de regresión para el α-tocoferol de las muestras de pasto de calibración.

    Tabla 19. Estadísticos del conjunto de muestras de calibración para el α-tocoferol de las muestras de pasto de

    calibración.

    PLS n CP

    CALIBRACIÓN VALIDACIÓN CRUZADA RPD (DE/EEvc) Tratamiento R2 EEC 1-VR EEvc DE

    Absorbancia 78 3 0.599 24.169 0.568 25.887 29.60 1.14

    EMSC1 79 3 0.617 23.605 0.577 25.106 29.52 1.17

    SNV 79 3 0.633 23.088 0.613 24.006 30.46 1.27

    1,11,15 80 3 0.632 23.058 0.571 25.081 30.43 1.21

    1,11,15 + EMSC 80 2 0.613 23.627 0.546 25.900 29.463 1.14

    1,11,15 + SNV 79 3 0.655 22.392 0.576 24.954 31.74 1.27

    2,10,15 79 4 0.661 22.031 0.584 24.731 31.43 1.27

    2,10,15 + EMSC 78 5 0.746 18.233 0.592 23.227 32.08 1.38

    2,10,15 + SNV 78 5 0.747 18.197 0.623 22.722 31.80 1.40

    EMSC: corrección multiplicativa extensivas de la señal; SNV: corrección dispersiva desviación

    estándar normalizada; (1,10,15) y (2, 10, 15): el primer término es el orden de la derivada

    aplicada, el segundo el intervalo de sustracción o GAP y el tercero la longitud del segmento de

    suavizado, n: número de muestras, CP. número de términos en la ecuación, R2: coeficiente de

    determinación en calibración, EEC: error estándar de calibración, 1-VR: coeficiente de

    determinación en validación cruzada, EEvc: error estándar de validación cruzada, DE:

    desviación estándar, RPD: coeficiente entre la DE del grupo de validación y el EEvc.

  • 24

    El modelo que genera mejores estadísticos es aquel en el que se realizó el pretratamiento

    2,10,15 + SNV. La simplificación espectral que genera este pretratamiento se observa en la

    Figura 40.

    Figura 40. Conjunto de espectros con tratamiento 2,10,15 + SNV de las muestras de pasto para la

    predicción del alfa tocoferol.

    Con 5 componentes principales (PC) se explica el 62.30% de la variabilidad del modelo. En la

    Figura 31 se observa la distribución de las muestras en el nuevo espacio vectorial formado por

    el CP1 y el CP2.

    Figura 41. Distribución de las muestras en el espacio vectorial conformados por los CP1 (eje x) y CP 2 (eje y) para

    el alfa tocoferol en pasto.

    Posteriormente en la Figura 42 se muestra el ajuste lineal logrado entre los datos predichos

    por el NIRS y los valores reales del método de referencia. No es un ajuste lineal perfecto si

    bien puede ser bastante útil en la determinación de este parámetro considerando el error que

    se comete.

  • 25

    Figura 42. Relación entre el valor real del laboratorio y el valor predicho por NIRS para el contenido en alfa

    tocoferol con pretatamiento 2,10,15 + SNV en calibración y validación cruzada.

    Las zonas espectrales más importantes para el alfa tocoferol serán las que presenten

    coeficientes de regresión mayores en valor absoluto, las cuales se pueden observar en la

    Figura 43,

    Figura 43. Coeficientes de regresión para la determinación de alfa tocoferol en pasto con pretratamiento 2,10,15

    + SNV.

    - Validación externa:

    Finalmente, una vez seleccionado el mejor modelo se realizó la validación con muestras

    externas como en los casos anteriores.

    En la Tabla 20 se pueden observar los estadísticos descriptivos de este conjunto de muestras,

    así como los valores de R2VE y EEP obtenidos tras la predicción con el modelo seleccionado.

    Tabla 20. Estadísticos de predicción de la validación externa del modelo para el alfa tocoferol.

    N Media DE R2VE EEP

    Alfa tocoferol (µg·g-1 MS) 20 68.61 35.28 0.70 18.71

  • 26

    Figura 44. Relación entre el valor real del laboratorio y el valor predicho del contenido en alfa tocoferol con

    pretratamiento 2,10,15 + SNV en validación externa.

    Conclusiones.

    Se ha logrado una muy buena calibración para la predicción del porcentaje en grasa en bellotas y para

    el contenido en proteínas y fibra en pasto. Además para el contenido de α-tocoferol en pasto se ha

    obtenido una calibración no tan buena como en los casos anteriores pero sí aceptable. Estas

    calibraciones pueden ser utilizadas a partir de ahora para el análisis de rutina en nuestro laboratorio sin

    necesidad de recurrir a los análisis químicos.

  • 27

    Bibliografía:

    � AOAC, 2003. Official methods of analysis of the Association of Official Analytical Chemists (17th ed.). Gaithersburg, MD: AOAC International.

    � Cano, A., Hernández-Ruiz, J., García- Canovas, F., Acosta, M. & Arnao, M.B. 1998. An end-point meted for estimation of the total antioxidant activity in plant material. Phytochem Anal, 9, 196-202.

    � Cayuela, J.M., Garrido, M.D., Sancho Bañón, J. & Ros, J.M. 2003. Simultaneus HPLC Análisis of α-tocopherol an cholesterol in fresh pig meat. J Agric Food Chem, 51, 1120-1124.

    � Folch, J.; Lees, M. & Sloane Stantley, G. H. (1957). A simple method for the isolation and purification of total lipids from animal tissues. J. Biol. Chem., vol. 226, pp. 497-509.

    � Liu, Q., Scheller, K.K. & Schaeffer, D.M. 1996. Technical note: a simplified procedure for vitamin E determination in beef muscle. J Anim Sci, 74, 2406-2410.

    � Singlenton, V. L. & Rossi, J.A. 1965. Colorimetry if total phenolics with phosphomolybdic-phosphotungtic acid reagents. Am J Enol Vitic, 16,144-158.

    � SPSS.PC+ (2005). SPSS Trends 14.0. SPSS Inc. Chicago. EEUU. � Waterman, P.G. & Mole, S. 1994. Extraction and quantification. Vainillin method. In:

    Analysis of phenolic plant metabolites. Blackwell Scietific Publication, Oxford.