uso de grandes datos (big data) en la agricultura- caso de estudio fedearroz en colombia

25
www.ciat.cgiar.org Agricultura Eco-Eficiente para Reducir la Pobreza Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia Big Data

Upload: decision-and-policy-analysis-program

Post on 20-Aug-2015

1.031 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

www.ciat.cgiar.org Agricultura Eco-Eficiente para Reducir la Pobreza

Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio

FEDEARROZ en Colombia

Big Data

Page 2: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Información eventos productivos (cosechas) = Grandes datos

•Utilizar información de eventos productivos para entender la variabilidad en la producción •De reduccionista a holístico (combinación de factores y sus interacciones) •Basado en los principios de investigación operacional •Generación de conocimiento para tomadores de decisiones en agricultura (investigadores, gremios, extensionistas, agricultores) •N= Todo (eventos productivos)

Page 3: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Identificar factores o combinaciones de factores que conducen a altas o bajas producciones

+ + =

Clima Suelo Manejo agronómico Producción

Rdto/ha

% ? + % ? + %? = A Explicar (100 %)

PARA:

Cómo hacerlo?

Page 4: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Información primaria: capturada a través de diferentes fuentes – Plataforma en línea Información secundaria : Bases de datos existentes

Cómo hacerlo?

Análisis

Reporte

Captura Limpieza, organización, almacenamiento

Interpretación, validación

Divulgación

Motor cuyo combustible son los datos !

Page 5: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Caso de estudio datos FEDEARROZ en Colombia

Colombia? laboratorio natural

Page 6: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Colombia? FEDEARROZ un gremio que ha compartido información

De lo general…………………………………………………………….. A lo específico

ENA (Encuesta Nacional Arrocera) 3 semestres de datos • 2010A : • 2011A : • 2012A : Total : alrededor de 400 eventos productivos

Registros de cosecha

• Saldaña y Purificación

o 08/2009 a 12/2012

o 530 eventos productivos

• Casanare – Yopal o 07 a 09/2013

o 91 eventos productivos

• Monteria (CI La Victoria) o 2012A

o 192 eventos productivos

Caso de estudio datos FEDEARROZ en Colombia

Page 7: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Rendimientos promedios zona llanos por sistema de riego, periodo 2010-2012. Fuente ENA FEDEARROZ

Baja productividad inhabitual

Rendimientos promedios nacionales por sistema de riego, periodo 2010-2012. Fuente ENA FEDEARROZ

3000

3800

4600

5400

6200

7000

2010A 2011A 2012A

Re

nd

imie

to (

Kg/

HA

)

Semestre evaluado

Zona llanos

Riego integral Secano mecanizado

3000

3500

4000

4500

5000

5500

6000

6500

7000

2010A 2011A 2012A

Re

nd

imie

to (

Kg/

HA

)

Semestre evaluado

Riego integral Riego complementario Secano mecanizado

N= alrededor de 400 eventos productivos

Page 8: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Panorama actual de la producción

Desempeño de variedades de arroz bajo 4 diferentes zonas agroecológicas

Sistema riego integral Rendimiento de las diferentes variedades en función de la zona

N= alrededor de 400 eventos productivos

Page 9: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

• Cuenta con estación meteorológica

• Ha Compartido

información

Saldaña 08/2009 a

12/2012 N: 530 eventos

productivos

Caso específico estación de Saldaña

Clima (%) + Suelo + Manejo agronómico = Rdto/Lote

Page 10: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Siembra Cosecha

Un evento productivo de arroz = alrededor de 120 días

Serie climática completa para 5 variables

Lote

tiempo

Hipótesis de trabajo

la variación del rendimiento en arroz en Saldaña esta asociada al clima

Page 11: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

6.12

5.59

5.04

3.39 2.97

2.33

0.86

0

2

4

6

8

Tmx Tmean Ener_min Ener_Accu Tmin Days_Tmax1 AccuT_Base11

% C

on

trib

uci

ón

al R

2

Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con todas las variedades, N = 329

Clima (%) + Suelo (%) + Manejo agronómico (%) = Rdto/Lote

Clima explica: 26.3 % del rendimiento

Arroz Información secundaria -> FEDEARROZ un gremio con información

Page 12: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Para FEDEARROZ 733, el clima explica el 37% del rendimiento

Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con por variedad

Para Lagunas, el clima explica el 22% del rendimiento

10.43

6.20 6.03 4.78

3.76 3.74

1.92

0.00

2.00

4.00

6.00

8.00

10.00

12.00

% d

e v

aria

nza

exp

licad

a

Fedearroz 733

8.05

6.57

3.53

1.26 1.03 0.94 0.50

0.00

2.00

4.00

6.00

8.00

10.00

% d

e v

aria

nza

exp

licad

a

Lagunas

Información secundaria -> FEDEARROZ un gremio con información

N = 98

N = 112

Page 13: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Perfiles de las variables – conocimiento valioso ! – Aprovechando el poder de la tecnología

0

1500

3000

4500

6000

7500

9000

34 35 36 37 38 39

Re

nd

imie

nto

Tmax

Tmax

0

1500

3000

4500

6000

7500

9000

52000 53000 54000 55000 56000 57000 58000

Re

nd

imie

nto

Ener_accut

Ener_accu

Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con variedad FEDEARROZ 733

Arroz

10.43

6.20 6.03 4.78

3.76 3.74

1.92

0.00

2.00

4.00

6.00

8.00

10.00

12.00

% d

e v

aria

nza

exp

licad

a

Fedearroz 733

Información secundaria -> FEDEARROZ un gremio con información

No lineal - Naturaleza

N = 98

Page 14: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Cómo aumentar la predicción?

Análisis por etapas fenológicas : Trabajo multidiciplinario , combinación FEDEARROZ CIAT

VEG

Ini Pan

FLOR

VEG

Ini Pan

FLOR

Variedad 1 Variedad 2

Siembra Cosecha

Fase vegetativa

Iniciación panícula

Floración

Llenado grano

Arroz

Page 15: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Todos los eventos (2010 hasta 2012), todas las variedades, trabajando en conjunto, N= 329

• Pasamos de explicar con clima 26.3 % a 44.3 % con etapas fenológicas • Siembras orientadas a aprovechar al máximo Eneraccu_llen. Mitigar influencia del

clima • Bases de mejoramiento para el futuro

Arroz

17.76

6.03

3.06 2.74 2.56 1.87 1.56 1.51 1.46 1.38 1.31

0.85 0.69 0.53 0.53 0.50

0

5

10

15

20

Var

ian

za e

xplic

ada

Perfil de la variable – Eneraccu_LLEN

Alcanzamos a explicar más del

40 % de variación en el rendimiento

Page 16: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

16.5

6.1 7.9

25.7

0.0

5.0

10.0

15.0

20.0

25.0

30.0

VEGETATIVA BOOT FLOR LLEN

R2 p

or

el m

od

elo

de

re

gre

sió

n

Etapa del cultivo

Análisis por ventana

7.93

6.38

2.11

0

2

4

6

8

10

Eneraccu_VEG Tmin_VEG TEMPavg_VEG

% V

aria

nza

exp

licad

a

VEGETATIVA

3.53

1.26 0.73

0

1

2

3

4

Tmax_BOOT Tmin_BOOT GDaccu11_BOOT

% V

aria

nza

exp

licad

a

BOOT

4.81

2.88

0

1

2

3

4

5

6

Tmin_FLOR Tmax_FLOR

% V

aria

nza

exp

licad

a

Axis Title

FLOR 21.79

1.52 1.06 0.88

0

5

10

15

20

25

% V

aria

nza

exp

licad

a

LLEN

Arroz

N = 329

Page 17: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Resultados preliminares con manejo agronómico

Clima (%) + Suelo + Manejo agronómico = Rdto/Lote

Fecha de siembra evaluada en día calendario, cuantos días tiene el cultivo

tomando como referencia el 1 de enero

canhec Cantidad de semilla por hectárea (Kg/HA)

cultant1 Cual fue el cultivo anterior

nitroge Cantidad de nitrógeno por hectárea utilizado sobre el cultivo (kg/HA)

fosfate Cantidad de fosforo por hectárea utilizado sobre el cultivo (kg/HA)

potash Cantidad de potasio por hectárea utilizado sobre el cultivo (kg/HA)

numfer Número de veces que el cultivo fue fertilizado

numher Número de veces que el cultivo fue tratado con herbicidas

numins Número de veces que el cultivo fue tratado con insecticidas

numfun Número de veces que el cultivo fue tratado con funguicidas

duracin_ciclo Duración en días del ciclo productivo

sistecose Sistema de cosecha implementado en el cultivo

humedad Humedad del grano en %

impure Impureza del grano en %

semestre Semestre en el que el cultivo es establecido

vartip Tipo de variedad (certificado/No Certificado)

variedad Variedad utilizada en el cultivo

cozona Zona en la que fue sembrada el cultivo

sistema Sistema en el que fue sembrado el cultivo

rend Rendimiento del cultivo (kg/HA)

siembra

Page 18: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Fedearroz 733 ZONA 1 (Centro) Sistema de riego 1 (Riego Integral)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 13448.43 1667.654 8.064 1.03E-07 ***

fosfate -18.774 5.819 -3.226 0.004236 **

potash 13.748 3.354 4.099 0.000559 ***

numins -347.542 94.22 -3.689 0.001455 **

numfun 262.812 98.161 2.677 0.014476 *

duracin_ciclo -41.153 13.212 -3.115 0.005457 **

semestre2011A -688.294 372.795 -1.846 0.079701 .

semestre2012A -1543.34 353.488 -4.366 0.000299 ***

vartipN -488.663 286.116 -1.708 0.103128

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 427.2 on 20 degrees of freedom

Multiple R-squared: 0.7863, Adjusted R-squared: 0.7009

27.37

14.14

10.09 8.76

7.40 5.49 5.37

0.00

5.00

10.00

15.00

20.00

25.00

30.00

Var

ian

za e

xplic

ada

N= 32 eventos de producción

78 % de variación en el rendimiento

Resultados preliminares con manejo agronómico

Page 19: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Fedearroz 733 ZONA 3 (Nororiental) Sistema de riego 1 (Riego Integral)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 7180.568 996.539 7.206 5.64E-07 ***

nitroge 12.308 5.193 2.37 0.028 *

fosfate 6.473 4.671 1.386 0.181

potash -10.59 6.169 -1.717 0.1015

numfer -541.692 195.855 -2.766 0.0119 *

vartipN -960.314 350.047 -2.743 0.0125 *

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 779.7 on 20 degrees of freedom

Multiple R-squared: 0.5558, Adjusted R-squared: 0.4447

F-statistic: 5.005 on 5 and 20 DF, p-value: 0.003912

28.08

10.37 9.01

5.63

2.48

0.00

5.00

10.00

15.00

20.00

25.00

30.00

vartip numfer nitroge fosfate potashV

aria

nza

exp

licad

a

N=26 eventos de producción

55 % de variación en el rendimiento

Vartip: Tipo de variedad (certificado/No Certificado)

Resultados preliminares con manejo agronómico

Page 20: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Fedearroz 60 ZONA 1 (Centro) Sistema de riego 1 (Riego Integral)

Estimate Std. Error t value Pr(>|t|)

(Intercept) 3690.987 861.08 4.286 0.000444 ***

siembra 5.633 2.637 2.136 0.046704 *

canhec 14.776 3.703 3.991 0.000857 ***

potash 3.886 2.52 1.542 0.140414

numfer 302.712 86.07 3.517 0.002462 **

numher -451.635 109.235 -4.135 0.000623 ***

numins -213.417 105.87 -2.016 0.058995 .

semestre2011A -371.702 373.825 -0.994 0.333247

semestre2012A 1376.037 765.684 1.797 0.089113 .

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 508.1 on 18 degrees of freedom

Multiple R-squared: 0.7016, Adjusted R-squared: 0.569

F-statistic: 5.291 on 8 and 18 DF, p-value: 0.00162

20.47

12.40 11.39

9.14 8.64

5.37

2.76

0.00

5.00

10.00

15.00

20.00

25.00

numher semestre canhec numfer siembra potash numins

Var

ian

za e

xplic

ada

N= 27 eventos de producción

70 % de variación en el rendimiento

Resultados preliminares con manejo agronómico

Page 21: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Fedearroz 473 ZONA 4 (Noroccidental) Sistema de riego 1 (Riego Integral)

89.3 % de variación en el rendimiento

29.92

17.18

12.99

9.17 8.68

6.12 5.25

0.00

5.00

10.00

15.00

20.00

25.00

30.00

35.00

Var

ian

za e

xplic

ada

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 16194.3 5881.317 2.754 0.0249 *

canhec 10.56 6.08 1.737 0.1206

cultant1 -279.315 263.478 -1.06 0.32

nitroge 19.214 5.982 3.212 0.0124 *

numher 206.886 171.314 1.208 0.2617

duracin_ciclo-107.901 47.52 -2.271 0.0528 .

semestre2012A-2028.42 764.114 -2.655 0.029 *

vartipN 667.718 432.321 1.544 0.161

vartipP -264.846 599.059 -0.442 0.6701

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 510 on 8 degrees of freedom

Multiple R-squared: 0.893, Adjusted R-squared: 0.786

F-statistic: 8.347 on 8 and 8 DF, p-value: 0.00351

N= 17 eventos de producción

Resultados preliminares con manejo agronómico

Page 22: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Improarroz 1550 ZONA 2 (Llanos) Sistema de riego 3 (Secano Mecanizado)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 6346.356 1070.254 5.93 0.00103 **

siembra -12.365 5.164 -2.395 0.05369 .

cultant1 -111.82 61.405 -1.821 0.11845

numfer -247.794 123.417 -2.008 0.09144 .

numher -623.946 201.154 -3.102 0.02107 *

numins 591.289 205.221 2.881 0.02801 *

numfun 1026.2 314.061 3.268 0.01709 *

semestre2011A -1169.03 309.927 -3.772 0.00927 **

semestre2012A -2506.37 643.193 -3.897 0.00801 **

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 475.2 on 6 degrees of freedom

Multiple R-squared: 0.8956, Adjusted R-squared: 0.7565

F-statistic: 6.436 on 8 and 6 DF, p-value: 0.01783

41.59

19.90

7.31 6.55 6.04 5.80

2.38

0.00

5.00

10.00

15.00

20.00

25.00

30.00

35.00

40.00

45.00

semestre numfun numins cultant1 siembra numher numferV

aria

nza

exp

licad

a

N=15 eventos de producción

89 % de variación en el rendimiento

Resultados preliminares con manejo agronómico

Page 23: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Conclusiones

• Las herramientas de análisis han arrojado resultados preliminares que tienen sentido

• Trabajo multidisciplinario mucho más poderoso que el individual (fisiólogos, agrónomos, estadísticos, fitomejoradores, acompañamiento de expertos)

• Por ahora clima y manejo… a probar suelos… otros factores

• A mayor cantidad de información mayor confiabilidad y robustez de los resultados

Page 24: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Perspectivas

• Acercamiento que responde a los propósitos de donantes

y clientes (product- outcome- impact)

• Explotación de información que ha sido obtenida con múltiples fuentes y diferentes propósitos para generar nuevo conocimiento para acelerar el desarrollo en la agricultura

• En la medida que hayan datos disponibles se puede hacer en cualquier lugar

• Mas importante….

Page 25: Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio FEDEARROZ en Colombia

Agricultura Específica por Sitio (AEPS) y uso de grandes datos (Big Data) en la Agricultura

http://www.youtube.com/watch?v=qju9Y-X1mN8

Información primaria: capturada a través de diferentes fuentes :

• Hoy arroz en Colombia pero las herramientas, recurso humano, tecnológico , voluntad y pasión están al

servicio de toda la región !

Muchas gracias por su atención !

Contacto : Daniel Jiménez R

[email protected]