“soluciones de big data como herramientas de mejoramiento...
TRANSCRIPT
“Soluciones de Big Data como herramientas de mejoramiento genético”
Ing Agr. Nicolas Garcia DutriezGerente de Proyectos y Coordinación
Resumen
• Descripción del problema
• Metodología de trabajo / Soluciones en producción
• Análisis Información y necesidades a mediano-largo plazo
Don Mario hoy
750Empleados
187 Localidades Investigacion
9Estaciones
Headquarters CAMBÉParaná State
BRASILPto Nacional (TO) – Rio
Verde (GO) – P.Fundo (RS) y L. de Rio V. (MT)
HeadquartersSan Isidro
ARGENTINA
CHACABUCOProvincia de Bs As
ARGENTINA
321 R&D Localidades
CHARATAProvincia de Chaco
ARGENTINA
DEWITTArkansas
EEUU
Don Mario en la cadena de valor
Genetica y semillas de
soja
Produccion primaria Industrialización
Produccionde granos
Production:
•Harina•Aceite•Biodiesel•Alimentacion animal•Alimentos humana
Mercados int y ext
Otros insumosBiotecnología
19 LOCS – 40.000 PLOTS
6 EMPLOYEE
32.000.000 has
70 LOCS – 350.000 PLOTS
50 EMPLOYEES
28.000.000 has
60 LOCS - 675.000 PLOTS
72 EMPLOYEES
19.000.000 has
6 LOCS – 3.000 PLOTS
3 EMPLOYEES
1.000.000 has
8 LOCS – 4.500 PLOTS
3 EMPLOYEES
1.500.000 has2 LOCS – 500 PLOTS
400.000 has
6 LOCS – 2700 PLOTS
3 EMPLOYEES
2.500.000 has
PROGRAMA GLOBAL DE MEJORAMIENTO
BASE DE GERMOPLASMA
• Amplitud: esta definida por el tamaño o escala del programa y por la cantidad de individuos evaluados año tras año. Medición: variedades y microparcelas.
• Diversidad: es la variabilidad genética que existe entre los individuos evaluados. A > Diversidad > probabilidad de encontrar variedades adaptadas a la s distintas exigencias agroecológicas.
• Distribución Espacial: Red de Ensayos . Nos permite explorar la Amplitud y la Diversidad con el mayor grado de precisión posible. Atender las necesidades de las distintas micro y macro regiones , encontrando el mejor producto para cada una de ellas.
INVERSIÓN EN INVESTIGACIÓN
PONER TEXTO FUERA DE IMAGEN
INVESTIGACION DESARROLLO Y PROMOCION
20/70 LOCALIDADESx 3 REPETICIONES
PRODUCCION
25/40 LOCALIDADESx 3 REPETICIONES
25/40 LOCALIDADESx 3 REPETICIONES
25/25 LOCALIDADESx 3 REPETICIONES
6 LOCALIDADESx 2 REPETICIONES
6 LOCALIDADESx 1 REPETICIONES
1 LOCALIDADES x 1 REPETICIONES
50/70 LOCALIDADES
22/70 LOCALIDADES40 PRECOMERCIALES
300 ELITE LINES
1.000 LINEAS ELITE
10.000 LINEAS PREAVANZADAS
40.000 LINEAS PRELIMINARES
400.000 SURCOS PROGENIE
1000 a 4000 ha. Pre- básica
50a 150 ha. Fundadora seed
3 ha. Breeder
200 Kg.
10 Kg.
VARIEDADES COMERCIALES
CB - POBLACIONES
5-6 AÑOS
Programa de mejoramiento global
MASTERPLAN PBS-MAX
• 7 PERSONAS TRABAJANDO
• ALTA INVERSIONAnálisis Transacción
Base de Datos de Información
Biológica de Variedades
Base de Datos Transaccional
Business Analytics
Statistical Analysis
Sistema de Investigación *
Laboratory Information Management System
Colaboración: Portal de Investigación
Búsqueda Consolidada
SeguridadSeguridad
Portal de Capacitación y Self ServicePortal de Colaboración
E-learningGestión del Conocimiento Base de Datos Documental
Planificacion PBS-MAX
� Cría� Testing
• Ensayos• Incrementos
� Análisis• Análisis de Lógica• Análisis Estadísticos• Análisis de Negocio
Reportes� Operaciones
Macroprocesos Contexto Interno Contexto Interno
� Stewardship� Seguridad� Trigo� Sanidad
ago sep oct nov dic ene feb mar abr ## jun jul ago sep oct nov dic ene feb mar abr ## jun jul ago sep oct nov dic ene feb mar abr ## jun jul ago sep oct nov dic
2012 2013 2014 2015
PLAN
CAMP
12-13
CLAVES POR SIST. + SEL FINAL
PESADA 12-13
REORG.MENUS
INCREMENTOS
USA
SEL PREL Y CONTROL DE
TIRADA
PYTO BAUFEST
BRASIL
PY BOL-TUCU
DESARROLO DE HERRAMIENTAS DM
LOG GALPON
SEL +
INTEGRACION BRASIL
AYUDA
ANAL.SANIT. INCREMENT
IMPL. TABLETS
REPORTES
CRIA
INICIO PYTO
BAUFEST
TABLETA
SANIDAD
GALPON
COSTOS-VIABILIDAD
LIMS SHAREPOINT
HERRAMIENTAS DE ANÁLISIS
INTEGRACION USA
CONECTIVIDAD BRASIL + TUCUMAN + DE WITT
COSTOS-VIABILIDADEJECUCION
SIS NUEVO (Fase 1)
SIS ACTUAL:EVOL
PESADA 13-14
USABRASIL
TUCUMAN
PESADA + SEL ASINC
ANALISIS BAUFEST
Estructura / Equipos de trabajo
� Negocio� Conexiones
Datos Fenotipicos
Datos de rendimiento: 1,200,000
Datos sanitarios: 600,000
Datos de campo: 3,000,000
Datos Laboratorio de Biotecnologia
Seleccion de genes de Traits
Fingerprint
Nuevos marcadores
Seleccion de genes de Traits
Analisis de Pureza
Seleccion assistida por marcadores
Presencia adventicia
Datapoints : 5,000,000
ADN de la soja
• 20 Cromosomas
• 46,400 genes (mas del doble que el humano)
• 1,100,000,000 pares de bases
Célula
Núcleo Cromossomo
DNA
Gene
Fragmento de ADN responsable por el control de uma
determinada caracteristica
Marcadores moleculares
ACTGCTATGCTAGCTAGCTGACTAGCTGATCGATGCTGACTAGCTA
ACTGCTATGCTAGCTAGGTGACTAGCTGATCGATGCTGACTAGCTA
ACTGCTATGCTAGCTAGCTGACTAGCTGATCGATGCTGACTAGCTA
ACTGCTATGCTAGCTAGGTGACTAGCTGATCGATGCTGACTAGCTA
ACTGCTATGCTAGCTAGGTGACTAGCTGATCGATGCTGACTAGCTA
Suscetível
Suscetível
Resistente
Resistente
Resistente
SNP (Single Nucleotide Polimorphism)
Secuencia de DNA ligada a un gen o dentro de la secuencia del gen de interes
Biotecnologia GDM
Selección asistida por marcadores moleculares
• Selección de genes de interés
• Backcross asistido
• Fingerprints
• Selección de regiones con QTL
Selección genómica amplia
• Valor genético
• Blup
El futuro
Análisis complejos
Rendimiento
Sanidad
Marcadores moleculares
Infometeorologica
Info suelos
Data mining
Modelos de simulación
GWS
Predicciones
Interpretacionde resultados
/ interacciones