semantic formalization of laboratory protocols

39
Formalización de Protocolos de Laboratorio Usando Tecnologías Semánticas Olga Ximena Giraldo Pasmín Supervisor: Oscar Corcho, PhD Co-supervisor: Alexander García, PhD

Upload: olga-ximena-giraldo

Post on 13-Aug-2015

168 views

Category:

Education


1 download

TRANSCRIPT

Formalización de Protocolos de Laboratorio Usando

Tecnologías Semánticas

Olga Ximena Giraldo Pasmín

Supervisor:

Oscar Corcho, PhD

Co-supervisor:

Alexander García, PhD

Tabla de Contenido

• Conceptos básicos, problema, estado del arte y preguntas de investigación.

• Nuestra propuesta

• Resultados

• Conclusiones

• Trabajo futuro

Conceptos básicos, Problema, Estado del arte y Preguntas de investigación

Método Científico

“un método o procedimiento que ha caracterizado a la ciencia natural desde el siglo XVII, que consiste en la observación

sistemática, medición, experimentación, formulación, análisis y modificación de las hipótesis”

Oxford English Dictionary - entrada para scientific.

Repetibilidad

Mismo investigador,Iguales condiciones experimentales.

Iguales resultados

Reproducibilidad

Factores que Influyen en la Reproducibilidad

http://migratingpoetics.wordpress.com/2013/02/

Precisión

x

¿Qué es un Protocolo de Laboratorio?

hashas

has has

has has

hashas

Problemas en Protocolos de Laboratorio

• Incubate the centrifuge tubes in a water bath.

•Incubate the samples for 5 min with gentle shaking.

• Rinse DNA briefly in 1-2 ml of wash.

•Incubate at -20C overnight.

Protocol

Objetivo

Los protocolos deberían ser descritos de forma precisa y con suficiente detalle.

• Para que puedan ser replicados por humanos y/o por maquinas.

Enfoques Existentes

MIBBI mantiene checklists que promueven cómo reportar un experimento.

OBI modela el diseño de una investigación. Incluyendo protocolos, instrumentación, materiales y datos generados.

EXPO formaliza conocimiento acerca de la organización, ejecución y análisis de experimentos científicos.

EXPO

EXACTEXACT proporciona un modelo para la descripción de

acciones experimentales.

Pregunta General de Investigación

¿Cómo estandarizar la representación de protocolos experimentales por medio del

uso de tecnologías semánticas?

Preguntas Específicas

1. ¿Cuál es la mínima cantidad de información, ontológicamente valida, necesaria para reportar un protocolo experimental?

2. ¿Cuál es la estructura ontológica que facilitaría la representación formal de un protocolo experimental como documento y como elemento ejecutable?

Propuesta

Nuestra Propuesta

SMART Protocols

SeMAntic RepresenTation for Protocols (SMART Protocols).

Estructura ontológica que nos ayuda a representar protocolos de laboratorio en biotecnología de plantas.

Análisis de Protocolos de Laboratorio

Repositorio No. de Protocolos

Biotechniques 8

CSH protocols 11

Current protocols 25

GMR 5

Jove 21

Protocol exchange 12

Plant methods 10

Plos One 3

Springer protocols 5

Total 100

Mínima Información para Reportar un Protocolo

Disponible en: goo.gl/gAVnn

Mínima Información Validada por Expertos de Dominio

04080

Sample Metadata

Domain expertsrepositories

Purpose Provenance of the protocol

Applications of the protocol

Comparison with other protocols

Limitations0

20406080

100

Introduction Section Metadata

Domain expertsrepositories

Name Manufacturer catalog number0

20406080

100

Laboratory Consumables or Supplies Metadata

Domain expertsrepositories

Alternative steps Critical steps Pause point Timing Hints Troubleshooting0

20406080

100

Protocol Metadata

Domain expertsrepositories

Software name Software version0

20406080

100

Software Metadata

Domain expertsrepositories

Procesos Típicos en Biotecnología de Plantas http://spie.org/Images/Graphics/Newsroom/Imported-2011/003464/003464_10_fig1.jpg

Extracción de ADN PCR Electroforesis

Ontologías Diseñadas

Desarrollo de Ontologías

NeOn Methodology

Especificación de Ontologías

• Dominio que cubre las ontologías. Biotecnología de plantas. • ¿Para qué se emplearán las ontologías?.

SMART Protocols-Document : provee un conjunto de metadatos para reportar un protocolo experimental.

SMART Protocols-Workflow: está diseñada para representar la ejecución de dichos protocolos.

• Granularidad de las ontologías.

Análisis de protocolos Se diseñaron casos de uso se plantearon preguntas de competencia.

Preguntas de Competencia

1. ¿Quién es el autor (autores) de un protocolo particular?

2. ¿De dónde fue adaptado el protocolo “x”?

3. ¿Cuáles son las limitaciones que presenta el protocolo “y”?

4. ¿Cuál es el propósito de un protocolo particular?

5. ¿Cuál es la muestra usada en un protocolo “x”?

6. ¿Qué reactivos, equipos y demás insumos son usados en un protocolo “y”?

7. ¿Cuál es el fabricante, número de identificación y nombre de un kit?

8. ¿Cuáles son los pasos básicos de una extracción, amplificación y separación de ácidos nucleícos?

Conceptualización y Categorización de Términos

Términos Reusados

Recurso No. de términos Recurso No. de términosOBI 15 P-Plan 3NCIthesaurus 9 NPO 3CHEBI 7 EXACT 2IAO 7 SO 2MGEDOntology 3 MeSH 1

• Clases reutilizadas

• Propiedades reutilizadas

Propiedad Origen Reusada en

isManufacturedBy OBI SMART Protocols-Document

hasInputVar P-Plan SMART Protocols-Workflow

hasOutputVar P-Plan SMART Protocols-Workflow

isStepOfPlan P-Plan SMART Protocols-Workflow

Términos Nuevos y Enfoque de las Ontologías

Ontología No. de clases No. de propiedadesSMART Protocols-Document 60 7SMART Protocols-Workflow 44 1Total 104 8

• Términos nuevos

• Enfoque “population”

¿Qué Soporta las Ontologías SMART Protocols?

Disponible en: http://smartprotocols.org/drupal/

sp= smart protocols, iao= information artifact ontology, ro= relation ontology

Caso de Uso 1

sp= smart protocols, ro= relation ontology

SMART Protocols-Workflow

Disponible en: http://smartprotocols.org/drupal/

sp= smart protocols, p-plan= p-plan ontology

Caso de Uso 2

sp= smart protocols, p-plan= p-plan ontology

Lenguaje y Editor Usado para el Diseño de Ontologías

• OWL permite representar los términos y las relaciones entre ellos de manera que sean fácilmente procesables por aplicaciones informáticas.

• OWL es un lenguaje compatible con los actuales estándares utilizados en la Web.

• Es un sistema de código abierto,

• permanece en constante mantenimiento y evolución, y

• su interfaz de usuario es simple y fácil de usar.

Evaluación de las Ontologías

• El objetivo: Qué define la ontología y la precisión de las definiciones.

• Metodología (Gomez-Perez, et al, 1995)• Consistencia

Editor protege Ontology Pitfall Scanner (OOPS!)

• Completitudse seleccionó el sub-lenguaje OWL-DL, el cual permite máxima

expresividad sin perder la completitud computacional

• Concisión no almacena conocimiento innecesario ni definiciones redundantes.

Conclusiones

Conclusiones

1. Se identificó un conjunto de metadatos que facilitan la captura de información necesaria y suficiente para reportar un experimento.

2. La validación de datos se hizo con la participación de expertos de dominio. La interacción con expertos de dominio permitió conocer su preocupación acerca de la pobre información que presentan algunos protocolos en biología de plantas.

3. Se identificaron los pasos básicos de procedimientos experimentales comúnmente usados en biotecnología de plantas.

4. Se propuso una estructura ontológica, SMART Protocols, compuesta por dos módulos: SMART Protocols-Document y SMART Protocols-Workflow.

5. Para el desarrollo de éstas ontologías, se hizo especial énfasis en el aspecto metodológico. Esta investigación retoma elementos de NeOn Methodology. Además, se siguen las buenas prácticas sugeridas por el proyecto OBO.

6. Este trabajo se centró en plantear una alternativa que ayude al investigador a recorrer el camino que conduzca a la reproducibilidad de un experimento.

Trabajo Presentado en…

Trabajo Futuro

Trabajo Futuro

1. Continuar con el análisis semántico.

Instrucción Término ambiguo Desambiguación“Grow the plants under short day conditions” short day conditions 8 horas de luz“Store the plants overnight at 4°C” overnight 8 -10 horas“Store the samples at room temperature” Room temperature 20 – 25°C

2. Identificar colocaciones léxicas en instrucciones o actividades encontradas en protocolos de laboratorio.

• “Store the samples at room temperature”• “Grow the plants under short day conditions”

3. Enriquecimiento de ontologías existentes. • P-plan, EXACT, MUO (Measurement Unit Ontology).

4. Crear o reutilizar un sistema basado en reglas. Que facilite la recuperación automática de pasos básicos de instrucciones experimentales y de información requerida para reportar un protocolo de laboratorio.

5. Validar la información recuperada. Esta actividad permitirá determinar la fiabilidad del sistema de recuperación de información.

“Los datos, sin información que indique cómo fueron generados y cómo generarlos nuevamente, son poco útiles”

(Thompson, Grethe, Berger, & Xie, 2001).

Gracias!!!