introducción a métodos experimentales y análisis de datos...
TRANSCRIPT
Charla #3b | Curso “Servicios Ambientales y Restauración de Bosques Tropicales” | Febrero 2-7, 2015 | Panamá
Introducción a métodos experimentales
y análisis de datos científicos
Edwin Lebrija
Becario postdoctoral
STRI
2
Investigación científica
Es la investigación sistemática, controlada, empírica, y
crítica de fenómenos naturales (o sociales).
Está (A) guiada por la teoría e hipótesis acerca de las
supuestas relaciones (verdaderas) entre dichos
fenómenos o (B) resulta en teorías y proposiciones
acerca de las posibles relaciones (verdaderas) entre
dichos fenómenos
• Que la investigación proponga preguntas que puedan
probarse (Objetivos)
• Que el estudio tenga un vínculo explícito con la teoría y la
investigación previa (Revisión de literatura)
• Que los métodos sean apropiados para responder las
preguntas y para falsificar hipótesis y/o preguntas alternativas
(Diseño experimental)
• Que el análisis de datos sea sistemático y apropiado (Diseño
experimental)
• Que el estudio esté disponible para la revisión y el criticismo
(Reporte/Publicación)
Para hacer (buena) ciencia es necesario:
Empezando un proyecto
Planteamiento del problema
“El reto más grande para un pensandor es describir el
problema de manera que permita una respuesta precisa
del mismo”. (Bertrand Russell)
• Para plantear bien un problema hay que delimitarlo
• Delimitarlo significa describir claramente lo que se intenta
hacer
• Una buena manera de hacerlo es:
1) presentar el problema principal u objetivo general de una manera
descriptiva
2) hacer una o pocas preguntas directas y simples
de una o dos oraciones… pero bien definidas!
Empezando un projecto No hay investigación sin un problema bien planteado
Las preguntas deben descomponer el objetivo
general en unidades más pequeñas
Cada pregunta debe ser una unidad
investigable
UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO
Objetivo:
Entender qué hace que una especie o un grupo de ellas estén presentes, dominen
y posteriormente desaparezcan en un espacio y tiempo determinados.
Específicamente:
¿Cómo cambia la composición, diversidad y estructura de los bosques
secundarios en el tiempo?
¿Cómo modifican al ambiente del sotobosque los cambios en la estructura del
bosque?
¿El ambiente del sotobosque determina la composición de la comunidad de
acuerdo a las estrategias funcionales de las especies?
Estudio de sucesión secundaria
Una vez trazado un objetivo realista y una vez
delimitadas las preguntas de estudio, hay que
determinar los métodos experimentales:
• ¿Cuál es el diseño más adecuado para responder las preguntas?
• ¿Cómo colectar los datos?
• ¿Qué medir?
• ¿Cómo analizar los datos?
La elección de un diseño apropriado depende de los
objetivos de la investigación y de cuánto se conoce del
problema
Diseño experimental Del qué al cómo.
Objetivo Diseño apropiado
Exploratorio,
Descriptivo
Explicativo
(causal)
Describir y medir fenómenos naturales,
Obtener información del entorno,
Clarificar problemas y formular hipótesis,
Establecer prioridades de investigación
Determinar causalidad
Probar hipótesis teóricas
La mayoría de la investigación tiene componentes descriptivos y
exploratorios.
La investigación causal efectiva sólo puede construirse con base en
conocimiento descriptivo sólido.
La investigación científica tambien pude tener como objetivo la
comparación o la clasificación
Diseño experimental Del qué al cómo.
Diseño experimental Métodos de razonamiento
La investigación exploratoria y descriptiva es inductiva:
va de lo específico a lo general
¿Qué, cómo, cúando, dónde
existe o sucede?
La investigación explicativa (causal) es deductiva:
va de lo general a lo específico
¿Por qué existe o sucede?
Investigación exploratoria:
• Sondeos/encuestas de campo: colecta de datos de campo para obtener información general a nivel local. Es una base fundamental para conducir una investigación más compleja.
Investigación descriptiva:
• Estudios transversales: Mide las unidades de muestra de una
población sólamente en un punto en el tiempo
• Estudios longitudinales: Mediciones repetidas de las unidades de muestra de una población a través del tiempo
Diseño experimental Diseños típicos
Investigación explicativa:
• Experimentos de laboratorio:manipulan al menos una variable causal (tratamiento) para evaluar sus efectos en la variable dependiente en un entorno artificial (para controlar lo mejor posible variables de confusión )
• Experimentos de campo: realizados dentro del entorno natural
Los tipos y diseños experimentales pueden combinarse
Elegir un tipo de investigación acorde a las preguntas:
- Ésto asegura que respondamos la pregunta inicial sin
ambigüedad y de manera parsimoniosa.
Un diseño experimental incluye una especificación directa
y clara de los métodos y procedimientos para colectar y
analizar la información necesaria (¿Qué? ¿Cómo?
¿Cuándo? ¿Dónde? y ¿Por qué?).
Diseño experimental resumen
¡OJO!
• La elección de los métodos afecta los resultados, el análisis, la discusión, las conclusiones y el alcance de la investigación.
• Por ejemplo, ¿te parece correcto basar la estimación de la altura promedio de los Panameños en la altura de 100 personas que viven en Clayton/Ciudad del Saber?
• Asegúrate que los métodos sean robustos.
Propósitos del muestreo
• Estimar atributos (parámetros), p.ej.: – Abundancia/ densidad
– Crecimiento
– Sobrevivencia
• Permitir inferencias sobre la población (o extrapolaciones de los datos)
• Permitir estimaciones de precisión (proveer parámetros estadísticos confiables)
Características principales de una muestra
Representa una copia miniatura de la población (en el caso más simple
cada miembro de la población tiene la misma propabilidad de ser
incluido en la muestra)
Esto es lo que permite realizar inferencias sobre la población
El muestreo necesita
• Precisión– conduce a estimaciones
exactas y sin sesgo.
• Repetibilidad– las estimaciones conducen
a respuestas similares
• Eficiencia– Evita el desperdicio de
recursos
Sesgo
• Que tan buena “en promedio” es la
estimación
• No se puede decir a partir de una sola
unidad de muestra
• Depende de la población, diseño de
muestreo y el estimador (parámetro)
Estimación sin sesgo (exacta)
Valor real de la
población
Estimación promedio
Estimación sesgada (inexacta)
Valor real de la
población
Estimación promedio SESGO
Repetible (precisa)
*
*
*
*
* *
*
Estimación
según una
muestra *
No repetible (imprecisa)
* *
*
*
*
*
*
Estimación
según una
muestra
*
Imprecisa pero exacta… ó
* *
*
*
*
*
*
Estimación
según una
muestra
*
Estimación promedio
Valor real
Precisamente inexacta…ó
Valor real
* *
* *
* *
*
*
Estimación promedio
Estimación
según una
muestra
¡Imprecisa e inexacta!
* *
*
*
*
* *
Estimación/muestra
*
Estimación promedio
Valor real
Una buena estimación:
sin sesgo y precisa
Valor real
*
*
*
*
* *
*
*
Estimación promedio
Estimación/muestra
¿Cómo hacer buenas
estimaciones? • Minimizar el sesgo
– Tomar muestras que representen
adecuadamente a la población
• Minimizar la varianza
– Replicación (determinar el tamaño de
muestra adecuado: ¡proyectos/muestras
piloto!)
– Registrar covariables, diseñar bloques
experimentales, estratificación
Hay que preguntarse
• ¿Cuál es el objetivo?
• ¿Cuál es la población de estudio?
• ¿Cuáles son las unidades de
estudio/experimentales adecuadas?
– Tamaño, forma, ubicación
– Cantidades
Abandonment Time (yr)
All Plants
Su
m c
row
n a
rea
Den
sity
Mature forest plantsPioneers (early colonizers)
Una muestra tiene que representar la población…
¿Cómo hacerlo?
Menos muestras
menos confianza en
la estimación del
promedio y en el
deviación (o error)
estándar
Minimiza varianza
Unidades de muestreo no
aleatorizadas (sesgadas)
Camino
Fáciles de ubicar y muestrear
No representan otros hábitats
(fuera del camino)
Bien si se redefine el objetivo
Camino
Unidades aleatorias
– Diseño estadístico válido
– Representa el área de estudio
– Réplicas permiten estimación de la
variación
– Pueden representar un problema logístico
– Más difíciles de ubicar
– Pueden no funcionar en áreas muy
heterogéneas
Muestreo estratificado
– Controlan áreas heterogéneas
– Permiten estimaciones por estrato
– Estimación más precisa del atributo general
– Diseño más complejo
– Puede requerir de una muestra total grande
¿Área Basal? ¿Carbono? ¿Composición de especies?
Sólo área baja (evitando pendientes fuertes): sesgo
¿Aleatoreamente? ¿o estratificado? ¿O todo (censo completo)?
¿Cómo / dónde hacer el inventario?
Inventarios: La composición de los bosques y la abundancia de cada especie
Sucesión
tardía
Sucesión
temprano 1000 m
TP
TP
Colecta de datos
Ya que está todo planeado se puede comenzar
(felizmente) la colecta de datos. Hay que:
• Ser claros y sistemáticos (organizados) acerca
del tipo de datos colectados
• Mantener archivos y registros claros de todos los
datos colectados
• Hacer notas claras de los metadatos
• Tener una bitácora clara de problemas
Recordar…
Colecta de datos
• ¡¡¡Pude pasar de todo en el campo!!! (o en
el lab.)
Colecta de datos
– Mantener recursos de respaldo
– Tener un plan de respaldo
– Tener un respaldo de datos (digital, impreso)
– Respaldar, respaldar, respaldar…
Análisis estadístico o cómo extraer
información de los datos
Estadística descriptiva: Se dedica a la descripción, visualización y resumen de
datos originados a partir de los fenómenos de estudio. Los datos pueden ser
resumidos numérica o gráficamente.
Estadística inferencial: Se usa para modelar patrones en los datos y hacer
inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar
la forma de respuestas a preguntas sí/no (pruebas de hipótesis), estimaciones
de características numéricas (estimación), pronósticos de futuras
observaciones, descripciones de asociación (correlación) o modelaje de
relaciones entre variables (regresión).
Análisis de datos
• Usa técnicas adecuadas para los datos
(tipos de datos/ distribución de los datos/
supuestos del análisis)
• Prefiere lo simple mientras sea posible.
• Innova cuando sea necesario.
• Piensa en presentaciones de resultados
con significado/útiles (gráfica vs. tabla).
• Presentaciones de resultados con
significado/útiles son más persuasivas.
Mortality
-
0.002
0.004
0.006
0.008
0.010
0.012
0.014
0.016
0.018
1975 - 1981 1981 - 2004
Period
Av
era
ge a
nn
ual m
ort
ality
rate
( in
d/i
nd
/yr )
a
a
Mortality
-
0.002
0.004
0.006
0.008
0.010
0.012
0.014
0.016
0.018
1975 - 1981 1981 - 2004
Period
Av
era
ge a
nn
ual m
ort
ality
rate
( in
d/i
nd
/yr )
a
a
R2
= 0.3663,
P < 0.002
0
2
4
6
8
10
12
14
16
0 10 20 30
Years since present
Ye
arl
y n
um
be
r o
f re
cru
its
in
60
0 m
2(N
o)
R2
= 0.3663,
P < 0.002
0
2
4
6
8
10
12
14
16
0 10 20 30
Years since present
Ye
arl
y n
um
be
r o
f re
cru
its
in
60
0 m
2(N
o)
-1.0 1.0
-1.0
1.0
Compoundness
Gravity dispersal
Wind dispersal
Pulvinus
SpininessLatex
Pubescens
Wood density
Hmax
Leaf area
Petiole length
Leaf thickness
LSI leaf
LMA
LDMCN Fix
Light
Air Temp.
Soil WP
Soil Temp.
Animal dispersal
Species
Environmental
variable
-1.0 1.0
-1.0
1.0
Compoundness
Gravity dispersal
Wind dispersal
Pulvinus
SpininessLatex
Pubescens
Wood density
Hmax
Leaf area
Petiole length
Leaf thickness
LSI leaf
LMA
LDMCN Fix
Light
Air Temp.
Soil WP
Soil Temp.
Animal dispersal
-1.0 1.0
-1.0
1.0
Compoundness
Gravity dispersal
Wind dispersal
Pulvinus
SpininessLatex
Pubescens
Wood density
Hmax
Leaf area
Petiole length
Leaf thickness
LSI leaf
LMA
LDMCN Fix
Light
Air Temp.
Soil WP
Soil Temp.
Animal dispersal
SpeciesSpecies
Environmental
variable
Heat
balance
Light
capture
Defense
Dispersal
Heat
balance
Light
capture
Defense
Dispersal
Anímate, sé creativo
Desarrollo de ecuaciones alométricas específicas para estimar biomasa
DBH (cm)
0 5 10 15 20 25 30
AG
B (
kg
)
0
50
100
150
200
250
300
350
R2adj P
Ln AGB = -1.857 + 2.161 * Ln(DBH) 0.97 < 0.00
Ln AGB = -1.274 + 2.206 * Ln(DBH) + 0.913 * Ln(WD) 0.98 < 0.00
Ln AGB = -1.619 + 1.969 * Ln(DBH) + 0.845 * Ln(WD) + 0.432 * Ln(H) 0.98 < 0.00
van Breugel et al. 2011
-60
-40
-20
0
20
40
Rela
tive e
rror
(%)
-60
-40
-20
0
20
40
AGB (Mg/ha)
0 10 20 30 40 50 60
-60
-40
-20
0
20
40
60
AGB (Mg/ha)
0 10 20 30 40 50 60
Rela
tive e
rror
(%)
-40
-20
0
20
40
60
80
c d
e f
-40
-20
0
20
40
60
Rela
tive e
rror
(%)
-20
0
20
40
60
80
a b
-60
-40
-20
0
20
40
60
Rela
tive e
rror
(%)
-60
-40
-20
0
20
40
60
g h
Errores en la estimación de biomasa relacionados con el uso de relaciones alométricas
van Breugel et al. 2011
La investigación en resumen
¿Cómo #1?
Diseño experimental •Sondeos
•Experimento
¿Qué?
Marco de la
investigación
•Conceptos
•Conocido
•Desconocido
Colecta de datos
¿Cómo #2?
Métodos •Colecta de datos
-población
-variables
•Análisis de datos
Análisis Discusión Conclusión
REPORTE/PUBLICACIÓN