ricardo fraiman universidad de san andrés, argentina ana justel universidad autónoma de madrid

38
Las temperaturas registradas en la Las temperaturas registradas en la Antártida como series de datos Antártida como series de datos funcionales, necesitamos un concepto funcionales, necesitamos un concepto de tendencia de tendencia Ricardo Fraiman Ricardo Fraiman Universidad de San Andrés, Argentina Universidad de San Andrés, Argentina Ana Justel Ana Justel Universidad Autónoma de Madrid Universidad Autónoma de Madrid Pamela Llop Pamela Llop Instituto de Matemática Aplicada del Instituto de Matemática Aplicada del Litoral (IMAL) - CONICET, Argentina Litoral (IMAL) - CONICET, Argentina Servei d'Estadística Servei d'Estadística 27 de marzo de 2009 27 de marzo de 2009

Upload: ince

Post on 10-Jan-2016

41 views

Category:

Documents


0 download

DESCRIPTION

Servei d'Estadística 27 de marzo de 2009. Las temperaturas registradas en la Antártida como series de datos funcionales, necesitamos un  concepto de tendencia. Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid Pamela Llop - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Las temperaturas registradas en la Las temperaturas registradas en la Antártida como series de datos Antártida como series de datos funcionales, necesitamos un  concepto funcionales, necesitamos un  concepto de tendencia de tendencia

Ricardo FraimanRicardo FraimanUniversidad de San Andrés, ArgentinaUniversidad de San Andrés, Argentina

Ana JustelAna JustelUniversidad Autónoma de MadridUniversidad Autónoma de Madrid

Pamela LlopPamela LlopInstituto de Matemática Aplicada delInstituto de Matemática Aplicada delLitoral (IMAL) - CONICET, ArgentinaLitoral (IMAL) - CONICET, Argentina

Servei d'EstadísticaServei d'Estadística27 de marzo de 200927 de marzo de 2009

Page 2: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Cambio climático globalCambio climático global

Page 3: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Cuando se habla del cambio climático en la Antártida, Cuando se habla del cambio climático en la Antártida, la información existente es muy escasa, y la que se la información existente es muy escasa, y la que se

aprovecha mucha menosaprovecha mucha menos

Los (pocos) estudios que se han hecho dicen que...

• Hay una cierta evidencia de calentamiento “global” en la Antártida

• Un enfriamiento en la Antártida Continental• Y un calentamiento muy por encima del global del

planeta en la Península Antártica

Lo dicen…

• IPCC (2001) • Comiso (2000): J. of Climate • Doran et al. (2002): Nature• Vaughan el al. (2003): Climatic Change• Turner et al. (2005): Int. J. Climatology• …• Steig (Enero, 2009): Nature

Page 4: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Sólo cuatro en la Región

de la Península Antártica

Page 5: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Sólo cuatro en la Región

de la Península Antártica

Page 6: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

PROBLEMAS DETECTADOS EN LOS ESTUDIOS PREVIOS:

Se usa una proporción muy baja de los datos existentes, sólo de estaciones con registros de 50 años y de TODO EL AÑO (menos de 20)

Conclusiones basadas en el ajuste por mínimos cuadrados de tendencias lineales deterministas

• No parece muy realista asumir que la evolución de la temperatura es determinista (el futuro está escrito)

• La estimación de la tendencia da más peso siempre a los datos centrales

Las medias anuales o mensuales pueden estar muy sesgadas por la abundancia de rachas de “missing data”

Sorprende la poca presencia de estadísticos entre los grupos que han realizado los estudios más relevantes sobre la tendencia de parámetros meteorológicos en la Antártida

Page 7: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

NUESTRO OBJETIVO:

Proponer nuevas herramientas Proponer nuevas herramientas estadísticas para tratar con datos “malos”estadísticas para tratar con datos “malos”

•Datos anuales en los que sólo se observa una estación

•Una cantidad alta de atípicos en datos que se

observan con mucha frecuencia (observaciones no

equiespaciadas)

•Rachas largas de datos faltantes

Page 8: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA BASE BASE ANTÁRTICA ESPAÑOLA JUAN CARLOS IANTÁRTICA ESPAÑOLA JUAN CARLOS I::

BAE-JCIBAE-JCISpanish Antarctic Base Spanish Antarctic Base

Juan Carlos IJuan Carlos I

• Funcionando desde enero de 1988, en la costa SO de la Peninsula Hurd, Isla Livingston (South Shetland Islands)

• Se registran TEMPERATURAS AREAS instantáneamente cada 10 minutos

• Tomamos la media de datos horarios (media de entre 1 y 5 datos, según el número de missing)

Shouth Shouth Sheatland Sheatland

Is.Is.

Page 9: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)

10 años10 años10 años10 años

Page 10: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

NUEVO ENFOQUE DEL PROBLEMA:

• Suponemos que existe una curva/función de temperatura para cada verano que se observa únicamente en periodos discretos de tiempo debido a las limitaciones que imponen los aparatos de medida

• Tenemos una serie temporal anual donde para cada año el dato que se observa es una curva

verano

X1

X2

X3

X4

XT

t

Page 11: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

VENTAJAS:

• No necesitamos observar la serie completa durante todo el año

• Se utiliza el micro-dato

• No se pierde la información de la estacionalidad diaria

• No necesitamos datos equiespaciados

Page 12: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES

El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia

verano

X1

X2

X3

X4

XT

t

Page 13: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)

No se ve nada

Page 14: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES

El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia

verano

X1

X2

X3

X4

XT

t

Bosq (1991) introduce el FAR(1)Ferraty y Vieu (2006) comentan los resultados de varios autoresTratan el problema de predecir en procesos estacionarios

PRINCIPAL DIFICULTAD: No tenemos una definición asociada PRINCIPAL DIFICULTAD: No tenemos una definición asociada al concepto de tendencia para el caso de datos funcionalesal concepto de tendencia para el caso de datos funcionales

Page 15: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Buscamos una “DEFINICIÓN” asociada al concepto DE Buscamos una “DEFINICIÓN” asociada al concepto DE TENDENCIA para el caso de datos funcionalesTENDENCIA para el caso de datos funcionales

Ideas basadas en RANGOSIdeas basadas en RANGOS

• Dos métodos descriptivos de evaluación de tendenciasDos métodos descriptivos de evaluación de tendencias

• Proponemos test sobre “curvas máximas”Proponemos test sobre “curvas máximas”

• Reducimos la dimensión infinita del problemaReducimos la dimensión infinita del problema

ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES

Page 16: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

IDEA 1: Rangos de las curvasRangos de las curvas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series serie de los “rangos” de las “series ordenadas” tiene tendenciaordenadas” tiene tendencia

IDEA 2: Rangos de las curvas ordenadasRangos de las curvas ordenadas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene “serie de rangos” de las curvas tiene tendenciatendencia

Métodos descriptivos de evaluación de tendenciasMétodos descriptivos de evaluación de tendencias

Page 17: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número

finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)

s

X1

X2

X3

t 1 1 1

2

2 2 2

3

33

2

1 1

1

33332

1

2

IDEA 1: Rangos de las curvas Rangos de las curvas

Page 18: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

Cada conjunto de barras corresponde a una curva, cuenta el Cada conjunto de barras corresponde a una curva, cuenta el número de veces a lo largo del tiempo en que el rango es 1,2, …,17número de veces a lo largo del tiempo en que el rango es 1,2, …,17

Page 19: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número

finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)

s

X1

X2

X3

t 1 1 1

2

2 2 2

3

33

2

1 1

1

33332

1

2

2.2. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva

R3 = 17/7

R2 = 14/7

R1 = 11/7

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

Page 20: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Comentarios:

• Aunque le llamamos “serie de rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros

• Reducimos la dimensión infinita asociando a cada curva un valor real positivo

• No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva

• En cada instante que calculamos los rangos tenemos que haber observado todas las series

• Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

Page 21: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

INTERPOLACIÓN “SHAPE PRESERVING” de MATLABINTERPOLACIÓN “SHAPE PRESERVING” de MATLAB

• Utiliza información local únicamente de la propia curvaUtiliza información local únicamente de la propia curva

• Es no paramétricaEs no paramétrica

• Es un método sencilloEs un método sencillo

• Y siempre mejorable con una modelización previa…Y siempre mejorable con una modelización previa…

• Da una solución bastante razonable!!!Da una solución bastante razonable!!!

Page 22: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”

Page 23: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”

Page 24: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”

Page 25: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid
Page 26: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

SeasonSeason Percentage of Percentage of observed dataobserved data

First observed First observed datadata

Last observed Last observed datadata

1987/1988 6.53 1864 2160

1988/1989 65.42 645 2158

1989/1990 71.11 230 2086

1990/1991 61.90 433 2158

1991/1992 71.39 539 2160

1992/1993 5.13 1243 2131

1993/1994 65.79 529 2040

1994/1995 59.03 143 2160

1995/1996 69.91 87 1720

1996/1997 31.30 1478 2160

1997/1998 84.40 185 2102

1998/1999 95.23 71 2160

1999/2000 90.42 168 2160

2000/2001 93.33 67 2160

2001/2002 97.17 1 2160

2002/2003 99.35 1 2160

2003/2004 90.23 1 1976

2004/2005 92.08 14 2160

2005/2006 100 1 2160

2006/2007 100 1 2160

Eliminadas Eliminadas (insuficientes datos)

1076 datos 1076 datos empleados empleados cada añocada año

Page 27: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid
Page 28: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número

finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)

2.2. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva

Page 29: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

IDEA 1: Rangos de las curvasRangos de las curvas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series serie de los “rangos” de las “series ordenadas” tiene tendenciaordenadas” tiene tendencia

IDEA 2: Rangos de las curvas ordenadasRangos de las curvas ordenadas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene “serie de rangos” de las curvas tiene tendenciatendencia

Métodos descriptivos de evaluación de tendenciasMétodos descriptivos de evaluación de tendencias

Page 30: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

1.1. Se calculan las curvas “ordenadas” xSe calculan las curvas “ordenadas” x(1)(1), …, x, …, x(T) (T) (mínima, (mínima, segunda,…, máxima)segunda,…, máxima)

Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia

IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas

s

X1

X2

X3

s

X(1)

X(2)X(3)

1 1 13

2 2

2

3 1 32

1 11

3333

2

2

2

R’3 = 18/7

R’2 = 12/7

R’1 = 12/7

2.2. Para cada xPara cada x(t)(t) calculamos los “rangos” en un número calculamos los “rangos” en un número finito de instantes, R’finito de instantes, R’tt

(1)(1),…,R’,…,R’tt(S)(S), siendo R’, siendo R’tt

(j) (j) el orden de el orden de la curva asociada en el instante jla curva asociada en el instante j

3.3. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva

Page 31: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia

IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas

Page 32: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Comentarios:

• Aunque le llamamos serie de “rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros, tampoco son las series “ordenadas”

• Reducimos la dimensión infinita del problema

• No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva

• En cada instante que calculamos los rangos tenemos que haber observado todas las series

• Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar

• Sirve de base para los test de “curvas máximas”…

Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia

IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas

Page 33: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Test para curvas máximasTest para curvas máximas

Consideramos la cantidad de Consideramos la cantidad de veces que una curva coincide veces que una curva coincide con la curva máxima con la curva máxima

1.1. Proponemos un test sobre la probabilidad de que una Proponemos un test sobre la probabilidad de que una curva coincida con la curva máximacurva coincida con la curva máxima

Si no hay calentamiento (HSi no hay calentamiento (H00), las curvas son independientes ), las curvas son independientes y la probabilidad es la misma para las T curvasy la probabilidad es la misma para las T curvas

3333

2

2

2

Bajo la hipótesis nula Bajo la hipótesis nula

eses

Page 34: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Test para curvas máximasTest para curvas máximas

Page 35: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

2.2. Proponemos un test sobre la Proponemos un test sobre la probabilidad de que una curva probabilidad de que una curva coincida con la curva máxima coincida con la curva máxima de las observadas hasta el de las observadas hasta el momentomomento

Rechazamos para todos los veranos excepto en 2003/04

que fue un verano “sorprendentemente” frío

para las personas que estuvimos allí

Rechazamos para todos los veranos excepto en 2003/04

que fue un verano “sorprendentemente” frío

para las personas que estuvimos allí

Test para curvas máximasTest para curvas máximas

Page 36: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Test para curvas máximas – Bases ArgentinasTest para curvas máximas – Bases Argentinas

Page 37: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

CONCLUSIONES:

• Con este trabajo no pretendemos dar respuesta a la pregunta de si hay o no calentamiento en la Antártida

• Proponemos herramientas estadísticas que permitan incorporar en los estudios la mayor parte de los datos que se están registrando con gran coste económico y humano

• Hemos visto que un enfoque basado en el Análisis de Datos Funcionales es útil para tratar series temporales que se observan sólo en una parte del año

• Las mismas técnicas se pueden utilizar en otros problemas similares. Por ejemplo, evolución del ozono troposférico

Page 38: Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid

Muchas graciasMuchas gracias