ricardo fraiman universidad de san andrés, argentina ana justel universidad autónoma de madrid

Post on 10-Jan-2016

41 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Servei d'Estadística 27 de marzo de 2009. Las temperaturas registradas en la Antártida como series de datos funcionales, necesitamos un  concepto de tendencia. Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid Pamela Llop - PowerPoint PPT Presentation

TRANSCRIPT

Las temperaturas registradas en la Las temperaturas registradas en la Antártida como series de datos Antártida como series de datos funcionales, necesitamos un  concepto funcionales, necesitamos un  concepto de tendencia de tendencia

Ricardo FraimanRicardo FraimanUniversidad de San Andrés, ArgentinaUniversidad de San Andrés, Argentina

Ana JustelAna JustelUniversidad Autónoma de MadridUniversidad Autónoma de Madrid

Pamela LlopPamela LlopInstituto de Matemática Aplicada delInstituto de Matemática Aplicada delLitoral (IMAL) - CONICET, ArgentinaLitoral (IMAL) - CONICET, Argentina

Servei d'EstadísticaServei d'Estadística27 de marzo de 200927 de marzo de 2009

Cambio climático globalCambio climático global

Cuando se habla del cambio climático en la Antártida, Cuando se habla del cambio climático en la Antártida, la información existente es muy escasa, y la que se la información existente es muy escasa, y la que se

aprovecha mucha menosaprovecha mucha menos

Los (pocos) estudios que se han hecho dicen que...

• Hay una cierta evidencia de calentamiento “global” en la Antártida

• Un enfriamiento en la Antártida Continental• Y un calentamiento muy por encima del global del

planeta en la Península Antártica

Lo dicen…

• IPCC (2001) • Comiso (2000): J. of Climate • Doran et al. (2002): Nature• Vaughan el al. (2003): Climatic Change• Turner et al. (2005): Int. J. Climatology• …• Steig (Enero, 2009): Nature

Sólo cuatro en la Región

de la Península Antártica

Sólo cuatro en la Región

de la Península Antártica

PROBLEMAS DETECTADOS EN LOS ESTUDIOS PREVIOS:

Se usa una proporción muy baja de los datos existentes, sólo de estaciones con registros de 50 años y de TODO EL AÑO (menos de 20)

Conclusiones basadas en el ajuste por mínimos cuadrados de tendencias lineales deterministas

• No parece muy realista asumir que la evolución de la temperatura es determinista (el futuro está escrito)

• La estimación de la tendencia da más peso siempre a los datos centrales

Las medias anuales o mensuales pueden estar muy sesgadas por la abundancia de rachas de “missing data”

Sorprende la poca presencia de estadísticos entre los grupos que han realizado los estudios más relevantes sobre la tendencia de parámetros meteorológicos en la Antártida

NUESTRO OBJETIVO:

Proponer nuevas herramientas Proponer nuevas herramientas estadísticas para tratar con datos “malos”estadísticas para tratar con datos “malos”

•Datos anuales en los que sólo se observa una estación

•Una cantidad alta de atípicos en datos que se

observan con mucha frecuencia (observaciones no

equiespaciadas)

•Rachas largas de datos faltantes

EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA BASE BASE ANTÁRTICA ESPAÑOLA JUAN CARLOS IANTÁRTICA ESPAÑOLA JUAN CARLOS I::

BAE-JCIBAE-JCISpanish Antarctic Base Spanish Antarctic Base

Juan Carlos IJuan Carlos I

• Funcionando desde enero de 1988, en la costa SO de la Peninsula Hurd, Isla Livingston (South Shetland Islands)

• Se registran TEMPERATURAS AREAS instantáneamente cada 10 minutos

• Tomamos la media de datos horarios (media de entre 1 y 5 datos, según el número de missing)

Shouth Shouth Sheatland Sheatland

Is.Is.

Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)

10 años10 años10 años10 años

NUEVO ENFOQUE DEL PROBLEMA:

• Suponemos que existe una curva/función de temperatura para cada verano que se observa únicamente en periodos discretos de tiempo debido a las limitaciones que imponen los aparatos de medida

• Tenemos una serie temporal anual donde para cada año el dato que se observa es una curva

verano

X1

X2

X3

X4

XT

t

VENTAJAS:

• No necesitamos observar la serie completa durante todo el año

• Se utiliza el micro-dato

• No se pierde la información de la estacionalidad diaria

• No necesitamos datos equiespaciados

ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES

El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia

verano

X1

X2

X3

X4

XT

t

Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)

No se ve nada

ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES

El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia

verano

X1

X2

X3

X4

XT

t

Bosq (1991) introduce el FAR(1)Ferraty y Vieu (2006) comentan los resultados de varios autoresTratan el problema de predecir en procesos estacionarios

PRINCIPAL DIFICULTAD: No tenemos una definición asociada PRINCIPAL DIFICULTAD: No tenemos una definición asociada al concepto de tendencia para el caso de datos funcionalesal concepto de tendencia para el caso de datos funcionales

Buscamos una “DEFINICIÓN” asociada al concepto DE Buscamos una “DEFINICIÓN” asociada al concepto DE TENDENCIA para el caso de datos funcionalesTENDENCIA para el caso de datos funcionales

Ideas basadas en RANGOSIdeas basadas en RANGOS

• Dos métodos descriptivos de evaluación de tendenciasDos métodos descriptivos de evaluación de tendencias

• Proponemos test sobre “curvas máximas”Proponemos test sobre “curvas máximas”

• Reducimos la dimensión infinita del problemaReducimos la dimensión infinita del problema

ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES

IDEA 1: Rangos de las curvasRangos de las curvas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series serie de los “rangos” de las “series ordenadas” tiene tendenciaordenadas” tiene tendencia

IDEA 2: Rangos de las curvas ordenadasRangos de las curvas ordenadas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene “serie de rangos” de las curvas tiene tendenciatendencia

Métodos descriptivos de evaluación de tendenciasMétodos descriptivos de evaluación de tendencias

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número

finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)

s

X1

X2

X3

t 1 1 1

2

2 2 2

3

33

2

1 1

1

33332

1

2

IDEA 1: Rangos de las curvas Rangos de las curvas

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

Cada conjunto de barras corresponde a una curva, cuenta el Cada conjunto de barras corresponde a una curva, cuenta el número de veces a lo largo del tiempo en que el rango es 1,2, …,17número de veces a lo largo del tiempo en que el rango es 1,2, …,17

1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número

finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)

s

X1

X2

X3

t 1 1 1

2

2 2 2

3

33

2

1 1

1

33332

1

2

2.2. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva

R3 = 17/7

R2 = 14/7

R1 = 11/7

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

Comentarios:

• Aunque le llamamos “serie de rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros

• Reducimos la dimensión infinita asociando a cada curva un valor real positivo

• No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva

• En cada instante que calculamos los rangos tenemos que haber observado todas las series

• Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

INTERPOLACIÓN “SHAPE PRESERVING” de MATLABINTERPOLACIÓN “SHAPE PRESERVING” de MATLAB

• Utiliza información local únicamente de la propia curvaUtiliza información local únicamente de la propia curva

• Es no paramétricaEs no paramétrica

• Es un método sencilloEs un método sencillo

• Y siempre mejorable con una modelización previa…Y siempre mejorable con una modelización previa…

• Da una solución bastante razonable!!!Da una solución bastante razonable!!!

DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”

DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”

DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”

SeasonSeason Percentage of Percentage of observed dataobserved data

First observed First observed datadata

Last observed Last observed datadata

1987/1988 6.53 1864 2160

1988/1989 65.42 645 2158

1989/1990 71.11 230 2086

1990/1991 61.90 433 2158

1991/1992 71.39 539 2160

1992/1993 5.13 1243 2131

1993/1994 65.79 529 2040

1994/1995 59.03 143 2160

1995/1996 69.91 87 1720

1996/1997 31.30 1478 2160

1997/1998 84.40 185 2102

1998/1999 95.23 71 2160

1999/2000 90.42 168 2160

2000/2001 93.33 67 2160

2001/2002 97.17 1 2160

2002/2003 99.35 1 2160

2003/2004 90.23 1 1976

2004/2005 92.08 14 2160

2005/2006 100 1 2160

2006/2007 100 1 2160

Eliminadas Eliminadas (insuficientes datos)

1076 datos 1076 datos empleados empleados cada añocada año

Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia

IDEA 1: Rangos de las curvas Rangos de las curvas

1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número

finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)

2.2. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva

IDEA 1: Rangos de las curvasRangos de las curvas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series serie de los “rangos” de las “series ordenadas” tiene tendenciaordenadas” tiene tendencia

IDEA 2: Rangos de las curvas ordenadasRangos de las curvas ordenadas

Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene “serie de rangos” de las curvas tiene tendenciatendencia

Métodos descriptivos de evaluación de tendenciasMétodos descriptivos de evaluación de tendencias

1.1. Se calculan las curvas “ordenadas” xSe calculan las curvas “ordenadas” x(1)(1), …, x, …, x(T) (T) (mínima, (mínima, segunda,…, máxima)segunda,…, máxima)

Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia

IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas

s

X1

X2

X3

s

X(1)

X(2)X(3)

1 1 13

2 2

2

3 1 32

1 11

3333

2

2

2

R’3 = 18/7

R’2 = 12/7

R’1 = 12/7

2.2. Para cada xPara cada x(t)(t) calculamos los “rangos” en un número calculamos los “rangos” en un número finito de instantes, R’finito de instantes, R’tt

(1)(1),…,R’,…,R’tt(S)(S), siendo R’, siendo R’tt

(j) (j) el orden de el orden de la curva asociada en el instante jla curva asociada en el instante j

3.3. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva

Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia

IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas

Comentarios:

• Aunque le llamamos serie de “rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros, tampoco son las series “ordenadas”

• Reducimos la dimensión infinita del problema

• No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva

• En cada instante que calculamos los rangos tenemos que haber observado todas las series

• Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar

• Sirve de base para los test de “curvas máximas”…

Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia

IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas

Test para curvas máximasTest para curvas máximas

Consideramos la cantidad de Consideramos la cantidad de veces que una curva coincide veces que una curva coincide con la curva máxima con la curva máxima

1.1. Proponemos un test sobre la probabilidad de que una Proponemos un test sobre la probabilidad de que una curva coincida con la curva máximacurva coincida con la curva máxima

Si no hay calentamiento (HSi no hay calentamiento (H00), las curvas son independientes ), las curvas son independientes y la probabilidad es la misma para las T curvasy la probabilidad es la misma para las T curvas

3333

2

2

2

Bajo la hipótesis nula Bajo la hipótesis nula

eses

Test para curvas máximasTest para curvas máximas

2.2. Proponemos un test sobre la Proponemos un test sobre la probabilidad de que una curva probabilidad de que una curva coincida con la curva máxima coincida con la curva máxima de las observadas hasta el de las observadas hasta el momentomomento

Rechazamos para todos los veranos excepto en 2003/04

que fue un verano “sorprendentemente” frío

para las personas que estuvimos allí

Rechazamos para todos los veranos excepto en 2003/04

que fue un verano “sorprendentemente” frío

para las personas que estuvimos allí

Test para curvas máximasTest para curvas máximas

Test para curvas máximas – Bases ArgentinasTest para curvas máximas – Bases Argentinas

CONCLUSIONES:

• Con este trabajo no pretendemos dar respuesta a la pregunta de si hay o no calentamiento en la Antártida

• Proponemos herramientas estadísticas que permitan incorporar en los estudios la mayor parte de los datos que se están registrando con gran coste económico y humano

• Hemos visto que un enfoque basado en el Análisis de Datos Funcionales es útil para tratar series temporales que se observan sólo en una parte del año

• Las mismas técnicas se pueden utilizar en otros problemas similares. Por ejemplo, evolución del ozono troposférico

Muchas graciasMuchas gracias

top related