una comparacion de dos metodologias para la estimacion del variograma

Upload: thomas-ross

Post on 05-Nov-2015

4 views

Category:

Documents


0 download

TRANSCRIPT

UNA COMPARACION DE DOS METODOLOGIAS PARA LA ESTIMACION DELVARIOGRAMA DE UN PROCESO ESPACIALAngela M. DiblasiTitular de la Ctedra EstadsticaGraciela Luca NardecchiaMara Elena ZabalJefes de Trabajos Prcticos de la Ctedra EstadsticaFacultad de Ciencias EconmicasUniversidad Nacional de CuyoResumenLa estimacin del variograma es un aspecto crucial en la modelizacin de unproceso estocstico espacial. Sin embargo existen en la literatura especfica sloreferencias bajo supuestos muy limitados. Cuando la estructura de covarianza esdesconocida y no se puede descartar la presencia de tendencia, la estimacin delvariograma por mnimos cuadrados ordinarios en general introduce sesgo.En este trabajo se plantea como alternativa para la estimacin del variograma lautilizacin de los residuos resultantes de aplicar la metodologa del pulido de medianas.Se realiza adems una comparacin de ambas metodologas en el contexto deprediccin.La propuesta se ilustra con una aplicacin a un proceso espacial que representa lastemperaturas medias del mes de agosto en Argentina.UNA COMPARACION DE DOS METODOLOGIAS PARA LA ESTIMACION DELVARIOGRAMA DE UN PROCESO ESPACIALAngela M. DiblasiTitular de la Ctedra EstadsticaGraciela Luca NardecchiaMara Elena ZabalJefes de Trabajos Prcticos de la Ctedra EstadsticaFacultad de Ciencias EconmicasUniversidad Nacional de CuyoIntroduccinExisten en la literatura estudios para modelar procesos que involucran variablesclimticas como la temperatura. Sin embargo la mayora de estos estudios no tienen encuenta la dependencia espacial, an cuando naturalmente estos fenmenos sonespaciales.Tradicionalmente los temas relacionados con el estudio de modelos para datosespaciales han sido incluidos en la disciplina conocida como Geoestadstica. Aunque susorgenes pueden ser atribuidos a Matheron en la dcada del sesenta, fue recin en ladcada del ochenta cuando varias contribuciones condujeron al desarrollo de lasherramientas estadsticas especficas para problemas provenientes de la geologa y laingeniera minera.Debido al reciente desarrollo de estas tcnicas existe una carencia deherramientas apropiadas a cada problema.Con el objetivo de explorar las herramientas estadsticas espaciales existentes noshemos propuesto aplicarlas a un conjunto de datos reales. La muestra consideradaresponde a valores de temperaturas medias del mes de agosto tomadas en distintasestaciones de la Argentina.Descripcin del problemaPara construir un modelo adecuado consideramos un proceso estocstico:Z(s), s Ddonde D es la regin en estudio, es decir un subconjunto de R2 yZ(s ) representa la media de la temperatura del mes de agosto en un lugar especfico sde la Argentina. Las coordenadas espaciales estn en consecuencia determinadas por s= (x, y) donde x representa la latitud e y la longitud.Vamos a considerar que este proceso puede ser descompuesto en una parte noaleatoria que representar la tendencia en el espacio, y una parte aleatoria que reflejarparticularmente la estructura de covarianza o variacin en pequea escala. Es decir,Z(s) m(s) e (s)donde m( s ) es una funcin no aleatoria de la ubicacin espacial, es decirs x y x y 0 1 2 m( ) m( , ) b b b , donde s x, yy e(s)es un procesoaleatorio con media nula.Un punto de partida en este trabajo es la estimacin de la media o drift param( s ) para cada s de la regin en estudio y la funcin de autocovarianzacov( s ,s ) covZ( s ),Z( s )i j i j para cada par ( s , s ) i j de puntos en el recintoespacial o el variograma s , s varZ( s ) Z( s )i j i j g .La estructura de covarianza o variacin a pequea escala del proceso Z(s)estrepresentada por el proceso e(s)y la media o variacin a gran escala por m(s).En principio para simplificar el problema, supondremos que el proceso e(s)esGaussiano con media nula estacionario e isotrpico. Es decir su variograma es unacurva que depende de la distancia entre todos los posibles pares posibles de ubicacionesa las que han sido observadas las variables del proceso, es decirs s s s s s hi j i j i j g , var e( ) e( ) g gAspectos preliminaresComo se mencion anteriormente hay dos puntos importantes a considerar:a) La estimacin de m(s)b) La estimacin de la estructura de covarianza o el variograma.En este sentido si m(s) m s , es decir m(s) es una funcin de lasubicaciones espaciales, entonces el variograma no puede estimarse directamente, esdecir a travs de Z(s).Por otra parte, si el variograma no es igual a una constante, es decir g (h) no esuna funcin constante de h, o lo que es lo mismo decir que las variables del procesoZ(s)no son independientes, entonces la estimacin de m(s) no puede hacerseutilizando el mtodo de los mnimos cuadrados ordinarios.La pregunta inicial es cmo analizar si existe tendencia?.Anlisis Exploratorio de los datosEsta es una forma preliminar del anlisis de la informacin espacial cuyo propsitoes hacer una identificacin inicial de las propiedades de la informacin. Los mtodosutilizados son los propuestos por Tukey (1977) adaptados a las necesidades de los datosespaciales.Los mtodos exploratorios necesitan ser resistentes a las observaciones que sonatpicas del modelo subyacente.1. Deteccin De OutliersUno de los objetivos del anlisis exploratorio de datos es la deteccin de outliersque se consideran observaciones inusuales en relacin con sus vecinos. Implcitamenteesto quiere decir que el modelo subyacente est gobernado por una clase deestacionariedad local que en general no es garanta de estacionariedad global. Laestacionariedad local puede modelarse considerando que la esperanza de una variableZ(s) del proceso es una funcin suave de la posicin s.Si se fija una direccin en el conjunto D y se analizan medias y medianas en esadireccin se puede detectar tanto la tendencia como la presencia de outliers.Las direcciones que se han fijado en el ejemplo de las temperaturas son dos: filas ycolumnas, Por esta razn se han reubicado los datos originales en una grilla regular deacuerdo a un sistema de coordenadas cartesianas colocando en el eje x las latitudes y en