modelamiento de datos espaciales y datos espacio-temporales

86
TRABAJO FIN DE MÁSTER MÁSTER EN ESTADÍSTICA APLICADA Modelamiento de Datos Espaciales y Datos Espacio-Temporales Análisis Espacial y Espacio-Temporal del Desplazamiento Forzado Autor Carlos Alfonso Mantilla Duarte (alumno) Director José Miguel Angulo Ibáñez (tutor) MÁSTER EN ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS UNIVERSIDAD DE GRANADA Granada, septiembre de 2017

Upload: others

Post on 01-Nov-2021

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

TRABAJO FIN DE MÁSTERMÁSTER EN ESTADÍSTICA APLICADA

Modelamiento de Datos Espaciales y DatosEspacio-Temporales

Análisis Espacial y Espacio-Temporal del Desplazamiento Forzado

AutorCarlos Alfonso Mantilla Duarte (alumno)

DirectorJosé Miguel Angulo Ibáñez (tutor)

MÁSTER EN ESTADÍSTICA APLICADA

FACULTAD DE CIENCIAS UNIVERSIDAD DE GRANADA

Granada, septiembre de 2017

Page 2: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Modelamiento de Espaciales y DatosEspacio-Temporales

Análisis Espacial y Espacio-Temporal del Desplazamiento Forzado

AutorCarlos Alfonso Mantilla Duarte (alumno)

DirectoresJosé Miguel Angulo Ibáñez (tutor)

Page 3: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Modelamiento de Datos Espaciales y Datos Espacio-Temporales: AnálisisEspacial y Espacio-Temporal del Desplazamiento Forzado

Carlos Alfonso Mantilla Duarte (alumno)

Palabras clave: Modelos Espaciales, Modelos Espacio-Temporales, Desplazamiento Forzado, Con-flicto Armado, Colombia

Resumen

Estimaciones recientes sugieren que cerca de 4.9 millones de colombianos han sido desplazados in-ternamente como resultado del prolongado conflicto armado y la violencia política asociada que en-vuelve al Estado y los grupos armados al margen de la ley.

Gran parte de ese desplazamiento forzado en los últimos años es el resultado directo o indirecto delas ofensivas militares de contraguerrilla por parte de los organismos del Estado y de la disputa por elcontrol de las zonas rurales, que históricamente han tenido presencia guerrillera, entre paramilitaresy guerrilla.

El presente documento busca realizar un modelamiento estadístico del desplazamiento forzado enColombia siempre que este fenómeno se entienda como un proceso espacial o un proceso espacio-temporal.

La primera parte hace una revisión teórica de los elementos que permiten entender porqué se va a mo-delar el fenómeno de desplazamiento forzado como un proceso espacial y, posteriormente, espacio-temporal. Se comienza con una descripción de lo que son los Sistemas de Información Geográficaque, para el estudio de caso, permiten definir los entes territoriales que son objeto de análisis.

Posteriormente, se realiza la definición de datos espaciales, sus características, tipos y formas de re-gistro y visualización y las distintas funciones que describen un proceso espacial y se termina esteapartado con una descripción de algunos modelos de interdependencia espacial. En la siguiente sec-ción se hace una descripción similar para el caso de los datos espacio-temporales.

En el segundo capítulo se realiza el estudio de caso: Desplazamiento Forzado en Colombia, periodo2007 - 2016. En primera instancia se estiman los modelos de interdependencia espacial: SAR,SEM ySDM. Posteriormente se construye un modelo espacio-temporal para un proceso Gaussiano debido alas características del fenómeno de desplazamiento forzado; luego se estima un modelo VAR.

En el capítulo final se presentan las conclusiones: los modelos SAR, SEM Y SDM son efectivos almomento de explicar el fenómeno de desplazamiento forzado. Los modelos espacio-temporales noson efectivos en el caso de estudio. Finalmente, se presenta la bibliografía relacionada. Se presentacomo anexo el código empleado en R.

Page 4: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Índice general

1. Marco Teórico 6

1.1. Sistemas de Información Geográfica (SIG) . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.1. ¿Qué son los SIG? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.2. Características de los SIG . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2. Datos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2.1. Evaluación del Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2.2. Estimación Óptima (Kriging) . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2.3. Estimación Empírica del Variograma y la Función de Covarianza . . . . . . 18

1.2.4. Modelización del Semivariograma . . . . . . . . . . . . . . . . . . . . . . . 19

1.2.5. Modelos de Interdependencia Espacial . . . . . . . . . . . . . . . . . . . . . 21

1.3. Datos Espacio - Temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.3.1. Características de los Datos Espacio-Temporales . . . . . . . . . . . . . . . 27

1.3.2. Procesos Espacio-Temporales . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.3.3. Estacionariedad y Estimadores Espacio-Temporales . . . . . . . . . . . . . . 32

1.3.4. Propiedades de la Función de Covarianza Espacio - Temporal . . . . . . . . 33

1.3.5. Modelos Espacio - Temporales . . . . . . . . . . . . . . . . . . . . . . . . . 33

2. Estudio de Caso: Desplazamiento Forzado en Colombia, Análisis Espacial y Espacio-

Temporal 39

2.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.2. Análisis Exploratorio de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.3. Modelos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.3.1. Modelo SAR: Spatial Auto Regresive . . . . . . . . . . . . . . . . . . . . . 49

2.3.2. Modelo SEM: Spatial Error Model . . . . . . . . . . . . . . . . . . . . . . . 52

2

Page 5: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

2.3.3. Modelo SDM: Spatial Durbin Model . . . . . . . . . . . . . . . . . . . . . 54

2.4. Modelo Espacio-Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.4.1. Modelo de Interdepencia Espacio-Temporal . . . . . . . . . . . . . . . . . . 58

2.4.2. Modelo VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3. Conclusiones 65

3

Page 6: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Índice de figuras

1.1. Ejemplo de Capas o Coberturas (layers) con información sobre la calidad del aire en

Madrid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2. Ejemplo de Capas Tipo Raster tomado de Hijmans (2016a) . . . . . . . . . . . . . . 8

1.3. Descripción de Estacionariedad: dos vectores con idénticos rezagos (Sherman, 2011) 18

1.4. Representación Gráfica de los Modelos para Semivariograma . . . . . . . . . . . . . 22

1.5. Representación Gráfica de los Modelos para Covarianza . . . . . . . . . . . . . . . 22

1.6. Ejemplificación de los casos de objetos espacio-temporales identificados por Pebesma

(2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1. Total de Víctimas del Desplazamiento Forzado en Colombia (1 de enero de 2007 - 31

de diciembre de 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.2. Mapa de Variables de Conflicto Armado: Desplazamiento Forzado y Acciones Béli-

cas. Total acumulado 2007 - 2016 . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.3. Total Mensual Víctimas de Desplazamiento Forzado en Colombia (enero 2007 - di-

ciembre 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.4. Total Acumulado Mensual Víctimas Desplazamiento Forzado en Colombia (enero

2007 - diciembre 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.5. Gráfica de Dispersión - I de Morán para Desplazamiento Forzado . . . . . . . . . . . 45

2.6. Mapa de Correlación Local (Coeficiente I de Moran) . . . . . . . . . . . . . . . . . 48

2.7. Gráfica de Dispersión Acciones Bélicas y Desplazamiento Forzado . . . . . . . . . . 48

2.8. Mapa Residuos SAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.9. Histograma del Efecto Equilibrio Modelo SAR . . . . . . . . . . . . . . . . . . . . 53

2.10. Efecto Equilibrio Modelo SAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2.11. Mapa Residuos SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4

Page 7: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

2.12. Mapa Residuos Modelo SDM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

2.13. Locaciones Espacio-Temporales de las observaciones divididas en Zonas, gráfica de

comprobación de cuantiles y dependencia de las observaciones con el Área del Mu-

nicipio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

2.14. Validación Cruzada de los resultados para las posibles funciones base . . . . . . . . 60

2.15. Estimaciones de regresión de β1(s) y β2(s) en cada ubicación, con intervalos de con-

fianza del 95%, en función del Área del municipio . . . . . . . . . . . . . . . . . . 61

5

Page 8: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Capítulo 1

Marco Teórico

1.1. Sistemas de Información Geográfica (SIG)

1.1.1. ¿Qué son los SIG?

Tradicionalmente, el almacenamiento y el análisis de los datos espaciales se ha hecho mediante los

Sistemas de Información Geográfica - SIG (comúnmente llamados GIS por su nombre en inglés:

Geographical Information Systems). Según Burrough, McDonnell & Lloyd (2015) un GIS es: “... una

poderoso conjunto de herramientas para recolectar, almacenar, recuperar a voluntad, transformar y

mostrar datos espaciales del mundo real...”

Por su parte, Huisman & A. de By (2009) definen un SIG como “...un sistema de base computacional

que provee el siguiente conjunto de capacidades para manipular datos georreferenciados”:

1. Captura y preparación de datos

2. Manejo de datos, incluyendo almacenamiento y mantenimiento

3. Manipulación y análisis de datos

4. Presentación de datos

Lo anterior implica que los usuarios de un SIG pueden introducir datos (georreferenciados) al sistema,

analizarlos por varios métodos y generar una presentación de los mismos mediante mapas y sistemas

de coordenadas geográficas.

6

Page 9: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

(a) Capa de Información NO2 (b) Capa Información NO2 + Capa Mapa

Figura 1.1: Ejemplo de Capas o Coberturas (layers) con información sobre la calidad del aire enMadrid

1.1.2. Características de los SIG

Los SIG se caracterizan por contar con una amplia gama de plataformas, aplicaciones, arquitecturas,

aplicaciones, procedimientos, etc., que permiten la gestión de datos espaciales.

La información en los GIS se estructura en capas o coberturas (layers) y cada capa ofrece un tipo de

información. Por ejemplo, las Figuras 1.1a y 1.1b muestran ejemplos de capas tomados de Perpiñán

(2014) con información sobre la calidad del aire para Madrid. Una capa en el prime caso; dos capas en

el segundo. La construcción de estas capas se hace a partir de un sistema de coordenadas geográficas

(georreferenciación).

La presentación de los objetos geográficos se hace mediante dos formatos básicos: vector y raster.

El vector se representa a partir de tres elementos: puntos, líneas y polígonos. El primero se localiza

mediante un par de coordenadas (x e y), la línea mediante dos pares de coordenadas y el polígono

mediante varios pares de coordenadas. La Figura 1.1a es un ejemplo de vector representado mediante

puntos.

Un “raster” es una estructura de datos espaciales que divide una región en rectángulos llamados celdas

o pixeles que puede almacenar uno o más valores para cada una de esas celdas (Hijmans, 2016a). Las

7

Page 10: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

(a) ’Raster’ con 100 Celdas (b) ’Raster’ Generado desde Archivo

Figura 1.2: Ejemplo de Capas Tipo Raster tomado de Hijmans (2016a)

Figuras 1.2a y 1.2b muestran dos formas de visualización de objetos tipo raster: (a) es el “esqueleto”

del raster definiendo “a mano” el número de filas, el número de columnas y la resolución; (b) un

obtejo tipo raster creado a partir de otro objeto.

Entre otros, los usos más destacados de los SIG son: arqueología, medio ambiente, prevención de

desastres, cartografía y planimetría, exploración de recursos energéticos, demografía, marketing so-

cial, transporte, epidemiología, etc.; asociándose al manejo de datos espaciales.

1.2. Datos Espaciales

Los datos espaciales (también conocidos como datos geoespaciales) están directa o indirectamente

referenciados con una localización sobre la superficie de la tierra (Perpiñán, 2014). Su referencia es-

pacial se compone de valores de coordenadas y un sistema de referencia para esas coordenadas. El

análisis de estos datos se hace a partir de la geoestadística la cuál cuenta con múltiples herramientas

para su modelamiento.

Con base en lo anterior, un proceso de interés para el análisis geoestadístico presenta una número

determinado de observaciones (n) y ese número de observaciones son denotados por Z(sss1), . . .Z(sssn),

aunque algunas veces se denota como Z1, . . . ,Z2 (Sherman, 2011). Básicamente, el modelamiento

8

Page 11: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

busca:

1. Realizar estimaciones en puntos no observados

2. Comprender la conexión entre puntos “vecinos”.

Para describir la relación entre los puntos, es necesario introducir los siguientes modelo de correla-

ción (Sherman, 2011):

Estacionariedad de Segundo Orden (SOS)

1. E[Z(sss)]−µ = 0

2. Cov[Z(sss+hhh)−Z(sss)] =Cov[Z(hhh),Z(000)] =C(hhh) ∀ hhh

Que es similar a la Estacionariedad Intrínseca (IS):

1. E[Z(sss)]−µ = 0

2. Cov[Z(sss+hhh)−Z(s)] =: 2γ(hhh) ∀ hhh

El término 2γ(hhh) es conocido como función de variograma y γ(hhh) semivariograma. Según Sherman

(2011), las razones por las cuales se prefiere el supuesto de IS sobre el de SOS son:

1. IS es más general que SOS:

Si se asume que 2γ(hhh) = 2[C(000)−C(hhh)], entonces, se puede definir el variograma como el lado

derecho de la igualdad. Adicionalmente, si se considera un proceso AR(1) con ρ = 1, es decir,

Zi = Zi−1 + εi, se tiene:

Zi+ j = Zi +δ j con Var(δ j)= jσ2 (1.1)

Entonces, Cov[Zi+ j,Zi] = iσ2 que es una función de i que SOS no tiene.

2. Los variogramas adaptan de una manera más fácil las observaciones no estacionarias.

3. Para estimar el variograma no se requiere una estimación de µ

4. La estimación del variograma es tan fácil como la estimación de la función de covarianza

9

Page 12: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

1.2.1. Evaluación del Error

El modelo inicial para una estimación óptima parte de una estructura simple que incluye la media

subyacente; según Sherman (2011) este modelo básico es:

Z(sss) = µ +δ (sss) (1.2)

donde µ es una constante desconocida y δ (sss) es un proceso intrínsecamente estacionario; luego, es

posible asumir que Z(sss) es IS. Al considerar una locación no muestreada, sss0, lo deseable es conocer

el valor no observado para el proceso Z(sss0); el objetivo es encontrar la mejor estimación para Z(sss0)

a partir de los valores de Z(sss1) . . .Z(sssn) para lo cual se minimiza MSE[Z(sss0)] = E{[Z(sss0)−Z(sss0)]2}.

La solución es:

Z(sss0) = E[Z(sss0)|Z(sss1) . . .Z(sssn)] (1.3)

Se denotará el vector de n observaciones como ZZZn := [Z(sss1) . . .Z(sssn)], se tiene:

E{[Z(sss0)−Z(sss0)]2} = E

({Z(sss0)−E[Z(sss0)|ZZZn]+E[Z(sss0)|ZZZn]−Z(sss0)

}2)

= E({

Z(sss0)−E[Z(sss0)|ZZZn]}2)+E

({E[Z(sss0)|ZZZn−Z(sss0)]}2

)+ 2E

({Z(sss0)−E[Z(sss0)|ZZZn]

}{E[Z(sss0)|ZZZn−Z(sss0)]}

)(1.4)

Como 2E({

Z(sss0)−E[Z(sss0)|ZZZn]}{E[Z(sss0)|ZZZn−Z(sss0)]}

)= 0, entonces:

MSE[Z(sss0)] = E({

Z(sss0)−E[Z(sss0)|ZZZn]}2)+E

({E[Z(sss0)|ZZZn−Z(sss0)]}2

)(1.5)

Y 1.5 se minimiza cuando Z(sss0) = E [Z(sss0)|ZZZn], la estimación de la varianza para este estimador es

(Sherman, 2011):

E({E [Z(sss0)|ZZZn]−Z(sss0)}2

)(1.6)

A partir de 1.6 el estimador Z(sss0) = E[Z(s0s0s0)|ZZZn] se hace, intuitivamente, la mejor estimación para

cualquier nueva observación basada en los valores observados y las expectativas dados los valores

10

Page 13: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

observados. Cuando Z(sss) tiene una distribución continua las expectativas condicionales dependen de

la articulación de las distribuciones de las observaciones y el cálculo de la media condicional requie-

re del conocimiento de esta densidad articulada y el cálculo de una integral (n+ 1)− dimensional

(Sherman, 2011). Dado que sólo se cuenta con n observaciones esta no sería la esperanza de las ob-

servaciones sino la esperanza de la estimación de las expectativas condicionales. Así, la mejor función

lineal que permite la búsqueda del estimador Z(sss0) es:

Z (sss0) =n

∑i=1

λiZ (sssi) (1.7)

Para valores constantes de λi, i = 1, . . . ,n.

Con esta condición en 1.7, se cambia el problema de estimar una distribución (n+1)−dimensional

a estimar n constantes.

Como la media se asume constante en 1.2, parece natural requerir que E[Z(∼0)] = µ; lo que implicaría

que la expectativa del estimador es la expectativa de la estimación, es decir, el estimador es insesgado.

Para esto, se requiere que ∑ni=1 λi = 1; ahora, el objetivo es minimizar:

E

[

n

∑i=1

λiZ(sssi)−Z(sss0)

]2 sujeto a

n

∑i=1

λi = 1 (1.8)

Según Sherman (2011), en 1.8 puede aparecer algún λi negativo, lo que puede ser inapropiado; sin

embargo, la presencia de pesos negativos es necesaria en un conjunto grande de observaciones, incluso

en un conjunto pequeño de observaciones.

1.2.2. Estimación Óptima (Kriging)

Obtener una estimación óptima implica definir el mejor estimador lineal. Para encaminarse en este

objetivo, Sherman (2011) propone expandir el término del error:

[Z(sss0)− Z(sss0)

]2= Z2(sss0)−2

n

∑i=1

λiZ(sss0)Z(sssi)+n

∑i=1

n

∑j=1

λiλ jZ(sssi)Z(sss j) (1.9)

11

Page 14: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Completando el cuadrado en los dos primeros términos de la derecha en 1.9, se tiene:

[Z(sss0)− Z(sss0)

]2=

n

∑i01

λi [Z(sssi)−Z(sss0)]2−

n

∑i=1

n

∑j=1

λiλ j

[Z(sssi)−Z(sss j)

]22

(1.10)

Si se considera que γ(hhh) = 12E [Z (s+hs+hs+h)−Z (sss)]2 para todo hhh, se tiene que 1.10 es la varianza de la

estimación para un estimador linear usando cualquier λi, i = 1, . . . ,n (Sherman, 2011).

La expresión 1.10 puede reescribirse:

H (λ1, . . . ,λn) = F (λ1, . . . ,λn)−mG(λ1, . . . ,λn) (1.11)

condicionado a G(λ1, . . . ,λn) := ∑ni=1 λi − 1 = 0 y donde m es un multiplicador de Lagrange, al

diferenciar H respecto a λi, i = 1, . . . ,n, se tiene:

dHdλi

= 2γ (sss0−sssi)−2n

∑j=1

λ jγ(sssi−sss j

)−m (1.12)

y

dHdm

=−m

∑i=1

λi +1 (1.13)

igualando a 0 las n+1 derivadas que se generan, la única solución del sistema está dada por (Sherman,

2011):

n

∑j=1

λ jγ(sssi−sss j

)+

m2= γ (sss0−sssi) , i = 1, . . . ,n (1.14)

y

n

∑i=1

λi = 1 (1.15)

Donde 1.14 y 1.15 conforman un sistema lineal de la forma:

12

Page 15: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

γ11 . . . γ1n 1...

......

...

γn1 . . . γnn 1

1 . . . 1 0

λ1

...

λn

m2

=

λ01

...

λ0n

1

(1.16)

donde γi j = γ(sssi−sss j

)

Como 1.16 puede simplificarse escribiendo Γλ = γΓλ = γΓλ = γ; si ΓΓΓ es invertible se tiene

λ = Γ−1

γλ = Γ−1

γλ = Γ−1

γ (1.17)

Los primeros n elementos de λ dan los pesos del mejor estimador lineal de Z(sss0). El estimador

Z(sss0) = ∑ni=1 λiZ(sssi) con esos pesos óptimos es lo que se conoce como kriging (Sherman, 2011).

Los errores asociados al estimador kriging están dados por la varianza kriging:

σ2Z0

:= E{[

Z (sss0)− Z (sss0)]2}

= 2n

∑i=1

λiγ (sss0−sssi)−n

∑i=1

n

∑j=1

λiλ jγ(sssi−sss j

)(1.18)

=n

∑i=1

λiγ (sss0−sssi)+m2= λλλ

Tγγγ

El estimador kriging es un interpolador exacto en el sentido que las ecuaciones kriging dan Z(sssi) =

Z(sssi) para todas las variables observadas y para i = 1, . . . ,n (Sherman, 2011).

Intervalos de Confianza

En general, estimar un intervalo de confianza para valores predictivos de Z(sss0) puede presentar varias

dificultades. Sin embargo, si las observaciones se encuentran normalmente distribuidas los intervalos

de confianza pueden resultar sencillos de estimar.

Si se tiene que ZZZ ∼ N (µ,ΣΣΣ), entonces, ∑ni=1 λiZi posee una distribución normal multivariada para

13

Page 16: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

algún λi cuyo intervalo se puede representar:

Z (sss0)±Zα

√σ2

z0(1.19)

Donde Zα corresponde a la distribución normal estándar.

Distribución Log-Normal

Una de la distribuciones más populares en el campo de los datos espaciales es la distribución Log-

Normal. En particular, el problema de la estimación en los campos aleatorios log-normales tiene una

larga historia en la literatura geoestadística donde la metodología estadística asociada es llamada, ge-

neralmente, kriging log-normal (De Oliveira, 2006).

Se tiene que µ = (µ1, . . . ,µn)′ es un vector arbitrario de tamaño n× 1 y Σ es una matriz definida

positiva de tamaño n× n. El vector ZZZ = (Z1, . . . ,Zn)′ presenta una distribución log-Gaussiana (log-

normal) denotada por ZZZ ∼ Λn (µµµ,ΣΣΣ); si ZZZ d= exp{YYY}, donde YYY = (Y1, . . . ,Yn)

′ tiene una distribución

normal multivariada con media µµµ y varianza ΣΣΣ, para algún vector vvv = (v1, . . . ,vn)′ y alguna función

de una variable g(·), es posible definir g(vvv) := (g(v1) , . . . ,g(vn))′ (Rui & De Oliveira, 2008). Las

funciones de la media y la covarianza para el vector ZZZ vienen dadas por (De Oliveira, 2006)

E [Z (sss)] = exp{

µY +σ2

Y2

}=: µZ

cov{Z (sss) ,Z (uuu)} = µ2Z (exp{CY (s,us,us,u)}−1)

Que puede reescribirse según Sherman (2011) como:

E [Z (sss)] = exp{

µ(sss)+σ2

2

}cov[Z (sssi) ,Z

(sss j)]

= µ(sssi)µ(sss j)[exp(Σsssi,sss j

)−1]

Si el predictante Z(sss0) es definido junto con las observaciones de ZZZ, entonces (Sherman, 2011):

14

Page 17: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

[Z (sss0) ,ZZZT ]T ∼ Λn+1

µY0

µYYY

,

σ2Y0

CT0Y

C0Y ΣYYY

(1.20)

donde C0Y representa el vector de covarianza Cov [Y (sss0,YYY )]n×1; por lo tanto, el estimador E [Z (sss0) |ZZZ]

es dado por:

Z∗ (sss0) = exp[Y ∗ (sss0)+

σ∗0Y2

](1.21)

donde

Y ∗ (sss0) = E [Y (sss0|YYY )] = µ0 +CT0Y Σ−1Y (YYY −µYYY ) (1.22)

y

σ∗0Y =Var [Y (sss0|YYY )] = σ

2−CT0Y Σ−1Y C0Y (1.23)

son conocidos como estimador simple kriging y la varianza simple kriging de Y0 (De Oliveira, 2006),

asumiendo que µY es conocida (Sherman, 2011).

En general, como se asume que µY es desconocida, las opciones para predecir observaciones son

(Sherman, 2011):

1. Krigning Log-Normal:

En primer lugar, es necesario encontrar el mejor estimador linear insesgado de Y (sss0). Enton-

ces, se exponencia este estimador usando una corrección multiplicativa de sesgo para hacer

E[Z(sss0)] = E[Z(sss0)]. En otras palabras,

Y 0K(sss0) = λT0YYYY (1.24)

donde λ0Y es el vector de pesos ordinarios usados para predecir Y (sss0) con base en YYY . Así, el

kriging log-normal está dado por (Rui & De Oliveira, 2008):

15

Page 18: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

ZLK (sss0) = exp[Y 0K +

12(Cy (sss0,sss0)−λ

′ (sss0)ΣY λ (sss0))]

= exp[Y 0K (sss0)+

12

σ0KY (sss0)−xxx′ (sss0)m(sss0)

](1.25)

Que puede ser reescrito en términos del kriging ordinario:

ZLK (sss0) = exp[Y 0K (sss0)+σ

2Y0−mOY

](1.26)

donde, σ2Y0

es la varianza de kriging y mOY es un multiplicador de Lagrange que representa el

tercer término del exponencial en 1.25

2. Tratar de alcanzar el estimador óptimo L2 para estimar Z (sss0) y no ln [Z (sss0)] a partir de:

Z (sss0) = exp[aTY −K0

], aT 1 = 1 (1.27)

Con manipulación matemática de 1.27, puede mostrarse que el estimador óptimo es (Sherman,

2011):

Z = exp[Z (sss0)+σ

2Y0−2mOY

](1.28)

Comparando 1.26 con 1.28 se observa que con un simple remplazo en el término que multiplica

mOY se obtienen expresiones equivalentes.

Kriging Universal

Hasta el momento se ha considerado que la función de la media es constante, esto es E [Z (sss)] = µ .

En muchos, un modelo más apropiado seria:

Z (sss) = µ (sss)+δ (sss) (1.29)

Uno de los ejemplos más comunes donde la función de la media no es constante es aquel donde

la función de media del campo espacial depende de la localización espacial; en cuyo caso se tiene

16

Page 19: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

sss = (x,y); en cuyo caso, un modelo razonable para algún entero positivo r sería (Sherman,2011):

µ (sss) = ∑0≤k+1≤r

βk,lxkyl (1.30)

Para observaciones en una cuadrícula regular, una función de media que depende de coordenadas

espaciales está dada por:

µ (sss) = a+ c(x)+ r (y) (1.31)

Donde c(x) describe la media en la coordenada x para todas las observaciones y r (y) la media en la

coordenada y. De manera más general se tiene (Sherman, 2011):

µ (sss) =p

∑k=1

fk−1,sβk−1 (1.32)

donde f j,s es una función conocida y β j es un parámetro desconocido.

Para simplificar el modelo para la media no constante se tiene:

ZZZ =XXXβ +δβ +δβ +δ (1.33)

donde XXX es una matriz n× p. En el caso de un Modelo Lineal Generalizado, se tiene que los erro-

res se asumen como independientes; mientras, en este caso, los errores δ (sssi) se supone que son la

estacionariedad intrínseca. Bajo este MLG, el predictante es (Sherman, 2011):

Z (sss0) = xxxT0 βββ +δ (sss0) (1.34)

donde xxx0 describe las p covarianzas para la locación que se desea predecir. El estimador lineal se sigue

asumiendo de la forma Z (sss0) = ∑ni=1 λiZ (sssi) (Sherman, 2011); por lo que la imparcialidad requiere:

E[Z (sss0)

]=

n

∑i=1

λiµ (sssi) =n

∑i=1

λixxxTi βββ = xxxT

0 βββ (1.35)

Si se procede de manera análoga que con el estimador kriging ordinario, se tiene (Sherman, 2011):

λλλ =ΓΓΓ−1

γγγ (1.36)

17

Page 20: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 1.3: Descripción de Estacionariedad: dos vectores con idénticos rezagos (Sherman, 2011)

donde λ = (λ1, . . . ,λn,m1, . . . ,mp)T , γ =

[γ (sss0−sss1) , . . . ,γ (sss0−sssn) ,1, f1,sss0, . . . , fp−1,sss0

]y ΓΓΓ es una

matriz de dimensiones (n+ p)×(n+ p). Con esto, el estimador universal kriging y su varianza vienen

dados por (Zimmerman & Stein, 2010):

Y (sss0) =[ΓΓΓ+XXX

(XXXT

ΓΓΓ−1XXX

)−1 (xxx0−XXXT

ΓΓΓ−1)]T

ΓΓΓ−1YYY (1.37)

y

σ2 (sss0) = γ

TΓΓΓ−1

γ−(XXXT

ΓΓΓ−1

γ−xxx0)T (

XXXTΓΓΓ−1XXX

)−1 (XXXT

ΓΓΓ−1

γ−xxx0)

(1.38)

1.2.3. Estimación Empírica del Variograma y la Función de Covarianza

En general, el variograma y las funciones de covarianza son desconocidas; hasta el momento, estas

han sido asumidas como conocidas y se requiere estimarlas a partir de los datos disponibles.

Para estimar de manera empírica el variograma y la función de covarianza se asume que la estaciona-

riedad se mantiene (bien sea la intrínseca (IS) o de Segundo Orden (SOS). La Figura 1.3 (Tomada de

Sherman, 2011) muestra un par de puntos separados por un rezago espacial hhh dada una estimación de

2γ (hhh), a saber {[Z(sssi)−Z(sss j)]2} con sssi−sss j = hhh. Lo que sugiere que el estimador intuitivo del semi-

variograma se obtiene a partir del promedio de todos los pares de puntos; por lo tanto, el estimador

empírico del semivariograma viene dado por (Zimmerman & Stein, 2010):

18

Page 21: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

γ (hhh) =1

2N (hhh) ∑sssi−sss j=hhh

{e(sssi)− e

(sss j)}2 (1.39)

donde e(sss∗) = Z (sss∗)

Y, para estimar la función empírica de covarianza se usa (Sherman, 2011):

C (hhh) =1

N (hhh) ∑sssi−sss j=hhh

[Z (sssi)−Zn

][Z(sss j)−Zn

](1.40)

Como se observa en 1.40, se emplea un estimador de µ , Zn para definir la covarianza; lo que hace

que E[C(hhh)] 6=C(hhh). Sin embargo, es claro que E[γ(hhh)] = γ(hhh) lo que hace preferir la estimación de

la función del variograma por sobre la función de covarianza.

1.2.4. Modelización del Semivariograma

De momento, se tiene un estimador intuitivo e imparcial; sin embargo, los estimadores del semivario-

grama y la función de covarianza presentan ineficiencias.

En primera instancia, estos estimadores no satisfacen las propiedades de la covarianza definida como

no negativa y el semivariograma definido no positivo (Sherman, 2011). En segundo lugar, este esti-

mador da, de momento, estimaciones de correlación sólo a los rezagos observados y, para estimar el

kriging en un punto, sss0, no observado se requiere estimar la correlación para los rezagos no obser-

vados. En otras palabras, se necesita un estimador de la correlación espacial para cualquier rezago

espacial.

Una solución bastante común para estas ineficiencias es ajustar un modelo paramétrico que cumpla

algunas consideraciones (conocimiento previo, simplicidad computacional, flexibilidad suficiente) y

que se base en la evaluación del semivariograma empírico. Las siguientes condiciones son necesarias

y suficientes para que un modelo para el semivariograma sea válido (siempre que se mantenga para

todo θ ∈Θ, donde Θ es el espacio paramétrico de θ ) (Gelfand et all, 2010):

1. γ (0,θ) = 0

19

Page 22: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

2. γ (−h−h−h;θ) = γ (hhh,θ) ∀ hhh

3. ∑ni=1 ∑

nj=1 aia jγ

(sssi−sss j;θ

)≤ 0 ∀ n;sss1, . . . ,sssn y ai, . . . ,a j tal que ∑

ni=1 ai = 0

Existe una gran variedad de modelos que satisfacen los requerimientos anteriores (en R2 y R3); los

más empleados en la estimación del semivariograma γ(hhh;θ) y la función de covarianza C(hhh;θ) según

Gelfand et all (2010) y Sherman (2011) son 1

Esférico

γ (hhh;θ) =

θ1

(3hhh2θ2− hhh3

2θ 32

)para 0≤ hhh≤ θ2

θ1 para hhh > θ2

(1.41)

C (hhh;θ) = θ1

(1− 3hhh

2θ2+

hhh3

2θ 32

)para 0 < θ1 ; hhh≤ θ2 (1.42)

Exponencial

γ (hhh;θ) = θ1

{1− exp

(− hhh

θ2

)}(1.43)

C (hhh;θ) = θ1exp(− hhh

θ2

)para 0 < θ1 ; 0 < θ2 ; hhh≤ θ2 (1.44)

Gaussiano

γ (hhh;θ) = θ1

{1− exp

(−hhh2

θ 22

)}(1.45)

C (hhh;θ) = θ1exp(−hhh2

θ2

)para 0 < θ1 ; 0 <

1θ2

(1.46)

1En este caso, θ1 = σ4; θ2 = m (que es el rango de la correlación) y hhh≡‖ hhh ‖ y denota la longitud del vector

20

Page 23: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

De Matérn

γ (hhh;θ) = θ1

(1− (h/θ2)

ν Kν (h/θ2)

2ν−1Γ(ν)

)(1.47)

C (hhh;θ) =σ2

Γ(ν +1/2)

(hhh

2/θ2

)Kν

(hhhθ2

)(1.48)

donde Kν es una función de Bessel modificada del segundo tipo de orden ν

De Potencia

γ (hhh;θ) = θ1hhhθ2 (1.49)

En el modelo de potencia no existe o está ausente la función de covarianza (Sherman, 2011).

La Figura 1.4 corresponde a la representación gráfica para las modelos citados, tomada de Gelfand

(2011). La Figura 1.5, tomada de Sherman (2011), corresponde a la representación gráfica de los

modelos de Covarianza.

1.2.5. Modelos de Interdependencia Espacial

En los procesos espaciales es posible incorporar relaciones mutuas entre variables que definen el

fenómeno estudiado. Todo modelo espacial ha de caracterizarse por su interdependencia, es decir,

deben incorporarse relaciones mutuas entre las observaciones de las variables económicas, sociales,

demográficas, etc. (Moreno & Vayá, 2000). Como tal, son varios los modelos que permiten realizar

un análisis confirmatorio de la interdependencia espacial.

Modelo Espacial Autorregresivo (SAR)

El Modelo Espacial Autorregresivo (SAR2) es una variación del modelo de Mínimos Cuadrados Ordi-

narios (OLS3) que incorpora el rezago espacial de la variable dependiente (Zhukov, 2010). El modelo

puede expresarse como (Ward & Gleditsch, 2007):

2Por su nombre en inglés Spatial Autoregressive Model3Ordinary Least Squares

21

Page 24: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 1.4: Representación Gráfica de los Modelos para Semivariograma

Figura 1.5: Representación Gráfica de los Modelos para Covarianza

22

Page 25: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Y = ρWyWyWy+XXXβ + ε (1.50)

ε ∼ N(0,σ2III

)(1.51)

donde III representa una matriz diagonal inversa. Si ρ = 0 se deduce que no existe dependencia espacial

y por lo tanto el modelo especificado corresponde a un modelo OLS.

Sin embargo, usar un modelo OLS para estimar la dependencia espacial puede ser problemático por

lo que es conveniente usar estimadores de máxima verosimilitud (MLE4) para el rezago espacial en

cuyo caso el estimador puede escribirse (Ward & Gleditsch, 2008):

β =(XXX ′XXX

)−1XXX ′ (III−ρWWW ) (1.52)

En caso que ρ sea desconocida se dificulta la estimación del parámetro siempre que la función del

logaritmo de verosimilitud envuelve el determinante de |III−ρWWW |. Sin embargo, Ord demostró en su

texto de 1975 que si WWW tiene valores propios (ω1, . . . ,ωn) entonces (Ward & Gleditsch, 2008):

|ωIII−ρWWW |=n

∏i=1

(ω−ρωi) (1.53)

Esto, a su vez, implica que:

|III−ρWWW |=n

∏i=1

(1−ρωi) (1.54)

Si se sabe que la función de verosimilitud logarítmica para un modelo clásico de regresión es:

lnL(β ,σ2) =− N2ln(2π)

− N2ln(2σ2)

− (y−XXXβ )′(y−XXXβ )

2σ2 (1.55)

Por contraste, la función del logarítmica de verosimilitud para el modelo de dependencia espacial es

(Ward & Gleditsch, 2008):4Maximum Likelihood Estimator

23

Page 26: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

lnL(β ,σ2,ρ) = ln|III−ρWWW |− N2ln(2π)

− N2ln(2σ2)

− (y−ρWWW −XXXβ )′(y−ρWWW −XXXβ )

2σ2 (1.56)

Según Ward & Gleditsch (2008), Ord (1975) sugiere que ωi puede ser dado como una condición a

priori a la estimación lo que facilita la estimación del modelo.

El parámetro β refleja el impacto directo de corto plazo ed xi sobre yi. Sin embargo, es necesario

determinar el impacto directo xi sobre yi a partir de la influencia que yi ejerce sobre sus vecinos y j y

que retorna a yi, lo que se conoce como Efecto Equilibrio.

Este efecto equilibrio de un cambio en xi sobre yi puede calcularse como:

E[∆y] = (IIIn−ρWWW )−1∆XXX (1.57)

donde ∆XXX es una matriz de cambios de las covariables y ∆y es el cambio asociado en la variable

dependiente.

Modelo de Error Espacial (SEM)

Mientras que los modelos de variable dependiente (como el SAR) consideran la dependencia espacial

como sustancial, en el sentido que el valor de y en la localización i está influenciando el el valor de y

en la localización j (siempre que i 6= j), el Modelo de Error Espacial (SEM5 trata a la correlación es-

pacial como una molesta, al igual que muchos enfoques estadísticos trata la correlación serial espacial

como algo que debe eliminarse y, únicamente, como un problema de estimación (Ward & Gleditsch,

2007).

Este enfoque, generalmente, se concentra en la estimación del los parámetros para las variables in-

dependientes de interés en la parte sistemática del modelo y ,esencialmente, desestima la posibilidad

que la correlación observada pueda reflejar algo significativo sobre el proceso de generación de los

datos. Así, en lugar de dejar que yi afecte directamente a y j, el modelo de error espacial supone que

5Spatial Error Model

24

Page 27: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

los errores de un modelo están espacialmente correlacionados (Ward & Gleditsch, 2007).

Para plantear el modelo SEM se parte de la expresión presentada en la ecuación 1.50; si se considera

que wiwiwi denota el vector de WWW que indica que tan cercanas a las unidades i son las unidades j 6= i, el

modelo puede escribirse (Ward & Gleditshc, 2007):

yi = xixixiβ + εi +λwiwiwiξi (1.58)

donde ε representa el error espacialmente incorrelacionado que satisface la hípotesis de regresion

normal; ξ representa el término que indica el error espacial y el parámetro λ indica el grado en que el

componente espacial de los errores ξ están correlacionados entre sí para las observaciones cercanas,

tal como lo indica el vector de conectividad wiwiwi.

El modelo puede reescribirse matricialmente como (Ward & Gleditsch, 2007):

y = XXXβ +λWWWξ + ε (1.59)

ε ∼ N(0,σ2III) (1.60)

donde es más fácil visualizar que si las observaciones i y j no presentan correlación espacial el pará-

metro λ será 0 y el modelo se reduce a una regresión lineal estándar.

La función del verosimilitud logarítmica del SEM es (Zhukov, 2010):

lnL = −n2+ ln |III−λWWW |− e′e

2σ2 (1.61)

e = (III−λWWW )(y−XXXβ ) (1.62)

Como el SEM no involucra los rezagos espaciales de la variable dependiente, los parámetros β esti-

mados pueden interpretarse como derivadas parciales:

25

Page 28: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

βk =∂yi

∂xi j∀ i,k (1.63)

donde i indica la observación y k la variable explicativa.

Modelo Espacial de Durbin (SDM)

El Modelo Espacial de Durbin (SDM6 tiene una motivación similar a la del modelo SEM: lo con-

cerniente a variables omitidas (Zhukov, 2010). Un punto de partida simple para la formulación del

modelo se observa en la ecuación 1.64:

y = XXXβ +(IIIn−λWWW )−1uuu (1.64)

uuu = XXXγ +vvv (1.65)

vvv ∼ N(0,σ2IIIn) (1.66)

Si se observa en detalle, es una variación del SEM donde γ y σ2 son escalares que definen la fuerza

de la relación entre XXX y (IIIn−λWWW )−1.

Sustituyendo uuu en 1.64 se tiene:

y = ρWyWyWy+αιn +XXXβ +WXWXWXθ + ε (1.67)

que es la expresión del SDM donde se incluyen los rezagos espaciales tanto de la variable dependiente

como de las independientes. Así, la función de verosimilitud logarítmica se expresa de la forma:

lnL = −n2

ln(πσ

2)+ ln |IIIn−ρWWW |− e′e2σ2 (1.68)

e ∼ yyy−ρWyWyWy−ZZZδ (1.69)

donde ZZZ = [ι XXX WXWXWX ], δ = [α β θ ] y ρ está delimitado por (min(ω)−1),(max(ω)−1) y ω es un vector

de tamaño n×1 que representa los valores propios de WWW .

6Spatial Durbin Model)

26

Page 29: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

1.3. Datos Espacio - Temporales

Un proceso espacial describe la distribución de puntos en un espacio bidimensional. Los procesos

espacio-temporales pueden llegar a considerar al tiempo como una coordenada más y contemplar este

proceso como un caso especial de un proceso espacial de dimensión superior (Gelfand, Diggle, Fuen-

tes & Guttorp, 2010). Sin embargo, un enfoque más adecuado consiste en considerar los procesos

espacio-temporales como procesos espaciales de dimensión dos mas uno. En este contexto, dos mas

uno no es igual a tres en el sentido que el tiempo es una dimensión fundamentalmente diferente a

cada una de las otras dos dimensiones espaciales (Diggle, 2014).

En concreto, los procesos espaciales son procesos estocásticos representados como{

Y (sss) : sss ∈ D⊆ Rd×R}

descritos dentro de un dominio Euclidiano; ahora bien, en el caso espacio-temporal debe considerarse

procesos de tipo (Gneiting & Guttorp, 2010):

{Y (sss, t) : (sss, t) ∈ D⊆ Rd×R

}(1.70)

que varían en función de la ubicación espacial, sss ∈ Rd , y el tiempo, t ∈ R.

En particular, todo resultado técnico sobre funciones de covarianza espacial y predicción por mínimos

cuadrados o kriging en espacios Euclídeos aplica para los problemas espacio-temporales aplicando el

respectivo resultado sobre el domino Rd+1 (Gneiting & Guttorp, 2010).

1.3.1. Características de los Datos Espacio-Temporales

Perpiñán (2014) plantea que los datos espacio-temporales se indexan tanto en el tiempo como en el

espacio y pueden consistir en un objeto vectorial espacial (como el caso de polígonos o puntos) o un

objeto en capas registrados en diferentes momentos.

Los datos espacio-temporales son asequibles y, relativamente, abundantes ya sea en el espacio o en

el tiempo pero no en ambas dimensiones. Las imágenes de satélite suelen ser muy abundantes en el

espacio, dando mucho detalle en una gran resolución espacial para grandes áreas, pero relativamente

escasas en el tiempo.

27

Page 30: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

El análisis de imágenes repetidas a lo largo del tiempo puede verse obstaculizado por los cambios

en las condiciones de luz, los errores en la georreferenciación que resultan en desajuste espacial y

modificaciones en áreas oscurecidas por los cambios de nubosidad (Pebesma, 2012). Por otro lado,

los datos suministrados por sensores fijos dan a menudo señales muy detalladas a través del tiempo,

lo que facilita el modelado, pero ofrecen poco detalle en el espacio ya que depende de la limitada

disponibilidad de sensores.

Güting & Schenider (2005) distinguen 10 tipos de datos generados en las dimensiones de espacio-

tiempo definidos, particulamente, por sus características7:

1. Eventos en el espacio y el tiempo

2. Ubicaciones válidas para un cierto periodo de tiempo

3. Conjunto de eventos con localización y secuencia tipo punto-momento, consideradas colectiva-

mente.

4. Localizaciones constantes con secuencia paso a paso

5. Entidades en movimiento - puntos en movimiento

6. Eventos regionales en espacio y tiempo

7. Regiones válidas para un periodo de tiempo

8. Conjunto de regiones de evento-secuencia

9. Regiones constantes de secuencia paso a paso

10. Entidades móviles con una región en movimiento

Con base en esta distinción, Pebesma (2012) identifica tres casos:7Pebesma (2012) los resume en tres grupos:

1. Conjuntos de eventos sin duración temporal: accidentes, rayos, nacimientos, muertes, etc.

2. Conjuntos de eventos con duración temporal pero no movimiento: una localización específica en una ciudad, unadirección, etc.

3. Puntos en movimiento (en conjunto o individualmente): migraciones de animales, desplazamiento de una o máspersonas, etc.

28

Page 31: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

1. El tiempo es instantáneo y la característica no se mueve (es decir, sólo puede existir en un

instante en el tiempo).

2. El tiempo es un intervalo y los objetos no se mueven durante este intervalo

3. El tiempo es instantáneo y las características están en movimiento a lo largo de una trayectoria

(los objetos existen entre los instantes de tiempo y pueden moverse)

La Figura 1.6 muestra los casos identificados por Pebesma (2012): parte superior izquierda: el tiempo

es instantáneo; parte superior derecha: los objetos presentan movimiento; parte inferior izquierda: el

tiempo presenta intervalos consecutivos; y, parte inferior derecha: los intervalos de tiempo son alea-

torios. s1 se refiere a la primera característica/ubicación, t1 a la primera instante de tiempo o intervalo.

Las líneas continuas indican intervalos de tiempo; las flechas, movimiento. Los círculos rellenos de-

notan el momento inicial y los círculos vacíos el momento final o cierre.

Cuando el tiempo refleja intervalos significa que la característica espacial o los valores de los datos

asociados no cambian durante dicho intervalo pero refleja el valor o e lestado durante este intervalo

(Pebesma, 2012).

Los instantes de tiempo pueden reflejar momentos de cambio o eventos cero o con duración ilegible;

mientra que el movimiento refleja el hecho que existen objetos en movimiento y pueden cambiar de

ubicación durante un intervalo de tiempo. Para datos de objetos en movimiento los instantes de tiem-

po reflejan la ubicación del objeto en un momento en particular y los cambios de ubicación ocurridos

durante el registro del tiempo y las características; esto debe ocurrir simultáneamente.

Las trayectorias se refieren al caso donde el conjunto de puntos espacio-temporales forman secuencias

y representan un trayecto; su agrupación puede ser simple, anidada o compleja (Pebesma, 2012).

1.3.2. Procesos Espacio-Temporales

El interés general para el análisis de los procesos espacio- temporales se centra en la forma:

Y (s, t) = µ (s, t)+ ε (s, t) (1.71)

29

Page 32: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 1.6: Ejemplificación de los casos de objetos espacio-temporales identificados por Pebesma(2012)

30

Page 33: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

donde Y (s, t) denota las observaciones espacio-temporales; µ (s, t) el la media del campo estructura-

do y ε (s, t) los residuales del campo espacio-tiempo.

La media del campo estructurado puede modelarse (Lindstrom, Szpiro, sampson, Bergen & Sheppard,

2013):

µ (s, t) =L

∑l=1

γlMl (s, t)+n

∑i=1

βi (sss) fi (t) (1.72)

donde Ml (s, t) representa las covarianzas espaciales; γl los coeficientes que definen las covarianzas;

{ fi (t)}mi=1 es el conjunto de funciones básicas temporales y βi (sss) los coeficientes de variación para

las funciones temporales.

A los coeficientes βi(s) en 1.72 se les da tratamiento de campos espaciales con una estructura de

Kriging universal permitiendo una estructura temporal que varía entre locaciones (Lindstrom et all,

2013b):

βi(s) ∈ N(Xiαi,Σβi(θi)

)para i = 1, . . . ,m, (1.73)

donde Xi es una matriz con diseño n× pi; αi es una matriz de coeficientes de regresión con diseño

pi×1 y Σβi(θi) es una matriz de covarianzas n×n.

ν(s, t) ∈ N

0,

Σ1

ν(θν) 0 0

0 . . . 0

0 0 ΣTν (θν)

︸ ︷︷ ︸

Σν (θν )

(1.74)

donde el tamaño de cada matriz Σtν(θν) es el número de observaciones y nt cada punto en el tiempo

(Lindstrom, 2013c). La independencia temporal en 1.74 se basa en el supuesto que la base temporal,

{ fi(t)}mi=1; en 1.72 explica la correlación temporal en los datos (Lindstrom, 2013b).

31

Page 34: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

1.3.3. Estacionariedad y Estimadores Espacio-Temporales

A partir de 1.72 se tiene que µ(sss, t) denota la media de Z(sss, t) y define la covarianza entre dos variables

espacio-temporales como:

Cov [Z(sss,u),Z(ttt,v)] = E {[Z(sss,u)−µ(sss,u)] [Z(ttt,v)−µ(ttt,v)]} (1.75)

La Estacionariedad de Segundo Orden (SOS) require que para cada ubicación sss y cada momento t, se

mantenga (Sherman, 2011):

1. E [Z(sss, t)] = µ

2. Cov [Z(sss+hhh, t +u),Z(sss, t)] = Con [Z(hhh,u),Z(000,0)] =: C(hhh,u), para toda variación espacial hhh y

variación temporal u.

Como en el caso puramente espacial, alguna forma de estacionariedad es necesaria para permitir la

estimación del la función de covarianza subyacente. Así, la función del variograma espacio-temporal

está dada por (Sherman, 2011):

γ(hhh,u) :=Var [Z(sss+hhh, t +u)−Z(sss, t)] (1.76)

Pese a esto, la formulación de un modelo espacio-temporal está dado más en términos de la función

de covarianza (cuando existe); aunque, para propósitos de estimación puede considerarse la corres-

pondiente función de variograma espacio-temporal.

En particular, el predictor de Z(sss0, t0) para una nueva combinación espacio-temporal basada en las nT

observaciones espacio-temporales, está dado por (Sherman, 2011):

µ (sss0, t0)+νννT

ΣΣΣ−1 (ZZZn,T −µn,T ) (1.77)

donde µn,T = E [ZZZn,T ]; ΣΣΣ es la matriz Var [ZZZn,T ] de tamaño nT ×nT y ννν es el vector nT ×1 de cova-

riazas Cov [Z(sss0, t0),ZZZn,T ]. Este sería el predictor óptimo para el caso del kriging simple mientras la

formulación para el kriging ordinario es (Sherman, 2011):

µ (sss0, t0) =(111T

ΣΣΣ−1111)−1

111TΣΣΣ−1ZZZn,T (1.78)

32

Page 35: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

que es el estimador de Mínimos Cuadrados Generalizados de la media.

1.3.4. Propiedades de la Función de Covarianza Espacio - Temporal

La estimación de la función de covarianza para las estructuras espacio-tiempo pueden resultar compli-

cada a no ser que se empleen algunas suposiciones: estacionariedad, separabilidad y simetría absoluta.

Además, algunas veces es deseable que el proceso espacio-temporal tenga una covarianza compacta,

tal que Cov{Z(s1, t1),Z(s2, t2)} = 0 cuando ‖ s1− s2 ‖ y/o |t1− t2| son lo suficientemente grandes

(Gneiting, Genton & Guttorp, 2007).

Una función de covarianza espacio-temporal es separable si existe una función de covarianza espacial,

Cs y una función de covarianza temporal, CT tal que (Gneiting & Guttorp, 2010):

C (hhh,u) =Cs(hhh) ·CT (u) (1.79)

y es completamente simétrica si:

C(hhh,u) =C(hhh,−u) =C(−hhh,u) = c(−hhh,−u) (1.80)

para todo (hhh,u) ∈ Rd×R. Por lo tanto, dadas dos ubicaciones espaciales, un modelo completamen-

te simétrico es incapaz de distinguir posibles efectos diferentes a medida que el tiempo avanza o

retrocede (Gneiting & Guttorp, 2010).

1.3.5. Modelos Espacio - Temporales

Algunos modelos de espacio-tiempo son considerados una estensión natural de las series de tiempo;

en otros casos, los modelos tratan explícitamente de los efectos de la dimensión espacio-tiempo y sus

interacciones (Sherman, 2011).

Modelos VAR

Una manera de ver los datos espacio-temporales es considerarlos una serie de tiempo multivariada

donde el orden de las observaciones multivariadas es el número de ubicaciones espaciales. Formal-

mente, se tiene que ZZZt = [Z(sss1, t), . . . ,Z(sssn, t)] denota el vector de n respuestas a lo largo de todos

33

Page 36: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

los puntos espacialmente identificados en el tiempo t; entonces, un proceso ARMA(p,q) multivariado

está dado por (Sherman, 2011):

ZZZt−aaa1ZZZt−1−·· ·−aaapZZZt−p = εt +bbb1εt−1 + · · ·+bbbqεt−q (1.81)

donde aaa1, . . . ,aaap y bbb1, . . . ,bbbq son matrices n×n y el proceso de ruido blanco εt es tal que Var(εt) =ΣΣΣ

y, para todo t 6= s, Cov(εt ,εs) = 0.

Un caso especial es el vector del proceso AR(1) dado por:

ZZZt = aZaZaZt−1 + εt (1.82)

donde la matriz de coeficients, aaa determina la dependiencia entre ZZZt y ZZZt−1 (Sherman, 2011) y εt es un

vector n×1 con características de ruido blanco (seriealmente incorrelacionado o independiente) con

matriz de covarianzas de tiempo, ΣΣΣ (Zivot & Wang, 2006). Por ejemplo, un modelo VAR(2) bivariado

podría expresarse:

y1t

y2t

=

c1

c2

+

a111 a1

12

a121 a1

22

y1t−1

y2t−1

+

a211 a2

12

a221 a2

22

y1t−2

y2t−2

+

ε1t

ε2t

Donde Cov(ε1t ,ε2t) = σ12 para t = s; y 0 en otro caso. Es de notar que, en este caso (y puede gene-

ralizarse) cada ecuación tiene los mismos valores para los regresores de los retardos de y1t y y2t . Por

lo tanto, el modelo VAR(p) es sólo un modelo de regresión aparentemente no relacionado (SUR) con

variables rezagadas y términos deterministas como regresores comunes (Zivot & Wang, 2006).

La notación para el operador del rezago de un modelo VAR(p) se escribe:

aaa(L)YYY t = ccc+ εt (1.83)

donde aaa(L) = IIIn−aaa1L−·· ·−aaapLp y se vuelve estable si se cumple que la raiz8:

det (IIIn−aaa1z−·· ·−aaapzp) = 0

8Esta notación se basa en Zivot & Wang (2006)

34

Page 37: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Tiene un módulo mayor que 1 o, equivalentemente, si los valores propios de la matriz complementaria:

F =

aaa1 aaa2 . . . aaan

IIIn 0 . . . 0

0 . . . 0...

0 0 IIIn 0

tiene módulo menor que 1. Asumiendo que el proceso ha iniciado en el pasado infinito, un proceso

VAR(p) es estacionario y ergódico cuando las medias, las varianzas y las autocovarianzas permanecen

invariables en el tiempo (Zivot & Wang, 2006).

Sin embargo, este enfoque es apropiado cuando el número de ubicaciones espaciales es relativamente

pequeño (Sherman, 2011).

Modelos STARMA

Un proceso STARMA (Space-Time Autoregressive Moveing Average9) combina, de manera simultá-

nea, un modelo de regresión espacial con un modelo ARMA para series de tiempo; permitiendo un

término aaa0ZZZt al lado derecho de la equación 1.81; es decir, cada ubicación espacial depende una de

otra al mismo tiempo (Sherman, 2011).

Los modelos STARMA desarrollados por Phillip E. Pfeifer y Stuart Jay Deutsch a comienzos de la

década de 1980 no podrían haber alcanzado la estructura teórica integrada como el método de Box-

Jenkins utilizado en el análisis convencional de series de tiempo. Pero, ofrece oportunidades para el

pronóstico y la estimación exitosos de manera similar a los modelos de Box-Jenkins en términos de

modelamiento espacio-temporal (Kurt & Tunay, 2015).

Así, un modelo espacio-temporal es un caso especial de modelos para series de tiempo el cual se

usa para calcular las dependencias lineales entre las variables considerando, a la vez, los factores de

tiempo y espacio. Con base en esto, es necesario identificar dos tipos de rezagos: los rezagos tempo-

rales, como se conocen en la teoría tradicional de series de tiempo; y los rezagos espaciales donde se

considera la asociación de una variable en una región con la misma variable en otra región.

9Media Movil Autorregresiva Espacio-Temporal

35

Page 38: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Se debe, entonces, definir las fronteras y vecindades para poder calcular el operador de rezago es-

pacial. El primer paso es identificar cada región vecina de acuerdo a algunos criterios de selección

previos y agruparlos en conjuntos de vecindad (Kurt & Tunay, 2015). Entonces, si yi es la observación

de la región i y Js es el s− esimo orden del conjunto de vecindad; el rezago espacial de orden s puede

definirse como (Zhou & Buongiorno, 2006):

L(s)yi = ∑j∈Js

x(s)i j x j s = 1,2, . . . (1.84)

La implementación de los rezagos espaciales se hace de manera similar a los rezagos distribuidos; pe-

ro los rezagos espaciales no están en una dirección como la estructura de retardo distribuido utilizada

en el análisis de series temporales. En 1.84, se asume que los pesos w(s)i j son, usualmente, externos,

no estocásticos y muestran la siguiente estructura (Zhou & Buongiorno, 2006):

w(s)i j =

(0,1] si el sitio j es el orden s de i

0 en otro caso(1.85)

y

∑i∈Js

w(s)i j = 1 (1.86)

La matriz w(s)i j corresponde a la matriz de pesos espaciales WWW (s); una matriz de dimensión n×n donde

cada fila de la misma suma uno. w(s)i j puede representar propiedades físicas del área de interés (por

ejemplo, la longitud de la frontera) para hacerlas iguales para vecinos espaciales del mismo orden o

para representar las especificaciones espaciales de quien construye el modelo . Si existe poca teoría

o resultados apriori para seleccionar los pesos espaciales, se asigna el mismo peso a cada vecino del

mismo orden. Entonces, por cada región i, para cada vecino de orden s; w(s)i j = 1/n(s)i , donde n(s)i es el

número de vecinos de orden s de i (Zhou & Buongiorno, 2006).

La notación matricial del modelo STARMA se puede escribir (Kurt & Tunay, 2015):

yt =p

∑l=1

kl

∑s=0

φlsWWW (s)yt−l−q

∑l=1

ml

∑s=0

θlsWWW (s)εt−l + εt (1.87)

36

Page 39: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

donde εt está normalmente distribuido con media cero y (Zhou & Buongiorno, 2006):

E[εtε′t+s]=

σ2IIIn si s = 0

0 en otro caso

La representación del proceso STARMA en 1.87 sería, entonces, STARMA(p,q,k, l).

Modelos STARIMA

Según Cheng, Wang & Li (2011) el modelo STARIMA expresa cada observación en el tiempo t y

locación i como una combinación lineal ponderada de la observación previa en la locación i (rezagada

en el tiempo) y las observaciones vecinas rezagadas en el espacio; describe las variaciones estocásticas

locales del término de erros ξi,t de la siguiente forma:

ξi,t =p

∑l=1

ml

∑s=0

φlsWWW (s)ξi,t−l−

q

∑l=1

nl

∑s=0

θlsWWW (s)εi,t−l + εi,t (1.88)

donde p es el orden AR; q el orden MA; ml el orden espacial del l− esimo término autorregresivo;

nl es el orden espacial de la l− esima media móvil: φls es el parámetro autorregresivo del rezago

temporal l y el rezago espacial s; WWW (s) es la matriz n×n de pesos espaciales y εi,t está normalmente

distribuida con las siguientes propieadades:

E [εi,t ] = 0

E[εtε′j,t+s

]=

σ2III, i = j,s = 0

0, i 6= j,s 6= 0

E[ξi,tε

′i,t+s]

= 0 para s > 0

Pfeifer & Deutsch (1980) expresan el mismo modelo de la siguiente forma:

5d zt =p

∑l=1

ml

∑s=0

φlsWWW (s)5d zt−l−q

∑l=1

nl

∑s=0

θlsWWW (s)εi,t−l + εi,t (1.89)

donde5 la matriz n×n del operador diferencia tal que:

37

Page 40: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

5zt = zt− zt−1

52zt = zt−2zt−1 + zt−2

y, además, se observa la similitud entre 1.88 y 1.89 por lo que ambos presentan las mismas condicio-

nes.

En ese contexto, se tienen algunas clases especiales de modelos STARIMA: si d = 0, se tiene un

modelo STARMA; si q = 0, se tiene un modelo STAR; y si p = 0, se trata de un modelo ST MA

(Pfeifer & Deutsch, 1980).

38

Page 41: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Capítulo 2

Estudio de Caso: Desplazamiento Forzado en

Colombia, Análisis Espacial y

Espacio-Temporal

2.1. Antecedentes

Estimaciones recientes sugieren que cerca de 4.9 millones de colombianos han sido desplazados

internamente como resultado del prolongado conflicto armado y la violencia política asociada que

envuelve al Estado y los grupos armados de guerrilla de izquierda, así como una serie de grupos “pa-

ramilitares” de derecha altamente regionalizados y redes armadas de tráfico de drogas (Cantor, 2011).

Gran parte de ese desplazamiento forzado en los últimos años es el resultado directo o indirecto de

las ofensivas militares de contraguerrilla por parte de los organismos del Estado y de la disputa por el

control de las zonas rurales, que históricamente han tenido presencia guerrillera, entre paramilitares y

guerrilla. El gran número de grupos armados no estatales y al compleja naturaleza cambiante de sus

disputas desmienten cualquier intento de caracterización del desplazamiento forzado en Colombia

(Cantor, 2011).

En este contexto, es necesario entender que el desplazamiento forzado es el resultado de un ataque

violento y una decisión no voluntaria: Las familias huyen para salvar sus vidas y proteger sus bienes

(Ibáñez & Vélez, 2008). No obstante, se observan episodios agudos de violencia en los cuales algunas

39

Page 42: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

personas emigran a buscar refugio mientras que otras prefieren quedarse.

El proceso migratorio involuntario va más allá de de la presencia y el actuar de los grupos armados,

tanto legales como ilegales, en las diferentes regiones. Mantilla (2015), además de los factores aso-

ciados a los eventos de violencia y conflicto armado, identifica otros Factores Comunes que incluyen

la creación de subsidios estatales, la inversión pública en salud y algunos aspectos relacionados con

la política y el desempeño fiscales como elementos determinantes en la decisión de abandonar un

territorio de manera no voluntaria. Sin embargo, el presente documento se ocupará únicamente del

fenómeno de desplazamiento forzado como resultado de las acciones bélicas registradas en el territo-

rio de desplazamiento.

La Figura 2.1 muestra la evolución histórica del total de víctimas del desplazamiento forzado en Co-

lombia, reportadas mes a mes, durante el periodo comprendido entre el 1 de enero de 2007 y el 31

de diciembre de 2016. El pico más alto observado en la serie coincide con el recrudecimiento de las

operaciones contra insurgentes del gobierno de Álvaro Uribe Vélez en contra de la guerrilla de las

FARC-EP1.

El máximo lider de las FARC-EP, Pedro Antonio Marín, mejor conocido como Manuel Marulanda

Vélez o Tirofijo, fallece por causas naturales en marzo de 2008 y, al poco tiempo, es abatido en com-

bate Luis Edgar Devia, alias Raúl Reyes, segundo al mando después de Tirofijo (Agencia EFE, 2016),

hechos que propician el debilitamiento de este grupo armado, el repliegue de sus frentes y la reduc-

ción significativa del número de víctimas del conflicto.

El posterior inicio formal de negociaciones entre el Gobierno colombiano y la Guerrilla de las FARC-

EP tuvo como resultado, en términos de desplazamiento forzado, la reducción del reporte de víctimas

ante los organismo veedores del derecho internacional humanitario y los organismos del Estado co-

lombiano.

Si se tiene en cuenta que los grupos armados al margen de la ley establecen su territorio mediante ac-

ciones bélicas contra las fuerzas del Estado e intimidación y ataque a la población civil que lo habita

1Fuerzas Armadas Revolucionarias de Colombia - Ejército del Pueblo

40

Page 43: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.1: Total de Víctimas del Desplazamiento Forzado en Colombia (1 de enero de 2007 - 31 dediciembre de 2016)

y que esto genera un fenómeno migratorio involuntario, surge, entonces, la pregunta: ¿es el desplaza-

miento forzado un fenómeno que pueda identificarse como un proceso espacial que puede expresarse

en términos de su registro temporal, es decir, obedece a un proceso espacio-temporal?

En un primer enfoque, se abordará el problema como un proceso espacial con el fin de determinar si

el fenómeno presenta algún tipo de relación con el territorio donde ocurre y si se relaciona con los

eventos registrados como acciones bélicas en el mismo territorio. El segundo enfoque empleado, será

el de un proceso espacio-temporal a fin de establecer si el tiempo es una dimensión determinante en

la definición del fenómeno de desplazamiento forzado para el caso particular de Colombia.

2.2. Análisis Exploratorio de los Datos

Los datos analizados en el presente documento proceden del Sistema Integrado de Información Huma-

nitaria (SIDIH) administrado la Unidad de Manejo y Análisis de Información de Colombia (UMAIC)

que recopila información suministrada por la Oficina de la ONU para la Coordinación de Asuntos

Humanitarios (OCHA).

41

Page 44: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

(a) Mapa Distribución Espacial del Desplazamiento Forzado (b) Mapa Distribución Espacial de las Acciones Bélicas

Figura 2.2: Mapa de Variables de Conflicto Armado: Desplazamiento Forzado y Acciones Bélicas.Total acumulado 2007 - 2016

La base de datos contiene el reporte mensual de casos registrados sobre desplazamiento forzado y

eventos asociados al conflicto armado durante el periodo comprendido entre el 1 de enero de 2007

y el 31 de diciembre de 20162. Los mapas de la Figura 2.2 muestra la distribución espacial del total

de eventos de desplazamiento forzado y acciones bélicas: 2.2a Mapa de la distribución espacial del

desplazamiento forzado; 2.10b Mapa de la distribución espacial de las Acciones Bélicas.

La Figura 2.3 muestra el comportamiento, mes a mes, del total de víctimas de desplazamiento forzado

en el periodo 2007 - 2016. Se aprecia una tendencia global decreciente con un salto importante ob-

servado en el mes de febrero; los demás meses del conjunto de datos no muestran valores que puedan

considerarse atípicos. En la Figura 2.4 se puede apreciar la serie acumulada mes a mes de los casos

de desplazamiento forzado. Se observan leves cambios de tendencia en la mayoria de las gráficas,

particularmente, a partir del año 2009.

Como el interés de este estudio se centra el desplazamiento forzado, el análisis exploratorio se cen-

2En realidad, el sistema recoge información desde el 1 de enero de 1995; sin embargo, este periodo de tiempo contienegran cantidad de datos perdidos y no están disponibles en la misma estructura periódica. La ventana de tiempo se redujoa 10 años debido a que en este rango de fechas las variables de interés mostraban información completa.

42

Page 45: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.3: Total Mensual Víctimas de Desplazamiento Forzado en Colombia (enero 2007 - diciembre2016)

Figura 2.4: Total Acumulado Mensual Víctimas Desplazamiento Forzado en Colombia (enero 2007 -diciembre 2016)

43

Page 46: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

trará en la variable de desplazamiento. La variable que describe las acciones bélicas o incursiones

armadas se tomará como referencia más adelante en el capítulo dedicado a los distintos modelos.

Debido a que los casos se encuentran localizados en unidades territoriales, se hace necesario evaluar

la autocorrelación espacial para mapear adecuadamente la distribución del fenómeno. Se empleó la I

de Moran para efectos del análisis exploratorio de los datos, la cual se define como:

I =nS0

∑ni=1 ∑

nj=1 wi j(xi− x)(y j− j)

∑ni=1(xi− x)2 (2.1)

donde wi j es el peso entre la observación i y j y S0 es la suma de todos los wi j (Paradis, 2017).

Para el caso de desplazamiento forzado se obtuvo el siguiente resultado:

Moran I test under randomisation

data: colb2$DESPLAZADOS

weights: col.W_cont_el_mat

Moran I statistic standard deviate = 14.083, p-value < 2.2e-16

alternative hypothesis: greater

sample estimates:

Moran I statistic Expectation Variance

0.2274464138 -0.0008952551 0.0002628880

Con un nivel de significancia α = 0,05, la hipótesis de ausencia de autocorrelación espacial se recha-

za; por lo tanto, la evidencia sugiere que el desplazamiento forzado no es un fenómeno espacialmente

aleatorio. El Coeficiente I de Morán presentó un valor de 0,227 lo que sugiere una autocorrelación

espacial global baja3.

La Figura 2.5 muestra la dispersión del desplazamiento forzado por municipio y su rezago espacial

(el promedio de desplazados en los centros poblados o municipios vecinos). Se observa una alta con-

centración de puntos cerca del centroide; sin embargo, la nube de datos muestra una tendencia hacia

el primer cuadrante del plano lo que sugiere la presencia de localidades con vecino de valores simi-

lares. casos excepcionales para las poblaciones de Tumaco y Buenaventura que se presentan como

valores atípicos. En el cuarto cuadrante sobresale la ciudad de Medellín cuya posición sugiere que las3Según Zhukov (2010), un valor cero indica un patrón espacial aleatorio, un valor −1 indica dispersión perfecta y un

valor +1 correlación perfecta.

44

Page 47: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.5: Gráfica de Dispersión - I de Morán para Desplazamiento Forzado

poblaciones vecinas presentan valores distintos de casos de desplazamiento forzado.

Llama la atención que una gran proporción de los datos se ubican en la zona media superior lo que

indica que la mayoría de las poblaciones son zonas de transición de regímenes espaciales. Este as-

pecto sugiere que, pese a que en todos los municipios registraron casos de desplazamiento durante el

periodo de estudio, el fenómeno se concentra en unas zonas específicas.

Las observaciones influyentes del fenómeno de desplazamiento forzado entendido como un proceso

espacial se muestran a continuación:

Potentially influential observations of

lm(formula = wx ~ x) :

dfb.1_ dfb.x dffit cov.r cook.d hat

DIBULLA 0.04 0.12 0.15_* 0.99_* 0.01 0.00

SANTA MARTA 0.01 -0.05 -0.05 1.03_* 0.00 0.03_*

CIENAGA 0.04 0.14 0.16_* 0.99_* 0.01 0.00

TURBO 0.00 -0.02 -0.02 1.01_* 0.00 0.01_*

VALENCIA 0.05 0.09 0.13_* 0.99_* 0.01 0.00

PUERTO SANTANDER 0.07 -0.02 0.07 0.99_* 0.00 0.00

UNGUIA 0.06 0.01 0.07 0.99_* 0.00 0.00

TIERRALTA 0.00 0.07 0.07 1.01_* 0.00 0.01_*

MONTELIBANO 0.00 0.13 0.13_* 1.01_* 0.01 0.01_*

45

Page 48: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

LA APARTADA 0.07 0.00 0.07 0.99_* 0.00 0.00

APARTADO 0.03 0.15 0.17_* 0.99_* 0.01 0.00

CAUCASIA 0.00 0.04 0.05 1.01_* 0.00 0.01

PUERTO LIBERTADOR -0.01 0.23 0.24_* 1.00 0.03 0.01_*

CAREPA 0.09 0.05 0.13_* 0.98_* 0.01 0.00

CHIGORODO 0.04 0.09 0.12 0.99_* 0.01 0.00

TARAZA 0.01 0.14 0.16_* 1.00 0.01 0.01

SAN PABLO 0.00 0.00 0.00 1.01_* 0.00 0.00

TAME 0.00 -0.10 -0.11 1.01_* 0.01 0.01_*

SAN JERONIMO 0.10 -0.03 0.10 0.99_* 0.00 0.00

COPACABANA 0.12 -0.03 0.12 0.98_* 0.01 0.00

BELLO 0.09 0.06 0.14_* 0.97_* 0.01 0.00

MEDELLIN 0.40 -1.63_* -1.64_* 1.06_* 1.32_* 0.10_*

QUIBDO 0.00 -0.04 -0.05 1.01_* 0.00 0.01_*

GUARNE 0.11 -0.03 0.11 0.98_* 0.01 0.00

HELICONIA 0.14 -0.04 0.14_* 0.97_* 0.01 0.00

RIONEGRO 0.07 -0.01 0.07 0.99_* 0.00 0.00

RETIRO 0.07 -0.02 0.07 0.99_* 0.00 0.00

ITAGUI 0.11 0.03 0.13 0.97_* 0.01 0.00

ENVIGADO 0.11 -0.03 0.11 0.98_* 0.01 0.00

ANGELOPOLIS 0.07 -0.02 0.07 0.99_* 0.00 0.00

LA ESTRELLA 0.11 -0.03 0.11 0.98_* 0.01 0.00

EL LITORAL DEL SAN JUAN 0.12 0.18 0.26_* 0.94_* 0.03 0.00

BUENAVENTURA 1.90_* -6.51_* -6.52_* 1.37_* 19.93_* 0.36_*

DARIEN 0.14 -0.03 0.14_* 0.97_* 0.01 0.00

CHAPARRAL 0.00 0.00 0.00 1.01_* 0.00 0.00

DAGUA 0.16 0.04 0.19_* 0.93_* 0.02 0.00

CALI 0.02 0.24 0.26_* 0.99_* 0.03 0.01_*

JAMUNDI 0.15 0.05 0.19_* 0.94_* 0.02 0.00

LOPEZ 0.08 0.31 0.37_* 0.93_* 0.07 0.00

VISTAHERMOSA 0.00 0.01 0.01 1.01_* 0.00 0.00

SUAREZ 0.00 0.04 0.04 1.01_* 0.00 0.01

TIMBIQUI 0.02 0.16 0.18_* 0.99_* 0.02 0.00

SAN VICENTE DEL CAGUAN 0.00 -0.03 -0.03 1.02_* 0.00 0.01_*

SAN JOSE DEL GUAVIARE 0.00 0.00 0.00 1.01_* 0.00 0.01_*

EL TAMBO 0.00 0.05 0.06 1.01_* 0.00 0.01_*

PUERTO CONCORDIA 0.06 0.01 0.07 0.99_* 0.00 0.00

GUAPI 0.03 0.21 0.24_* 0.98_* 0.03 0.00

SANTA BARBARA 0.13 0.10 0.20_* 0.94_* 0.02 0.00

LA MACARENA 0.07 0.04 0.09 0.99_* 0.00 0.00

EL CHARCO 0.00 -0.01 -0.01 1.02_* 0.00 0.02_*

LA TOLA 0.11 0.02 0.12 0.97_* 0.01 0.00

FRANCISCO PIZARRO 0.24 0.08 0.30_* 0.86_* 0.04 0.00

ARGELIA 0.00 0.19 0.20_* 1.00 0.02 0.01_*

ROBERTO PAYAN 0.08 0.19 0.24_* 0.96_* 0.03 0.00

EL DONCELLO 0.06 0.05 0.09 0.99_* 0.00 0.00

BALBOA 0.04 0.06 0.09 0.99_* 0.00 0.00

MAGUI 0.05 0.04 0.08 0.99_* 0.00 0.00

LEIVA 0.06 0.04 0.09 0.99_* 0.00 0.00

FLORENCIA 0.00 -0.02 -0.03 1.01_* 0.00 0.01_*

TUMACO 0.57 -2.10_* -2.10_* 1.19_* 2.17_* 0.18_*

CALAMAR 0.06 0.01 0.07 0.99_* 0.00 0.00

POLICARPA 0.00 -0.01 -0.01 1.01_* 0.00 0.00

46

Page 49: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

EL PAUJIL 0.06 0.05 0.09 0.99_* 0.00 0.00

BARBACOAS 0.02 0.26 0.28_* 0.98_* 0.04 0.01_*

RICAURTE 0.11 0.11 0.19_* 0.96_* 0.02 0.00

CARTAGENA DEL CHAIRA 0.01 0.12 0.13_* 1.00 0.01 0.01_*

PUERTO GUZMAN 0.00 0.04 0.04 1.01_* 0.00 0.01_*

PUERTO CAICEDO 0.05 0.03 0.07 0.99_* 0.00 0.00

PUERTO ASIS 0.00 0.10 0.11 1.01_* 0.01 0.01_*

SAN MIGUEL 0.08 0.11 0.16_* 0.98_* 0.01 0.00

ZONA BANANERA 0.00 0.02 0.02 1.01_* 0.00 0.00

MUTATA 0.06 0.02 0.07 0.99_* 0.00 0.00

Cabe resaltar que estas poblaciones señaladas coinciden con las que Cantor (2011) e Ibañes & Vélez

(2008) señalan como ejes del desplazamiento forzado en Colombia.

La Figura 2.6 corresponde a los valores del coeficiente de correlación espacial local I de Morán para

el desplazamiento forzado. Los "puntos calientes"del mapa indican aquellas poblaciones donde el vo-

lumen de casos de desplazamiento forzado son significativamente diferentes de los centros poblados

vecinos.

Los resultados observados hasta el momento conllevan al planteamiento de modelos que permitan

explicar los factores que motivan el desplazamiento forzado. El mapa de la Figura 2.10b, presentado

anteriormente, mostraba la distribución espacial de las acciones bélicas o incursiones armadas del

periodo 2007 - 2016 y el mapa de la Figura 2.2a la distribución espacial del desplazamiento forzado.

Se observaban múltiples coincidencias de presencia de los dos sucesos en los mapas lo que sugiere

que es posible emplear la variable que describe las incursiones armadas como factor explicativo del

desplazamiento forzado.

En el apartado siguiente se analizarán varios modelos que permitan explicar el desplazamiento for-

zado como fenómeno espacial dependiente de los eventos de conflicto armado, específicamente, las

acciones bélicas o incursiones armadas registradas durante el mismo periodo.

Finalmente, la Figura 2.7 representa la posible influencia de las acciones bélicas sobre el desplaza-

miento forzado.

47

Page 50: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.6: Mapa de Correlación Local (Coeficiente I de Moran)

Figura 2.7: Gráfica de Dispersión Acciones Bélicas y Desplazamiento Forzado

48

Page 51: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

2.3. Modelos Espaciales

Un primer enfoque empelado para analizar el desplazamiento forzado en el caso Colombia corres-

ponde a modelos espaciales. Se emplearán tres modelos:

El Modelo Autorregresivo Espacial (SAR por su nombre en inglés: “Spatial Auto Regressive

Model”

El Modelo de Error Espacial (SEM: “Spatial Error Model”)

El Modelo Espacial de Durbin (SDM: “Spatial Durbin Model”)

2.3.1. Modelo SAR: Spatial Auto Regresive

Ward & Gletisch (2008) y Zhukov (2010) expresan este modelo como:

yyy = ρWyWyWy+XXXβ + ε (2.2)

para el caso de estudio, yyy representa el volumen de casos de desplazamiento forzado por centro pobla-

do; XXX la variable acciones bélicas registradas en cada centro poblado, ρ describe la autocorrelación

espacial y WWW la matriz de pesos espaciales. Los resultados obtenidos para este modelo son:

Call:

lagsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,

zero.policy = T, tol.solve = 1e-12)

Residuals:

Min 1Q Median 3Q Max

-32798.902 -625.144 -260.921 16.111 104563.801

Type: lag

Regions with no neighbours included:

908 1119 1120 1121

Coefficients: (numerical Hessian approximate standard errors)

Estimate Std. Error z value Pr(>|z|)

(Intercept) 260.9630 174.3136 1.4971 0.1344

ACC.BELIC 121.3348 5.4784 22.1480 <2e-16

Rho: 0.23192, LR test value: 40.786, p-value: 1.6981e-10

Approximate (numerical Hessian) standard error: 0.035583

z-value: 6.5177, p-value: 7.1395e-11

Wald statistic: 42.48, p-value: 7.1395e-11

Log likelihood: -11129.66 for lag model

49

Page 52: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.8: Mapa Residuos SAR

ML residual variance (sigma squared): 23953000, (sigma: 4894.1)

Number of observations: 1122

Number of parameters estimated: 4

AIC: 22267, (AIC for lm: 22306)

Según se observa, el desplazamiento forzado obedece a eventos del conflicto armado como el caso

de las acciones bélicas o incursiones armadas. Además, con base en la evidencia es posible afirmar

que existe dependencia espacial en el caso del desplazamiento forzado (ρ = 0,23192; p− value =

1,698×10−10). El mapa de la Figura 2.8 muestra los residuos espaciales del modelo.

Con base en lo anterior, es necesario evaluar si el modelo SAR tiene la capacidad de describir toda la

dependencia espacial, para lo que se va a calcular el coeficiente de correlación espacial I de Morán

50

Page 53: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

para los residuos:

Moran I test under randomisation

data: res.sar

weights: col.W_cont_el_mat

Moran I statistic standard deviate = 4.2919, p-value = 8.856e-06

alternative hypothesis: greater

sample estimates:

Moran I statistic Expectation Variance

0.0673496289 -0.0008952551 0.0002528335

Como se observa, aunque la autocorrrelación espacial es pequeña (I = 0,0673) los residuos del mode-

lo no describen patrones espaciales aleatorios. La presencia de dependencia espacial en los residuos

sugiere la posibilidad de sesgo por variables omitidas.

El modelo SAR estimado puede resumirse como en la Tabla 2.1. Las cifras entre paréntesis corres-

ponden al p-valor asociado a las pruebas de hipótesis de los parámetros del modelo.

Tabla 2.1: Resumen del Modelo SAR

SAR(Intercept) 260.96 (0.1344)

ACC.BELIC 121.33 (<2e-16)ρ 0.23192 (1.6981e-10)

AIC 22267.33I de Moran (residuales) 0.06735

S.E. I de Moran 4.2919 (8.856e-06)

En el análisis exploratorio se identificaron tres poblaciones con un volumen alto de casos de desplaza-

miento (Medellín, Buenaventura y Tumaco) por lo que se estimó el efecto de equilibrio (incremento

del volumen de desplazados) en el caso que se duplicaran las acciones bélicas en estos municipios.

La tabla 2.2 muestra los nombres de las 10 poblaciones que presentarían mayor cambio hipotético en

el desplazamiento forzado dado una duplicación hipotética de las acciones bélicas en las poblaciones

de Medellín, Buenaventura y Tumaco.

La Figura 2.9, muestra el histograma correspondiente al efecto equilibrio anteriormente descrito.

51

Page 54: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Tabla 2.2: “Top 10” del Efecto Equilibro para el Modelo SAR

POBLACIÓN Efeecto Equilibrio del modelo SARLA GLORIA 103473.04

TAMALAMEQUE 85043.14NEIRA 84469.49

CORDOBA 83637.94CHINU 82549.75SINCE 81113.56

EL GUACAMAYO 80837.82GUADALUPE 79605.64MAGANGUE 73802.20

ANSERMA 73209.44

Los mapas de la Figura 2.10 describen el efecto equilibrio de las acciones bélicas sobre el desplaza-

miento forzado.

2.3.2. Modelo SEM: Spatial Error Model

Uno de los principales problemas del modelo SAR es la posibilidad de sesgo por variables omitidas.

Los Modelos SEM y SDM incluyen en su estructura la dependencia espacial del error, por lo que

pueden presentar un mejor ajuste.

El primer modelo a estimar es el SEM cuyos resultados se presentan a continuación:

Call:

errorsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,

zero.policy = T, tol.solve = 1e-15)

Residuals:

Min 1Q Median 3Q Max

-38626.287 -599.305 -315.093 55.915 101584.104

Type: error

Regions with no neighbours included:

908 1119 1120 1121

Coefficients: (asymptotic standard errors)

Estimate Std. Error z value Pr(>|z|)

(Intercept) 558.4053 238.9992 2.3364 0.01947

ACC.BELIC 141.5640 5.8862 24.0500 < 2e-16

Lambda: 0.38862, LR test value: 88.96, p-value: < 2.22e-16

Asymptotic standard error: 0.040633

z-value: 9.5641, p-value: < 2.22e-16

Wald statistic: 91.473, p-value: < 2.22e-16

52

Page 55: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.9: Histograma del Efecto Equilibrio Modelo SAR

(a) Efecto Equilibrio (b) Acciones Bélicas

Figura 2.10: Efecto Equilibrio Modelo SAR

53

Page 56: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Tabla 2.3: Resumen Modelos SAR y SEM

SAR SEM(Intercept) 260.9630 (0.1344) 558.4053 (0.01947)

ACC.BELIC 121.3348 (<2e-16) 141.5640 (<2e-16)ρ 0.23192 (1.6981e-10)λ 0.38862 (<2.22e-16)

AIC 22267 22219I de Moran (Residuales) 0.06735 -0.0157

S.E. I de Moran 4.2919 (8.856e-06) -0.93427 (0.8249)

Log likelihood: -11105.58 for error model

ML residual variance (sigma squared): 22520000, (sigma: 4745.5)

Number of observations: 1122

Number of parameters estimated: 4

AIC: 22219, (AIC for lm: 22306)

Con un nivel de significancia α = 0,05 la evidencia sugiere que el modelo SEM estimado permite

explicar adecuadamente la interdependencia espacial de las variables. El coeficiente λ es positivo y

altamente significativo lo que indica dependencia espacial en los errores. El cálculo del coeficiente de

correlación I de Morán para los residuales del modelo obtuvo los siguientes resultados:

Moran I test under randomisation

data: res.sem

weights: col.W_cont_el_mat

Moran I statistic standard deviate = -0.93427, p-value = 0.8249

alternative hypothesis: greater

sample estimates:

Moran I statistic Expectation Variance

-0.0157531476 -0.0008952551 0.0002529099

Los valores observados sugieren que el modelo SEM recoge adecuadamente toda la autocorrelación

espacial de las variables. El resumen del modelo SEM, y comparado con el SAR, se aprecia en la

Tabla 2.3. El mapa para los residuales del SEM se observa en la figura

2.3.3. Modelo SDM: Spatial Durbin Model

Otro modelo a estimar para definir la interdependencia espacial de las variables es el SDM. Motivado

por lo concerniente al sesgo por variables omitidas este modelo incluye, ademas de la autocorrela-

ción espacial de la variable dependiente, los rezagos espaciales de las covariables. Los resultados de

estimación de este modelo para el caso de estudio se presentan a continuación:

54

Page 57: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.11: Mapa Residuos SEM

55

Page 58: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Call:

lagsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,

type = "mixed", zero.policy = T, tol.solve = 1e-12)

Residuals:

Min 1Q Median 3Q Max

-40541.855 -726.443 -501.743 57.329 100926.047

Type: mixed

Regions with no neighbours included:

908 1119 1120 1121

Coefficients: (numerical Hessian approximate standard errors)

Estimate Std. Error z value Pr(>|z|)

(Intercept) 581.4218 171.5297 3.3896 0.0006999

ACC.BELIC 148.6759 6.3953 23.2478 < 2.2e-16

lag.ACC.BELIC -78.3992 10.1965 -7.6888 1.488e-14

Rho: 0.38025, LR test value: 86.933, p-value: < 2.22e-16

Approximate (numerical Hessian) standard error: 0.03838

z-value: 9.9075, p-value: < 2.22e-16

Wald statistic: 98.158, p-value: < 2.22e-16

Log likelihood: -11101.66 for mixed model

ML residual variance (sigma squared): 22392000, (sigma: 4732)

Number of observations: 1122

Number of parameters estimated: 5

AIC: 22213, (AIC for lm: 22298)

Según se observa el SDM resulta significativamente mejor ajustado.

El cálculo del coeficiente de autocorrelación espacial I de Morán se presenta a continuación:

Moran I test under randomisation

data: res.sdm

weights: col.W_cont_el_mat

Moran I statistic standard deviate = -0.84742, p-value = 0.8016

alternative hypothesis: greater

sample estimates:

Moran I statistic Expectation Variance

-0.0143981787 -0.0008952551 0.0002538952

El resumen de los tres modelos (SAR, SEM y SDM) se presenta en la Tabla 2.4.

El mapa de los residuos del SDM se observa en la Figura

56

Page 59: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Tabla 2.4: Resumen Modelos SAR, SEM y SDM

SAR SEM SDM(Intercept) 260.9630 (0.1344) 558.4053 (0.01947) 518.4218 (0.0007)

ACC.BELIC 121.3348 (<2e-16) 141.5640 (<2e-16) 148.6759 (<2.2e-16)ρ 0.23192 (1.6981e-10) 0.38025 (<2.2e-16)λ 0.38862 (<2.22e-16)θ -78.3992 (1.488e-14)

AIC 22267 22219 22213I de Moran (Residuales) 0.06735 -0.0157 -0.014398

S.E. I de Moran 4.2919 (8.856e-06) -0.93427 (0.8249) -0.84742 (0.8016)

Figura 2.12: Mapa Residuos Modelo SDM

57

Page 60: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

2.4. Modelo Espacio-Temporal

En la Sección 1.3.5 se presentaron varios modelos espacio-temporales. El caso de los modelos STAR-

MA y STARIMA, como lo denotan las ecuaciones 1.87 y 1.88, suponen procesos espacio-temporales

univariados. El fenómeno de desplazamiento forzado, como se explicó en la sección 2.1, debe enten-

derse como un proceso de interdepencia espacial según lo plantean Ibáñez & Vélez (2008)4. Por lo

anterior, en esta sección se desarrollara sólo el caso especial de modelo espacio temporal descrito en

la sección 1.3.2.

2.4.1. Modelo de Interdepencia Espacio-Temporal

Al considerarse el desplazamiento forzado como una decisión no voluntaria se entiende que existen

otras variables que pueden llegar a influir en el proceso. EL algoritmo en R del paquete SpatioTem-

poral tiene algunos requerimientos especiales: incluir variables categóricas que permitan identificar

la existencia de efecto Nugget y variables adicionales diferentes a las covariables espacio-temporales.

Para el ejemplo se incluyeron las 13 Zonas político-militares-administrativas como variable de agru-

pamiento y el área de los municipios como covariable no espacio-temporal. Para reducir el tiempo de

computo y restringir el uso de memoria se consideraron sólo las capitales de departamento (estados)

existentes en Colombia.

La Figura 2.13 muestra la localización espacio-temporal del desplazamiento forzado, la gráfica de

probabilidad normal de las observaciones y la dependencia del desplazamiento forzado con el área

que abarca el ente territorial.

Se observa que las observaciones espacio-temporales del desplazamiento forzado no siguen una dis-

tribución normal y la dependencia de las mismas observaciones con el área del municipio no está

definida de manera clara.

Antes de estimar el modelo se requiere identificar el número de funciones base del mismo para lo

4...el desplazamiento forzado es el resultado de un ataque violento y una decisión no voluntaria: Las familias huyenpara salvar sus vidas y proteger sus bienes... (Ibáñez & Vélez, 2008

58

Page 61: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.13: Locaciones Espacio-Temporales de las observaciones divididas en Zonas, gráfica decomprobación de cuantiles y dependencia de las observaciones con el Área del Municipio

cual se empleó el Error Cuadratico Medio (MSE); el coeficiente de determinación R2 y los criterios

de información de Akaike (AIC) y bayesiano (BIC):

Result of SVDsmoothCV, average of CV-statistics:

MSE R2 AIC BIC

n.basis.0 15575.919 0.0000000 796.8352 799.5178

n.basis.1 11678.715 0.2514713 763.7296 769.0947

n.basis.2 11006.030 0.2922089 759.7309 767.7785

n.basis.3 10686.466 0.3103862 758.4320 769.1622

n.basis.4 9765.892 0.3246857 758.2084 771.6211

Los valores observados sugieren que dos (2) funciones básicas son suficientes para estimar el modelo

espacio-temporal de interdependencia. La Figura 2.14 presenta un resumen gráfico de los resultados

anteriores.

El paso siguiente consiste en calcular los coeficientes β para las locaciones para luego realizar la

estimación del modelo espacio-temporal. Los resultados obtenidos se muestran a continuación:

beta.const beta.V1 beta.V2 beta.sd.const beta.sd.V1 beta.sd.V2

05001 438.782791 10.3685255 -124.6709694 39.8442904 40.5485737 40.0645011

08001 26.528747 -10.0443125 -1.1324179 1.3216463 1.3578392 1.3288879

11001 54.254995 -30.5973465 4.2534185 3.0816442 3.1660341 3.0985292

13001 31.200984 -12.4462614 -3.0873271 1.7306380 1.8072691 1.7381817

15001 3.085053 -0.7711746 -0.4313180 0.7137243 0.4736014 0.6010360

17001 9.613863 -5.2065053 -0.4410209 0.7514073 0.7552692 0.7238294

18001 123.492345 -81.6322675 12.3632540 6.7518449 6.9541455 6.7908446

59

Page 62: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.14: Validación Cruzada de los resultados para las posibles funciones base

19001 25.629053 -5.2759055 -6.3085159 1.1255288 1.1800505 1.1314923

20001 85.926893 -112.0712772 13.9379260 7.0324696 7.3304306 7.0390126

23001 66.919710 -22.8068264 9.3896958 4.5039660 4.6273058 4.5286442

25001 3.952432 -0.3029615 -0.3742932 0.8402204 0.5462641 0.7293220

27001 130.012027 -36.5955045 -36.4234343 8.1936634 8.3384937 8.2389480

41001 66.891579 -31.0997431 8.6422907 3.4532632 3.6205427 3.4715599

44001 97.042982 -48.2027959 36.1125823 7.5051064 7.8374258 7.5378202

47001 265.908849 -318.1356109 -29.9991408 26.1361137 26.9192111 26.2870799

50001 31.119191 -6.1068561 -1.1800171 1.6508275 1.7176428 1.6602981

52001 22.599577 -7.5262933 -4.0522408 1.5009406 1.5524500 1.5112312

54001 73.810020 -18.3340427 -18.1082468 6.0514666 6.2963928 6.0861834

63001 12.159291 -4.1072495 -0.7183323 0.8446551 0.8681555 0.8414524

66001 23.514000 -11.8601884 -5.7900290 1.4410997 1.4789986 1.4516659

68001 20.408636 -18.4578101 2.9373085 1.4719485 1.5356079 1.4603571

70001 29.610695 -14.0339816 -0.8932888 2.0164183 2.0768348 2.0280654

73001 90.631216 -39.3577629 1.6907988 5.5759583 5.7842251 5.6058194

76001 113.536063 -6.2345555 -48.3815499 6.9751313 7.1841221 7.0154207

81001 45.751804 -22.0039922 2.9280695 2.7723779 2.8168998 2.7860580

85001 14.967070 -7.2970375 0.3281703 0.9876059 1.0209421 0.9885322

86001 24.522141 -7.6072885 -3.5746276 1.2495528 1.2966000 1.2539906

88001 3.402222 -0.2811495 -0.6908851 0.6930618 0.9223580 0.7264687

91001 6.592266 -2.2034818 -1.0368612 0.5622749 0.5945782 0.5493178

94001 15.634581 -5.3836598 -0.1061732 1.1369199 1.1823822 1.1402705

95001 125.457012 -57.7879032 39.1696826 8.0938828 8.4214734 8.1403168

97001 16.707169 -7.8769166 3.6197763 1.2432252 1.2986987 1.2418764

99001 8.912128 -6.2679311 0.4593658 0.7813621 0.7640424 0.7760521

Con esto, se obtienen los coeficientes espaciales del modelo. Se procede a simular la respuesta de las

observaciones en función del área del municipio. La Figura 2.15 permite evaluar las funciones base

en función de la covariable Área del Municipio. Se observa una gran dispersión en varios puntos lo

60

Page 63: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Figura 2.15: Estimaciones de regresión de β1(s) y β2(s) en cada ubicación, con intervalos de confianzadel 95%, en función del Área del municipio

que podría implicar dificultades para el cálculo de las funciones de covarianza y el efecto nugget.

Como tal, el proceso de computo supone dificultades debido a la presencia valores cero en múltiples

puntos para la covariable espacio-temporal (Acciones Bélicas). El resultado se presenta a continua-

ción:

Optimisation using starting value 1/2

N = 21, M = 5 machine precision = 2.22045e-16

At X0, 0 variables are exactly at the bounds

At iterate 0 f= 1.2259e+06 |proj g|= 15

At iterate 10 f = 15750 |proj g|= 24.373

At iterate 20 f = 15466 |proj g|= 12.655

At iterate 30 f = 15453 |proj g|= 3.6905

At iterate 40 f = 15450 |proj g|= 4.8059

At iterate 50 f = 15450 |proj g|= 0.53253

At iterate 60 f = 15449 |proj g|= 1.4539

At iterate 70 f = 15449 |proj g|= 1.7082

At iterate 80 f = 15449 |proj g|= 0.58783

At iterate 90 f = 15449 |proj g|= 3.1424

ys=-5.118e-01 -gs= 7.545e-01, BFGS update SKIPPED

At iterate 100 f = 15446 |proj g|= 2.5051

At iterate 110 f = 15445 |proj g|= 4.6288

At iterate 120 f = 15353 |proj g|= 21.987

61

Page 64: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

At iterate 130 f = 15319 |proj g|= 2.7983

At iterate 140 f = 15319 |proj g|= 0.26712

iterations 144

function evaluations 187

segments explored during Cauchy searches 161

BFGS updates skipped 1

active bounds at final generalized Cauchy point 1

norm of the final projected gradient 0.0519789

final function value 15319.1

F = 15319.1

l(0) > u(0). No feasible solutionfinal value 15319.149208

converged

Error in solve.default(res[[i]]$hessian) :

Lapack routine dgesv: system is exactly singular: U[1,1] = 0

Los resultados de la estimación indican que la optimización el punto de partida no converge.

Existe un problema particular con los datos que está asociado a la covariable espacio-temporal: mul-

tiplicidad de valores cero debido a que no todas las localidades registraron acciones bélicas durante

el periodo de tiempo observado. Esta situación hace que el sistema de ecuaciones no tenga solución

debido a la singularidad por lo que el modelo, debido a la características de los datos, sólo posee

componente espacial.

2.4.2. Modelo VAR

En la sección 1.3.5 se presentó el modelo VAR como una alternativa para analizar un proceso espacio-

temporal; sin embargo, este modelo tiene como limitante que sólo es efectivo cuando se tienen pocas

unidades espaciales.

El fenómeno de desplazamiento forzado en Colombia posee observaciones en 1107 unidades terri-

toriales o municipios, lo que hace que no sea un modelo adecuado para implementar. Sin embargo,

en este apartado se incluye, como parte del ejercicio el análisis del desplazamiento forzado como

consecuencia de las acciones bélicas o incursiones armadas bajo el supuesto que cualquier incursión

armada genera una respuesta sobre las personas de la misma unidades territorial y que el efecto puede

reflejarse, también, a través del comportamiento temporal de las variables para lo cual el modelo VAR

es una buena herramienta.

62

Page 65: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Un primer paso es identificar el número de rezagos distribuidos en las variables de interes; los resul-

tados se muestran a continuacion:

$selection

AIC(n) HQ(n) SC(n) FPE(n)

1 1 1 1

$criteria

1 2 3 4 5

AIC(n) 2.912416e+01 2.916772e+01 2.917865e+01 2.923036e+01 2.927449e+01

HQ(n) 2.918229e+01 2.926460e+01 2.931429e+01 2.940475e+01 2.948764e+01

SC(n) 2.926737e+01 2.940641e+01 2.951282e+01 2.966000e+01 2.979961e+01

FPE(n) 4.451145e+12 4.649722e+12 4.701746e+12 4.952942e+12 5.179174e+12

Según se observa, todos los criterios apuntan a que el número máximo de rezagos para la ecuación es uno (1).Con este parámetro fijado se procede a estimar el modelo. Los resultados son los siguientes:

VAR Estimation Results:

=========================

Endogenous variables: Desplazamiento, Acciones.Belicas

Deterministic variables: const

Sample size: 119

Log Likelihood: -2066.987

Roots of the characteristic polynomial:

0.8539 0.001083

Call:

VAR(y = fenom.ts, p = 1, type = "const")

Estimation results for equation Desplazamiento:

===============================================

Desplazamiento = Desplazamiento.l1 + Acciones.Belicas.l1 + const

Estimate Std. Error t value Pr(>|t|)

Desplazamiento.l1 0.85400 0.04718 18.099 <2e-16 ***

Acciones.Belicas.l1 -0.08634 1.54170 -0.056 0.9554

const 2696.30105 1140.18457 2.365 0.0197 *

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5906 on 116 degrees of freedom

Multiple R-Squared: 0.7386, Adjusted R-squared: 0.734

F-statistic: 163.8 on 2 and 116 DF, p-value: < 2.2e-16

Estimation results for equation Acciones.Belicas:

=================================================

Acciones.Belicas = Desplazamiento.l1 + Acciones.Belicas.l1 + const

63

Page 66: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Estimate Std. Error t value Pr(>|t|)

Desplazamiento.l1 6.531e-04 2.841e-03 0.230 0.819

Acciones.Belicas.l1 1.017e-03 9.284e-02 0.011 0.991

const 9.338e+01 6.866e+01 1.360 0.176

Residual standard error: 355.6 on 116 degrees of freedom

Multiple R-Squared: 0.0004574, Adjusted R-squared: -0.01678

F-statistic: 0.02654 on 2 and 116 DF, p-value: 0.9738

Covariance matrix of residuals:

Desplazamiento Acciones.Belicas

Desplazamiento 34877258 50694

Acciones.Belicas 50694 126479

Correlation matrix of residuals:

Desplazamiento Acciones.Belicas

Desplazamiento 1.00000 0.02414

Acciones.Belicas 0.02414 1.00000

Según se observa, el desplazamiento forzado responde al estímulo inmediato de las acciones bélicas y al efectode la misma variable en su primer rezago. El efecto espacio-temporal de la covariable fue analizado en elapartado anterior y la relación descrita por el modelo VAR es mejor explicado a través de los modelos deinterdependencia espacial presentados en la sección 2.3. Por lo tanto, se descarta el modelo VAR para el análisisdel desplazamiento forzado y su relación con la variable acciones bélicas.

64

Page 67: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Capítulo 3

Conclusiones

El principal objetivo de este trabajo ha sido modelar el fenómeno de desplazamiento forzado a la luz de losevento de conflicto armado en Colombia registrados durante el periodo enero de 2007 - diciembre 2016, paralo cual se recurrió a la implementación de modelos espaciales y modelos espacio-temporales.

En el caso de los modelos espaciales se encontró:

El modelo SAR no permite explicar adecuadamente la interdependencia espacial del fenómeno.

Los modelos SEM y SDM son capaces de vincular una estructura para la autocorrelación espacial lo queles hace buenas opciones de modelamiento.

El SDM se observa como una leve ventaja sobre el modelo SEM para explicar el fenómeno de desplaza-miento forzado en función de los eventos de conflicto armado.

En términos de la interdependencia espacial, se puede firmar que cualquier acción belica o incursionarmada en un ente territorial causa que las personas de mismo territorio y de los territorios vecinos sedesplacen de manera no voluntaria hacia otras regiones.

Los valores observados en los coeficientes de autocorrelación espacial (IdeMoran) sugieren que el des-plazamiento forzado es un fenómeno que espacialmente autocorrelacionado.

Para los modelos espacio-temporales planteados se encontró:

El modelo de interdependencia espacial para proceso Gaussianos no permitió explicar el desplazamientoforzado como un proceso espacio-temporal.

La alta presencia de valores cero en la variable acciones bélicas creó un sistema singular que truncó elproceso de estimación del modelo.

El modelo VAR no fue efectivo para la estimación de un modelo que permitiera explicar el fenómeno dedesplazamiento forzado como un proceso espacio-temporal.

En general se tiene:

Por definición, el fenómeno de desplazamiento forzado no puede considerarse un proceso univariado porlo que los modelos STARMA y STARIMA no son adecuados en este caso.

Es recomendable considerar entes territoriales mayores (departamentos o distritos) para evitar la singu-laridad del proceso.

Se requiere realizar un estudio a más profundidad que permita incorporar otras variables de evento deconflicto armado y variables de carácter socio-económico para definir mejor el fenómeno.

Se requiere desarrollar algoritmos que permitan incorporar observaciones ausentes y múltiples covaria-bles espacio-temporales.

65

Page 68: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Bibliografía

1. Agencia EFE. (17 de septiembre de 2016). Cinco líderes en cinco décadas de las Farc. Obtenido de ElHeraldo: https://www.elheraldo.co/politica/cinco-lideres-en-cinco-decadas-de-las-farc-285794

2. Arnold, J. (2017). ggthemes: Extra Themes, Scales and Geoms for ’ggplot2’. R package version 3.4.0.https://CRAN.R-project.org/package=ggthemes

3. Bivand, R. (2017). classInt: Choose Univariate Class Intervals. R package version 0.1-24. https://CRAN.R-project.org/package=classInt

4. Bivand, R. & Lewin-Koh, N. (2017). maptools: Tools for Reading and Handling Spatial Objects. Rpackage version 0.9-2. https://CRAN.R-project.org/package=maptools

5. Bivand, R. & Piras, G. (2015). Comparing Implementations of Estimation Methods for Spatial Econo-metrics. Journal of Statistical Software, 63(18), 1-36. URL http://www.jstatsoft.org/v63/i18/.

6. Bivand, R., Hauke, J., & Kossowski, T. (2013). Computing the Jacobian in Gaussian spatial autoregres-sive models: An illustrated comparison of available methods. Geographical Analysis, 45(2), 150-179.

7. Bivand, R., Keitt, T. & Rowlingson, B. (2017). rgdal: Bindings for the Geospatial Data AbstractionLibrary. R package version 1.2-7. https://CRAN.R-project.org/package=rgdal

8. Burrough, P. McDonnell, R. & Lloyd, C. (2015). Principles of Geographical Information Systems. Ox-ford University Press, Oxford.

9. Cantor, D. J. (2011). The colombian guerrilla, forced displacement and return. Forced Migration Review,(37), 20-22. Recuperado de: https://search.proquest.com/docview/ 869631540?accountid=29068

10. Cheng, T., Wang, J., & Li, X. (2011). A Hybrid Framework for Space–Time Modeling of EnvironmentalData. Geographical Analysis, 43, 188-2010.

11. Cheysson, F. (2016). starma: Modelling Space Time AutoRegressive Moving Average (STARMA) Pro-cesses. R package version 1.3. https://CRAN.R-project.org/package=starma

12. Cressie, N. & Wikle, C.K. (2011). Statistics for Spatio-Temporal Data. Wiley Series in Probability andStatistics.Wiley, New York.

13. De Oliveira, V. (2006). On Optimal Point and Block Prediction in Log-Gaussian Random Fields, Scan-dinavian Journal of Statistics, 33, 523–540.

14. Diggle, P. (2014). Statistical Analysis of Spatial and Spatio-Temporal Points patterns. Taylor & FrancisGroup. Boca Ratón.

15. Gelfand, A., Diggle, P., Fuentes, M. & Guttorp, P. (2010). Handbook of Spatial Statistics. Boca Ratón:Taylor & Francis Group.

16. Gneiting, T., Genton, M. & Guttorp, P. (2007). Geostatistical Space-Time Models, Stationarity, Sepa-rability and Full Symmetry. En Finkenstädt, B., Held, L. and Isham, V. (Eds.), Statistical Methods forSpatio-Temporal Systems, Chapman & Hall, Boca Raton, FL, pp. 151–175. .

66

Page 69: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

17. Gneiting, T. & Guttorp, P. (2010). Continuous parameter Spatio-Temporal Processes. En A. Gelfand, P.Diggle, M. Fuentes, & P. Guttorp, Handbook of Spatial Statistics (págs. 427-436). Boca Ratón: Taylor& Francis Group.

18. Greenberg, J. & Mattiuzzi, M (2015). gdalUtils: Wrappers for the Geospatial Data Abstraction Library(GDAL) Utilities. R package version 2.0.1.7. https://CRAN.R-project.org/package=gdalUtils

19. Güting, R. & Schneider, M. (2005). Moving Objects Databases. Morgan Kaufmann.

20. Hijmans, R. (2016a). Introduction to the ’raster’ package (version 2.5-8). https://CRAN.R-project.org/package=raster

21. Hijmans, R. (2016b). Raster: Geographic Data Analysis and Modeling. R package version 2.5-8. https://cran.r-project.org/web/packages/raster/vignettes/Raster.pdf

22. Huisman, O & A. de By, R. (2009). Principles of Geographic Information System. An IntroductoryTextbook. The International Institute for Geo-Information Science and Earth Observation (ITC), TheNetherlands.

23. Ibañez, A. M., & Velez, C. E. (2008). Civil Conflict and Forced Migration: The Micro Determinants andWelfare Losses of Displacement in Colombia. World Development, 36(4), 659-676.

24. Kurt, S., & Tunay, B. (2015). STARMA Models Estimation with Kalman Filter: The Case of RegionalBank Deposits. Procedia - Social and Behavioral Sciences, 2537-2547.

25. Lee, D., Rushworth, A. & Napier, G. (2017). CARBayesST: Spatio-Temporal Generalised Linear Mi-xed Models for Areal Unit Data. R package version 2.5. https://CRAN.R-project.org/package =CARBa-yesST

26. Lindstrom, J. & Bergen, S. (2013a). Comprehensive Tutorial for the Spatio-Temporal R-package. Rpackage version 1.1.7. https://CRAN.R-project.org/package =SpatioTemporal

27. Lindstrom, J., Szpiro, A., Sampson, P., Bergen, S. & Oron, A. (2013b). SpatioTemporal: Spatio-TemporalModel Estimation. R package version 1.1.7. https://CRAN.R-project.org/package =SpatioTemporal

28. Lindstrom, J., Szpiro, A., Sampson, P., Bergen, S. & Sheppard, L. (2013c). SpatioTemporal: An RPackage for Spatio-Temporal Modelling of Air-Pollution. R package version 1.1.7. https://CRAN.R-project.org/package =SpatioTemporal

29. Mantilla, C. (2015). Factorial Analysis for Forced Migration in Colombia. International Statistical Insti-tute (ISI) - 60th World Statistics Congreee - ISI2015. Recuperado de: http://www.isi2015.org

30. Moreno, R. & Vayá. E. (2000). Ténicas econométricas para el tratamiento de datos espaciales : laeconometría espacial. Universitat de Barcelona, Barcelona.

31. Paradis, E. (2017). Moran’s Autocorrelation Coefficient in Comparative Methods. Recuperado de: https://cran.r-project.org/web/packages/ape/vignettes/

32. Pebesma, E. (2012). Spacetime: Spatio-Temporal Data in R. In: Journal of Statistical Software 51.7, pp.1–30. ISSN: 1548-7660. http://www.jstatsoft.org/v51/i07.

33. Perpiñán, O. (2014). Displaying Time Series, Spatial, and Space-Time Data with R. Taylor & FrancisGroup. Boca Ratón.

34. Perpinán, O. & Hijmans, R. (2016), meteoForecast. R package version 0.41.

35. Pfeifer, P., & Deutsch, S. (1980). A STARIMA model-building procedure with application to descriptionand regional forecasting. Transactions of the Institute of British Geographers, 5(3), 330-349.

36. Rui, C & De Oliveira, V (2008). Point and Block Prediction in Log-Gaussian Random Fields: The Non-Constant Mean case, Journal of Statistical Planning and Inference, 138, 2128-2142.

67

Page 70: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

37. Ryan, J. & Ulrich, J. (2014). xts: eXtensible Time Series. R package version 0.9-7. https://CRAN.R-project.org/package=xts

38. Sherman, M. (2011). Spatial Statistics ans Spatio-Temporal Data. Covariance Functions and DirectionalProperties. John Wiley & Sons, Ltd. United Kingdom

39. Tennekes, M. (2017). tmap: Thematic Maps. R package version 1.10. https://CRAN.R-project.org/ pac-kage=tmap

40. Unidad de Manejo y Análisis de Información de Colombia. (2017). Sistema Integrado de InformaciónHumanitaria. Obtenido de https://sidi.umaic.org

41. Ward, M. & Gleditsch, KS. (2007). An Introduction to Spatial Regression Models in the Social Sciences.SAGE Publications, Inc. California.

42. Ward, M. & Gleditsch, KS. (2007). Spatial Regression Models. SAGE Publications, Inc. California.

43. Wickham, H. (2007). Reshaping Data with the reshape Package. Journal of Statistical Software, 21(12),1-20. URL http://www.jstatsoft.org/v21/i12/.

44. Wickham, H. & Francois, R. (2016). dplyr: A Grammar of Data Manipulation. R package version 0.5.0.https://CRAN.R-project.org/package=dplyr

45. Wickham, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2009.

46. Zeileis, A. & Grothendieck, G. (2005). zoo: S3 Infrastructure for Regular and Irregular Time Series.Journal of Statistical Software, 14(6), 1-27. doi:10.18637/jss.v014.i06

47. Zimmerman, D. & Stein, M. (2010). Classical geostatistical Methods. En A. Gelfand, P. Diggle, M.Fuentes, & P. Guttorp, Handbook of Spatial Statistics (págs. 427-436). Boca Ratón: Taylor & FrancisGroup.

48. Zhou, M. & Buongiorno, J. (2006). Space-Time Modeling of Timber Prices. Journal of Agricultural andResource Economics, 31(1), 40-56

49. Zhou, X & Lin. H. (2008). Geary’s C. En: Shekhar, S & Xiong. H, Encyclopedia of GIS (págs. 329-330),Springer US.

50. Zhukov, Y. (2010). Applied Spatial Statistics in R. Recuperado de: http://scholar.harvard.edu/ zhukov/classes/appliedspatial- statistics-r.

51. Zivot, E. & Wang, J. (2006). Modeling Financial Time Series With S-PLUS R©. Springer. New York.

68

Page 71: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

Anexos

Sintaxis en R del Caso de estudio

#######################################

#### DATOS ###

#######################################

rm(list=ls(all=TRUE))

ls()

save(list=ls(all=TRUE),file="base.RData")

load("base1.RData")

#######################################

#### LIBRERIAS BASICAS ###

#######################################

install.packages("rgdal")

install.packages("spdep")

install.packages("maptools")

install.packages("classInt")

install.packages("tmap")

install.packages("dplyr")

install.packages("xts")

install.packages("ggthemes")

install.packages("rasterVis")

install.packages("spatstat")

install.packages("pgirmess")

install.packages("spgwr")

library(rgdal)

library(spdep)

library(maptools)

library(classInt)

library(dplyr)

library(tmap)

library(raster)

library(zoo)

library(rasterVis)

library(ggplot2)

library(xts)

library(ggthemes)

library(reshape2)

library(SpatioTemporal)

69

Page 72: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

library(plotrix)

library(ggplot2)

library(xts)

library(ggthemes)

library(reshape2)

library(maps) ## Projections

library(maptools) ## Data management

library(sp) ## Data management

library(spdep) ## Spatial autocorrelation

library(gstat) ## Geostatistics

library(splancs) ## Kernel Density

library(spatstat) ## Geostatistics

library(pgirmess) ## Spatial autocorrelation

library(RColorBrewer) ## Visualization

library(classInt) ## Class intervals

library(spgwr) ## GWR

#######################################

#### MAPAS ###

#######################################

#### LIBRERIAS

library(rgdal)

library(spdep)

library(maptools)

library(classInt)

library(dplyr)

library(tmap)

# Crear el objeto "colb" de "Municipios" shapefile

#colmpio<-readShapePoly("mpio")

col.mpios <- readOGR(dsn = "mpio", layer = "mpio")

win.graph(10,16,12)

plot(col.mpios) # plot the lnd object (not shown)

nrow(col.mpios) # return the number of rows (not shown)

#######################################

##### CAPTURA DE DATOS #####

#######################################

######## SERIE DESPLAZADOS

datos<-read.table("conflicto.txt",header = T, sep="\t",dec=",",

colClasses = c("numeric", "numeric", "character", "character", "numeric", "character", "character"))

despl<-datos

summary(despl)

str(despl)

despl<-despl

despl$PERIODO<-as.Date(despl$FINAL, origin = "1899-12-30")

despl$MPIOS<-despl$CODIGO.MUNICIPIO

str(despl)

summary(despl)

70

Page 73: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

plot(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl),type=’l’,lwd=2,cex=1.5)

library(ggplot2)

library(xts)

library(ggthemes)

library(reshape2)

plt.despl<-ggplot(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl),aes(PERIODO, DESPLAZADOS))

###############

### SERIE GENERAL

win.graph(10,6,6)

plt.despl + geom_line(size=1) +

geom_point(size=(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl)$DESPLAZADOS)/10000,col="red",shape=1) +

scale_x_date(date_labels = "%b %Y",date_breaks = "3 month")+

xlab("Mes. A~no") + ylab("Total Desplazados") + theme_light()+

theme(axis.text.x = element_text(hjust = 1,size=8,angle=90,vjust=1.5))+

ggtitle("Vıctimas de Desplazamiento Forzado en Colombia \n enero 2007 - diciembre 2016")

despl1$MPIOS<-as.factor(despl1$MPIOS)

despl$PERIODO<-factor(despl$PERIODO)

despl1<-despl[,c(5,7,8)]

despl1$MPIOS<-as.factor(despl1$MPIOS);str(despl1)

colb2<-col.mpios

despl.tot<-aggregate(DESPLAZADOS ~ MPIOS, FUN = sum, data = despl)

head(left_join(colb2@data, despl1))

colb2@data <- left_join(colb2@data, despl.tot)

colb2$DESPLAZADOS[is.na(colb2$DESPLAZADOS)] <- 0

colb2$DESPLAZADOS[is.na(colb2$DESPLAZADOS)] <- 0

colb2@data<-colb2@data[,c(5:8,11,16:17)]

split(colb2@data,colb2$PERIODO)

library(tmap) # load tmap package (see Section IV)

qtm(colb2, "DESPLAZADOS") # plot the basic map

qtm(colb2[colb2$DPTO=="05",], "DESPLAZADOS")

qtm(colb2[colb2$DPTO=="08",], "DESPLAZADOS")

qtm(colb2[colb2$DPTO=="11",], "DESPLAZADOS")

qtm(colb2[colb2$DPTO=="13",], "DESPLAZADOS")

qtm(colb2[colb2$DPTO=="15",], "DESPLAZADOS")

qtm(colb2[colb2$DPTO=="17",], "DESPLAZADOS")

#theme(axis.text.x = element_text(hjust = 1,size=0.5))+

#######################################

#### limpiar: rm(datos)

71

Page 74: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

col.mpios$DESPLAZADOS[is.na(col.mpios$DESPLAZADOS)] <- 0

col.map_crd <- coordinates(colb2)

col.W_cont_el <- poly2nb(colb2, queen=T)

col.W_cont_el_mat <- nb2listw(col.W_cont_el, style="W", zero.policy=TRUE)

par(mar=rep(0,4))

plot(colb2,border="gray")

plot(col.W_cont_el_mat,coords=col.map_crd,pch=19, cex=0.1, add=T)

dev.off()

moran.test(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T)

geary.test(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T)

dev.off()

win.graph(10,6,12)

moran.plot(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T,

xlim=c(-0.3,125000),ylim=c(-0.3,35500), pch=16, col="black",cex=.5,

quiet=F, labels=as.character(colb2$MPIOS),xlab="Desplazados",

ylab="Desplazados (Spatial Lag)", main="Moran Scatterplot")

win.graph(10,6,12)

moran.plot(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T,

xlim=c(-0.3,125000),ylim=c(-0.3,35500), pch=16, col="black",cex=1,

quiet=F, labels=as.character(colb2$NOMBRE_MPI),xlab="Desplazados",

ylab="Desplazados (Spatial Lag)", main="Moran Scatterplot")

################ AUTOCORRELACION LOCAL

lm1 <- localmoran(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T)

colb2@data$lm1 <- abs(lm1[,4]) ## Extract z-scores

lm.palette <- colorRampPalette(c("white","orange", "red"), space = "rgb")

spplot(colb2[colb2$DPTO=="68",], zcol="lm1", col.regions=lm.palette(20),

main="Local Moran’s I (|z| scores)", pretty=T)

desene2007<-despl[despl$PERIODO=="2007-01-31",]

desene2007<-desene2007[,-1];str(desene2007)

desene2007<-desene2007[,c(4,7)];str(desene2007)

desene2007<-na.omit(desene2007)

72

Page 75: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

col.mpios$MPIOS[!col.mpios$MPIOS %in% desene2007$MPIOS]

desene2007$MPIOS[!desene2007$MPIOS %in% col.mpios$MPIOS]

head(left_join(col.mpios@data, desene2007))

colb2@data <- left_join(colb2@data, desene2007)

####################################### Matriz Deplazamiento

eventosconflicto <- read.table("eventosdespl.txt",header=T,sep="\t",dec=",")

View(eventosconflicto)

eventosconflicto[is.na(eventosconflicto)]<-0

head(eventosconflicto)

rownames(eventosconflicto)<-eventosconflicto[,1]

head(array(eventosconflicto))

head(data.matrix(eventosconflicto[,-1]))

desplazados<-eventosconflicto;rm(eventosconflicto);head(desplazados,1)

class(desplazados)

desplazados@data

###############################

########### SERIES

###############################

serie<-read.delim("clipboard",header=T)

ts.series<-ts(serie,start=c(2007,1),freq=12)

win.graph(10,6,10)

ts.plot(ts.series,lty=c(1:length(serie[,1])))

acum<-read.delim("clipboard",header=T)

acum.ts<-ts(acum,start=c(2007,1),freq=12)

library(ggplot2)

library(ggfortify)

library(dlm)

autoplot(acum.ts)

library(plotly)

library(plyr)

install.packages("plotly")

# data. ts converted to long matrix:

myData <- data.frame(Year = c(floor(time(acum.ts) + .01)),

Month = c(cycle(acum.ts)),

Value = c(acum.ts))

# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:

myData$Month <- factor(myData$Month)

levels(myData$Month) <- month.abb

73

Page 76: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

# plotting reference lines across each facet:

referenceLines <- myData # \/ Rename

colnames(referenceLines)[2] <- "groupVar"

zp <- ggplot(myData,

aes(x = Year, y = Value))

zp <- zp + geom_line(data = referenceLines, # Plotting the "underlayer"

aes(x = Year, y = Value, group = groupVar),

colour = "GRAY", alpha = 1/2, size = 1/2)

zp <- zp + geom_line(size = 1) # Drawing the "overlayer"

zp <- zp + facet_wrap(~ Month)

zp <- zp + theme_bw()

###

indiv<-read.delim("clipboard",header=T)

indiv.ts<-ts(indiv,start=c(2007,1),freq=12)

# data. ts converted to long matrix:

myData2 <- data.frame(Year = c(floor(time(indiv.ts) + .01)),

Month = c(cycle(indiv.ts)),

Value = c(indiv.ts))

# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:

myData2$Month <- factor(myData2$Month)

levels(myData2$Month) <- month.abb

# plotting reference lines across each facet:

referenceLines2 <- myData2 # \/ Rename

colnames(referenceLines2)[2] <- "groupVar"

zp2 <- ggplot(myData2,

aes(x = Year, y = Value))

zp2 <- zp2 + geom_line(data = referenceLines2, # Plotting the "underlayer"

aes(x = Year, y = Value, group = groupVar),

colour = "GRAY", alpha = 1/2, size = 1/2)

zp2 <- zp2 + geom_line(size = 1) # Drawing the "overlayer"

zp2 <- zp2 + facet_wrap(~ Month)

zp2 <- zp2 + theme_bw()

zp2

#######################################

######## SERIE ACCIONES BELICAS

datos.acciones<-read.table("acciones.txt",header = T, sep="\t",dec=",",

colClasses = c("numeric", "numeric", "character", "character", "numeric", "character", "character"))

acciones<-datos.acciones

summary(acciones)

str(acciones)

74

Page 77: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

accion<-acciones

accion$PERIODO<-as.Date(accion$FINAL, origin = "1899-12-30")

accion$MPIOS<-accion$CODIGO.MUNICIPIO

str(accion)

summary(accion)

plot(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion),type=’l’,lwd=2,cex=1.5)

library(ggplot2)

library(xts)

library(ggthemes)

library(reshape2)

plt.accion<-ggplot(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion),aes(PERIODO, ACC.BELIC))

################################

win.graph(10,6,6)

plt.accion + geom_line(size=1) +

geom_point(size=(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion)$ACC.BELIC)/10000,col="red",shape=1) +

scale_x_date(date_labels = "%b %Y",date_breaks = "3 month")+

xlab("Mes. A~no") + ylab("Total Desplazados") + theme_light()+

theme(axis.text.x = element_text(hjust = 1,size=8,angle=90,vjust=1.5))+

ggtitle("Acciones Belicas en Colombia \n enero 2007 - diciembre 2016")

accion$MPIOS<-as.factor(accion$MPIOS)

accion$PERIODO<-factor(accion$PERIODO)

accion1<-accion[,c(5,7,8)]

accion1$MPIOS<-as.factor(accion1$MPIOS);str(accion1)

colb2<-col.mpios

accion.tot<-aggregate(ACC.BELIC ~ MPIOS, FUN = sum, data = accion)

head(left_join(colb2@data, accion.tot))

colb2@data <- left_join(colb2@data, accion.tot)

colb2$ACC.BELIC[is.na(colb2$ACC.BELIC)] <- 0

colb2$ACC.BELIC[is.na(colb2$ACC.BELIC)] <- 0

colb2@data<-colb2@data[,c(5:8,11,16:17)]

split(colb2@data,colb2$PERIODO)

library(tmap) # load tmap package (see Section IV)

qtm(colb2, "ACC.BELIC") # plot the basic map

qtm(colb2[colb2$DPTO=="05",], "ACC.BELIC")

qtm(colb2[colb2$DPTO=="08",], "ACC.BELIC")

qtm(colb2[colb2$DPTO=="68",], "ACC.BELIC")

qtm(colb2[colb2$DPTO=="13",], "ACC.BELIC")

qtm(colb2[colb2$DPTO=="15",], "ACC.BELIC")

qtm(colb2[colb2$DPTO=="17",], "ACC.BELIC")

qtm(colb2[colb2$DPTO=="52",], "ACC.BELIC")

qtm(colb2[colb2$DPTO=="19",], "ACC.BELIC")

75

Page 78: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

qtm(colb2[colb2$DPTO=="05",], "ACC.BELIC", fill.title="ACCIONES BELICAS",

title = "DEPARTAMENTO DE ANTIOQUIA")

qtm(colb2[colb2$DPTO=="52",], "ACC.BELIC", fill.title="ACCIONES BELICAS",

title = "DEPARTAMENTO DE NARI~NO")

qtm(colb2[colb2$DPTO=="76",], "ACC.BELIC", fill.title="ACCIONES BELICAS",

title = "DEPARTAMENTO DE VALLE DEL CAUCA")

##################################################

serie.a<-read.delim("clipboard",header=T)

ts.series.a<-ts(serie.a,start=c(2007,1),freq=12)

win.graph(10,6,10)

ts.plot(ts.series.a,lty=c(1:length(serie.a[,1])))

acum.a<-read.delim("clipboard",header=T)

acum.ts.a<-ts(acum.a,start=c(2007,1),freq=12)

library(ggplot2)

library(ggfortify)

library(dlm)

win.graph(6,10,12)

autoplot(acum.ts)+theme_light()+ ggtitle("SERIE ACUMULADA DESPLAZAMIENTO")

win.graph(6,10,12)

autoplot(acum.ts.a)+theme_light() + ggtitle("SERIE ACUMULADA ACCIONES BELICAS")

library(plotly)

library(plyr)

install.packages("plotly")

# data. ts converted to long matrix:

myData.a <- data.frame(Year = c(floor(time(acum.ts.a) + .01)),

Month = c(cycle(acum.ts.a)),

Value = c(acum.ts.a))

# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:

myData.a$Month <- factor(myData.a$Month)

levels(myData.a$Month) <- month.abb

# plotting reference lines across each facet:

referenceLines.a <- myData.a # \/ Rename

colnames(referenceLines.a)[2] <- "groupVar"

zp.a <- ggplot(myData.a,

aes(x = Year, y = Value))

zp.a <- zp.a + geom_line(data = referenceLines.a, # Plotting the "underlayer"

aes(x = Year, y = Value, group = groupVar),

76

Page 79: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

colour = "GRAY", alpha = 1/2, size = 1/2)

zp.a <- zp.a + geom_line(size = 1) # Drawing the "overlayer"

zp.a <- zp.a + facet_wrap(~ Month)

zp.a <- zp.a + theme_bw()

indiv.a<-read.delim("clipboard",header=T)

indiv.ts.a<-ts(indiv.a,start=c(2007,1),freq=12)

# data. ts converted to long matrix:

myData2.a <- data.frame(Year = c(floor(time(indiv.ts.a) + .01)),

Month = c(cycle(indiv.ts.a)),

Value = c(indiv.ts.a))

# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:

myData2.a$Month <- factor(myData2.a$Month)

levels(myData2.a$Month) <- month.abb

# plotting reference lines across each facet:

referenceLines2.a <- myData2.a # \/ Rename

colnames(referenceLines2.a)[2] <- "groupVar"

zp2.a <- ggplot(myData2.a,

aes(x = Year, y = Value))

zp2.a <- zp2.a + geom_line(data = referenceLines2.a, # Plotting the "underlayer"

aes(x = Year, y = Value, group = groupVar),

colour = "GRAY", alpha = 1/2, size = 1/2)

zp2.a <- zp2.a + geom_line(size = 1) # Drawing the "overlayer"

zp2.a <- zp2.a + facet_wrap(~ Month)

zp2.a <- zp2.a + theme_bw()

zp2.a

#######################################

#######################################

#######################################

#######MODELOS ########################

#######################################

#######################################

#######################################

########## VARIOGRAMA

#######################################

library(gstat)

library(sp)

library(nlme)

win.graph(10,6,10)

plot(variogram(ACC.BELIC~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA ACCIONES BELICAS")

plot(variogram(DESPLAZADOS~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA DESPLAZADOS")

plot(variogram(res.sar~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA RESIDUALES MODELOS SAR")

77

Page 80: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

win.graph(10,6,10)

ggplot(data.frame(acciones.b=colb2@data$ACC.BELIC,

desplaz.t=colb2@data$DESPLAZADOS,munip=colb2@data$HECTARES),

aes(x=acciones.b,y=desplaz.t,col=munip))+ theme(legend.position="top")+

geom_point(aes(size=colb2@data$HECTARES))+theme_light()+

guides(col=FALSE, size = FALSE)+ scale_y_continuous(limits=c(0,150000))+

labs(x="Acciones Belicas", y="Desplazamiento Forzado")

########

## SAR Model (WARNING: This takes a while to run)

########

mod.sar <- lagsarlm(DESPLAZADOS ~ ACC.BELIC, data = colb2,

listw=col.W_cont_el_mat, zero.policy=T, tol.solve=1e-12)

summary(mod.sar)

res.sar <- mod.sar$residuals

res.palette <- colorRampPalette(c("red","orange","white", "lightgreen","green"), space = "rgb")

pal <- res.palette(5)

classes_fx <- classIntervals(res.sar, n=5, style="fixed", fixedBreaks=c(-32800.00,-625.10,-260.90,0.00,16.11,104600.00), rtimes = 1)

cols <- findColours(classes_fx,pal)

win.graph(8,8,10)

par(mar=rep(0,4))

plot(colb2,col=cols, border="grey",pretty=T)

legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),title="Residuals from SAR Model",ncol=5)

dev.off()

## Residual Autocorrelation

moran.test(res.sar, listw=col.W_cont_el_mat, zero.policy=T)

########

## SEM Model (WARNING: This takes a while to run)

########

mod.sem <- errorsarlm(DESPLAZADOS ~ ACC.BELIC, data = colb2,

listw=col.W_cont_el_mat, zero.policy=T, tol.solve=1e-15)

summary(mod.sem)

res.sem <- mod.sem$residuals

78

Page 81: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

classes_fx <- classIntervals(res.sem, n=5, style="fixed", fixedBreaks=c(-.2,-.1,0,.1,.2,.4), rtimes = 1)

cols <- findColours(classes_fx,pal)

win.graph(8,8,10)

par(mar=rep(0,4))

plot(colb2,col=cols, border="grey",pretty=T)

legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),title="Residuals from SEM Model",ncol=5)

dev.off()

## Residual Autocorrelation

moran.test(res.sar, listw=col.W_cont_el_mat, zero.policy=T)

########

## SDM Model (WARNING: This takes a while to run)

########

mod.sdm <- lagsarlm(DESPLAZADOS ~ ACC.BELIC, data = colb2,

listw=col.W_cont_el_mat, zero.policy=T, type="mixed", tol.solve=1e-12)

summary(mod.sdm)

res.sdm <- mod.sdm$residuals

classes_fx <- classIntervals(res.sdm, n=5, style="fixed", fixedBreaks=c(-.2,-.1,0,.1,.2,.4), rtimes = 1)

cols <- findColours(classes_fx,pal)

par(mar=rep(0,4))

plot(colb2,col=cols, border="grey",pretty=T)

legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),title="Residuals from SDM Model",ncol=5)

dev.off()

## Residual Autocorrelation

moran.test(res.sdm, listw=col.W_cont_el_mat, zero.policy=T)

#################################################################

#######################CORRELACION###############################

#################################################################

with(colb2@data, plot(NOMBRE_DPT,DESPLAZADOS))

data.col<-colb2@data

ggplot(data.col, aes(x=NOMBRE_DPT,y=DESPLAZADOS))+geom_boxplot()+

geom_jitter()

win.graph(10,5,12)

ggplot(data.col, aes(x=ACC.BELIC,y=DESPLAZADOS))+ theme_light()+

geom_point(aes(size = HECTARES),shape=1, col = "Orange")+

79

Page 82: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

labs(y="Volumen de Desplazados",size="Areas de los\nMunicipios",

x="Eventos de Conflicto: Acciones Belicas")+

scale_x_continuous(labels = scales::comma)+

scale_y_continuous(labels = scales::comma)

moran.test(colb2$ACC.BELIC, listw=col.W_cont_el_mat, zero.policy=T)

geary.test(colb2$ACC.BELIC, listw=col.W_cont_el_mat, zero.policy=T)

################## EFECTO EQULIBRIO MODELO SAR

names <- attr(col.W_cont_el,"region.id")

W <- matrix(0,nrow=length(names),ncol=length(names))

for(i in 1:length(names)){

W[i,as.vector(col.W_cont_el[[i]])] <- 1

}

I <- matrix(0,nrow=nrow(colb2@data),ncol=nrow(colb2@data))

diag(I) <- 1

X0 <- cbind(colb2@data$ACC.BELIC)

X1 <- cbind(colb2@data$ACC.BELIC)

X1[c(378,827,976)] <- 2*X1[c(378,827,976)] # Medellin, Tumaco, Buenaventura

Xd <- X1-X0

beta.sar <- mod.sar$coefficients

rho.sar <- mod.sar$rho

EE.sar <- solve(I - rho.sar*W)%*%Xd*beta.sar[2]

names(EE.sar) <- colb2@data$NOMBRE_MPI

top.sar <- EE.sar[rev(order(EE.sar))][1:10]

top.sar ## Top ten changes

colb2@data$EEsar <- EE.sar

paletteEEsar <- colorRampPalette(c("white","lightgoldenrodyellow","yellow",

"orange","red"), space = "rgb")

palEEsar <- paletteEEsar(5)

classes_fxEEsar <- classIntervals(colb2@data$EEsar, n=5, style="fixed",

fixedBreaks=c(-113250,0,5000,20000,50000,105000), rtimes = 1)

colsEEsar <- findColours(classes_fxEEsar,palEEsar)

par(mar=rep(0,4))

plot(colb2,col=colsEEsar, border="grey",pretty=T)

legend(x="bottomleft",cex=1,fill=attr(colsEEsar,"palette"),

bty="n",legend=names(attr(colsEEsar, "table")),

title="Equilibrium Effect over Forced Migrations",ncol=1)

paletteAccBel <- colorRampPalette(c("white","lightgoldenrodyellow","yellow",

"orange","red"), space = "rgb")

80

Page 83: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

palAccBel <- paletteAccBel(5)

classes_fxAccBel <- classIntervals(colb2@data$ACC.BELIC, n=5, style="fixed",

fixedBreaks=c(0,10,50,100,200,418), rtimes = 1)

colsAccBel <- findColours(classes_fxAccBel,palAccBel)

par(mar=rep(0,4))

plot(colb2,col=colsAccBel, border="grey",pretty=T)

legend(x="bottomleft",cex=1,fill=attr(colsAccBel,"palette"),

bty="n",legend=names(attr(colsAccBel, "table")),

title="Armed Incursions",ncol=1)

###############################################

###############################################

###############################################

#### MODELOS ESPACIO - TEMPORALES #########

###############################################

###############################################

###############################################

library(readxl)

locac<- read_excel("F:/Dropbox (Personal)/DOCUMENTOS ESTADISTICA/MAESTRIA/C TRABAJO FIN DE MASTER/Datos/eventos/eventosconflicto.xlsx",

sheet = "Hoja6")

str(locac)

locac<-as.data.frame(locac)

locac$ID<-factor(locac$ID)

fenomX<-locac

head(fenomX)

fenomX$ZONA<-factor(fenomX$ZONA)

fenomX$type<-factor(fenomX$type)

str(fenomX)

desplazados2 <- read_excel("F:/Dropbox (Personal)/DOCUMENTOS ESTADISTICA/MAESTRIA/C TRABAJO FIN DE MASTER/Datos/eventos/eventosconflicto.xlsx",

sheet = "Hoja5")

despl2<-as.data.frame(desplazados2)

head(despl2)

row.names(despl2)<-despl2$MPIOS

despl2<-despl2[,-1]

head(despl2)

fenomObs<-as.matrix(t(despl2))

str(fenomObs)

fenomObs[is.na(fenomObs)]<-0

eventosconflicto <- read_excel("F:/Dropbox (Personal)/DOCUMENTOS ESTADISTICA/MAESTRIA/C TRABAJO FIN DE MASTER/Datos/eventos/eventosconflicto.xlsx",

sheet = "acciones")

eventosconflicto

acc2<-as.data.frame(eventosconflicto)

head(acc2)

row.names(acc2)<-acc2$MPIOS

81

Page 84: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

acc2<-acc2[,-1]

head(acc2)

fenomLax<-as.matrix(t(acc2))

str(fenomLax)

library(SpatioTemporal)

library(plotrix)

library(maps)

fenom.data<-createSTdata(obs=fenomObs, covars=fenomX,

SpatioTemporal=list(accx=fenomLax))

str(fenom.data)

win.graph(10,8,12)

layout(matrix(c(1,2,1,3), 2, 2))

par(mar=c(2.3,3.3,2,1), mgp=c(2,1,0))

plot(fenom.data, "loc", main="Occurrence of Observations", xlab="",

ylab="Location", col=c("black", "red"), legend.loc=NULL)

par(mar=c(3.3,3.3,2,1))

qqnorm(fenom.data, line=1)

scatterPlot(fenom.data, covar="AREA", xlab="Area",

ylab="Forced Migrations", pch=19, cex=.25,

smooth.args=list(span=4/5,degree=2))

D<-createDataMatrix(fenom.data)

SVD.cv<-SVDsmoothCV(D, 0:4)

print(SVD.cv)

plot(SVD.cv)

fenom.data <- updateTrend(fenom.data, n.basis=2)

smooth.trend<-calcSmoothTrends(na.omit(fenom.data), n.basis=2, cv=TRUE)

fenom.data.cv <- vector("list", length(smooth.trend$trend.fnc.cv))

win.graph(10,6,10)

for(i in 1:length(fenom.data.cv)){

suppressMessages(fenom.data.cv[[i]] <- updateTrend(fenom.data,

fnc=smooth.trend$trend.fnc.cv[[i]]))

}

plot(fenom.data, main="Possible Temporal Trends",

xlab="", ylab="Forced Migrations", pch=c(19,NA), cex=.25)

for(i in 1:length(fenom.data.cv)){

plot(fenom.data.cv[[i]], add=TRUE, col=i, pch=NA, lty=c(NA,2))

}

par(mar=c(3.3,3.3,1.5,1), mgp=c(2,1,0))

layout(matrix(c(1,1,2,2,3,4), 3, 2, byrow=TRUE))

plot(fenom.data, "obs", ID="76109",

xlab="", ylab="Forced Migrations",

82

Page 85: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

main="Temporal Trend in Buenaventura")

plot(fenom.data, "res", ID="76109",

xlab="", ylab="Forced Migrations",

main="Residuals in Buenaventura")

plot(na.omit(fenom.data), "acf", ID="76109")

plot(fenom.data, "acf", ID="76109")

fenom.data.fnc <- updateTrend(fenom.data, fnc=function(x){

x = x;

return( cbind(x, x, x) )})

par(mfrow=c(2,1), mar=c(2.3,3.3,1.5,1), mgp=c(2,1,0))

for(i in c("76109","76109")){

plot(fenom.data, ID=i, pch=c(19,NA), cex=.25, xlab="",

ylab="NOx (log ppb)", main=paste("AQS site",i))

plot(mesa.data.fnc, ID=i, add=TRUE, col=2, pch=NA)

}

beta.lm <- estimateBetaFields(fenom.data)

par(mfrow=c(1,2), mar=c(3.3,2.3,1.5,1), mgp=c(2,1,0))

plotCI(fenom.data$covars$AREA, beta.lm$beta[,1],

uiw=1.96*beta.lm$beta.sd[,1], ylab="", xlab="Area",

main="Beta-field for f1(t)")

plotCI(fenom.data$covars$AREA, beta.lm$beta[,2],

uiw=1.96*beta.lm$beta.sd[,2], ylab="", xlab="Area",

main="Beta-field for f2(t)")

LUR <- list(~AREA+ZONA,~AREA,~AREA)

cov.beta <- list(covf="exp", nugget=TRUE)

cov.nu <- list(covf="exp", nugget=~type, random.effect=FALSE)

fenom.data$covars$x<-fenom.data$covars$lon+1

fenom.data$covars$y<-fenom.data$covars$lat+1

locations <- list(coords=c("x","y"), long.lat=c("lon","lat"),

others="type")

fenom.model <- createSTmodel(fenom.data, ST="accx",

cov.beta=cov.beta, cov.nu=cov.nu, locations=locations)

model.dim <- loglikeSTdim(fenom.model)

str(model.dim)

x.init <- cbind(c( rep(2, model.dim$nparam.cov-1), 0),

c( rep(c(1,-3), model.dim$m+1), -3, 0))

rownames(x.init) <- loglikeSTnames(fenom.model, all=FALSE)

x.init

est.fenom.model <- estimate(fenom.model, x.init, type="p", hessian.all=TRUE)

# Singular Sistem, no solution

#######

# mod VAR

#######

83

Page 86: Modelamiento de Datos Espaciales y Datos Espacio-Temporales

ls()

indiv

indiv.a<-read.delim("clipboard",header=T,)

names(indiv.a)<-"Acciones.Belicas"

names(indiv)<-"Desplazamiento"

fenom<-data.frame(indiv,indiv.a)

fenom.ts<-ts(fenom,,start=c(2007,1),freq=12)

fenom.ts

library(vars)

VARselect(fenom.ts, lag.max = 5, type="const")

var.2c <- VAR(fenom.ts, p = 1, type = "const");summary(var.2c)

amat <- diag(2)

amat

diag(amat) <- NA

amat[1,2] <- NA

save(list=ls(all=TRUE),file="base1.RData")

## Estimation method scoring

SVAR(x = var.2c, estmethod = "scoring", Amat = amat, Bmat = NULL,

max.iter = 100, maxls = 1000, conv.crit = 1.0e-8)

## Estimation method direct

SVAR(x = var.2c, estmethod = "direct", Amat = amat, Bmat = NULL,

hessian = TRUE, method="BFGS")

84