análisis exploratorio de datos econometria

6
Análisis exploratorio de datos El objetivo del presenta trabajo es realizar un análisis exploratorio de datos espaciales (AEDE) aplicado al caso chileno, para ello se emplean los salarios pertenecientes a la Casen año 2011, en términos de georreferenciación el mapa corresponde a la distribución administrativa del censo del año 2002. Los resultados indican una marcada concentración de altos salarios en la región Metropolitana puntualmente en comunas del sector oriente de la capital, a su vez concentrando las escolaridades promedio comunales más elevadas del país (en años de educación), por otro lado se encuentran concentrados bajos salarios y escolaridades para comunas pertenecientes a la novena región. Descripción de los datos La base de datos empleada el análisis exploratorio pertenece a la Casen año 2011 georeferenciada en el mapa de Chile según censo año 2002. Para alcanzar representatividad a nivel comunal las observaciones fueron ponderadas de acuerdo a su factor de expansión por comuna. Las variables de interés para el análisis corresponden al salario promedio por comunas, su variación porcentual a través de logaritmo natural, la escolaridad promedio y las proporciones correspondientes a proporciones de altas y bajas escolaridades por comunas. Se incluyen además las proporciones promedio comunales de los sectores económicos.

Upload: mauricio-oyarzo

Post on 17-Jan-2016

216 views

Category:

Documents


0 download

DESCRIPTION

Spatial Econometrics

TRANSCRIPT

Page 1: Análisis Exploratorio de Datos Econometria

Análisis exploratorio de datos

El objetivo del presenta trabajo es realizar un análisis exploratorio de datos espaciales

(AEDE) aplicado al caso chileno, para ello se emplean los salarios pertenecientes a la

Casen año 2011, en términos de georreferenciación el mapa corresponde a la

distribución administrativa del censo del año 2002. Los resultados indican una marcada

concentración de altos salarios en la región Metropolitana puntualmente en comunas del

sector oriente de la capital, a su vez concentrando las escolaridades promedio

comunales más elevadas del país (en años de educación), por otro lado se encuentran

concentrados bajos salarios y escolaridades para comunas pertenecientes a la novena

región.

Descripción de los datos

La base de datos empleada el análisis exploratorio pertenece a la Casen año 2011

georeferenciada en el mapa de Chile según censo año 2002. Para alcanzar

representatividad a nivel comunal las observaciones fueron ponderadas de acuerdo a su

factor de expansión por comuna. Las variables de interés para el análisis corresponden

al salario promedio por comunas, su variación porcentual a través de logaritmo natural,

la escolaridad promedio y las proporciones correspondientes a proporciones de altas y

bajas escolaridades por comunas. Se incluyen además las proporciones promedio

comunales de los sectores económicos.

Cabe destacar que la base de datos de la encuesta Casen contiene 324 comunas no

obstante prevalecieron para el análisis espacial 322 comunas debido a la división

político administrativa de Chile para el año 2002.

Análisis exploratorio de datos espaciales (AEDE)

Para llevar a cabo el AEDE se encuentran presentes en la literatura diversas formas

gráficas de poder representan la distribución espacial de variables de interés y como

señala Chasco (2002) existen hoy en día múltiples opciones gráficas, sin embargo se

señala según Haining et al. (2000) la escasez de estudios que avalen la efectividad y

utilidad de llevar a cabo un AEDE.

Page 2: Análisis Exploratorio de Datos Econometria

El objetivo del análisis será visualizar la distribución espacial de los salarios en Chile y

fenómenos específicos de asociación espacial (global y local), con ello poder identificar

cuáles son las comunas en Chile que concentran los mayores salarios. Adicionalmente

se incluyen variables de interés como son la escolaridad promedio, proporciones de alta

y baja escolaridad y finalmente la proporción de participación por sectores económicos

a nivel de comunas.

Distribución espacial de los salarios

Se comenzará analizando el salario de acuerdo al diagrama de cajas1 (boxplott) con el

ánimo de poder visualizar la existencia de puntos atípicos “outliers” en los datos

espaciales.

Figura 1. Diagrama de caja de la variable salario promedio por comuna

Fuente: Elaboración propia

en base a las salidas de GeoDa.

De acuerdo a la figura existen valores atípicos que sobrepasan y están por debajo de las

cotas, dichos valores son representados en el mapa correspondiendo a comunas en 1 “La construcción del diagrama y mapa de caja parte del cálculo de los cuartiles y la media de una variable, así como de la obtención de las llamadas cotas o valores adyacentes superior e inferior, que se obtienen, a su vez, como el producto de los valores del tercer (primer) cuartil por 1,5 veces el recorrido intercuartílico” Chasco (2002).

Page 3: Análisis Exploratorio de Datos Econometria

sector norte, centro y sur, presumiblemente existen salarios promedio que se alejan en

mayor proporción a la media, por otro lado existen observaciones con valor cero

haciendo necesario excluirlas del análisis2.

Fenómeno de dependencia espacial

Un elemento clave en el AEDE es como entender el espacio y la contigüidad entre las

conunas de Chile, pues dada su accidentada geografía se torna complejo decidir si se va

a entender esta relación de forma binaria través de una matriz de retardos espaciales a

la queen o a la rook de acuerdo si comparten una frontera en común de longitud no nula,

o en su defecto emplear distancias euclideanas mediante la fijación de centroides por

comuna. Cada procedimiento no está excento de problemas desde el punto de vista

metodológico . Sin embargo es recomendable observar como se comporta la

dependencia espacial de acuerdo alcontraste de autocorrelación espacial I de

Moran bajo diversas nociones de espacio y orden de contigüidad.

Al analizar los graficos de Moran global de acuerdo al salario promedio comunal bajo

primer, segundo y tercer orden y sumado a ello al realizar las permutaciones

correspondientes se encuentra significancia bajo dicha prueba, por tanto se verifica loa

existencia de autocorrelacion espacial. Se decide finalmente trabaja con una matriz

queen de orden 2.

2 Pertenecen a las comunas de Tortel, San Gregorio y Torres del Paine, para efectos prácticos no se tomarán en cuenta dichas observaciones.

Page 4: Análisis Exploratorio de Datos Econometria

Para definir el criterio de contigüidad y el tratamiento del espacio en el análisis

exploratorio se considerarán las formulaciones de acuerdo a

Mapas

Cuales son

Donde están los de alto ingreso y de bajo ingreso

Análisis exploratorio espacial de datos