diplomagis_geoestadistica
DESCRIPTION
Curso Sistemas de Información Geográfica. GeoestadísticaTRANSCRIPT
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
Valencia 27 y 28 de Febrero
Juan Antonio García González Geografiando en las nubes ;-) [email protected]
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
ANTECEDENTES
• La información disponible suele ser escasa y heterogénea
• La recogida y homogeneización de información suele ser costosa y
compleja
• El principio de escepticismo respecto de los datos
• Todo dato cuenta con una estructura y un ruido
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
EL DATO GEOGRÁFICO
• Unidad espacial modificable
• No suele haber muestra sino sólo población
• la contigüidad espacial
• Autocorrelación espacial
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
AUTOCORRELACIÓN ESPACIAL
“todas las cosas se relacionan entre sí, pero las cosas más próximas se relacionan mucho más que las cosas que están alejadas”. Tobler
Los hechos geográficos con unos valores temáticos y localizados en
unas determinadas coordenadas están relacionados entre sí. Las
cosas que están cerca tienden a ser semejantes. A medida que nos
alejamos tienden a diferenciarse. Las cosas más próximas se
relacionan mucho más que las que están más alejadas.
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
EL DATO GEOGRÁFICO
• Componente temática
• Componente espacial
• Componente temporal
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
GEOESTADÍSTICA
La Geoestadística o “arte de modelizar datos espaciales”
(Silbato, W y Yudego, C. 2004:13)
“Conjunto de operaciones, técnicas y herramientas que permiten
analizar y predecir valores de una variable distribuida en el espacio
de una forma continuada. A veces también se denomina estadística
espacial” (Moral, F.J. 2003:17).
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
Los análisis geoestadísticos cuentan con varias etapas:
• Estadística descriptiva
• Análisis exploratorio de datos
• Análisis estructural
• Estadística inferencial
• Predicciones
El análisis de los datos se puede llevar de múltiples formas siendo la estadística y la gráfica las más habituales
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
Tipología de las variables en función de su medida • Escala nominal: Cada valor se ubica en categorías no numéricas y
mutuamente excluyentes. En este caso las variables pueden ser dicotómicas (sexo) o politómicas (colores)
• Escala ordinal: Los valores cuentan con un orden establecido siguiendo una gradación (dureza de las rocas, nivel de estudios)
• Escala de intervalo: En este caso, en la variable sabemos la distancia que separa un valor de otro (temperatura)
• Escala de razón o proporción: Parecida a la escala de intervalo permite contar con un cero absoluto (Cantidad de población)
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
CONCEPTOS
Universo: Conjunto de individuos considerados en un estudio
Entidades: Cada uno de los individuos del universo
Población: Conjunto de individuos que adoptan una característica determinada
Muestra: Subconjunto de población
Parámetro: Propiedad descriptiva de la población
Estadístico: Propiedad descriptiva de la muestra
Carácter: Cualidad o propiedad de las unidades estadísticas
Variable: Valor que adopta un carácter en diferentes situaciones
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
• Análisis monovariable
• Análisis de la distribución • Medidas de tendencia central • Medidas de dispersión
• Análisis bivariado
• Diagrama de dispersión • La correlación • La regresión
• Análisis Multivariante
• ACP Análisis de componentes principales • Cluster • Análisis factorial
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
• Análisis monovariable
• Análisis de la distribución
• Medidas de tendencia central
• Medidas de dispersión
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
ANÁLISIS DE LA DISTRIBUCIÓN
• Frecuencia absoluta: número de veces que se repite cada valor en la variable.
• Frecuencia relativa. frecuencia absoluta dividida por el número de
observaciones.
• Frecuencia absoluta acumulada: número de observaciones que existen igual
al valor considerado o inferiores a él.
• Frecuencia relativa acumulada: cociente entre la frecuencia absoluta
acumulada con el total de observaciones.
• Porcentaje: frecuencia relativa multiplicada por cien.
• Porcentaje acumulado: frecuencia relativa acumulada multiplicada por cien.
• Curva de Lorenz:
TOTAL NACIONAL
ANDALUCÍA
ARAGÓN 1344509 670316 674193
ASTURIAS, PRINCIPADO DE
BALEARS, ILLES
CANARIAS
CANTABRIA
CASTILLA Y LEÓN
CASTILLA-LA MANCHA
CATALUÑA
COMUNITAT VALENCIANA
EXTREMADURA
GALICIA
MADRID, COMUNIDAD DE
MURCIA, REGIÓN DE
NAVARRA, COMUNIDAD FORAL DE
PAÍS VASCO
RIOJA, LA
Ceuta
Melilla 81323 42067 39256
Fuente:Instituto Nacional de Estadística
Copyright INE 2014
Paseo de la Castellana, 183 - 28071 - Madrid - España Teléfono: (+34) 91 583 91 00 - Contacta:
321173 160500 160673
83517 42765 40752
640129 319276 320854
2185393 1066953 1118440
6421874 3097070 3324804
1462128 737706 724422
1104499 549567 554932
2772928 1341269 1431658
7519843 3717804 3802039
5009931 2488380 2521551
2540188 1259641 1280546
2106331 1062925 1043406
2082655 1039574 1043080
592542 290214 302328
1075183 516031 559152
1100503 552756 547747
46815916 23104303 23711613
8371270 4149489 4221781
Censos de Población y Viviendas 2011. Resultados Nacionales, por
Cifras de Población del Censo 2011
Población según comunidad autónoma y sexo
Unidades:personas
Ambos sexosHombres Mujeres
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
CURVA DE LORENZ
• Se pasan los valores absolutos a porcentuales
• Se ordenan en sentido creciente
• Se suman los porcentajes de forma acumulada
• Se representan los datos en un gráfico de abscisas y ordenadas a
través de una línea
CURVA DE LORENZ %
Melilla 0,17
Ceuta 0,35
RIOJA, LA 1,04
CANTABRIA 2,3
NAVARRA, COMUNIDAD FORAL DE 3,67
ASTURIAS, PRINCIPADO DE 5,97
BALEARS, ILLES 8,32
EXTREMADURA 10,7
ARAGÓN 13,5
MURCIA, REGIÓN DE 16,7
CANARIAS 21,1
CASTILLA-LA MANCHA 25,6
PAÍS VASCO 30,3
CASTILLA Y LEÓN 35,7
GALICIA 41,6
COMUNITAT VALENCIANA 52,3
MADRID, COMUNIDAD DE 66,1
CATALUÑA 82,1
ANDALUCÍA 100
0
1000000
2000000
3000000
4000000
5000000
6000000
7000000
8000000
9000000
POBLACIÓN TOTAL 2011
pob11
Melilla Ceuta
RIOJA, LA
CANTABRIA
NAVARRA, COMUNIDAD
FORAL DE
ASTURIAS, PRINCIPADO
DE
BALEARS, ILLES
EXTREMADURA
ARAGÓN
MURCIA, REGIÓN DE
CANARIAS
CASTILLA-LA MANCHA
PAÍS VASCO
CASTILLA Y LEÓN
GALICIA
COMUNITAT VALENCIANA
MADRID, COMUNIDAD DE
CATALUÑA
ANDALUCÍA
Población total, 2011
0
10
20
30
40
50
60
70
80
90
100
CURVA DE LORENZ
CURVA DE LORENZ
Población 2011 por comunidades autónomas
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
MEDIDAS DE TENDENCIA CENTRAL
• Moda
• Mediana
• Media
• Media ponderada
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
MODA
• valor que más se repite en una serie de números
• Es el valor más común. Aplicable a todo tipo de variables
• Se trata de una medida fácil de identificar, aplicable a cualquier
tipo de variable
• En el histograma se ubica en la sección más elevada del gráfico
• =MODA(rango)
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
MEDIANA
• Punto medio de un conjunto de datos
• Su resultado no depende de los valores de la variables, sino del
orden de los mismos por ello no es indicado para variables
nominales
• Al ordenar los valores crecientes la mediana es aquel que se
encuentra en la mitad habiendo un mismo número de valores
• =MEDIANA(Rango)
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
MEDIA
• Se calcula sumando los valores del conjunto de datos y
dividiéndolo por el número de casos
• Esta media se puede ponderar en base a algún valor
• =PROMEDIO(Rango)
MORAL, F.J. (2003)
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
MEDIDAS DE DISPERSIÓN
• Cuantiles
• Desviación intercuartílica
• Coeficiente de asimetría de Pearson
• Varianza
• Desviación típica
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
CUANTILES
Cuartil: se trata de tres particiones que dividen el conjunto de
valores en cuatro partes iguales
=CUARTIL.INC(rango;1); =CUARTIL.INC(J$2:J$20;2);…
Deciles: nueve particiones que dividen el conjunto de valores en
diez partes iguales
Percentil: noventa y nueve particiones que dividen el conjunto de
valores en cien partes iguales. El percentil 50 coincide con el
segundo cuartil y con el Decil 5.
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
DESVIACIÓN INTERCUARTÍLICA
DI= Q3-Q1 Diferencia entre los cuartiles tercero y primero. La diferencia intercuartílica muestra el 50% de los datos. Caso de que los datos estén por encima de la mediana o por debajo de dicha medida marcaran la tendencia de asimetría de los datos.
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
COEFICIENTE DE ASIMETRÍA DE PEARSON
Coef. Asimetría 𝑀𝑒𝑑𝑖𝑎−𝑚𝑜𝑑𝑎
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎:
Sus valores oscilan entre +1 y -1
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
VARIANZA
Media cuadrática de las desviaciones de los valores con respecto a la media aritmética de los mismos. Se eleva al cuadrado para anular las desviaciones de signo positivo y las de signo negativo; aquellas que están por encima y por debajo de la media. =VAR(rango)
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
DESVIACIÓN TÍPICA
Raíz cuadrática de la varianza Se puede definir como la raíz cuadrada del promedio de los cuadrados de las desviaciones =DESVEST.P(Rango)
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
• Análisis bivariado
• Diagrama de dispersión
• La correlación
• La regresión
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
DIAGRAMA DE DISPERSIÓN
Gráfico en donde se representa una variable en el
gráfico de las abscisas y el de la otra en el de las
ordenadas. Muestran tanto las posibles relaciones entre
las dos variables así como la presencia de datos
erróneos. El resultado es una nube de puntos en donde
se pueden dar varias situaciones tipo
0
1000000
2000000
3000000
4000000
5000000
6000000
7000000
0 2000000 4000000 6000000 8000000 10000000
0
2000000
4000000
6000000
8000000
10000000
12000000
14000000
0 1000000 2000000 3000000 4000000
DIAGRAMA DE DISPERSIÓN
Gráfico de Dispersión entre la población por comunidades autónomas de 2011 y la de 1981
Gráfico de Dispersión entre la población por comunidades autónomas de 2011 y pernoctación acampada 2011
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
CORRELACIÓN
La correlación permite medir la dirección y la fuerza de
la relación de dos o más variables. Existen varias formas
de medir la correlación entre variables, algunas de
forma gráfica e incluso por interpretación visual a través
de la comparación de mapas
DESARROLLA
Determina el coeficiente de correlación de Pearson (r) entre las variables:
- nº centros comerciales 2011
- Superficie Centros comerciales 2011
- Población 2011
- Población 1981
- Pernoctaciones en campamento
nº centros comerciales 2011- Superficie Centros comerciales 2011 0,99
nº centros comerciales 2011- Población 2011 0,90
nº centros comerciales 2011-pob81 0,87
Población 2011- Población 1981 0,99
Población 2011 Pernoctaciones en campamento 0,38
0
2000000
4000000
6000000
8000000
10000000
12000000
14000000
ANDALUCÍA
ARAGÓN
ASTURIAS, PRINCIPADODE
BALEARS, ILLES
CANARIAS
CANTABRIA
CASTILLA Y LEÓN
CASTILLA-LA MANCHA
CATALUÑACOMUNITATVALENCIANA
EXTREMADURA
GALICIA
MADRID, COMUNIDADDE
MURCIA, REGIÓN DE
NAVARRA, COMUNIDADFORAL DE
PAÍS VASCO
RIOJA, LA
Ceuta
Melilla
Población 1981
Pernoctaciones en campamento
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
REGRESIÓN
Una correlación positiva no implica una relación causal
entre ambas. El análisis de la regresión implica una
dependencia de una variable respecto a la otra. En
ocasiones la regresión puede ser lineal, al representarlo
en un gráfico los puntos se distribuyen en torno a una
línea recta. En otras ocasiones el ajuste pudiera ser
exponencial, logarítmico o polinómico
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
Módulo Geostatisctical Analyst Análisis descriptivo de las variables espaciales Herramienta muy visual Complementaria de la estadística lineal Contigüidad espacial
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
SIMBOLIZACIÓN DE UNA CAPA
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
ANÁLISIS GEOESTADÍSTICO DE INFORMACIÓN ESPACIAL
Modulo Geostatistical Analyst
• Histograma
• Normal qs plot
• Trend Analyst
• General qqplot
• Semivariograma/covariance
• Crossvariance cloud
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
HISTOGRAMA
• Muy similar al que pudiéramos realizar en una hoja de
cálculo
• Permite de una forma interactiva decidir el número de
intervalos o barras de representación
• Calcula los estadísticos
• Interactividad
• Exportable como objeto Ole
Interactividad del histograma con el mapa
Data 10
Frequency 10
0,08 0,91 1,74 2,57 3,4 4,23 5,06 5,88 6,71 7,54 8,370
0,22
0,44
0,66
0,88
1,1
CountMinMaxMeanStd. Dev.
: 20 : 81323 : 8371300 : 2396000 : 2465200
SkewnessKurtosis1-st QuartileMedian3-rd Quartile
: 1,3524 : 3,5741 : 857660 : 1403300 : 2656600
HistogramTransformation: None
Data Source: centroscomerciales_CCAA Attribute: pob11
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
NORMAL QS PLOT Gráfico que compara los datos a una distribución normal Interactividad Layout
Standard Normal Value
Data's Quantile 10
-1,96 -1,57 -1,18 -0,78 -0,39 0 0,39 0,78 1,18 1,57 1,960,08
1,74
3,4
5,06
6,71
8,37
Normal QQPlotTransformation: None
Data Source: centroscomerciales_CCAA Attribute: pob11
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
TREND ANALYST Nos permite identificar la presencia o ausencia de la tendencia de un conjunto de datos Disposición de los valores en un gráfico tridimensional Ajustar a una línea la tendencia Interactivo, intuitivo, exportable, visual
XX
YY
Trend Analysis
Data Source: centroscomerciales_CCAA Attribute: pob11
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
GENERAL QQPLOT
Data Source #1 Quantile 10
Data Source #2 Quantile 10
0,08 0,91 1,74 2,57 3,4 4,23 5,06 5,88 6,71 7,54 8,370,05
1,33
2,61
3,89
5,16
6,44
General QQPlot
Data Source #1 Layer: centroscomerciales_CCAA Attribute: pob11Data Source #2 Layer: centroscomerciales_CCAA Attribute: pob81
Data Source #1 Quantile 10
Data Source #2 Quantile 10
0,08 0,91 1,74 2,57 3,4 4,23 5,06 5,88 6,71 7,54 8,370
0,27
0,53
0,8
1,07
1,33
General QQPlot
Data Source #1 Layer: centroscomerciales_CCAA Attribute: pob11Data Source #2 Layer: centroscomerciales_CCAA Attribute: Per_campa
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
SEMIVARIOGRAMA/COVARIANCE Gráfico de dispersión que tiene en cuenta la distancia h Cada punto en el semivariograma representa un par de lugares Muy útil para hacer estimación Krigging El incremento del variograma con la distancia indica como varia la influencia de la muestra
Distance, h 10
g 10
0 0,23 0,46 0,7 0,93 1,16 1,39 1,63 1,86
0,57
1,15
1,72
2,29
2,86
1,0711,0711,0711,0711,0711,0711,0711,0711,071 10 10 10 10 10 10 10 10 10
9,0949,0949,0949,0949,0949,0949,0949,0949,094 10 10 10 10 10 10 10 10 10
2,5432,5432,5432,5432,5432,5432,5432,5432,543 10 10 10 10 10 10 10 10 10
4,1774,1774,1774,1774,1774,1774,1774,1774,177 10 10 10 10 10 10 10 10 10
5,815,815,815,815,815,815,815,815,81 10 10 10 10 10 10 10 10 10
7,4447,4447,4447,4447,4447,4447,4447,4447,444 10 10 10 10 10 10 10 10 10
9,0789,0789,0789,0789,0789,0789,0789,0789,078 10 10 10 10 10 10 10 10 10
Semivariogram/Covariance Cloud
Data Source: centroscomerciales_CCAA Attribute: pob11
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
CROSSVARIANCE CLOUD Herramienta predictiva Análisis bivariado de la correlación espacial Interactivo, intuitivo, exportable, visual
Distance, h 10
g 10
0 0,23 0,46 0,7 0,93 1,16 1,39 1,63 1,86-1,35
1,35
1,81,81,81,81,81,81,81,81,8 10 10 10 10 10 10 10 10 10
-1,036-1,036-1,036-1,036-1,036-1,036-1,036-1,036-1,036 10 10 10 10 10 10 10 10 10
-5,632-5,632-5,632-5,632-5,632-5,632-5,632-5,632-5,632 10 10 10 10 10 10 10 10 10
-9,059-9,059-9,059-9,059-9,059-9,059-9,059-9,059-9,059 10 10 10 10 10 10 10 10 10
3,823,823,823,823,823,823,823,823,82 10 10 10 10 10 10 10 10 10
8,5468,5468,5468,5468,5468,5468,5468,5468,546 10 10 10 10 10 10 10 10 10
1,3271,3271,3271,3271,3271,3271,3271,3271,327 10 10 10 10 10 10 10 10 10
Crosscovariance Cloud
Data Source #1 Layer: centroscomerciales_CCAA Attribute: pob11Data Source #2 Layer: centroscomerciales_CCAA Attribute: pob81
Distance, h 10
g 10
0 0,23 0,46 0,7 0,93 1,16 1,39 1,63 1,86-3,52
3,52
Crosscovariance Cloud
Data Source #1 Layer: centroscomerciales_CCAA Attribute: pob11Data Source #2 Layer: centroscomerciales_CCAA Attribute: Per_campa
Diploma de GIS aplicado al uso del profesional del Territorio
GEOESTADÍSTICA
BIBLIOGRAFÍA GENERAL
AGUILERA, M.J.; AZCÁRATE, M.V.; GONZÁLEZ, M.P.; RUBIO, M.T. Y SANTOS, J.M. (2003) Fuentes, tratamiento y representación de la información geográfica. UNED 421 p
BARREDO, J.I. (1996). Sistemas de información geográfica y evaluación multicriterio en la ordenación del territorio. Ed. RA-MA. Pp 264.
ESTEBANEZ, J. Y BRADSHAW, R.P. (1980) Técnicas de cuantificación en geografía. Ed Tebar Flores 512P.
MORAL, F.J. (2003). La representación gráfica de las variables regionalizadas. Geoestadística lineal. Universidad de Extremadura Pp. 157.
GAMIR, A., RUIZ, M Y SEGUI, J.M. (1995). Prácticas de análisis espacial. Ed Oikos-tau Pp.383.
HAMMOND, R. Y MCCULLAGH, P. (1980) Técnicas cuantitativas en Geografía. Ed. Saltes. Pp. 366
FERNÁNDAZ, C. Y FUENTES, F. (1995). Curso de estadística descriptiva. Teoría y práctica. Ariel economía. Pp. 523
Gracias por la atención, puedes seguirnos en
“Geografiando en las nubes ;-)”
http://www.facebook.com/juanantonio.garciagonzalez.37
@JGARCIAGONZALEZ
http://geografiandoenlasnubes.blogspot.com.es/
http://www.linkedin.com/profile/view?id=139061635&trk=tab_pro
http://es.slideshare.net/JuanAntonioGarciaGonzlez
http://pinterest.com/geografiando/boards/
https://plus.google.com/u/0/105941284089211583758/posts
http://www.youtube.com/user/garciotum1?feature=mhee
http://www.scoop.it/u/dr-juan-antonio-garcia-
gonzalez