final informe 2 geoestadistica
TRANSCRIPT
Informe: Proyecto N°2 Análisis Geoestadístico de Datos
Integrantes: Eduardo Retamales
Javier Rosas
Fabián Cárdenas
Profesor: Xavier Emery
Curso: MI4040
Fecha de entrega: 4 de julio 2013
0
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Abstract
The following report presents aexploratory analysis and a variografics analysis of data from a
Database of cupper law ,where thas laws of soluble copper (CuS) and total copper ( CuT) was obtained from drilling of exploration.
This report provides a comprehensive analysisof a statistical nature, in order to find
Trends and relation ships between different types of data. This is to estimate the law of CuS and CuT blocks.
As main objective, were calculated the resources of CuS and CuT.
Was usedas an essential tool the computer program"ISATIS", whichwasimported the data of the project 1 "Datos.xls". Exploratory and variografics analysis was performed of the data, continuing
with the cross-validation.It was createda grid of blocks with the purpose of estimating local laws of CuS and CuT.
Finally ,were calculated resources in tonnage, average grades and quantities.
1
MI4040 – Análisis Estadístico y Geoestadístico de Datos
ContenidoAbstract........................................................................................................................................1
Introducción.................................................................................................................................3
Análisis Exploratorio de Datos......................................................................................................4
Cobre soluble...........................................................................................................................4
Cobre Total...............................................................................................................................5
Desagrupamiento.....................................................................................................................6
Otras herramientas geoestadísticas.........................................................................................7
Mapas Variográficos.................................................................................................................9
Variograma experimental CuT................................................................................................11
Variograma modelo de CuT....................................................................................................12
Variograma experimental CuS...............................................................................................14
Variograma modelado Cobre soluble.....................................................................................14
Validación por Jack-Knife...........................................................................................................17
Creación de Grilla.......................................................................................................................23
Preparación a la creación de Grillas.......................................................................................23
Creación y ajuste de la grilla...................................................................................................25
Definición de la grilla completa..................................................................................25
Estableciendo una zona de selección.........................................................................26
Estimación por Krigging..............................................................................................................29
Estimaciones de Leyes de cobre para bloques.......................................................................29
Estimación para Cobre Soluble...........................................................................................30
Estimación para Cobre Total..............................................................................................31
Conclusiones..............................................................................................................................34
Bibliografía.................................................................................................................................35
2
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Introducción
El presente informe tiene como objetivo calcular los recursos in situ y los recursos
recuperables de cobre total (CuT) y cobre soluble (CuS) mineral que están disponibles, lo cual
se obtiene a través de información de sondajes de exploración, esto en el contexto del
Proyecto N°2 del curso Análisis Estadístico y Geoestadístico de datos.
Para aquello se hará un análisis geoestadístico completo de una base de datos con
información sobre ley de cobre total y cobre soluble y sus respectivas coordenadas geográficas
y cota. Dicha base de datos cuenta con 1546 muestras.
El análisis se inicia con el proceso de importación de datos desde el archivo “Datos.xls”
al software “Isatis”; posteriormente se realiza un estudio exploratorio de datos que permite
identificar la existencia de errores, anomalías e información redundante en la muestra. Se
eliminarán las muestras erróneas de manera que se trabajará sobre una base de datos más
confiable.
Luego se procede a realizar el análisis variográfico para cada variable, e identificar las
direcciones de máxima variación, para luego ajustar un modelo variográfico necesario para el
kriging.
Antes de realizar el kriging es necesario hacer la validación cruzada para verificar tanto
el modelo variográfico como para la vecindad de búsqueda. Además se debe definir la
correspondiente grilla y el tamaño de la discretización de bloques.
Una vez hecho el kriging, se presentan los datos obtenidos para cada variable a través
de histogramas de estimación y varianza, y del mapa a escala de colores que representan la
distribución espacial de las variables y su varianza.
Finalmente se calculan los recursos disponibles a través de la curva de “Tonelaje-Ley”,
y en especial para una ley de corte del Cu de 0,35%.
3
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Análisis Exploratorio de Datos
Se realizará un análisis a grandes rangos utilizando el programa Isatis. Se utilizó la base de datos de Excel pretratada en el Informe 1, sin los outliers ni duplicados detectados en dicho estudio. Sólo se analizan los datos de Sondajes, a menos que se explicite lo contrario.
Cobre soluble
En primer lugar, se elaboró el mapa de los datos (figura 1-A):
Se observa en la figura 1 un outlier (valor de 3.58 en rojo) que no se excluyó en el estudio estadístico del Informe 1. Al excluir este valor del estudio geoestadístico del presente informe, se obtuvo el mapa de la figura 3.
4
MI4040 – Análisis Estadístico y Geoestadístico de Datos
En segundo lugar se calcularon los estadísticos globales de los datos y se generó un histograma.
Cobre Total
A continuación se elaboraron el mapa de datos sin el outlier detectado (en el mismo punto en que se excluyó el valor de CuS - fig. 5) y el histograma (fig. 4). Se puede observar que se tomaron mediciones de CuT y CuS en los mismos puntos, lo cual en general es conveniente para los estudios geoestadísticos. Esta observación se ratifica al revisar las coordenadas en el archivo Excel.
5
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Desagrupamiento
A continuación se muestran los cambios en los estadísticos principales de las muestras de CuS y CuT al realizar un desagrupamiento por el método de las celdas, con celdas de 100[m] X 100[m] X 10[m], pues 100 m se consideró el espaciamiento promedio de datos en ambos ejes del mapa, y 10 [m] cubren el rango de cotas (alturas) que se tiene. Se observa un gran efecto sobre los estadísticos, debido a los tres claros clusters que se observan en los mapas.
Tabla 1. Estadísticos principales para el CuS, antes (raw) y después (weighted) del desagrupamiento.
Tabla 2.Estadísticos principales para el CuT, antes (raw) y después (weighted) del desagrupamiento.
6
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Otras herramientas geoestadísticas
Gráfico Cuantil contra Cuantil entre ambas variables: se observa en la figura 6 que ambas variables tienen distribuciones de formas similares (se tiene casi una recta), y además que tienen dispersiones similares (recta es cercana a una paralela de la diagonal), lo que concuerda con los valores de las desviaciones estándar, de 0.33 (CuT) y 0.29 (CuS). Sin embargo, la diferencia entre medias hace que la "recta" obtenida sea lejana a la diagonal.
Nube de dispersión o correlación: se observa en la figura 7 que hay una altísima correlación entre ambas variables, dándose que en los sectores de mayor ley de CuT hay mayor ley de CuS, lo cual hace sentido.
7
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Nubes de dispersión diferida: la forma de las figuras 8A y 8B se debe a la alta dispersión (medible en la razón entre la desviación estándar y la media). Para los cálculos se utilizó un paso de 100 [m] con tolerancias de 20 [m] y de 90°.
Para finalizar el análisis exploratorio de datos, se realiza un estudio de cuantil
contra cuantil, para comparar las distribuciones de los datos, en las siguientes
ilustraciones se detallan los resultados.
8
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Mapas Variográficos
Esta herramienta consiste en calcular y visualizar el variograma experimental en
todas las direcciones del espacio, bajo la forma de un mapa de color. De este modo, se
puede distinguir si existe anisotropía y calcular el variograma a lo largo de las
direcciones principales de la anisotropía.
en primer lugar se elaboró el mapa variográfico del CuT, utilizando los parámetros indicados en la tabla 3. Se debió reajustar la escala de colores respecto de la utilizada en los mapas de datos, para poder visualizar con claridad el mapa variográfico.
Tabla 3. Parámetros utilizados para la elaboración de los mapas variográficos de CuT y CuS.
Plano de referencia
N° Direcciones
N° Pasos Largo Paso
Tolerancia en distancia
Tolerancia en dirección
Mínimo de pares
Sin rotación
18 12 50 [m] 1 [paso] 1 [sector] 1
CuT
9
MI4040 – Análisis Estadístico y Geoestadístico de Datos
CuS
En las figuras se observa que existen dos direcciones preferenciales de anisotropía: N40°E y N130°E, que son perpendiculares y por tanto serán las utilizadas para la elaboración de los variogramas direccionales.
10
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Variograma experimental CuT
Tabla 4. Parámetros utilizados para la elaboración de los variogramas de CuT y CuS. *Véase figura 10.
Ancho de banda
Altura de banda
Tolerancia en ángulo
Paso* N° Pasos* Tolerancia en distancia
170 [m] 10 [m] 10 ° 75 [m] 8 0.5 pasos
Figura 10. A la izquierda se muestra el variograma de CuT con un paso de 50 [m]. A la derecha, con un paso de 75 [m]; este último fue el variograma elegido para elaborar el variograma
modelado, dado que es más suave, haciendo más fácil la evaluación y ajuste visual de dicho modelo.
11
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Variograma modelo de CuT
a continuación se explica el desarrollo del modelo en base a observaciones del variograma experimental.
Hay un efecto pepita de aproximadamente 0.039 (ajustado automáticamente). A pesar de la elección cuidadosa del paso, hay una alta variabilidad que dificulta la
determinación de las mesetas; por tanto se utilizó el ajuste automático de mesetas. Para las dos direcciones se utilizaron modelos esféricos, dado su comportamiento
lineal cerca del origen. Para el variograma N40°E el alcance usado fue de 100 [m] en una dirección y de 150
[m] en la otra, y la meseta fue de 0.069. Para el variograma N130°E el alcance usado fue de infinito en una dirección (para no
modificar el modelo de N40°E) y 150 [m] en la otra, y la meseta de 0.006. El variograma experimental hacen pensar que podría existir un efecto de hoyo, sin
embargo no se incorporó en el modelo, pues se consideró que lo más importante es ajustarse al sector de distancias h bajas pues éste es el sector de mayor confiabilidad del variograma.
Se realizó una validación cruzada de este modelo, con kriging ordinario (por defecto). Se consideró un umbral de errores estandarizados de 2.5 (los datos son considerados "mal estimados", y marcados con un círculo relleno en la figura 12, cuando el error estandarizado está fuera del intervalo [-2.5, 2.5]). Además, se utilizó para estimar una vecindad móvil en forma de elipse de radio mayor 200 [m] en la dirección N40°E y radio menor 125 [m] (y radio de altura 10 [m]).
12
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Los resultados obtenidos en la validación se enumeran a continuación:
Los valores de la media y varianza del error son cercanos a cero, es decir, son aceptables. La varianza del error estandarizado es relativamente cercana a 1, sin embargo sería deseable que fuese mayor (véanse valores en tabla 5).
Los datos "mal estimados" fueron 24, que corresponden a un 2% del total de 1190 datos.
Relacionado a lo anterior, la figura 12-B muestra que a pesar que hay una cierta dispersión, la mayoría de los valores son cercanos a la diagonal, es decir, están bien estimados.
Todo lo anterior valida el modelo, es decir, lo hace digno de ser utilizado en el kriging.
Tabla 5. Estadísticos relacionados a la validación cruzada del modelo variográfico desarrollado para el CuT.
13
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Variograma experimental CuS
Se utilizaron los mismos parámetros que para el variograma CuT.
Variograma modelado Cobre soluble
Nuevamente se utilizó el ajuste automático de mesetas. Hay un efecto pepita de aproximadamente 0.042 . Para las dos direcciones se utilizaron modelos esféricos, dado su comportamiento
lineal cerca del origen. Para el variograma N40°E el alcance usado fue de 100 [m] en una dirección y de 150
[m] en la otra, y la meseta fue de 0.042. Para el variograma N130°E el alcance usado fue de infinito en una dirección (para no
modificar el modelo de N40°E) y 150 [m] en la otra, y la meseta de 0.007. El variograma experimental hacen pensar que podría existir un efecto de hoyo, sin
embargo no se incorporó en el modelo, pues se consideró que lo más importante es ajustarse al sector de distancias h bajas pues éste es el sector de mayor confiabilidad.
14
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Se realizó una validación cruzada de este modelo, con kriging ordinario (por defecto). Se consideró un umbral de errores estandarizados de 2.5 (los datos son considerados "mal estimados", y marcados con un círculo relleno en la figura 12, cuando el error estandarizado está fuera del intervalo [-2.5, 2.5]). Además, se utilizó para estimar una vecindad móvil en forma de elipse de radio mayor 200 [m] en la dirección N40°E y radio menor 125 [m] (y radio de altura 10 [m]).
Los resultados obtenidos en la validación se enumeran a continuación:
Los valores de la media y varianza del error son cercanos a cero, es decir, son aceptables. La varianza del error estandarizado es relativamente cercana a 1, sin embargo sería deseable que fuese mayor (véanse valores en tabla 5).
Los datos "mal estimados" fueron 17, que corresponden a un 1.4% del total de 1190 datos.
Relacionado a lo anterior, la figura 12-B muestra que a pesar que hay una cierta dispersión, la mayoría de los valores son cercanos a la diagonal, es decir, están bien estimados.
Todo lo anterior valida el modelo, es decir, lo hace digno de ser utilizado en el kriging, lo cual no quiere decir que no se podrían encontrar mejores aproximaciones.
Tabla 6. Estadísticos relacionados a la validación cruzada del modelo variográfico desarrollado para el CuS.
15
MI4040 – Análisis Estadístico y Geoestadístico de Datos
16
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Validación por Jack-Knife
Estimación CuT pozos: se utilizó para esta validación más elaborada una vecindad móvil igual a la utilizada en las validaciones cruzadas de la sección anterior; se realizó un kriging puntual estimando los valores en todos los puntos de medición de pozos, y se comparó con los valores medidos reales de pozos.
En los mapas de datos (figura 13) se observa claramente la mayor suavidad (homogeneidad) de los datos estimados, teniéndose un comportamiento espacial general similar a la realidad, pero con mucha menor dispersión. Lo anterior es típico de cualquier estimación por kriging y para evitar este tipo de inexactitudes se necesita utilizar métodos multivariables de estimación geoestadística.
17
MI4040 – Análisis Estadístico y Geoestadístico de Datos
En los histogramas se observa nuevamente que los datos estimados tienden a ser más bajos: las fracciones estimadas son más altas que las reales hacia los valores más bajos y hacia los valores más altos (extremos) las fracciones estimadas son más bajas que las reales. En el mismo sentido, el máximo estimado es mucho menor que el real y la media estimada es considerablemente menor que la real. El hecho que la dispersión de los datos estimados es menor que la de los datos reales, ya percibido en los mapas, se vuelve a notar aquí al comparar las desviaciones estándar.
18
MI4040 – Análisis Estadístico y Geoestadístico de Datos
En la figura 15-A se observa que la varianza del Kriging es máxima en dos sectores (amarillos): esto implica que la confiabilidad de los datos estimados es mínima justo en esos dos sectores. Además, se observa en la figura 13 que justamente en estos sectores hay un gran error (una gran diferencia entre datos estimados y reales).
En la figura 15-B se muestra la nube de correlación entre los valores reales (CuT) y estimados (Krig CuT). Se observa una gran masa de datos bien estimados (la línea negra es una diagonal, pues los ejes usados no son de la misma escala), pero también una gran cantidad de datos mal estimados.
19
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Estimación CuS pozos:
De forma similar a lo ocurrido con el CuT, en los mapas de datos se observa claramente mayor suavidad (homogeneidad) en los datos estimados, teniéndose sin embargo un comportamiento espacial general similar a los datos reales.
En los histogramas se observa nuevamente que los datos estimados tienden a ser más bajos: las fracciones estimadas son más altas que las reales hacia los valores más bajos y hacia los valores más altos (extremos) las fracciones estimadas son más bajas que las reales. En el mismo sentido, el máximo estimado es mucho menor que el real y la media estimada es menor que la real. El hecho que la dispersión de los datos estimados es menor que la de los datos reales, ya percibido en los mapas, se vuelve a notar aquí al comparar las desviaciones estándar.
20
MI4040 – Análisis Estadístico y Geoestadístico de Datos
En la figura 15-A se observa que la varianza del Kriging es máxima en dos sectores (amarillos y rojos): esto implica que la confiabilidad de los datos estimados es mínima justo en esos dos sectores.
En la figura 15-B se muestra la nube de correlación entre los valores reales (CuT) y estimados (Krig CuT). Se observa una gran masa de datos bien estimados (la línea negra es una diagonal, pues los ejes usados no son de la misma escala), pero también una gran cantidad de datos mal estimados.
Respecto del análisis realizado para la estimación de CuT y CuS de pozos (la validación jack-knife), se puede concluir que los modelos de variograma desarrollados permiten representar la continuidad espacial de la variable, pues dan origen a buenas estimaciones en prácticamente todo el espacio. Sin embargo, y como en cualquier estimación por kriging, hay inexactitudes y errores que pueden sesgar decisiones tomadas en base a estas estimaciones; lo anterior es
21
MI4040 – Análisis Estadístico y Geoestadístico de Datos
inevitable y algunas formas de disminuir este sesgo son utilizar otros métodos de estimación o tomar más datos en terreno (pues a mayor cantidad de datos mejor es la estimación obtenida en base a ellos).
22
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Creación de Grilla
Preparación a la creación de Grillas
Para la creación de las grillas es necesario ajustar los valores filtrados, es decir sin datos aberrantes ni duplicados, lo más posible usando bloques de 10x10x10 m3 hasta obtener una discretización apta para utilizar la técnica de krigging posteriormente.
Dado que nuestro banco de interés se encuentra alrededor de la cota 2885m, nos pareció necesario graficar en un mapa básico las cotas y de esta forma encontrar estadísticas y posiblemente datos aberrantes.
En rojo podemos ver la cota que sale del banco de interés, y aquí su valor en las estadísticas, que correspondería al máximo:
23
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Luego de quitar los valores aberrantes tanto por concepto de ley y cota, tenemos el siguiente mapa básico, en donde apreciamos que todos los valores están cercanos a la cota 2885m,
Y la estadística lo confirma:
Por lo tanto ahora se está en condiciones de comenzar a trabajar sobre este banco de interés, comenzando por el ajuste de las grillas y seleccionando una zona de interés para el krigging.
24
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Creación y ajuste de la grilla
Definición de la grilla completa
El primer paso para lograr un ajuste de la grilla a nuestros datos de sondaje fue obtener los valores mínimos y máximos para la ubicación regional de datos, es decir para el este, norte y la cota. Para lograrlo se hizo uso de las estadísticas proporcionadas por Isatis:
Con estos valores es posible comenzar la discretización, comenzando con valores iniciales para la cota de 2.88 km, para la coordenada Este de 0.08km y para la coordenada Norte de 0.15km. Usando bloques de 10x10x10 m3 son necesarios 2 bloques en la cota, 92 bloques hacia el Este y 125 bloques hacia el Norte para cubrir los datos obtenidos por sondaje hasta el último punto.
Grilla total Plano X-Y
25
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Grilla total Plano Y-Z
Acercamiento Grilla total Plano Y-Z
Por lo tanto tenemos una grilla tridimensional formada por 23000 Nodos o bloques de 10x10x10 m3. Pero como se puede apreciar de mapas básicos obtenidos en nuestra primera etapa de análisis, muchos de estos datos se encuentran aislados y por lo tanto hay zonas en donde hacer krigging simplemente no sería representativo, esto nos lleva a pensar que la zona de trabajo debe reducirse a una filtrada, en donde las estimaciones obtenidas si tengan una cercanía a la realidad.
Estableciendo una zona de selección
Para establecer una zona de selección a partir de los 23000 bloques debemos usar los datos tanto de cobre soluble como de cobre total y a partir de eso obtener dos zonas distintas, representativas para cada tipo de cobre.
26
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Zona para cobre solubleSe comienza la selección proyectando los datos de cobre soluble sobre la grilla total,
Luego se procede a desechar aquellos bloques que no están en la cercanía de los datos obtenidos por sondaje, a fin de crear una zona de selección representativa, obteniendo como resultado lo siguiente:
La selección se realizó sobre una grilla de 23000 bloques, de los cuales 8286 fueron desestimados y 14714 seleccionados para el proceso de Krigging.
27
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Zona de selección para cobre totalRealizando el mismo procedimiento anterior, se obtiene:
La selección
se realizó sobre una grilla de 23000 bloques, de los cuales 8580 fueron
desestimados y 14420 seleccionados para el proceso de Krigging.
Estimación por Krigging
28
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Estimaciones de Leyes de cobre para bloques
Usando las mismas características de la elipse encontrada en los primeros estudios del informe, e incorporando las nuevas zonas de selección, fue posible obtener las estimaciones de las leyes de los bloques antes mencionados.
Se presenta la configuración de la vecindad en Isatis
Es de notar que la discretización de bloques se hizo de 10x10x1, dado que se obtenían valores muchos más estables de CVV al momento de ejecutar los test.
Los resultados obtenidos se presentan en los siguientes histogramas y mapas.
29
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Estimación para Cobre Soluble
Estimación de la ley Cobre soluble - Mapa básico
Estimación de la ley Cobre soluble - Histograma
30
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Estimación de la ley Cobre soluble – Variograma
Estimación de la ley Cobre soluble – Estadísticas Básicas
Estimación para Cobre Total
31
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Estimación de la ley Cobre soluble - Mapa básico
Estimación de Ley de Cobre Total – Histograma
Estimación de Ley de Cobre Total –Variograma
32
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Estimación de la ley Cobre Total– Estadísticas básicas
33
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Conclusiones
Isatis es una herramienta bastante eficiente al momento de trabajar con variables
regionalizadas, se pueden realizar una gran cantidad de análisis univariables y multivariables.
El modelamiento del variograma experimental debe ser lo mas exacto posible, pues de
ello depende la mayor parte de la estimación por kringing, la mayor parte de los datos mal
estimados (varianza mayor a 2,5) ocurren por esta razón.
La estimación por kriging es bastante útil al momento de estimar los recursos de un
yacimiento, ya que éste es un estimador insesgado, lineal y de varianza mínima, sin embargo
se debe tener cuidado ya que el kriging tiende a acercar las estimaciones a la media,
disminuyendo la frecuencia de los datos extremos (que en algunos casos suele ser el de mayor
interés, por ejemplo, el oro).
34
MI4040 – Análisis Estadístico y Geoestadístico de Datos
Bibliografía
-Emery, Xavier; Cátedras MI4040-2Análisis estadístico y geoestadístico de datos, Semestre
Primavera 2012, U-cursos, Material Docente.
-Emery, Xavier; Guía y Manual ISATIS, Semestre Primavera 2012, U-cursos, Material Docente.
-Emery, Xavier; Laboratorio ALGES, ALGES 1: Estudio exploratorio de datos.
-Emery, Xavier; Laboratorio ALGES, ALGES 2: Variograma.
-Caballero, Enrique; Memoria de título,“Predicción Multivariable De Recursos Recuperables”, Abril 2012.
35
MI4040 – Análisis Estadístico y Geoestadístico de Datos