3 - estimación y validación cruzada

15
Estimación y Validación Cruzada 1. Propósitos Realizar la estimación de la ley del bloque utilizando Kriging Ordinario y definir el plan de estimación óptimo utilizando validación cruzada, que consiste en estimar valores conocidos y luego analizar estadísticamente las diferencias entre el valor real versus el estimado. A pesar que la validación cruzada es técnicamente independiente de la estimación de los bloques, en el presente documento se han considerado complementarias, ya que la primera requiere algunos archivos generados en durante la estimación. 2. Responsabilidades Es responsabilidad del Ingeniero Jefe de la Unidad de Evaluación y Diseño de Mina, velar por la difusión y cumplimiento de este procedimiento a todo el personal relacionado con la ejecución del control de calidad y de la validación de los resultados obtenidos, tanto trabajadores propios como contratistas de empresas de servicios, el presente instructivo y/o procedimiento. 3. Definiciones 3.1 Modelo de Bloques El modelo de bloques consistente en la discretización de todo el yacimiento minero en paralelepípedos regulares o bloques. 3.2 Kriging En términos de estimación, el kriging consiste en encontrar el mejor estimador lineal de una variable en una región del espacio, considerando la información disponible, es decir, el valor de las muestras ubicadas en el entorno de la región. El kriging consiste en efectuar una ponderación, vale decir, atribuir un peso ( ) al valor asociado a cada muestra. Estos pesos serán calculados de tal manera de hacer mínima la varianza de estimación ( 2 ). 2 = ( ) 2 Obteniéndose el siguiente sistema de ecuaciones para la ponderación de cada muestra al desarrollar la expresión anterior e introducir el concepto de correlación espacial: ( (1,1) (2,1) (,1) 1 (1,1) (2,2) (,2) 1 (1,) (2,) (,) 1 1 1 1 0 ) ( 1 2 ) = ( (1,) (2,) (,) 1 ) Por otra parte, la correspondiente varianza de estimación ( 2 ) es calculada mediante: 2 =∑ (, ) + − ̅(, ) En donde (, ) es la varianza entre el compósito y el bloque a ser estimado mientras que ̅(, ) es la varianza con respecto a la discretización del bloque.

Upload: max-tapia-castillo

Post on 05-Jan-2016

40 views

Category:

Documents


2 download

DESCRIPTION

Tutorial Datamine

TRANSCRIPT

Page 1: 3 - Estimación y Validación Cruzada

Estimación y Validación Cruzada

1. Propósitos

Realizar la estimación de la ley del bloque utilizando Kriging Ordinario y definir el plan de

estimación óptimo utilizando validación cruzada, que consiste en estimar valores conocidos y

luego analizar estadísticamente las diferencias entre el valor real versus el estimado. A pesar

que la validación cruzada es técnicamente independiente de la estimación de los bloques, en el

presente documento se han considerado complementarias, ya que la primera requiere algunos

archivos generados en durante la estimación.

2. Responsabilidades

Es responsabilidad del Ingeniero Jefe de la Unidad de Evaluación y Diseño de Mina, velar por la

difusión y cumplimiento de este procedimiento a todo el personal relacionado con la ejecución

del control de calidad y de la validación de los resultados obtenidos, tanto trabajadores propios

como contratistas de empresas de servicios, el presente instructivo y/o procedimiento.

3. Definiciones

3.1 Modelo de Bloques

El modelo de bloques consistente en la discretización de todo el yacimiento minero en

paralelepípedos regulares o bloques.

3.2 Kriging

En términos de estimación, el kriging consiste en encontrar el mejor estimador lineal de una

variable en una región del espacio, considerando la información disponible, es decir, el valor de

las muestras ubicadas en el entorno de la región. El kriging consiste en efectuar una

ponderación, vale decir, atribuir un peso (𝑤𝑖) al valor asociado a cada muestra. Estos pesos serán

calculados de tal manera de hacer mínima la varianza de estimación (𝜎2).

𝜎2 = (𝑧∗𝑝 − 𝑧𝑝)2

Obteniéndose el siguiente sistema de ecuaciones para la ponderación de cada muestra al

desarrollar la expresión anterior e introducir el concepto de correlación espacial:

(

𝛾(1,1)𝛾(2,1)⋮

𝛾(𝑛,1)1

𝛾(1,1)𝛾(2,2)⋮

𝛾(𝑛,2)1

⋯⋯⋱⋯⋯

𝛾(1,𝑛)𝛾(2,𝑛)⋮

𝛾(𝑛,𝑛)1

11⋮10)

(

𝑤1𝑤2⋮𝑤𝑛𝜇 )

=

(

𝛾(1,𝑏)𝛾(2,𝑏)⋮

𝛾(𝑛,𝑏)1 )

Por otra parte, la correspondiente varianza de estimación (𝜎2𝑘) es calculada mediante:

𝜎2𝑘 =∑𝑤𝑖𝛾(𝑖, 𝐵) + 𝜇 − �̅�(𝐵, 𝐵)

En donde 𝛾(𝑖, 𝐵) es la varianza entre el compósito y el bloque a ser estimado mientras que

�̅�(𝐵, 𝐵) es la varianza con respecto a la discretización del bloque.

Page 2: 3 - Estimación y Validación Cruzada

3.3 Validación Cruzada

Se puede verificar la adecuación entre los datos y los parámetros adoptados (modelo de

variograma y cantidad de datos considerados para estimar) utilizando una técnica llamada

validación cruzada. El principio es estimar sucesivamente, mediante kriging, cada dato,

considerando sólo los datos restantes. Se puede calcular entonces el error de estimación

(diferencia entre el valor estimado y el valor verdadero) en cada sitio con dato y realizar un

análisis estadístico de los errores cometidos.

La validación cruzada es presentada usualmente bajo la forma de pruebas gráficas, en especial:

La nube de correlación entre los valores de los compósitos (𝑧) y los valores estimados

(𝑧∗).

El histograma de los errores estandarizados

𝑒 =𝑧∗ − 𝑧

𝜎𝑘

Donde 𝜎 es la desviación estándar de kriging (o sea, la raíz cuadrada de la varianza de

kriging) en el punto a estimar.

4. Consideraciones

Se deben considerar los siguientes criterios estadísticos para comparar cuantitativamente dos

planes de estimación:

Las medias de los errores y los errores estandarizados miden el sesgo del estimador, y

deben ser cercanas a cero.

La varianza de los errores, que mide la precisión del estimador, debe ser mínima.

El coeficiente de correlación entre los valores estimados y los valores de los datos debe

ser lo más cercano posible a 1.

Page 3: 3 - Estimación y Validación Cruzada

5. Descripción de la Actividad

5.1 Crear prototipo

Antes de crear un prototipo debemos definir las coordenadas límite de nuestro modelo de

bloques, es decir, definir la región que se discretizará mediante bloques. Recuerde que los lados

de esta región deben ser múltiplos del tamaño del bloque.

Para comenzar debe ir a la opción Models, Create Model y luego Define Prototype.

En el campo OUT deberá ingresar un nombre para el archivo de salida. Presione aceptar.

Figura 1. Crear un prototipo.

Figura 2. Interfaz para crear un prototipo.

Page 4: 3 - Estimación y Validación Cruzada

Antes de ejecutarse el proceso preguntará si es requerido un campo de salida minado y

respondemos NO. Luego preguntará si usa sub-celdas y también responderemos que NO.

Luego debemos ingresar las coordenadas del origen. Se considerará origen la menor de las

coordenadas este, norte y la cota.

Ahora debemos ingresar las dimensiones del bloque. En CAP se utilizan bloques de 10x10 m2

en el plano y 15 m de altura (altura del banco).

Figura 3. Interfaz para crear un prototipo.

Figura 4. Interfaz para crear un prototipo.

Figura 5. Interfaz para crear un prototipo.

Page 5: 3 - Estimación y Validación Cruzada

A continuación debemos ingresar el número de bloques en cada dirección (el número de bloques

es la diferencia entre las coordenadas máximas y mínimas divida por la longitud del bloque en

esa dirección). Luego aparecerá PROTOM COMPLETE indicando que el proceso ha finalizado.

5.2 Crear un modelo de bloques

Para crear el modelo de bloques de cada unidad de estimación debemos luego de definir el

prototipo ir a la opción Models, Create Model y Fill Wireframe with Cells.

En la pestaña Files debemos ingresar los tres archivos de entrada para la rutina. En el campo

PROTO debemos ingresar el archivo creado en el procedimiento anterior que contiene las

dimensiones y la posición de los bloques. En los campos WIRETR y WIREPT se deben ingresar los

archivos que contienen la triangulación y los puntos respectivamente del sólido correspondiente

a la unidad de estimación deseada. Observe que en nuestro caso la unidad de estimación

corresponde la unión de dos unidades geológicas y no contamos con su sólido, por lo que

generaremos los bloques para cada UG y luego los uniremos para formar el modelo de bloques

de la UE. En el campo MODEL ingresaremos un nombre para el archivo de salida.

En la pestaña Parameters debemos asegurarnos que en el campo MODELTYPE este

seleccionada la opción 1 y que en el campo SPLITS esté seleccionada la opción 0. Finalmente

presione Aceptar.

Figura 6. Interfaz para crear un prototipo.

Figura 7. Interfaz para crear el modelo de bloques.

Page 6: 3 - Estimación y Validación Cruzada

Repetir este proceso hasta crear un modelo de bloques para cada unidad geológica (UG).

Figura 8. Interfaz para crear el modelo de bloques.

Figura 9. Interfaz para crear el modelo de bloques.

Page 7: 3 - Estimación y Validación Cruzada

5.3 Unir los modelos de bloques

Como se mencionó anteriormente se generó un modelo de bloques para cada unidad geológica

pero necesitamos el modelo de bloques de las unidades de estimación (que en algunos casos

corresponde a la unión de dos o más UG) por lo tanto quizá tendremos que unir alguno de los

modelos de bloques.

Para unirlos deberá ir a la opción Applications, File Manipulation Processes, Merge y Append.

En los campos IN 1 e IN 2 ingresar los archivos a unir y en OUT escribir un nombre para el archivo

de salida. Finalmente presione aceptar.

5.4 Estimar los bloques mediante Kriging.

En estricto rigor no es necesario estimar para realizar la validación cruzada, pero el programa

requiere un archivo generado durante la estimación en el que guarda la información del plan de

estimación, por lo que nos vemos obligados a estimar para obtenerlo.

Para estimar la ley de hierro de un conjunto de bloques debe ejecutar el comando Estimate.

Figura 10. Unir dos modelos de bloques.

Figura 11. Estimación de los bloques.

Page 8: 3 - Estimación y Validación Cruzada

Una vez dentro, en la pestaña Input debemos ingresar los archivos de entrada de la rutina. En

el campo Geological Model se debe ingresar el modelo de bloques. Si el objetivo aun no es

estimar y sólo se desea obtener los archivos necesarios para la validación cruzada se recomienda

ingresar un modelo de bloques reducido, es decir, solo una porción del modelo de bloques total

para disminuir los tiempos de cálculo. En el campo de Sample Data se ingresa el nombre del

archivo que contiene los compósitos que se estimaran, además se indica el nombre de las

coordenadas este, norte y cota dentro del mismo.

En la pestaña Output se deben ingresar el nombre de los archivos de salida, ver figura 13. Los

archivos necesarios para la validación cruzada son Search Volume File, Estimation Parameter

File y Variogram Model File. Se recomienda ingresar en nombre mostrado u otro que luego

recordemos para ingresar estos archivos en el proceso siguiente. Luego presione Next.

Figura 12. Interfaz proceso de estimación.

Page 9: 3 - Estimación y Validación Cruzada

En la sección Search Value se ingresa la información del volumen de búsqueda. En la pestaña

Shape se ingresa la forma del radio de búsqueda. Si se obtuvo durante el análisis variográfico

que no existe una dirección preferencial de continuidad ya que el alcance es el mismo en todas

las direcciones el volumen de búsqueda es una esfera de radio igual al alcance. Por el contrario

si existe una dirección preferencial el radio de búsqueda será un elipsoide cuyos ejes están dados

por el alcance en dicha dirección.

Figura 13. Interfaz proceso de estimación.

Figura 14. Interfaz proceso de estimación.

Page 10: 3 - Estimación y Validación Cruzada

En los campos X Axis, Y Axis y Z Axis deberá ingresar el alcance del variograma en esa dirección.

El cuadro Shape Rotation ingresamos los ángulos de rotación si es que la anisotropía no coincide

con la dirección por defecto este, norte y cota. El ejemplo mostrado corresponde a la rotación

para un elipsoide con ejes de 40 m, 45 m y 60 m en las direcciones 60°/0°, 150°/30° y 330°/60°

respectivamente.

En la pestaña Category se ingresar los parámetros referentes a la cantidad de compósitos

utilizados para estimar. En la primera parte, llamada Primary Search Volume se ingresan

número mínimo y máximo de compósitos utilizados dependiendo del plan de estimación. En la

segunda parte, Dynamic Search Volume, es una opción que se ejecuta cuando no se encuentran

compósitos dentro del primer volumen de búsqueda. El campo Expansion Factor indica cuando

va a crecer el nuevo radio con respecto al anterior. Se recomienda mantener el mismo máximo

de compósitos pero reducir a la mitad del número mínimo. Lo mismo se aplica para un tercer

volumen de búsqueda si es que aún no se encuentran compósitos. Si desea no activar esta

opción basta con fijar como 0 el factor de expansión. Para continuar presione Next.

En la sección Variogram Models se ingresaran los parámetros relativos al modelo variográfico

definido en el plan de estimación. En la pestaña Rotation se deben ingresar los ángulos de giro

de los ejes para alcanzar la dirección del variograma. Estos deben ser los mismos ángulos

ingresados en la sección Search Value.

Figura 15. Interfaz proceso de estimación.

Page 11: 3 - Estimación y Validación Cruzada

En la pestaña Structures se debe ingresar el modelo de variograma ajustado al variograma

experimental. En Nugget Variance se debe ingresar el efecto pepita. Luego se debe presionar

New e ingresar en Range el alcance en las nuevas direcciones X, Y, Z (producto de la rotación).

En Variance se debe ingresar el sill menos el efecto pepita, es decir, la varianza que alcanza el

modelo cuando no se tiene efecto pepita.

Figura 16. Interfaz proceso de estimación.

Figura 17. Interfaz proceso de estimación.

Page 12: 3 - Estimación y Validación Cruzada

En la opción Estimation Types se ajustan los parámetros referentes a la técnica de estimación.

En la sección Method seleccionaremos Ordinary Kriging. En Sample Grade se indica la variable

que se estimará mediante la técnica seleccionada. En la sección Model Fields ingresar los

parámetros indicados en la figura 18. En la sección Search and Variogram Definition

seleccionamos el volumen de búsqueda y el modelo variográfico a utilizar si es que previamente

creamos más de uno.

En la pestaña Options seleccionamos la opción Reset Negative Weights to zero, la cual eliminará

los ponderadores o pesos (𝑤𝑖) negativos producto del efecto pantalla. Presionamos Next.

En la sección Controls mantemos las opciones por defecto y damos a Next y luego a Run. Luego

de esto debemos esperar a que la estimación termine, puede demorar varios minutos

dependiendo del numero de bloques.

Figura 18. Interfaz proceso de estimación.

Page 13: 3 - Estimación y Validación Cruzada

5.5 Validación Cruzada

Para realizar la validación cruzada y seleccionar el mejor plan de estimación de acuerdo de los

criterios vistos, debemos ir a la opción Applications, Variograms y luego a Cross Validate.

Dentro de la interfaz de esta herramienta en el campo IN debemos ingresar el archivo que

contiene los compósitos. En SRCPARM (parámetros del volumen de búsqueda), ESTPARM

(parámetros de la estimación) y VMODPARM (parámetros del modelo variográfico) se deben

ingresar los archivos que fueron creados durante la estimación. Ver figura 20. En la pestaña

Fields identificar el nombre de las coordenadas este, norte y cota dentro del archivo de los

compósitos, por defecto X, Y y Z. Finalmente apretar Aceptar.

Figura 19. Interfaz validación cruzada.

Page 14: 3 - Estimación y Validación Cruzada

Si al ejecutarse el proceso aparece el error mostrado en la figura 21, el cual se debe a que el

archivo de los compósitos contiene demasiadas columnas y no se ha especificado que es la

variable Fe la que se desea validar.

Para solucionar esto vamos a hacer una copia del archivo de los compósitos mediante la

herramienta Applications, File Manipulation Processes y Copy. Borrar todas las columnas del

nuevo archivo salvo las que contienen las coordenadas X,Y,Z y la Ley de Fe. Presionar Guardar y

luego Salir.

Figura 20. Interfaz validación cruzada.

Figura 21. Error durante el proceso de validación cruzada.

Page 15: 3 - Estimación y Validación Cruzada

Realizar nuevamente la validación cruzada anterior con el nuevo archivo y el error debería

desaparecer.

El archivo que contiene la información de la ley real y estimada de cada compósito se llama

xvsamps, al abrirlo observamos una tabla como la mostrada en la figura 23. Las columnas XC,

YC y ZC corresponden a las coordenadas del centroide del bloque que pertenece el compósito y

las columnas X, Y y Z corresponden a las coordenadas del compósito. Las columnas FE y

ESTIMATE corresponden a la ley real y la ley estimada respectivamente. La columna NS

corresponde a la cantidad de compósitos usadas para estimar. La columna SV corresponde a él

volumen de búsqueda usado, es decir, si se utilizó el factor de expansión al no encontrar

compósitos. La columna TD es la distancia transformada y VA es la varianza de estimación.

Podemos copiar las columnas FE, ESTIMATE y VA al software Minitab para realizar un análisis

estadístico de los resultados según las consideraciones propuestas por Emery y resumidas en

la sección 3.3 y 4 de este documento.

6. Referencias

E. Tulcanaza, 1999. Evaluación de Recursos y Negocios Mineros.

X. Emery, 2007. Apuntes de Geoestadística, Universidad de Chile.

A. Sinclair y G. Blackwell, 2002. Applied Mineral Inventory Estimation.

Figura 22. Datos que debe contener el archivo de entrada para evitar el error.

Figura 23. Archivo xvsamps.