teorema del limite central- ultimo trabajo de geoestadistica 1

Upload: victor-alexander-juarez-racchumi

Post on 14-Jan-2016

19 views

Category:

Documents


1 download

DESCRIPTION

TEOREMA DEL LIMITE CENTRAL

TRANSCRIPT

Monografa

18

Trabajo de Geoestadstica ITeorema del lmite central y modelamiento de Gauss-Desarrollado en Visual Basic - EXCEL-

Victor Alexander Juarez RacchumiUniversidad Nacional de IngenieraGEOESTADISTICA IProfesor de Teora: Alfredo MarnProfesor de Prctica: Augusto Teves

Formato APAEscuela de Ing. Minas, Universidad Nacional de Ingeniera

Resumen

El Teorema Central del Lmite es obra de muchos grandes matemticos. Dentro de la historia del Teorema Central del Lmite, Laplace ocupa un lugar fundamental: a pesar de que nunca enunci formalmente este resultado, ni lo demostr rigurosamente, a l le debemos este importante descubrimiento.Con Teorema Central del Lmite nos referiremos a todo teorema en el que se arma, bajo ciertas hiptesis, que la distribucin de la suma de un nmero muy grande de variables aleatorias se aproxima a una distribucin normal. Un ejemplo de este hecho es el caso de los errores de medida. Con respecto a este tema, Laplace propuso una hiptesis que considera el error total como una suma de numerosos errores elementales muy pequeos debidos a causas independientes. Liapunov generaliz el trabajo de Chebyshov y Mrkov, y consigui demostrar el teorema central del lmite a partir de condiciones ms generales de las que se haba pedido hasta entonces.El Teorema Central de Lmite no es un nico teorema, sino que consiste en un conjunto de resultados acerca del comportamiento de la distribucin de la suma (o promedio) de variables aleatorias.

ndice General

Resumen2ndice General3Objetivos:4Teorema del Limite Central de Lyapunov5Definicin:5Enunciado formal:7Propiedades:8Modelo matemtico8Nmeros aleatorios gaussianos9Forma general para generar datos aleatorios gaussianos9Desarrollo:10Conclusiones17Bibliografa18

Objetivos:

Hacer un estudio de la simulacin de datos gaussianos, y comprender que se puede modelar cualquier situacin que tenga comportamiento gaussiano Simular 1000 datos utilizando datos reales de campo (con media = 3 y desviacin estndar = 1.5). Pero para una mejor observacin del fenmeno decid hacerlo para 5000 datos. Graficar el histograma de la simulacin, en cuya grfica se observar la campana de gauss que mostrar la media y la desviacin estndarTeorema del Limite Central de Lyapunov

Las primeras demostraciones realmente rigurosas de T.C.L. son el resultado de la labor de tres grandes matemticos rusos: Shebyshev (1887), Markov (1898) y Liapunov (1900-1901). Shebyshev y Markov lo hicieron utilizando el mtodo de los momentos. Liapunov fue el primero en utilizar el mtodo de las funciones caractersticas. l, ha demostrado por este mtodo, que el T.C.L. era aplicable con hiptesis mucho ms generales que los de Shebyshev y Markov 4adems su mtodo de demostracin tiene la ventaja de la simplicidad.El teorema del lmite central o teorema central del lmite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes, entonces la funcin de distribucin de Sn se aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.Definicin:Sealafuncin de densidadde ladistribucin normaldefinida como:

Con unamediay unavarianza2. El caso en el que su funcin de densidad es, a la distribucin se le conoce comonormal estndar. Se defineSncomo la suma denvariables aleatorias, independientes, idnticamente distribuidas, y con una mediay varianza2finitas (20):

De manera que, la media deSnesny lavarianzan2, dado que son variables aleatorias independientes. Con tal de hacer ms fcil la comprensin del teorema y su posterior uso, se hace unaestandarizacin deSncomo:

Para que la media de la nueva variable sea igual a 0 y ladesviacin estndarsea igual a 1. As, las variablesZnconvergern en distribucina la distribucin normal estndarN(0,1), cuandontienda ainfinito. Como consecuencia, si (z) es lafuncin de distribucinde N(0,1), para cadanmero realz.

Dnde:Pr() indicaprobabilidad lim se refiere almite matemtico.

Enunciado formal:De manera formal, normalizada y compacta el enunciado del teorema es:Teorema del lmite central: Sea,, ...,un conjunto de variables aleatorias, independientes e idnticamente distribuidas con mediay varianza2distinta de cero. Sea Entonces. Es muy comn encontrarlo con la variable estandarizadaZnen funcin de la media muestral,

Puesto que son equivalentes, as como encontrarlo en versiones no normalizadas como puede ser:Teorema del lmite central: Sea ,, ...,un conjunto de variables aleatoria, independientes e idnticamente distribuidas de una distribucin con media y varianza20. Entonces, sines suficientemente grande, la variable aleatoria.

Tiene aproximadamente una distribucin normal cony.Propiedades:

El teorema del lmite central garantiza una distribucin normal cuando n es suficientemente grande.Existen diferentes versiones del teorema, en funcin de las condiciones utilizadas para asegurar la convergencia. Una de las ms simples establece que es suficiente que las variables que se suman sean independientes, idnticamente distribuidas, con valor esperado y varianza finitas.La aproximacin entre las dos distribuciones es, en general, mayor en el centro de las mismas que en sus extremos o colas, motivo por el cual se prefiere el nombre "teorema del lmite central" ("central" califica al lmite, ms que al teorema).

Modelo matemtico Estadstica (descriptiva)

La mediaLa varianza

Desviacin estndar

Coeficiente de variacinNmeros aleatorios gaussianosCuando generamos una sucesin aleatoria con una distribucin uniforme, todos los valores tienen la misma probabilidad de ocurrir. A veces necesitamos generar nmeros aleatorios usando distribuciones en las que algunos valores tienen mayor probabilidad de ser generados que otros. Por ejemplo, suponga que una sucesin aleatoria representa mediciones de temperatura exterior tomadas durante cierto tiempo. Veramos que las mediciones de temperatura tienen cierta variacin, pero por lo regular no son igualmente verosmiles. Por ejemplo, podramos encontrar que los valores varan en unos cuantos grados, aunque ocasionalmente pueden ocurrir cambios mayores causa de tormentas, nublados y cambios del da a la noche. Las sucesiones aleatorias que tienen algunos valores con mayor probabilidad de ocurrir que otros a menudo pueden modelarse con nmeros aleatorios gaussianos (tambin llamados nmeros aleatorios normales).Forma general para generar datos aleatorios gaussianos

Desarrollo: En este caso simularemos 5000 datos (el profesor dijo 1000 datos pero yo hare 5000 datos para una mejor observacin de lo que ocurra) haciendo uso de la siguiente frmula:

Donde:y = tiempo simuladori = nmero aleatorio entre 0 y 1n = cantidad de nmeros aleatorios para simular un tiempo (en este caso usaremos 12, 20, 50, 100 Y 500 nmeros aleatorios). = es la media de los nmeros aleatorios (para una cantidad considerablemente grande se considera = 0.5). = es la desviacin estndar de los nmeros aleatorios (similar a la media, para una cantidad considerablemente grande se considera =). = deviacin estndar obtenida de los datos de campo. = media obtenida de los datos de campo.Para nuestro caso de la media y desviacin estndar de campo consideraremos:yQue fueron los datos dados por el Dr. Marn Comenzamos generando los nmeros aleatorios en Excel segn los requerimientos, para k = n = 12, 20, 50, 100 y 500, para ello solo programamos en el macros, como se muestra:

La importancia de este paso radica en que ya no se me muestran los nmeros aleatorios, solo se muestran las sumas de dichos nmeros aleatorios tomados para K =12, 20, 50, 100, y 500. Como se ve a continuacin:

Luego simulamos los valores de Y que me representarn los tiempos de carguo de la pala con una media de 3 min y des. Estndar de 1.5 como se observa:

Despus tenemos que graficar esos 5000 datos simulados para cada valor de K, previo a ello tenemos que hallar el mximo y mnimo valor de los datos simulados para cada K ayudndonos de Excel para as determinar el ancho de clase constante de cada intervalo y poder agruparlos en con sus respectivas frecuencias.

Generamos los intervalos y frecuencias para cada valor de K. Al momento de generar las frecuencias tenemos que tener mucho cuidado ya que los datos se ingresan como matriz:

Para ello previamente seleccionamos la columna donde queremos que aparezcan nuestras frecuencias. En la barra de ecuaciones presionamos las teclas CTRL + SHIF + ENTER antes de ingresar el smbolo = (igual) seguido del operador FRECUENCIA. Luego nos pedir (datos, grupos), en la parte de datos seleccionamos todos nuestros datos simulados, y en la parte de grupos seleccionamos nuestra columna de intervalos. Finalmente cerramos con la combinacin CTRL + SHIF + ENTER y eso es todo. (los resultados se muestran a continuacin)

Luego graficamos los histogramas con los intervalos en el eje x y las frecuencias en el eje y:

5

Conclusiones

Para una cantidad muy grande de datos aleatorios que se presentan en la naturaleza la frecuencia con que se dan los datos se aproxima a una grfica conocida como la campana de gauss. A medida que se aumenta los datos random la campana de gauss tambin aumenta. El teorema de lmite central solo se usa cuando la distribucin es Gauss o Lognormal, en caso contrario se usara el mtodo Montecarlo. La importancia del teorema del lmite central es que nos permite usar estadsticos de muestra para hacer inferencias con respecto a los parmetros de poblacin sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin ms que lo que podamos obtener de esa muestra.

Bibliografa

Dr. Marn (UNI-2014II) Clases del curso Geoestadstica II.

J. Han, M. Kamber and A. K. H. Tung - Spatial Clustering Methods In Data Mining

Enlaces externos:

Algoritmo de Agrupamiento:http://es.wikipedia.org/wiki/Algoritmo_de_agrupamiento

Teorema del Lmite Central:http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_centralTeorema Central del Limite, Universidad de Buenos Aires,Facultad de Ciencias Exactas y Naturales, 30 de julio de 2004, Pablo Delieutraz.http://www.scielo.cl/pdf/estped/v34n2/art01.pdfhttp://www.marcoalfaro.cl/archivos/MatheronFasciculo2.pdf