simulación montecarlo
DESCRIPTION
Simulación de Montecarlo a partir de una pequeña cantidad de muestrasTRANSCRIPT
Hewlett-Packard[Escriba el título del documento]
1
AÑO DE LA DIVERSIFICACIÓN PRODUCTIVA Y
FORTALECIMIENTO DE LA EDUCACIÓN
2° MONOGRAFÍA DE GEOESTADÍSTICA
DOCENTES:
PHD. MARIN SUAREZ, VALERIANO ALFREDO
ING. TEVES ROJAS, AUGUSTO
ALUMNO:
ZANABRIA CARRASCO JUAN LUIS
CÓDIGO:
20122057A
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA GEOLÓGICA MINERA Y METALURGICA
Lima 8 de Julio del 2015
Hewlett-Packard[Escriba el título del documento]
2
INTRODUCCIÓN
La necesidad de acudir a herramientas estadísticas para el análisis de datos en todas
las áreas del conocimiento, ha hecho que aparezcan con el correr de los años nuevas
metodologías que, no obstante se centran en fundamentos probabilísticos comunes,
son específicas para cada una de las diversas disciplinas del saber. El análisis de
riesgo forma parte de todas las decisiones que tomamos. Nos enfrentamos
continuamente a la incertidumbre, la ambigüedad y la variabilidad. Y aunque tenemos
un acceso a la información sin precedentes, no podemos predecir con precisión el
futuro. La simulación Monte Carlo permite ver todos los resultados posibles de las
decisiones que tomamos y evaluar el impacto del riesgo, lo cual nos permite tomar
mejores decisiones en condiciones de incertidumbre.
Hewlett-Packard[Escriba el título del documento]
3
INDICE
Introducción………………………………………………………….…2
Marco teórico…………………………………………………………...4
Procedimiento…………………………………………………………..8
Resultados…………………………………………………………...…15
Hewlett-Packard[Escriba el título del documento]
4
MARCO TEORICO
HISTOGRAMA
En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de
los valores representados, ya sea en forma diferencial o acumulada. Sirven para
obtener una "primera vista" general, o panorama, de la distribución de la población,
o la muestra, respecto a una característica, cuantitativa y continua, de la misma y
que es de interés para el observador (como la longitud o la masa). De esta manera
ofrece una visión en grupo permitiendo observar una preferencia, o tendencia, por
parte de la muestra o población por ubicarse hacia una determinada región de
valores dentro del espectro de valores posibles (sean infinitos o no) que pueda
adquirir la característica.
En general se utilizan para relacionar variables cuantitativas continuas, pero también
se lo suele usar para variables cuantitativas discretas, en cuyo caso es común
llamarlo diagrama de frecuencias y sus barras están separadas, esto es porque en el
Hewlett-Packard[Escriba el título del documento]
5
"x" ya no se representa un espectro continuo de valores, sino valores cuantitativos
específicos como ocurre en un diagrama de barras cuando la característica que se
representa es cualitativa o categórica. Su utilidad se hace más evidente cuando se
cuenta con un gran número de datos cuantitativos y que se han agrupado en
intervalos de clase.
TEOREMA DEL LIMITE CENTRAL
El teorema del límite central o teorema central del límite indica que, en
condiciones muy generales, si Sn es la suma de n variables aleatorias independientes
y de varianza no nula pero finita, entonces la función de distribución de Sn «se
aproxima bien» a una distribución normal (también llamada distribución gaussiana,
curva de Gauss o campana de Gauss). Así pues, el teorema asegura que esto ocurre
cuando la suma de estas variables aleatorias e independientes es lo suficientemente
grande.
Sea la función de densidad de la distribución normal definida como
con una media µ y una varianza σ2.
Hewlett-Packard[Escriba el título del documento]
6
SIMULACIÓN MONTECARLO
La simulación Monte Carlo es una técnica matemática computarizada que permite
tener en cuenta el riesgo en análisis cuantitativos y tomas de decisiones.
La simulación Monte Carlo ofrece a la persona responsable de tomar las decisiones
una serie de posibles resultados, así como la probabilidad de que se produzcan según
las medidas tomadas. Muestra las posibilidades extremas, los resultados de tomar la
medida más arriesgada y la más conservadora, así como todas las posibles
consecuencias de las decisiones intermedias. Los científicos que trabajaron con la
bomba atómica utilizaron esta técnica por primera; y le dieron el nombre de Monte
Carlo, la ciudad turística de Mónaco conocida por sus casinos. Desde su introducción
durante la Segunda Guerra Mundial, la simulación Monte Carlo se ha utilizado para
modelar diferentes sistemas físicos y conceptuales.
CÓMO FUNCIONA LA SIMULACIÓN MONTE CARLO
La simulación Monte Carlo realiza el análisis de riesgo con la creación de modelos de
posibles resultados mediante la sustitución de un rango de valores, una distribución
de probabilidad, para cualquier factor con incertidumbre inherente. Luego, calcula los
resultados una y otra vez, cada vez usando un grupo diferente de valores aleatorios de
las funciones de probabilidad. Dependiendo del número de incertidumbres y de los
rangos especificados, para completar una simulación Monte Carlo puede ser
necesario realizar miles o decenas de miles de recálculos. La simulación Monte Carlo
produce distribuciones de valores de los resultados posibles.
Hewlett-Packard[Escriba el título del documento]
7
La simulación Monte Carlo proporciona una serie de ventajas sobre el análisis
determinista o “estimación de un solo punto”.
Resultados probabilísticos. Los resultados muestran no sólo lo que puede
suceder, sino lo probable que es un resultado.
Resultados gráficos. Gracias a los datos que genera una simulación Monte
Carlo, es fácil crear gráficos de diferentes resultados y las posibilidades de
que sucedan. Esto es importante para comunicar los resultados a otras
personas interesadas.
Análisis de sensibilidad. Con sólo unos pocos resultados, en los análisis
deterministas es más difícil ver las variables que más afectan el resultado. En
la simulación Monte Carlo, resulta más fácil ver qué variables introducidas
tienen mayor influencia sobre los resultados finales.
Correlación de variables de entrada. En la simulación Monte Carlo es posible
modelar relaciones interdependientes entre diferentes variables de entrada.
Esto es importante para averiguar con precisión la razón real por la que,
cuando algunos factores suben, otros suben o bajan paralelamente.
Hewlett-Packard[Escriba el título del documento]
8
PROCEDIMIENTO
1° Trabajamos con esta tabla de datos: TIEMPO DE LLEGADA DE CAMIONES
165 220 232 248 266 290182 221 236 250 270 298199 225 238 251 272 301209 228 240 256 277 302210 230 245 262 262 338
TABLA DE LLEGADA DE CAMONES
2° HACEMOS SU RESPECTIVO HISTOGRAMA
177,357 2202,071 3226,786 8251,500 8276,214 4300,929 4325,643 1
MARCA DE CLASE
FRECUENCIA
160 180 200 220 240 260 280 300 320 3400
1
2
3
4
5
6
7
8TIEMPO DE LLEGADA DE CAMIONES
TIEMPO
FR
EC
UE
NC
IA
Hewlett-Packard[Escriba el título del documento]
9
3°HACEMOS LA PRUEBA CHI CUADRADO
100 150 200 250 300 350 4000
1
2
3
4
5
6
7
8TIEMPO DE LLEGADA DE CAMIONES
TIEMPO
FR
EC
UE
NC
IA
XCalculado2=∑
i=1
7 (oi−ei )2
ei
OBSERVADO ESTIMADO2 1,3743 3,7948 6,7828 7,8474 5,8774 2,8491 0,894
Hewlett-Packard[Escriba el título del documento]
10
OBSERVADO (Obs) ESTIMADO (Est) Obs-Est (Obs-Est)^2 (Obs-Est)^2/Est2 1,374 0,626 0,392 0,28563 3,794 -0,794 0,630 0,16608 6,782 1,218 1,485 0,21898 7,847 0,153 0,023 0,00304 5,877 -1,877 3,523 0,59954 2,849 1,151 1,324 0,46491 0,894 0,106 0,011 0,0126
TOTAL 1,7504gl=7−1=6α=0.05
XTeorico2=12.59
Se observa que: XCalculado2<XTeorico
2 Por lo tanto si se acepta la hipótesis que los camiones siguen una distribución uniforme.
4° AHORA GENERAREMOS 1000 TIEMPOS DE LLEGADA USANDO MONTECARLO.
a) Histograma relativo acumulado de la tabla de tiempos
160 180 200 220 240 260 280 300 320 3400
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1HISTOGRAMA ACUMULATIVO RELATIVO
TIEMPO
FR
EC
UE
NC
IA R
EL
AT
IVA
Hewlett-Packard[Escriba el título del documento]
11
x y165.00 0.000189.71 0.067214.43 0.167239.14 0.433263.86 0.700288.57 0.833313.29 0.967338.00 1.000
Con estos puntos haremos regresión de grado n>4 que mejor se ajuste a estos
puntos
Pero la que realmente necesitamos es la función inversa a esta, entonces:
150.00 200.00 250.00 300.00 350.000.000
0.200
0.400
0.600
0.800
1.000
1.200
f(x) = 5.67348E-11 x⁵ − 0.0000000694058 x⁴ + 0.0000328915 x³ − 0.00752285 x² + 0.834499817 x − 36.1278806R² = 0.997635777973995
LINEA DE TENDENCIA
TIEMPO
FREC
UEN
CIA
Hewlett-Packard[Escriba el título del documento]
12
0.000 0.200 0.400 0.600 0.800 1.000 1.2000.00
50.00
100.00
150.00
200.00
250.00
300.00
350.00
400.00
f(x) = 1441.0576 x⁵ − 3727.1982 x⁴ + 3785.8517 x³ − 1842.4811 x² + 512.48808 x + 164.28755R² = 0.996789154897319
LINEA DE TENDENCIA
FRECUENCIA
TIEM
PO
y x0.000 165.000.067 189.710.167 214.430.433 239.140.700 263.860.833 288.570.967 313.291.000 338.00
5| ACONTINUACION SE SIMULA 1000 TIEMPOS DELLEGADA USANDO LA FUNCION POLINOMICA INVERSA:
En el Matlab crearemos un código para simular los 1000 tiempos de llegada.clear;clc;x=rand(1000,1);y=1441.1*x.^5-3727.2*x.^4+3785.9*x.^3-1842.5*x.^2+512.49*x+164.29;
RESULTADOS DEL CODIGO
Hewlett-Packard[Escriba el título del documento]
13
RANDON TIEMPO SIMULADO0.84 285.780.25 223.670.81 281.250.24 222.630.93 306.730.35 231.910.20 217.450.25 223.360.62 256.930.47 242.700.35 232.050.83 284.020.59 253.730.55 250.120.92 303.180.29 226.530.76 273.030.75 272.580.38 234.460.57 251.950.08 194.100.05 187.140.53 248.240.78 275.990.93 308.210.13 207.060.57 252.050.47 242.330.01 170.130.34 230.850.16 212.680.79 278.170.31 228.690.53 248.010.17 213.210.60 255.460.26 224.48
0.65 260.980.69 264.850.75 271.860.45 240.600.08 196.350.23 221.150.91 302.110.15 211.100.83 283.160.54 248.981.00 332.240.08 194.770.44 239.880.11 202.120.96 317.810.00 166.630.77 275.400.82 281.740.87 291.290.08 196.520.40 236.110.26 224.190.80 279.030.43 238.870.91 301.370.18 215.530.26 224.560.15 209.940.14 208.240.87 291.410.58 253.160.55 250.130.14 209.840.85 288.100.62 257.560.35 231.990.51 246.510.40 236.280.08 194.130.24 222.270.12 205.750.18 215.810.24 222.27
Hewlett-Packard[Escriba el título del documento]
14
REALIZAMOS SU RESPECTIVO HISTOGRAMA DE 1000 DATOS SIMULADOS
176.649 49200.831 123225.014 249249.196 259273.319 187297.562 82321.744 51
MARCA DE CLASE
FRECUENCIA
Hewlett-Packard[Escriba el título del documento]
15
RESULTADOS
HACEMOS LA PRUEBA CHI CUADRADO
OBSERVADO (Obs) ESTIMADO (Est) Obs-Est (Obs-Est)^2 (Obs-Est)^2/Est49 39.988 9.012 81.209 2.0308
123 121.323 1.677 2.812 0.0232249 229.971 19.029 362.099 1.5745259 272.347 -13.347 178.153 0.6541187 201.509 -14.509 210.497 1.044682 93.150 -11.150 124.323 1.334651 26.903 24.097 580.685 21.5847
TOTAL 28.2466
gl=7−1=6α=0.05
XCalculado2=28.2466
XTeorico2=12.59
Se observa que: XCalculado2>XTeorico
2