05 lab simulaciÓn de sistemas tratamiento de datos input analizer

39
Red de aprendizaje Modelado y Simulación Proyectos Simulación Generación Valores de Variables Aleatorias Simulación por Eventos Sistema de Colas con Servidores en Serie Sistema de Colas con Un servidor Sistemas de Colas con Servidores en Paralelo Sistemas de Inventarios Revisión Periódica Sistemas de Inventarios Punto de Repedido Sistema Combinado de: Cadena de Almacenes Sistema Combinado de: Sistema de Colas e Inventario Modelación Montecarlo

Upload: czzar-silva

Post on 24-Nov-2015

32 views

Category:

Documents


3 download

TRANSCRIPT

  • Red de aprendizaje Modelado

    y

    Simulacin

    Proyectos

    Simulacin

    Generacin

    Valores de

    Variables

    Aleatorias

    Simulacin

    por

    Eventos

    Sistema de Colas con

    Servidores en Serie

    Sistema de Colas con

    Un servidor

    Sistemas de Colas con

    Servidores en Paralelo

    Sistemas de

    Inventarios

    Revisin Peridica

    Sistemas de

    Inventarios Punto

    de Repedido

    Sistema

    Combinado de:

    Cadena de

    Almacenes

    Sistema

    Combinado de:

    Sistema de Colas e

    Inventario

    Modelacin

    Montecarlo

  • Anlisis y Tratamiento de Datos para la

    Simulacin de Sistemas

    En esta parte del curso analizaremos los inputs

    del sistema y que tratamiento debemos darles.

    Trabajarlos como datos reales o debemos ajustarlos a una distribucin?

  • Introduccin

    Modelar en la computadora un sistema del mundo real significa crear una especie de analoga digital del sistema en estudio.

    Adems, el modelo posee la capacidad de comportarse de manera semejante al sistema original de tal forma que, al interactuar con el usuario le permita la realizacin de experimentos.

    Con la intencin de obtener un mayor conocimiento y compresin del sistema real por medio de la inferencia estadstica.

  • Introduccin

    Para que un modelo pueda crear una historia artificial del sistema real, es fundamental que este traiga consigo a posibilidad de representar por si mismo un comportamiento estocstico, a semejanza de la gran mayora de los sistemas.

    En los modelos de simulacin de sistemas, este objetivo es alcanzado por la utilizacin de distribuciones de probabilidades como forma de representar la multiplicidad de ocurrencias de eventos aleatorios.

  • Introduccin

    Cuando se hace uso de distribuciones de probabilidades para representar el comportamiento de las variables aleatorias presentes en los sistemas a ser modelados, es preciso considerar los siguientes puntos:

    1. Los posibles valores que una variable puede asumir estarn dentro de la amplitud cubierta por la distribucin.

    2. La probabilidad de ocurrencia de cualquier valor en el intervalo, esta determinada por el perfil de la distribucin probabilidad de la variable en estudio.

  • El Proceso de Muestreo y Recoleccin de Datos

    Es el procedimiento inicial para identificar la distribucin de probabilidades ms adecuada

    que representar la muestra de datos.

    Tambin acostumbra ser el marco inicial de los problemas que se enfrenta en la modelacin de

    sistemas.

    Los datos estn disponibles?

    De que manera estn disponibles?

    Como recolectarlos?

    Como analizarlos?

  • Datos Determinsticos vs. Aleatorios

    Determinsticos: valores fijos

    Ejemplos:

    Numero de unidades de un recurso.

    Tiempo de transferencia de una unidad.

    Tiempos de llegadas y tiempos de procesamiento.

    Datos que no presentan variaciones.

  • Datos Determinsticos vs. Aleatorios

    Aleatorios: modelacin con base en distribuciones

    de probabilidades, en donde los valores son

    obtenidos directamente del sistema en estudio.

    Ejemplos:

    Transferencias, llegadas, procesos, tiempos, temperatura, eventos.

    Qu distribucin se utiliza?

    Que parmetros se ingresan?

    Esto implica necesariamente resultados aleatorios

  • Uso de los Datos: Alternativas y discusiones

    Usando los datos reales directamente en la simulacin:

    Los datos son ledos de archivos y usados directamente en el modelo (llegadas, servicios, tipos de entidades, tiempos, temperaturas, etc.);

    Todos los valores sern reales

    No se tendrn elementos diferentes de los ya observados

    En consecuencia se tendr que:

    Los datos sern insuficientes para muchas o largas simulaciones;

    Perder de desempeo computacional (lectura de archivos).

  • Uso de los Datos: Alternativas y discusiones

    Uso de las distribuciones de probabilidades:

    Los datos sern generados de acuerdo con una distribucin propuesta.

    Los posibles valores que la variable podr asumir estarn dentro de la amplitud cubierta por la distribucin.

    Otros valores: adems de los observados podrn ser usados los valores generados por la distribucin de probabilidad. (bien o mal?).

    La probabilidad de ocurrencia de cualquier valor en el intervalo esta determinada por el perfil de la distribucin.

    El proceso de ajuste puede no ser perfecto o adecuado (problema de validacin).

  • Recoleccin de Datos

    Generalmente es difcil, cara y rutinaria.

    El sistema puede no existir (es el proyecto de un sistema).Donde los obtenemos los datos?

    Los datos disponibles pueden no ser los deseados.(Tiempo en cola)

    Puede haber cambios en el modelo en funcin de los datos disponibles.

    Pueden ser incompletos (cantidad menor a la deseada)

    Muchos datos innecesarios.

  • Recoleccin de Datos

    La sensibilidad de los resultados es afectado por la incertidumbre en la recoleccin de datos.

    Modelos tendrn un nivel de detalle de acuerdo con la calidad de los datos.

    Capturar la variabilidad en los datos Validacin.

    Datos incoherentes entran y resultados incoherentes salen (Garbage In, Garbage out).

    Los costos de obtencin de datos deben ser incluidos en el proyecto.

  • Fuentes de Datos

    En la mayora de los casos y, dependiendo de las circunstancias, las fuentes de datos pueden ser:

    Archivos histricos (mostrando el comportamiento, resultados, etc.) del sistema; provenientes de observaciones del sistema en estudio.

    Originarios de sistemas similares;

    Determinados con base en las estimaciones de los operadores;

    Determinados con base en afirmaciones de vendedores de mquinas, equipamientos, etc.;

    Estimaciones de proyectistas de sistemas;

    Consideraciones tericas sobre el sistema. .

  • Muestreo

    Planeamiento y Observacin Preliminar.

    1. Planeamiento.

    Pre - observacin de la situacin. Recolectar datos de cuanto se observa.

    Como recolectar en Circunstancias no usuales?

    2. Utilidad de los Datos Recolectados. Son adecuados para las distribuciones? Son tiles?

    No existe la necesidad de recolectar dados superfluos.

    3. Conjuntos Homogneos de Datos. Combinar datos en conjuntos homogneos.

    4. Relaciones entre Variables Diagrama de dispersin.

    Independencia de las Observaciones.

    Considerar la posibilidad de autocorrelacin.

  • Puntos importantes en la bsqueda de los datos

    Identificacin de las entidades (tipos de clientes); Identificacin de sus procesos (actividades con los

    recursos del banco);

    Identificacin de los recursos utilizados (las cajas)

    A partir de estos elementos, buscar e identificar:

    Los parmetros de la VA involucradas. Tiempos de ocurrencias de los eventos. Evento llegada del cliente. Evento fin del proceso (depende de la duracin de las

    actividades)

    Verificar si los datos recolectados son homogneos. Verificar cual es tamao de muestra adecuada.

  • Muestra -Homogeneidad de los Datos

    Por ejemplo en una agencia bancaria tendramos que tener en lo siguiente:

    Considerar los clientes que se dirigen a las cajas.

    Periodos crticos en da (ms congestionados).

    Das considerados normales.

    Las distribuciones de las llegadas de los clientes durante el Horario comercial son diferentes.

  • Muestra -Homogeneidad de los Datos

    Puede ser que algunos das de la semana el comportamiento de las llegadas sean semejantes.

    Las informaciones pasadas por la gerencia facilitan sobremanera, el proceso de recoleccin de datos.

    No siempre existe la posibilidad, que se realicen recoleccin de muestras sobre los innumerables perodos de diversidad de la demanda.

  • Tamao de Muestra

    Definidos los periodos en que la recoleccin ser realizada, el prximo paso en el planeamiento es la determinacin del tamao de muestras.

    La palabra clave en el muestreo (Tamao de muestra) es la Representatividad.

    Cul debe ser el tamao de las muestras a ser recolectadas durante los periodos ya definidos?

    El concepto de representatividad de la muestra puede ser reseada a travs del ejemplo de lanzar un dado.

  • Tamao de Muestra

    Cuntas veces tendremos que lanzar un dado para que podamos afirmar que los posibles resultados {1, 2, 3, 4, 5, 6}, tienen una misma posibilidad de ocurrencia?

  • Relacin entre el Tamao de Muestra y la

    Variable Aleatoria a Generar.

    Vamos a imaginar, que el verdadero valor de la variable TELL en el periodo de las 10:00 y las 11:00 horas ser perfectamente descrito por una distribucin exponencial con media 2 min.

    Veamos lo que ocurre cuando recolectamos las muestras con tamaos que varan de 10 a 100 elementos.

    Valores obtenidos con

    el Input

    Analyzer

    Experimento Tamao. de muestra Valor del Parmetro

    1 10 EXPO(2,45)

    2 20 EXPO(2,78)

    3 30 EXPO(2,26)

    4 40 EXPO(2,13)

    5 50 EXPO(1,98)

    6 100 EXPO(2,01)

  • Importancia de un Buen Ajuste

    Vea el ejemplo del empleo de una distribucin Exponencial.

    Muestra con 500 valores

    Experimento

    Parmetro

    Utilizado

    Parmetro

    Calculado

    Valor Mx.

    en la muestra

    1 2,0 2,03 10,5

    2 2,2 1,97 14,4

    3 2,4 2,44 14,8

    4 2,6 2,56 23,9

    5 2,8 2,81 24,6

  • Conceptos bsicos del muestreo

    Si la varianza de la poblacin es desconocida, que es lo que mas frecuente se ve en la prctica el tratamiento ser diferente, no es posible encontrar una frmula cuando la varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el siguiente procedimiento:

    Se toma una pequea muestra, que se le llama muestra piloto, con ella se estima la varianza poblacional (2) y con este valor se evala en la formula siguiente:

    2

    12

    d

    Zsn 1dxP

    Donde se sustituye (2) por su estimacin (s2). Donde el valor de d por lo general es un valor es menor o igual a 0.1

    El valor de d = 0.1 es tomado en forma estndar.

  • Conceptos bsicos del muestreo

    Tomar una muestra piloto de tamao n

    valores (100 valores mnimo)

    Calcular la varianza muestral (s) de los n valores

    n* n

    Calcular el nmero (n*) nuevo tamao de muestra

    adicionales

    NO

    SI

    Tomar una nueva muestra de tamao n=n* valores

    Fin del procedimiento

    2

    12

    *

    d

    Zsn

  • Identificacin de la Distribucin Terica de

    Probabilidades

    El siguiente paso en el proceso de anlisis de los datos recolectados es la identificacin de una distribucin terica

    de probabilidades.

    La utilizacin de grficos, tales como un histograma, son muy tiles para la identificacin o delineamiento de la

    distribucin terica de probabilidades.

    La construccin de un histograma permite dar inicio al proceso de inferencia sobre una distribucin terica de

    probabilidades.

    Las hiptesis sobre cual distribucin adoptar deben estar basadas en el contexto del sistema en estudio y en el perfil

    del histograma obtenido.

  • Principales Distribuciones Continuas y sus

    aplicaciones

    Uniforme: Se aplica en procesos en los cuales las probabilidades de ocurrencia de los eventos son o se

    asumen iguales.

    Normal: Es una de las distribuciones ms importantes y utilizadas en amplia gama de situaciones. Esta gran

    utilizacin se debe fundamentalmente al Teorema del

    Lmite Central.

    Exponencial: Todo lo referido a duracin tiempo entre eventos, por ejemplo tiempo de llegadas en un sistema de

    colas.

  • Principales Distribuciones Continuas y sus

    aplicaciones

    Triangular: Se emplea la tcnica de administracin de

    proyectos PERT y fenmenos para los cuales se produzcan

    eventos que tengan marcas MINIMA, NORMAL o ms

    COMUN y MAXIMA.

    Lognormal:

    Para describir la vida til de sistemas mecnicos y electrnicos.

    Abundancia de especies de animales.

    Concentracin de elementos qumicos en materiales geolgicos.

    Periodos de incubacin de enfermedades infecciosas.

    En econometra para caracterizar econmicos asimtricos.

  • Principales Distribuciones Continuas y sus

    aplicaciones

    Erlang:

    Duracin de K procesos secuenciales, c/u de ellos con la misma duracin promedio 1/ y distribucin exponencial.

    Para el ajuste de datos empricos en teora de colas, confiabilidad, reemplazos e inventarios, (en este caso K no

    tiene interpretacin fsica).

    Weibull: Fue establecida por el fsico suizo Weibull quien

    demostr que el esfuerzo al que se someten los materiales

    puede modelarse de manera adecuada mediante el empleo

    de esta distribucin.

    Tambin. se ha usado para modelar situaciones del tipo tiempo- falla, bien puede indicar la vida til de cierto

    artculo, planta o animal, confiabilidad de un componente.

  • Principales Distribuciones Continuas y sus

    aplicaciones

    Gamma: se ha utilizado frecuentemente en variables tales como:

    El tiempo ( espacio) requerido para observar ocurrencias del evento A en el intervalo t ( regin del espacio ), sucesos del tipo Poisson.

    Problemas de trfico en lneas telefnicas, ERLANG, 1900.

    Flujos mximos, MARKOVIC, 1965.

    Resistencia de componentes del concreto reforzado, TICHY VARLIETK, 1965.

    Altura de la precipitacin mensual, WHITCOMB, 1940.

    Tiempo de falla de un sistema de componentes, cada uno falla con frecuencia.

    Ingresos familiares.

    Edad del hombre al contraer matrimonio por primera vez.

    Tiempo total para completar una operacin, s sta se lleva a cabo en subestaciones a una frecuencia.

  • Principales Distribuciones Continuas y sus

    aplicaciones

    Beta: Sea un fenmeno aleatorio y X una variable aleatoria que puede

    representar una caracterstica fsica cuyos valores se encuentran

    restringidos a un intervalo de longitud finita. Tales como:

    Proporcin de impurezas en un producto qumico.

    La fraccin de tiempo que una mquina est en reparacin.

    La proporcin vendida de un lote durante un tiempo t.

    La humedad relativa medida en cierto lugar.

    Porcentaje del costo total destinado a reparacin de maquinaria.

    Porcentaje de costo adicional destinado a reparacin de maquinaria.

    La distribucin del tiempo necesario para completar una fase del proyecto PERT.

    Evaluacin de programas y tcnicas de revisin.

  • Principales Distribuciones Discretas y sus

    aplicaciones

    Poisson: La variable aleatoria representa el nmero de eventos que ocurren durante un intervalo de tiempo.

    Uniforme discreta: Esta variable presenta una probabilidad constante para diferentes valores discretos que toma la variable aleatoria.

  • Caso de aplicacin

    Un sistema de tramite documentario tiene la siguiente descripcin:

    Los clientes llegan al sistema con un tiempo entre llegadas que esta descrito por la muestra de datos ubicados en el archivo TELL.txt. Si la cola es muy larga

    (mximo de 7 personas) proceden a abandonar el sistema.

    Luego pasan a la estacin de recepcin cuyo tiempo de servicio se encuentra definido por la data TS1.txt. En esta parte cliente puede abandonar el sistema

    por falta de algn requisito.

    Luego son atendidos por dos servidores en paralelo cuyos tiempos de servicio se pueden calcular segn la data que se encuentra en los archivos TS2.txt y

    TS3.txt. Donde se llenaran los formularios que sern presentados al ultimo

    empleado

    Este ultimo empleado da conformidad o no de que el tramite se concluyo satisfactoriamente. Si no se concluyo satisfactoriamente, el cliente tendr que

    volver al servidor anterior para subsanar los errores cometidos en el proceso,

    este rechazo sucede con una incidencia del 7% de las veces, si termina

    satisfactoriamente el cliente sale del sistema.

    El tiempo de servicio de este empleado esta dado por la muestra que se encuentra contenida en el archivo TS4.txt

  • Caso de aplicacin Representacin del sistema

  • Caso de aplicacin

    Inputs del sistema no controlables:

    TELL ~ TELL.txt

    TS1 ~ TS1.txt

    TS2 ~ TS2.txt

    TS3 ~ TS3.txt

    TS4 ~ TS4.txt

    Cola mxima 1

    % de falta de requisito

    % de inconformidad en el proceso de atencin.

    Inputs del sistema controlables:

    Horario de trabajo

    # Operarios

    Inicio del tiempo de descanso

    Duracin del tiempo de descanso

    Salario, etc.

  • Ajuste de Distribuciones con el Arena Input Analyzer

    Objetivos y necesidades:

    Seleccionar una distribucin de probabilidades para ser usada en la generacin de datos para el modelo de simulacin.

    Obtener una muestra de datos (IID Independiente e idnticamente distribuida) recolectado del sistema real.

    Arena Input Analyzer

    Aplicacin independiente

    Tambin accesible va el men Tools;

    Realiza un proceso de ajuste.

    Calcula una expresin vlida en el Arena pasando esta expresin directamente al modelo va un Copy/Paste.

  • Ajuste de Distribuciones con el Arena Input Analyzer

    Ajuste = decidir sobre el tipo de distribucin (exponencial, normal, emprica, etc.) y estimar sus parmetros;

    Diferentes mtodos (Mxima semejanza, mnimos cuadrados, ...)

    Realizando de pruebas de Hiptesis para hallar la mejor distribucin

    H0: la distribucin escogida representa adecuadamente los datos

    Probar el valor de p (mayor > mejor)

    Verificar ajuste entre distribucin terica X emprica;

    Trabaja con datos de distribuciones continuas y discretas;

    Realiza Best fit entre varias distribuciones

  • Archivos de Datos para el Input Analyzer

    Crear un archivo de datos (editores, platillas, etc...)

    Debe ser del tipo ASCII (guardado o exportado);

    Los Datos deben estar separados por blancos (espacios, tab., nuevas lneas)

    Acepta tambin formato libre Abrir archivo a partir del Input Analyzer

    menu File/New o menu File/Data File/Use Existing Get histogram, basic summary of data Para ver los datos: menu Window/Input Data

  • El Menu Fit

    Verifica distribuciones (pruebas de ajuste); Verifica a forma de distribuciones especficas Disea la funcin de densidad sobre un histograma

    (visual); Calcula la expresin exacta (parmetros) para Copy y Paste al modelo de simulacin;

    Puede incluir limites (offset), dependiendo de la distribucin;

    Calcula los resultados de la prueba de ajuste. Pruebas de Chi-cuadrado y Kolmogorov - Smirnov

    Lo ms importante: valor de p, siempre entre 0 y 1; Si p pequeo (< 0.05): ajuste pobre; El uso de la distribucin ajustada puede presentar un

    conjunto de datos ms inconsistentes de lo que el conjunto de datos de la muestra, en funcin de la probabilidad de puntos extremos.

  • El Menu Fit

    Verifica distribuciones (pruebas de ajuste); Verifica a forma de distribuciones especficas Disea la funcin de densidad sobre un histograma

    (visual); Calcula la expresin exacta (parmetros) para Copy y Paste al modelo de simulacin;

    Puede incluir limites (offset), dependiendo de la distribucin.

    Calcula los resultados de la prueba de ajuste. Pruebas de Chi-cuadrado y Kolmogorov - Smirnov

    Lo ms importante: el valor de p, siempre entre 0 y 1; Si p pequeo (< 0.05): ajuste pobre; El uso de la distribucin ajustada puede presentar un

    conjunto de datos ms inconsistentes de lo que el conjunto de datos de la muestra, en funcin de la probabilidad de puntos extremos.

  • Caso de aplicacin

    Inputs del sistema:

    TELL~NORM(4.07, 1.49)

    TS1~TRIA(9, 11.9, 14)

    TS2~NORM(12, 1.28)

    TS3~5 + EXPO(7.97)

    TS4~8 + GAMM(6.13, 1.95)

    Cola mxima 1

    % de falta de requisito

    % de inconformidad en el proceso de atencin.