Download - analisis de datos en ingenieria

UNIVERSIDAD DEL NORTEDIVISION DE INGENIERIAS

DEPARTAMENTO DE INGENIERIA INDUSTRIAL

ANÁLISIS DE DATOS EN INGENIERIA I

TALLER

1. Para hacer más sencillos todos los análisis respectivos recurrimos al software

estadístico Statgraphics, el cual es una herramienta que permite automatizar de

forma clara y sencilla todos nuestros cálculos. En el archivo adjunto de Excel, y de

Statgraphics, están resumidos todos los cálculos hechos durante la investigación.

a) Nuestra variable de interés son tiempos de atención, en minutos.

En primer lugar, hacemos el respectivo gráfico de líneas:

1

No observamos ningún patrón extraño que indique correlación entre los tiempos

tomados. Para trazar el histograma, debemos seguir la siguiente secuencia de

comandos:

Por defecto, Statgraphics usa una cantidad irrisoria de clases. Nosotros usamos la

cantidad óptima, que es 6:

2

Este histograma será analizado de manera detallada en incisos posteriores.

b) Para este paso, nos valemos de Microsoft Excel.

Medidas de Centralización:

CentralizaciónMedia 7,51

Mediana 5,93Moda 2,4

3

Vemos que, la moda es menor a la Mediana, y esta a la vez menor a la media.

Esto nos indica una distribución sesgada a la derecha.

Medidas de posición:

PosiciónCuartil 1 3,70Cuartil 2 5,93Cuartil 3 8,12

Según los resultados, el 75% de los datos se encuentra entre 3,7 y 8,12. Esto

supone una alta variabilidad entre los datos.

Medidas de dispersión:

DispesiónVarianza 35,80

Desviación 5,98Coef var 0,17

Rango InterQ 4,42

Tenemos un coeficiente de variación relativamente pequeño, lo que indica que la

dispersión dentro del rango inter cuartil es pequeña.

c) Dado el sesgo hacia la derecha en la distribución, y el hecho de trabajar con

tiempos, podemos suponer que se trata de una distribución exponencial. Así,

procedemos a hacer la prueba de bondad de ajuste respectiva, donde debe

estimarse un solo parámetro, el tiempo promedio de atención:

4

H 0 : t Proviene deuna poblaciónexponencialmente distribuida

H 1: t no Proviene deuna poblaciónexponencialmente distribuida

5

Como el p valor de la prueba es superior a 0,05, no puede rechazarse la hipótesis

nula; es decir, los tiempos de atención se ajustan a una distribución exponencial

con una confiabilidad del 95%.

d) Para la distribución exponencial:

F ( x )=1−e−βx

Donde β=7,51 minutos. Además:

σ=β=7,51

Los límites para dos desviaciones de distancia de la media son:

LI=7,51−2∗7,51=−7,51 ; LI=7,51+2∗7,51=22,53

7

En la muestra, hay 29 datos que cumplen esta condición, lo que representa un

93,5% del total. Usando la distribución exponencial:

F ( X=22,53 )=1−e−7,51(22,53)=1

Así, hay un distanciamiento significativo en ambos resultados. Esto podemos

atribuirlo al hecho de que el tamaño de la muestra es relativamente pequeño.

e) Los primeros 16 datos fueron tomados durante la mañana, mientras que los

otros dos durante la tarde. Así, procederemos a hacer una prueba de medias:

H 0 :umañana=uTarde

H 1: umañana≠uTarde

Para automatizar la prueba, nos valemos nuevamente de Statgraphics.

8

Vemos que la conclusión es no rechazar la hipótesis nula con alfa del 5%, por lo

que la media en el tiempo de atención es independiente de la hora del día.

2. Para este punto, evaluamos el mismo proceso. Sin embargo, la variable a

estudiar no fue el tiempo de atención, sino la cantidad de entidades que llegaban

al sistema cada 10 minutos.

Planteamos las hipótesis:

H 0 :Las llegadas siguenunadistribución Poisson

H 1: Las llegadasno siguenunadistribución Poisson

Volvemos a hacer la prueba de bondad de ajuste en Statgraphics:

10

El p valor de la prueba es 0,477>0,05. Esto nos lleva a concluir, que, en efecto, las

entidades que llegan en un período de 10 minutos se ajustan a una distribución

Poisson.

11

3. Para la encuesta, se encontraron los siguientes lugares susceptibles de quejas

por parte de los estudiantes. En el archivo de la encuesta, iniciamos haciendo una

tabla dinámica:

Rótulos de filaSuma de Cantidad

Biblioteca 4Cafetería 8

Centro de copiado 7Centro médico 4

Otro 1Parqueadero 10

Registro 5Salas de usuario 7Zonas de deporte 1Zonas de estudio 8

Total general 55

Ordenamos las frecuencias de mayor a menor, y acumulamos:

Ítem f F F RelativaParqueadero 10 10 0,18181818

Cafetería 8 18 0,32727273Zonas de estudio 8 26 0,47272727

Centro de copiado

733 0,6

Salas de usuario 7 40 0,72727273Registro 5 45 0,81818182

Biblioteca 4 49 0,89090909Centro médico 4 53 0,96363636

Otro 1 54 0,98181818Zonas de deporte

155 1

Haciendo el respectivo gráfico de Pareto

12

Parquea

dero

Cafeter

ía

Zonas

de estu

dio

Centro

de copiad

o

Salas

de usu

ario

Regist

ro

Bibliotec

a

Centro

méd

ico Otro

Zonas

de dep

orte.000

.200

.400

.600

.800

1.000

1.200

.182.327

.473.600

.727.818

.891.964 .982 1.000

F Relativa

Ítem

Acum

ulad

o

De las 10 causas asignables encontradas, 6 acumulan el 82% de todas las quejas.

Estas 6 causan representan un 60% del total de causas. Podemos interpretar este

resultado de la siguiente manera: En particular, no hay una causa única de queja,

y puede resultar normal que alguna de estas causas presenten fallas en ciertos

momentos del tiempo, pero no permanentemente, ya que de ser así, esto se

hubiese visto reflejado en el gráfico. Por ejemplo si registro siempre prestara un

mal servicio, la gran mayoría de los encuestados se habría quejado de este lugar.

Sin embargo, esto no ocurrió.

:

13

Download - analisis de datos en ingenieria

Top Related