David R. González-Barreto Estadísticas Industriales Marzo 2010 1
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estadísticas Industriales
Presentado en:
Stryker, Puerto Rico
David R. González-Barreto Estadísticas Industriales Marzo 2010 2
Prin EDA DistEstim Hyp Cont Cap R&RMues
Variabilidad
• Virtualmente, todos los procesos y sistemas del mundo real exhiben
variabilidad. Las estadísticas son fundamentales en el mejoramiento de la
calidad debido a que las técnicas estadísticas se utilizan para describir y
entender la variabilidad. En efecto estas técnicas se han utilizado para
reducir: el re-trabajo, los desperdicios, la necesidad de inspección y los
costos de garantía.
David R. González-Barreto Estadísticas Industriales Marzo 2010 3
Prin EDA DistEstim Hyp Cont Cap R&RMues
Variabilidad
• ¿Por qué ocurre la variabilidad?
– En términos generales, la variabilidad es el resultado de cambios en las condiciones de los procesos y/o sistemas en donde las medidas se efectúan. En manufactura estos cambios se pueden deber a cambios en las propiedades de los materiales, diferencias en la manera en que las personas realizan su trabajo, diferencias en los parámetros del proceso y finalmente también puede deberse al sistema de medida.
– El campo de las probabilidades y estadísticas consiste de métodos para describir y modelar la variabilidad y para tomar
decisiones cuando ésta está presente.
David R. González-Barreto Estadísticas Industriales Marzo 2010 4
Prin EDA DistEstim Hyp Cont Cap R&RMues
Clasificación de los datos
• Los datos tienen dos clasificaciones: datos contínuos o por variable
y datos categóricos o por atributo.
– Datos por variable - decimos que la escala podría ser
infinitamente subdivisible y que está determinada por el
instrumento de medida.
– Datos por atributo - decimos que la escala es meramente
un conteo, ejemplo de esto sería la clasificación del número de
artículos defectuosos encontrados en una muestra.
David R. González-Barreto Estadísticas Industriales Marzo 2010 5
Prin EDA DistEstim Hyp Cont Cap R&RMues
Definiciones
• Estadísticas - Es la ciencia y el arte de recopilar, mostrar e interpretar
datos con el propósito de probar teorías y hacer inferencias acerca de todo
tipo de fenómenos.
• Análisis Exploratorio de Datos (Exploratory Data Analysis –
EDA) – Es el arte de mostrar los datos con un formato atractivo, que a su
vez proporcione información de interés para el ingeniero o científico.
David R. González-Barreto Estadísticas Industriales Marzo 2010 6
Prin EDA DistEstim Hyp Cont Cap R&RMues
Definiciones
• Entre las herramientas más utilizadas encontramos:
Diagrama de Punto (Dot Diagram)
Histograma de Frecuencia
Diagrama de Pareto
Gráficos de Caja (Boxplots)
Sencillo
Múltiple
Diagrama de Dispersión (Scatter Diagram)
David R. González-Barreto Estadísticas Industriales Marzo 2010 7
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Punto
• El diagrama de punto es un gráfico muy útil para mostrar conjuntos
pequeños de datos, regularmente hasta alrededor de veinte observaciones.
El mismo permite observar fácilmente la localización o la tendencia central
así como la dispersión o variabilidad en los datos. Estos diagramas, con
frecuencia, nos ayudan a comparar dos o más conjuntos de datos.
David R. González-Barreto Estadísticas Industriales Marzo 2010 8
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Punto - Ejemplo
Considere los siguientes datos que se refieren al esfuerzo en
tensión de un tipo de cemento cuando se le añade un polímero (P).
16.85 16.40 17.21 16.35 16.52
17.04 16.96 17.15 16.59 16.57
El siguiente sería el diagrama de punto correspondiente a estos
valores. Dot Diagram
P
Fre
que
ncy
16.3 16.5 16.7 16.9 17.1 17.3 17.5
0
1
David R. González-Barreto Estadísticas Industriales Marzo 2010 9
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Punto - Ejemplo
Suponga que los siguientes diez valores corresponden al esfuerzo
en tensión de muestras de cemento sin el polímero.
17.50 17.63 18.25 18.00 17.86
17.75 18.22 17.90 17.96 18.15
. . ... . . . . .
---+---------+---------+---------+---------+---------+---P
. . . .. .. . :
---+---------+---------+---------+---------+---------+---SP
16.45 16.80 17.15 17.50 17.85 18.20
David R. González-Barreto Estadísticas Industriales Marzo 2010 10
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Punto - Ejemplo
• En el diagrama de punto anterior puede notarse que el cemento al que se le añade el polímero (P) resulta en un esfuerzo en tensión menor al cemento (SP) común considerado. No obstante, podríamos decir que la variabilidad inherente dentro de cada grupo
es fundamentalmente la misma.
• Cuando el número de datos disponibles es relativamente grande,construir un diagrama de punto no es muy eficiente. Otras técnicasque se discutirán a continuación resultarán ser mucho másefectivas.
David R. González-Barreto Estadísticas Industriales Marzo 2010 11
Prin EDA DistEstim Hyp Cont Cap R&RMues
Histograma
• Una distribución de frecuencia es una forma compacta de resumir los
datos. Se obtiene de dividir el rango de los datos en intervalos comúnmente
llamados celdas. El número de celdas dependerá del número de
observaciones así como de la dispersión encontrada.
• A la representación gráfica de una distribución de frecuencia es a lo que
llamamos histograma.
David R. González-Barreto Estadísticas Industriales Marzo 2010 12
Prin EDA DistEstim Hyp Cont Cap R&RMues
Histograma - Ejemplo
La siguiente tabla muestra el octanaje de varias marcas de
gasolina. 88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 96.5 93.3
94.7 91.1 91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7
84.3 86.7 88.2 90.8 88.3 98.8 94.2 92.7 93.2 91.0
90.1 93.4 88.5 90.1 89.2 88.3 85.3 87.9 88.6 90.9
89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.4 88.9 91.2 89.3 84.4 92.7 91.8
91.6 90.4 91.1 92.6 89.8 90.6 91.1 90.4 89.3 89.7
90.3 91.6 90.5 93.7 92.7 92.2 92.2 91.2 91.0 92.2
90.0 90.7
David R. González-Barreto Estadísticas Industriales Marzo 2010 13
Prin EDA DistEstim Hyp Cont Cap R&RMues
Histograma - Ejemplo
Histogram for Octanaje
82 86 90 94 98 102
Octanaje
0
10
20
30
40
freq
uen
cy
David R. González-Barreto Estadísticas Industriales Marzo 2010 14
Prin EDA DistEstim Hyp Cont Cap R&RMues
Histograma - Ejemplo
• La siguiente gráfica presenta la distribución acumulativa de los datos
nuevamente para el ejemplo del octanaje.
Histogram for Octanaje
Octanaje
freq
uen
cy
82 86 90 94 98 102
0
20
40
60
80
100
David R. González-Barreto Estadísticas Industriales Marzo 2010 15
Prin EDA DistEstim Hyp Cont Cap R&RMues
Histograma
• En la práctica se ha encontrado que utilizar entre cinco y veinte celdas
produce resultados satisfactorios. A medida que el número de
observaciones aumenta, el número de celdas también debe aumentar.
Algunos analistas (e.g. Montgomery) sugieren que este número debe ser
aproximado a la raíz cuadrada del número de observaciones.
David R. González-Barreto Estadísticas Industriales Marzo 2010 16
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Pareto
• Una variación importante al histograma cuando se utilizan datos
categóricos lo es el diagrama de Pareto. Este gráfico es altamente utilizado
en los esfuerzos de mejoramiento continuo de la calidad en donde las
categorías representan, por ejemplo, tipos de defectos, modos de falla y
problemas del proceso. Las categorías son ordenadas en forma
descendente.
• El nombre de este diagrama se debe a un economista italiano cuya ley (Ley
de Pareto) puede interpretarse dentro del ambiente industrial de la
siguiente forma: “la mayoría de los defectos se debe a sólo un puñado de
las categorías”.
David R. González-Barreto Estadísticas Industriales Marzo 2010 17
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Pareto - Ejemplo
La siguiente tabla muestra defectos estructurales en las puertas de
un tipo de automóvil.
Categoría Frecuencia
Abolladuras 4
Fallos en pintura 6
Fallos en lubricación 5
Fallos de contorno 30
Fuera de secuencia 8
Fallos en terminación 3
David R. González-Barreto Estadísticas Industriales Marzo 2010 18
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Pareto - Ejemplo
Pareto Chart for Frecuencia
freq
uen
cy
0
10
20
30
40
50
60
Fallos de contornoFuera de secuencia
Fallos en pinturaFallos en lubricació
AbolladurasFallos en terminació
53.57
67.86
78.5787.50
94.64100.00
David R. González-Barreto Estadísticas Industriales Marzo 2010 19
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Pareto - Ejemplo
• En el Diagrama de Pareto anterior podemos observar que las primeras tres
categorías ordenadas resultan en alrededor del 79% de las fallas totales.
• Variaciones al Diagrama de Pareto incluyen:
• “Diagramas de Pareto Pesados”
• “Diagramas de Pareto Anidados”
David R. González-Barreto Estadísticas Industriales Marzo 2010 20
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja (Boxplot)
• Un gráfico de caja es una representación esquemática de la mediana muestral, de las cuartilas inferior y superior, y de la observación máxima y mínima de un conjunto de datos. Como muestra la figura en la página siguiente, se construye una caja cuyos extremos corresponden a las cuartilas inferior y superior y unas líneas verticales que salen de los extremos de la caja para representar la observación máxima y mínima respectivamente. Finalmente, una línea corta la caja y representa la mediana muestral.
David R. González-Barreto Estadísticas Industriales Marzo 2010 21
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja (Boxplot)
Cuartila – 75%
Cuartila – 25%
Observación Mínima
Observación Máxima
Mediana
David R. González-Barreto Estadísticas Industriales Marzo 2010 22
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja (Boxplot)
• Un gráfico de caja provee una representación gráfica simple de la forma del
conjunto de datos. Note que la mitad de las observaciones están
contenidas en la caja y la otra mitad fuera de ella. Si un histograma
muestra simetría, entonces las líneas del “boxplot” deben ser de un largo
similar y la mediana debe estar localizada en la vecindad del centro de la
caja. Si los datos están sesgados, las líneas no serán de igual largo y la
mediana no se localizará cerca del centro de la caja. Muchos paquetes
estadísticos representan valores espúreos (“outliers”) con asteriscos fuera
de las líneas de los valores máximos.
David R. González-Barreto Estadísticas Industriales Marzo 2010 23
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja - Ejemplo
Los datos para la radiación emitida por 42 hornos de microondas
se presentan en la siguiente tabla.
0.15 0.09 0.18 0.10 0.05 0.12 0.08
0.05 0.08 0.10 0.07 0.02 0.01 0.10
0.10 0.10 0.02 0.10 0.01 0.40 0.10
0.05 0.03 0.05 0.15 0.10 0.15 0.09
0.08 0.18 0.10 0.20 0.11 0.30 0.02
0.20 0.20 0.30 0.30 0.40 0.30 0.05
David R. González-Barreto Estadísticas Industriales Marzo 2010 24
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja - Ejemplo
Box-and-Whisker Plot
Radiacion
0 0.1 0.2 0.3 0.4
David R. González-Barreto Estadísticas Industriales Marzo 2010 25
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja - Ejemplo
• Como puede observarse, las radiaciones emitidas con valor igual a 0.4 son
identificadas por este gráfico como valores espúreos. También se puede
notar del gráfico que la distribución de las radiaciones parece sesgarse
hacia los valores altos.
• Los diagramas de caja son muy útiles para hacer comparaciones entre
conjuntos o poblaciones de datos. En el siguiente ejemplo se muestra este
uso al comparar dos poblaciones de bombillas.
David R. González-Barreto Estadísticas Industriales Marzo 2010 26
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja - Ejemplo
Un estudio se realiza para comparar el efecto de dos distintos
filamentos (Tipo A, Tipo B) en el número de horas de servicio de unas bombillas. Diez observaciones para cada tipo de filamento
aparecen en la siguiente tabla.
A B
1293 1643 1061 1138
1380 1466 1065 1143
1614 1627 1092 1094
1497 1383 1017 1270
1340 1711 1021 1028
David R. González-Barreto Estadísticas Industriales Marzo 2010 27
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Caja - Ejemplo
Este boxplot muestra claramente cómo el filamento Tipo A
redunda en largos de vida mucho mayores que el Tipo B, pero a su vez induce una mayor variabilidad.
A
B
Box-and-Whisker Plot
1000 1200 1400 1600 1800
Horas
Tip
o
David R. González-Barreto Estadísticas Industriales Marzo 2010 28
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Dispersión
• Los gráficos estudiados hasta el momento nos ayudan a entender la
distribución de una variable. Los diagramas de dispersión son útiles para
estudiar la relación entre dos variables. Esta gráfica presenta simplemente
pares ordenados (xi , yi), con el propósito de detectar alguna relación entre
las variables.
David R. González-Barreto Estadísticas Industriales Marzo 2010 29
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Dispersión
David R. González-Barreto Estadísticas Industriales Marzo 2010 30
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Dispersión
Relación positiva - los puntos en el diagrama siguen una trayectorialineal ascendente.
Relación negativa - los puntos en el diagrama siguen una trayectorialineal descendente, o sea, mientras una de las variables disminuye la otraaumenta.
Relación no lineal – los puntos en el diagrama siguen una trayectoriacurvilínea.
• Relación no sistemática – los puntos en el diagrama muestran un patrón aleatorio que no sigue ninguna de las relaciones antes indicadas. Esto puede ser interpretado como la independencia entre ambas variables.
David R. González-Barreto Estadísticas Industriales Marzo 2010 31
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Dispersión
Ejemplo• En la tabla que se presenta a continuación y representa la pureza del
oxígeno producida por un proceso químico mientras que x es el porcentaje
de hidrocarbonos presentes en el condensador de la unidad de destilación.
David R. González-Barreto Estadísticas Industriales Marzo 2010 32
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Dispersión
Ejemplo
Observación x y
1 0.99 90.01
2 1.02 89.05
3 1.15 91.43
4 1.29 93.74
5 1.46 96.73
6 1.36 94.45
7 0.87 87.59
8 1.23 91.77
9 1.55 99.42
10 1.40 93.65
11 1.19 93.54
12 1.15 92.52
13 0.98 90.56
14 1.01 89.54
15 1.11 89.85
16 1.20 90.39
17 1.26 93.25
18 1.32 93.41
19 1.43 94.98
20 0.95 87.33
David R. González-Barreto Estadísticas Industriales Marzo 2010 33
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Dispersión
Ejemplo
Plot of Y vs X
0.87 1.07 1.27 1.47 1.67
X
87
90
93
96
99
102
Y
David R. González-Barreto Estadísticas Industriales Marzo 2010 34
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diagrama de Dispersión
Ejemplo• La inspección de este diagrama indica que aunque ninguna curva
contendría exactamente todos los puntos, una relación lineal positiva
parece existir entre estas dos variables.
• Nota de cautela: El que este diagrama muestre una relación aparente
entre las variables no puede tomarse como que existe una causalidad entre
éstas.
David R. González-Barreto Estadísticas Industriales Marzo 2010 35
Prin EDA DistEstim Hyp Cont Cap R&RMues
Población Muestra
x1
x2
Parámetros Estadísticas
x3
x4
xn
:
.
Muestra vs. Población
,.......,,, 2 rSSx
David R. González-Barreto Estadísticas Industriales Marzo 2010 36
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Tendencia Central
• Promedio muestral
– El valor del promedio muestral tiene mayor precisión que cada
observación individual. Por lo tanto, en la mayoría de los casos
éste será representado con un dígito más que los utilizados para
las observaciones individuales.
n
n
ii
x
x 1
David R. González-Barreto Estadísticas Industriales Marzo 2010 37
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Tendencia Central
• Mediana
– La mediana es el punto en el cual la muestra es dividida en dos
mitades. Si x(1) , x(2) , …, x(n) representa una muestra ordenada
en forma ascendente, entonces la mediana se define como la
observación del medio o la observación ([n + 1] / 2) cuando n es
impar y el promedio de las dos observaciones del medio si n es
par.
David R. González-Barreto Estadísticas Industriales Marzo 2010 38
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Tendencia Central
En términos matemáticos,
• La ventaja fundamental de la mediana es que ésta no es influenciada por
valores extremos.
, n parxx
, n imparx
x n/n/
/n
2
~122
21
David R. González-Barreto Estadísticas Industriales Marzo 2010 39
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Tendencia Central
• Moda
– La moda es la observación que ocurre con mayor frecuencia en
la muestra. Cuando los dos valores más frecuentes ocurren
igual número de veces, decimos que los datos siguen una
distribución bimodal.
David R. González-Barreto Estadísticas Industriales Marzo 2010 40
Prin EDA DistEstim Hyp Cont Cap R&RMues
Cuartilas y Percentilas
• La mediana de una muestra o una población divide los datos en dos
mitades iguales. Los datos también pueden dividirse en más de dos partes.
Cuando un conjunto de datos ordenados se divide en cuatro partes iguales,
los puntos en los cuales ocurre esa división son llamados cuartilas.
David R. González-Barreto Estadísticas Industriales Marzo 2010 41
Prin EDA DistEstim Hyp Cont Cap R&RMues
Cuartilas y Percentilas
• La primera cuartila o cuartila inferior, q1, corresponde al valor que
tiene aproximadamente una cuarta parte (25%) de las observaciones bajoel mismo y aproximadamente 75% de las observaciones por encima de él.La segunda cuartila q
2, tiene aproximadamente el 50% de las
observaciones bajo su valor y corresponde a la mediana. Finalmente, la
tercera cuartila o cuartila superior, q3, tiene aproximadamente tres
cuartas partes (75%) de las observaciones bajo su valor. Como en el casode la mediana, las cuartilas pueden no ser únicas. Cuando esto ocurre,una forma simple de manejarlo es tomar el promedio como la cuartila
cuando más de una observación satisface la definición.
David R. González-Barreto Estadísticas Industriales Marzo 2010 42
Prin EDA DistEstim Hyp Cont Cap R&RMues
Cuartilas y Percentilas
Ejemplo
Las siguientes observaciones representan el tiempo en horas hasta
falla de un material eléctrico de insulación. 204 228 252 300 324 444 624 720 816 912
1176 1296 1392 1488 1512 2520 2856 3192 3528 3710
David R. González-Barreto Estadísticas Industriales Marzo 2010 43
Prin EDA DistEstim Hyp Cont Cap R&RMues
Cuartilas y Percentilas
Ejemplo
La mediana sería:
~x q2
912 1176
21044
La primera cuartila:
q1
324 444
2384
La cuartila superior:
q3
1512 2520
22016
David R. González-Barreto Estadísticas Industriales Marzo 2010 44
Prin EDA DistEstim Hyp Cont Cap R&RMues
Cuartilas y Percentilas
Ejemplo
Note que los valores de la mediana, cuartila inferior y cuartila
superior corresponden a los extremos y la línea cortante de la
caja en este gráfico.
Box-and-Whisker Plot
0 1 2 3 4(X 1000)
Tiempo
David R. González-Barreto Estadísticas Industriales Marzo 2010 45
Prin EDA DistEstim Hyp Cont Cap R&RMues
Cuartilas y Percentilas
• Cuando un conjunto ordenado de datos es subdividido en cien partes
iguales, los puntos en los cuales ocurre esa división son llamados
percentilas (pk).
David R. González-Barreto Estadísticas Industriales Marzo 2010 46
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Variabilidad
• Rango
– Una medida muy simple de la variabilidad es el rango muestral,
que se define como la diferencia entre la observación mayor y la
menor en la muestra.
r = max (xi) – min (xi)
David R. González-Barreto Estadísticas Industriales Marzo 2010 47
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Variabilidad
• Rango
– El rango muestral es fácil de obtener, pero ignora toda la
información existente en la muestra no contenida en las dos
observaciones consideradas. Cuando el tamaño de muestra es
pequeño, digamos n < 10, la información perdida al calcular el
rango no es tan significativa. En general, se prefiere una
medida de variabilidad que considere todas las observaciones
en lugar de una que considere solo unas pocas.
David R. González-Barreto Estadísticas Industriales Marzo 2010 48
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Variabilidad
• El rango entre cuartilas (“interquartile range” – IQR) se define como la
diferencia entre las cuartilas superior e inferior. El IQR es menos sensitivo
a valores extremos en la muestra que el rango muestral ordinario.
IQR = q3 – q1
David R. González-Barreto Estadísticas Industriales Marzo 2010 49
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Variabilidad
• Varianza muestral y desviación estándar muestral
– Las más importantes medidas de variabilidad lo son: la varianza
muestral y la desviación estándar muestral. Si x1 , x2 , …, xn es
una muestra de n observaciones, entonces la varianza muestral
estará dada por:
n
i
i
n
xxs
1
22
1
)(
David R. González-Barreto Estadísticas Industriales Marzo 2010 50
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Variabilidad
• La desviación estándar muestral, s, es la raíz cuadrada positiva de
la varianza muestral.
• Las unidades de la varianza muestral son el cuadrado de las unidades de la
variable original. La desviación estándar tiene la propiedad deseable de
medir la variabilidad en las unidades originales de la variable de interés x.
David R. González-Barreto Estadísticas Industriales Marzo 2010 51
Prin EDA DistEstim Hyp Cont Cap R&RMues
Medidas de Variabilidad
• Coeficiente de variación
– En ocasiones es deseable expresar la variación como una
fracción del promedio. Una medida no dimensional llamada el
coeficiente muestral de variación se usa con este propósito.
– Este coeficiente es útil cuando comparamos dos o más
conjuntos de datos que difieren considerablemente en la
magnitud de las observaciones.
x
scv
David R. González-Barreto Estadísticas Industriales Marzo 2010 52
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribuciones
• La distribución de probabilidad o simplemente la distribución de una variable aleatoria X, es una descripción del comportamiento de los posibles valores de X y sus respectivas probabilidades. En muchas ocasiones la distribución de probabilidad de la variable de interés es el resumen más útil para el analista del experimento o proceso bajo estudio.
• Las distribuciones también son clasificadas de acuerdo a los datos considerados. Es decir, tenemos distribuciones discretas o por
atributo y distribuciones continuas o por variable.
David R. González-Barreto Estadísticas Industriales Marzo 2010 53
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Binomial
• Un experimento de n intentos donde
los intentos son independientes,
cada intento tiene solamente dos posibles
resultados llamados: éxito o fracaso y
la probabilidad de éxito en cada intento,
denominada p, permanece constante
– El número de éxitos, x, tiene una distribución binomial con
parámetros p y n.
David R. González-Barreto Estadísticas Industriales Marzo 2010 54
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Binomial
• La función de probabilidad de x es:
• Si x es una variable aleatoria binomial con parámetros p y n, entonces:
nxppx
nnpxf
xnxx ,...,1,0,1,;
pnpXV
npXE
x
x
1)(
)(
2
David R. González-Barreto Estadísticas Industriales Marzo 2010 55
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Geométrica
• En una serie de pruebas Bernoulli, con probabilidad de éxito constante, p,
la variable aleatoria x representa el número de intentos hasta que ocurra elprimer éxito. Entonces x sigue una distribución geométrica con
parámetro p
,...2,1,1;1
xpppxfx
x
David R. González-Barreto Estadísticas Industriales Marzo 2010 56
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Geométrica
• Si x es una variable aleatoria con parámetro p, entonces el promedio y la
varianza de x son:
22 /1)(
/1)(
ppXV
pXE
x
x
David R. González-Barreto Estadísticas Industriales Marzo 2010 57
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Poisson
• Dado un intervalo de números reales, asuma que el conteo ocurre
aleatoriamente a lo largo del intervalo. Si el intervalo se dividiera en sub-
intervalos de tamaño pequeño de modo que:
la propabilidad de más de un conteo en un sub-intervalo es cero,
la probabilidad de un conteo en un sub-intervalo es igual para
todos los sub-intervalos y proporcional al largo del sub-intervalo
el conteo en cada sub-intervalo es independiente de otros sub-
intervalos
David R. González-Barreto Estadísticas Industriales Marzo 2010 58
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Poisson
• Si un número promedio de conteos en el intervalo es > 0, la variable
aleatoria x que representa el número de conteos en el intervalo sigue una
distribución Poisson con parámetro y la función de probabilidad de x es
,...2,1,0,!
; xx
exf
x
x
David R. González-Barreto Estadísticas Industriales Marzo 2010 59
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Poisson
• Si x es una variable aleatoria de distribución Poisson con parámetro ,
entonces el promedio y la varianza de x son
)(
)(
2 XV
XE
x
x
David R. González-Barreto Estadísticas Industriales Marzo 2010 60
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Normal
• La distribución más utilizada para el modelaje de experimentos aleatorioses la distribución normal. Esto es así porque muchos fenómenos de lanaturaleza y de procesos de manufactura tienen un “comportamientonormal”.
• Puede demostrarse además, que cuando un experimento consiste de unaserie de intentos independientes (n) y cada uno de ellos resulta en un valorobservado de una variable aleatoria proveniente de una distribuciónparticular, entonces, la variable aleatoria que representa el promedio o eltotal de los n intentos se aproximará a comportarse normalmente. Esteconcepto se conoce como el Teorema de Límite Central.
David R. González-Barreto Estadísticas Industriales Marzo 2010 61
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Normal
• La distribución normal consta de dos parámetros. El de tendencia central,
conocido como y el de dispersión, en este caso representado por la
desviación estándar .
• La función de probabilidad para la distribución normal está dada por:
0 y parámetroscon
2
1,;
2
2
2 xexf
x
x
David R. González-Barreto Estadísticas Industriales Marzo 2010 62
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Normal
• Una variable aleatoria con = 0 y 2 = 1 se le conoce como una normal estandarizada y se denota como z. Donde, z = (x - ) / para el caso de las observaciones individuales. Cuando trabajamos con promedios,
• Interpretamos z como el número de desviaciones estándar a que se encuentra x del promedio . Magnitudes altas de z corresponden a valores de x no típicos.
n
xz
David R. González-Barreto Estadísticas Industriales Marzo 2010 63
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Normal
68%
95.5%
99.73%
David R. González-Barreto Estadísticas Industriales Marzo 2010 64
Prin EDA DistEstim Hyp Cont Cap R&RMues
Distribución Normal
x
2 = 1
2 = 9
2 = 1fx(x)
5 15
David R. González-Barreto Estadísticas Industriales Marzo 2010 65
Prin EDA DistEstim Hyp Cont Cap R&RMues
Pruebas para Determinar
Normalidad• En ocasiones se quiere determinar o corroborar si una muestra de interés
proviene de una población con cierta distribución probabilística. Para esto
existen varias pruebas tanto numéricas como gráficas. Una de las pruebas
más más utilizadas para determinar si los datos provienen de una
distribución normal es la Kolmogorov-Smirnov.
David R. González-Barreto Estadísticas Industriales Marzo 2010 66
Prin EDA DistEstim Hyp Cont Cap R&RMues
Prueba para Determinar Normalidad
EJEMPLOAnalice la siguiente muestra de 60 pesos de tabletas y determine si sería correcto
inferir que la distribución que mejor representa los pesos individuales de las tabletas
es la distribución normal.
0.563 0.548 0.55 0.554 0.55 0.556
0.556 0.547 0.55 0.55 0.552 0.552
0.556 0.556 0.544 0.547 0.55 0.55
0.559 0.552 0.549 0.547 0.549 0.554
0.552 0.552 0.551 0.549 0.551 0.544
0.555 0.555 0.55 0.554 0.557 0.546
0.558 0.554 0.554 0.555 0.556 0.551
0.558 0.549 0.55 0.552 0.559 0.556
0.559 0.545 0.548 0.55 0.562 0.55
0.551 0.556 0.551 0.559 0.554 0.556
Ho: Los pesos de las tabletas siguen una distribución Normal.
Hi: Los pesos de las tabletas no siguen una distribución Normal.
David R. González-Barreto Estadísticas Industriales Marzo 2010 67
Prin EDA DistEstim Hyp Cont Cap R&RMues
Pruebas para Determinar
Normalidad• La prueba Kolmogorov-Smirnov utiliza la diferencia vertical máxima (Max. Diff.)
entre la distribución empírica y la teórica para determinar la bondad de ajuste
de la muestra observada. La prueba Kolmogorov-Smirnov es preferida sobre
la de Chi Cuadrada especialmente cuando el tamaño de la muestra es pequeño.
}Max. Diff.Empirical Dist.
Theoretical Dist.
David R. González-Barreto Estadísticas Industriales Marzo 2010 68
Prin EDA DistEstim Hyp Cont Cap R&RMues
Pruebas para Determinar
Normalidad• En todas las pruebas la forma de decidir si la hipótesis bajo consideración,
datos provienen de una distribución normal, es idéntica. El “software”
reportará un valor p, que de ser bajo (i.e. < .05) indicaría que la hipótesis se
rechaza o que los datos no provienen de una distribución normal.
David R. González-Barreto Estadísticas Industriales Marzo 2010 69
Prin EDA DistEstim Hyp Cont Cap R&RMues
Pruebas para Determinar
Normalidad• Un método gráfico para determinar si la distribución de los datos bajo
consideración es normal, es el trazo de cuantilas normales (normal
probability plot).
• Este trazo debe mostrar un comportamiento lineal para decidir
afirmativamente que los datos son normales.
David R. González-Barreto Estadísticas Industriales Marzo 2010 70
Prin EDA DistEstim Hyp Cont Cap R&RMues
Pruebas para Determinar
Normalidad• Otra herramienta gráfica para evaluar la normalidad de unos datos es el
trazo de probabilidad normal.
• En esta herramienta se trazan los datos de interés contra su respectiva
frecuencia acumulada observada (pares ordenados) en un papel que tiene
su escala vertical diseñada de tal forma que si las observaciones trazadas
tienen un comportamiento lineal entonces decidimos que los datos
provienen de un fenómeno con distribución normal.
David R. González-Barreto Estadísticas Industriales Marzo 2010 71
Prin EDA DistEstim Hyp Cont Cap R&RMues
Pruebas para Determinar
Normalidad• Para determinar los pares de coordenadas a trazarse en el papel:
– Ordene de menor a mayor las observaciones x(j),
– Calcule la frecuencia acumulada observada para cada x(j), y
= [(j – 0.5)/tamaño de muestra].
David R. González-Barreto Estadísticas Industriales Marzo 2010 72
Prin EDA DistEstim Hyp Cont Cap R&RMues
Pruebas para Determinar
Normalidad - Ejemplo
• Se analizaron 60 pesos de tabletas. Los resultados fueron los siguientes:
David R. González-Barreto Estadísticas Industriales Marzo 2010 73
Prin EDA DistEstim Hyp Cont Cap R&RMues
Planes de Muestreo
David R. González-Barreto Estadísticas Industriales Marzo 2010 74
Prin EDA DistEstim Hyp Cont Cap R&RMues
Planes de Muestreo
• Indice
Definiciones
Relación Productor – Consumidor
Curva O.C.
Planes de Muestreo Sencillo
Riesgo del Consumidor
Riesgo del Productor
Estándar Militar 105 E
Muestreo Secuencial
David R. González-Barreto Estadísticas Industriales Marzo 2010 75
Prin EDA DistEstim Hyp Cont Cap R&RMues
Definición
• Definición de planes de muestreo – Herramienta estadística en la que se
llevan a cabo los siguientes pasos:
Una muestra aleatoria se toma de un lote.
Una o más características de calidad de las
unidades en la muestra son inspeccionadas.
A base del resultado de lo inspeccionado se dicta
la sentencia sobre aceptar o rechazar el lote.
David R. González-Barreto Estadísticas Industriales Marzo 2010 76
Prin EDA DistEstim Hyp Cont Cap R&RMues
Aspectos Importantes
• Aspectos importantes sobre los planes de muestreo:
• No estiman la calidad del lote, sólo lo sentencian.
• No proveen ninguna forma directa de control de lacalidad.
• Su uso más efectivo es como una herramientapara asegurarse de que lo producido por elproceso cumple con los requerimientos.
• Tipos de planes de muestreo
• Variables (cuantitativa)
• Por atributo (cualitativa)
David R. González-Barreto Estadísticas Industriales Marzo 2010 77
Prin EDA DistEstim Hyp Cont Cap R&RMues
Planes de Muestreo Sencillos
• Planes de muestreo sencillos
• Seleccione una muestra de n unidades de un lote
tamaño N.
• Si encuentra c o menos unidades defectuosas en
la muestra, acepte el lote.
• Si encuentra más de c unidades defectuosas (d)
en la muestra, rechace el lote.
David R. González-Barreto Estadísticas Industriales Marzo 2010 78
Prin EDA DistEstim Hyp Cont Cap R&RMues
Ventajas y Desventajas
• Ventajas de los planes de muestreo
Consume menos tiempo y dinero que la inspección del 100%
de los lotes.
Menos daños al producto debido a la reducción del manejo.
Reduce errores de inspección por concepto de fatiga humana
(dependiendo del plan de muestreo).
• Desventajas de los planes de muestreo
• Riesgo de rechazar lotes buenos y/o aceptar los que se
debieron rechazar.
• Se obtiene información reducida sobre las características de
calidad del proceso.
• No contribuyen a reducir la variabilidad del proceso.
David R. González-Barreto Estadísticas Industriales Marzo 2010 79
Prin EDA DistEstim Hyp Cont Cap R&RMues
Relación Productor-Consumidor
RELACION PRODUCTOR-CONSUMIDOR
• Cuando usamos planes de muestreo existe un conflicto de interés entre el productor y el consumidor. Por un lado el productor quiere que todos los lotes buenos (que no excedan cierta proporción de piezas defectuosas predeterminada p0) sean aceptados. Por otro lado, el consumidor quiere que todos los lotes malos (que excedan p0) sean rechazados. Este conflicto sólo puede ser resuelto con un plan de muestreo cuya curva característica operacional (OC) sea ideal según discutiremos más adelante.
David R. González-Barreto Estadísticas Industriales Marzo 2010 80
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC)
Curva Característica Operacional (OC)
• Las curvas OC miden la ejecutoria de los planes de muestreo. En éstas, se
traza la probabilidad de aceptar (pa) un lote contra la proporción de
defectuosos (p) del mismo. Es por esto que las curvas OC son utilizadas
para determinar el poder de discernir o discriminar lotes con distintos
niveles de unidades defectuosas que tienen los planes de muestreo.
David R. González-Barreto Estadísticas Industriales Marzo 2010 81
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC)
Curva OC Plan de Muestreo Sencillo
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.02 0.04 0.06 0.08 0.1 0.12
Fracción de defectuosos
Pro
ba
bil
ida
d d
e A
ce
pta
r
David R. González-Barreto Estadísticas Industriales Marzo 2010 82
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC)
• Una curva OC ideal es aquella donde la probabilidad de aceptar lotes
buenos (p p0) es 1 y la probabilidad de aceptar lotes malos (p > p0) es 0.
En la práctica, obtener una Curva OC ideal para un plan de muestreo no es
común. Lo más cercano que un plan de muestreo estará de obtener una
curva OC ideal será al aumentar significativamente el tamaño de muestra
del mismo.
David R. González-Barreto Estadísticas Industriales Marzo 2010 83
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC)
Proporción de defectuosos (p)P0
1
(Pa)
0
David R. González-Barreto Estadísticas Industriales Marzo 2010 84
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC)
• Existen dos tipos de Curvas OC:
– Tipo A – usadas para lotes finitos (pequeños) en cuyo caso (p) está
dada por la distribución probabilística Hipergeométrica.
– Tipo B – usadas para lotes infinitos (grandes) en cuyo caso (p) está
dado por la distribución probabilística Binomial.
• Si ambas curvas son similares.
• La curva OC tipo B tiende a caer por encima de la tipo A.
• El poder de discriminación del plan de muestreo aumentará a
medida que aumente el tamaño de la muestra (n).
10.0N
n
David R. González-Barreto Estadísticas Industriales Marzo 2010 85
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC) Ejemplo
Se desea construir la curva OC para el siguiente plan de muestreo:
N = 10,000 n = 89 c= 2 p = 0.01
Como el lote es grande (infinito) y 10.0N
n uso la distribución Binomial para calcular
los puntos de la Curva OC tipo B.
Pa {d defectuosos} = dnd p1p
!dn!d
!n
Pa {d < c} = d89d
c
0d
99.001.0!d89!d
!89
Pa (d < 2 / p = 0.01)
=9397.099.001.0
!87!2
!8999.001.0
!88!1
!8999.001.0
!89!0
!89 872881890
David R. González-Barreto Estadísticas Industriales Marzo 2010 86
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC) Ejemplo
Plan de Muestreo: N = 10,000 n = 89 c = 2
Fracción de Defectuosos (p) Probabilidad de Aceptar el Lote (Pa)
0.005 0.9897
0.010 0.9397
0.020 0.7366
0.030 0.4985
0.040 0.3042
0.050 0.1721
0.060 0.0919
0.070 0.0468
0.080 0.0230
0.090 0.0109
David R. González-Barreto Estadísticas Industriales Marzo 2010 87
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC) Ejemplo
Curva OC Plan de Muestreo Sencillo
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.02 0.04 0.06 0.08 0.1 0.12
Proporción defectuosos en Lote (p)
Pro
bab
ilid
ad
de A
cep
tar
David R. González-Barreto Estadísticas Industriales Marzo 2010 88
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC) Ejemplo
• Si variamos el tamaño de muestra (n), la curva OC del plan de muestreo de interés
sería como se presenta a continuación:
Dos Planes de Muestreo Sencillo
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.02 0.04 0.06 0.08 0.1 0.12
Proporción defectuosos del Lote (p)
Pro
bab
ilit
idad
de A
cep
tar
Plan 1
Plan 2
n = 50, c =1
n=200, c=4
David R. González-Barreto Estadísticas Industriales Marzo 2010 89
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva Característica Operacional (OC) Ejemplo
• Para distintos valores de c, la curva OC del plan de muestreo de interés sería como
se presenta a continuación:
Dos Planes de Muestreo Sencillo
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.02 0.04 0.06 0.08 0.1 0.12
Proporción defectuosos del Lote (p)
Pro
ba
bil
itid
ad
de
Ac
ep
tar
Plan 1
Plan 2
n = 89, c =2
n=89, c=0
David R. González-Barreto Estadísticas Industriales Marzo 2010 90
Prin EDA DistEstim Hyp Cont Cap R&RMues
Puntos de Interés
• En todo plan de muestreo estarán presentes los siguientes puntos deinterés tanto para el productor como para el consumidor:
– Riesgo del productor ( ) = la probabilidad de rechazar un lote que debióhaber sido aceptado.
– AQL (Acceptable Quality Level) = nivel más pobre de calidad, o lamáxima fracción defectuosa del proceso del productor que elconsumidor consideraría aceptable como el promedio del proceso.
– Riesgo del consumidor ( ) = probabilidad de aceptar un lote que debióhaber sido rechazado.
– LTPD (Lost Tolerance Percent Defective) = un nivel de calidad del lotetan pobre que el consumidor solo lo podría aceptar por error.
David R. González-Barreto Estadísticas Industriales Marzo 2010 91
Prin EDA DistEstim Hyp Cont Cap R&RMues
Puntos de Interés
• Se debe siempre recordar que es a AQL como es a LTPD. El nivel de
protección que un plan de muestreo ofrezca a cada una de las partes en la
relación Productor-Consumidor dependerá de los dos puntos antes
mencionados (AQL, 1 - ), (LTPD, ). Estos puntos de interés pueden ser
vistos en la Curva OC del plan de muestreo diseñado.
David R. González-Barreto Estadísticas Industriales Marzo 2010 92
Prin EDA DistEstim Hyp Cont Cap R&RMues
Puntos de Interés
Curva OC Plan de Muestreo Sencillo
Fracción de defectuosos
Pro
babilid
ad d
e A
cepta
r
AQL LTPD
(AQL, 1 - )
(LTPD, )
David R. González-Barreto Estadísticas Industriales Marzo 2010 93
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diseño e Implantación
Diseño e Implantación de Planes de Muestreo
• El objetivo principal de diseñar un plan de muestreo es el determinar
tamaño de muestras (n) y límite de aceptación (c), para dictar sentencia
sobre un lote, que cumpla el nivel de riesgo estipulado por el productor, el
consumidor o ambos.
David R. González-Barreto Estadísticas Industriales Marzo 2010 94
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diseño e Implantación
Plan de Muestreo Sencillo
Plan de Muestreo Sencillo
• Suponga que se toma una muestra aleatoria de
tamaño n de un lote de tamaño N. Al inspeccionar
la muestra, si hay más de c unidades defectuosas
rechazo el lote, de lo contrario lo acepto. Existen
varias formas de diseñar un plan de forma tal que
el interés del consumidor o del productor sea
protegida.
David R. González-Barreto Estadísticas Industriales Marzo 2010 95
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diseño e Implantación
Planes de muestreo basados en el riesgo del productor• Cuando el riesgo del productor ( ) y el nivel de calidad aceptable (AQL)
asociado con éste son estipulados como la base del plan de muestreo sedesea diseñar un plan de muestreo sencillo cuya Curva OC pase por lacoordenada (AQL, 1 - ). Para diseñar dicho plan siga los siguientespasos:
Seleccione el límite de aceptación (c).
Utilice la distribución probabilística Poisson (presumiendo Curva OC tipo B,p < 0.10) para determinar la cantidad promedio de unidades defectuosaspor muestra ( ).
Determine el tamaño de la muestra (n).
AQLnn p
AQLn
David R. González-Barreto Estadísticas Industriales Marzo 2010 96
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diseño e Implantación - Ejemplo
Diseñe un plan de muestreo sencillo que satisfaga el riesgo del productor de 5% para
lotes que tienen una fracción de defectuoso de 1.5%.
= 0.05 AQL = 0.015
Para c = 1 obtenemos de la distribución Poisson un = 0.355
2467.23015.0
355.0
AQL
355.0n
El plan diseñado indica que se debe tomar una muestra aleatoria de 24 unidades y aceptar
el lote como bueno si no encuentra más de 1 unidad defectuosa.
Para c = 3
9207.91015.0
366.1n
Para c = 6
n
Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo
estipulado del productor ( = 5%, AQL = 1.5%)
David R. González-Barreto Estadísticas Industriales Marzo 2010 97
Prin EDA DistEstim Hyp Cont Cap R&RMues
Diseño e Implantación - Ejemplo
Comparación Planes de Muestreo
0
0.2
0.4
0.6
0.8
1
0 0.05 0.1 0.15
Fracción de defectuosos (p)
Pro
bab
ilid
ad
de
Acep
tar
Plan 1
Plan 2
David R. González-Barreto Estadísticas Industriales Marzo 2010 98
Prin EDA DistEstim Hyp Cont Cap R&RMues
Riesgo del Consumidor
Planes de muestreo basados en el riesgo del consumidor
• Cuando el riesgo del consumidor ( ) y el nivel de calidad aceptable (LTPD) asociada con éste,
son estipulados como la base del plan de muestreo, se desea diseñar un plan de muestreo
sencillo cuya Curva OC pase por la coordenada (LTPD, ). Para diseñar dicho plan siga los
siguientes pasos:
Seleccione el límite de aceptación (c).
Utilice la distribución probabilística Poisson para determinar la cantidad promedio de unidades
defectuosas por muestra ( ).
Determine el tamaño de la muestra (n).LTPDnn p
LTPDn
David R. González-Barreto Estadísticas Industriales Marzo 2010 99
Prin EDA DistEstim Hyp Cont Cap R&RMues
Riesgo del Consumidor - Ejemplo
Diseñe un plan de muestreo sencillo que satisfaga el riesgo del consumidor de 10% para
lotes que tienen una fracción de defectuoso de 8%.
= 0.10 LTPD = 0.08
Para c = 1 obtenemos de la distribución Poisson un = 3.890
4962.4808.0
890.3
LTPD
890.3n
Para c = 3
8451.8308.0
681.6n
Para c = 6
n
Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo
estipulado del consumidor ( = 10%, LTPD = 8%).
David R. González-Barreto Estadísticas Industriales Marzo 2010 100
Prin EDA DistEstim Hyp Cont Cap R&RMues
Riesgo del Consumidor - Ejemplo
Comparación Planes de Muestreo
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.05 0.1 0.15
Fracción de defectuosos (p)
Pro
ba
bil
ida
d d
e A
ce
pta
r
Plan 1
Plan 2
David R. González-Barreto Estadísticas Industriales Marzo 2010 101
Prin EDA DistEstim Hyp Cont Cap R&RMues
Riesgos del Productor y el Consumidor
Planes de muestreo basados en los riesgos del productor y elconsumidor
• Diseñar un plan de muestreo que satisfaga exactamente ambas partes, el productory el consumidor; es prácticamente imposible. Una alternativa es satisfacerexactamente una de las partes (Productor o Consumidor) y tratar de satisfacer lomás cercano posible a lo estipulado por la otra parte (por tanteo). Otra alternativamás fácil pero menos exacta es utilizar una herramienta gráfica llamadaNomograma. Para obtener un plan de muestreo que cumpla con lo estipulado porambas partes mediante el uso del Nomograma siga los siguientes pasos:
– Trace una línea que conecte AQL con (1 - ) y otra línea conectandoLTPD con .
– Identifique el plan de muestreo dado por la intersección de las doslíneas dentro del Nomograma.
David R. González-Barreto Estadísticas Industriales Marzo 2010 102
Prin EDA DistEstim Hyp Cont Cap R&RMues
Riesgos del Productor y el Consumidor -
Ejemplo
Diseñe un plan de muestreo sencillo que satisfaga tanto el riesgo del productor de 5%
para lotes que tienen una fracción de defectuoso de 2% como el riesgo del consumidor de
10% para lotes que tienen una fracción de defectuoso de 8%.
= 0.05, AQL = 0.02, = 0.10, LTPD = 0.08
En base al punto de intersección de las dos líneas (desde 0.95 hasta 0.02 y desde 0.10
hasta 0.08) se obtiene el siguiente plan de muestreo sencillo:
n = 98 c = 4
David R. González-Barreto Estadísticas Industriales Marzo 2010 103
Prin EDA DistEstim Hyp Cont Cap R&RMues
Riesgos del Productor y el Consumidor -
Ejemplo
David R. González-Barreto Estadísticas Industriales Marzo 2010 104
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E (ANSI/ASQC Z1.4)
• Están basados en el AQL, en el tamaño del lote y en el nivel de inspección.
• El nivel de inspección I requiere aproximadamente la mitad de la inspección que el nivel II y se utiliza cuando se requiere menor discriminación.
• El nivel de inspección III requiere aproximadamente el doble de la inspección del nivel II y se utiliza cuando se necesita mayor discriminación.
• Existen cuatro niveles de inspección especial: S-1, S-2, S-3 y S-4. Estos niveles producirán tamaños de muestra muy pequeños y sólo deben ser utilizados cuando se puedan o se necesite aceptar riesgos grandes.
David R. González-Barreto Estadísticas Industriales Marzo 2010 105
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E
• Sus curvas O. C. son del tipo B.
• Debido a que estos planes están orientados al AQL, se
enfocan en el riesgo del productor. Por lo tanto, el poder
discriminatorio del plan de muestreo (la forma de la
curva O. C.) se obtiene mediante la selección del nivel
de inspección.
David R. González-Barreto Estadísticas Industriales Marzo 2010 106
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E - Reglas de
intercambio
David R. González-Barreto Estadísticas Industriales Marzo 2010 107
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E
• Procedimiento
– Escoga el AQL
– Escoga el nivel de inspección
– Determine el tamaño del lote
– De acuerdo a la tabla que sigue, encuentre la letra para buscar
el tamaño de la muestra
– Determine el tipo de plan de muestreo apropiado (sencillo,
doble, múltiple)
– Busque en la tabla correcta para encontrar el tipo de plan a
utilizarse
David R. González-Barreto Estadísticas Industriales Marzo 2010 108
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E – Tabla de letras
David R. González-Barreto Estadísticas Industriales Marzo 2010 109
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E – Inspección Normal
David R. González-Barreto Estadísticas Industriales Marzo 2010 110
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E – Inspección ajustada
David R. González-Barreto Estadísticas Industriales Marzo 2010 111
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E – Inspección reducida
David R. González-Barreto Estadísticas Industriales Marzo 2010 112
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estándar Militar 105E - Ejemplo
• N = 2000
• AQL = 0.65%
• Nivel de inspección general II
– Solución
• De la tabla de las letras: letra K
• De la tabla de inspección normal: n = 125, c = 2
• De la tabla de inspección ajustada: n = 125, c = 1
• De la tabla de inspección reducida: n = 50, c = 1, r
= 3
David R. González-Barreto Estadísticas Industriales Marzo 2010 113
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo Secuencial
• El muestreo secuencial está basado en el “sequential
probability ratio test” (SPRT) desarrollado por Wald.
• Para cada punto en la gráfica del muestreo el eje de x
corresponde al número de artículos inspeccionados
hasta el momento, mientras que el eje de y representa el
número total de defectuosos encontrados hasta ese
momento.
David R. González-Barreto Estadísticas Industriales Marzo 2010 114
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestro secuencial
• Si el punto trazado se mantiene dentro de las líneas de
aceptación y rechazo, otro artículo debe ser
inspeccionado.
• Tan pronto como un punto esté sobre o por encima de la
línea de rechazo, el lote se rechaza.
• Por otro lado, si un punto cae sobre o por debajo de la
línea de aceptación, el lote se acepta.
David R. González-Barreto Estadísticas Industriales Marzo 2010 115
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo secuencial
• Para diseñar un plan de muestreo secuencial es
necesario especificar las siguientes dos coordenadas:
(p1, 1 - ) , (p2, 1 - ).
David R. González-Barreto Estadísticas Industriales Marzo 2010 116
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo secuencial
• Las ecuaciones para las dos líneas basadas en las dos
coordenadas están dadas por:
kpps
pp
ppk
kh
kh
snh
snhXA
/1/1log
1
1log
1log
1log
donde
line) (rejection X
line) e(acceptanc
21
21
12
2
1
2R
1
David R. González-Barreto Estadísticas Industriales Marzo 2010 117
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo secuencial
David R. González-Barreto Estadísticas Industriales Marzo 2010 118
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo Secuencial - Ejemplo
• Supongamos que queremos encontrar un plan de
muestreo secuencial en el que:
p1 = 0.01, = 0.05, p2 = 0.06, y = 0.10
Entonces:
80066.0
)94.0)(01.0(
)99.0)(06.0(log
1
1log
21
12
pp
ppk
David R. González-Barreto Estadísticas Industriales Marzo 2010 119
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo Secuencial - Ejemplo
57.1
80066.0/05.0
90.0log
/1
log
22.1
80066.0/10.0
95.0log
/1
log
2
1
kh
kh
David R. González-Barreto Estadísticas Industriales Marzo 2010 120
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo Secuencial - Ejemplo
028.0
80066.0/94.0/99.0log
/1/1log21
kpps
Entonces, las líneas de aceptación y rechazo son:
(rechazo) 028.057.1X
n)(aceptació 028.022.1
Rn
nXA
David R. González-Barreto Estadísticas Industriales Marzo 2010 121
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo Secuencial – Ejemplo
• En lugar de trazar un gráfico para determinar la disposición del lote, en el
muestreo secuencial utilizamos una tabla en la que los datos se obtienen
sustituyendo los valores de n en las ecuaciones para las líneas de
aceptación y rechazo y calculando los números de aceptación y rechazo.
Por ejemplo, el cálculo para n = 45 es:
(rechazo) 83.2)45(028.057.1
028.057.1X
n)(aceptació 0.040.028(45)-1.22
028.022.1
Rn
nXA
David R. González-Barreto Estadísticas Industriales Marzo 2010 122
Prin EDA DistEstim Hyp Cont Cap R&RMues
Muestreo Secuencial - Ejemplo
InspeccionadosNúmero de
aceptación
Número de
rechazoInspeccionados
Número de
aceptación
Número de
rechazo
1 a b 24 a 3
2 a 2 25 a 3
3 a 2 26 a 3
4 a 2 27 a 3
5 a 2 28 a 3
6 a 2 29 a 3
7 a 2 30 a 3
8 a 2 31 a 3
9 a 2 32 a 3
10 a 2 33 a 3
11 a 2 34 a 3
12 a 2 35 a 3
13 a 2 36 a 3
14 a 2 37 a 3
15 a 2 38 a 3
16 a 3 39 a 3
17 a 3 40 a 3
18 a 3 41 a 3
19 a 3 42 a 3
20 a 3 43 a 3
21 a 3 44 0 3
22 a 3 45 0 3
23 a 3 46 0 3
"a" - aceptación no es posible
"b" - rechazo no es posible
David R. González-Barreto Estadísticas Industriales Marzo 2010 123
Prin EDA DistEstim Hyp Cont Cap R&RMues
Hipótesis Estadística
• Supuestos o conjeturas acerca de una o más poblaciones de interés. Prueba para verificar si el reclamo sobre cierto parámetro de la población de interés es igual al establecido de la hipótesis nula (Ho).
• “El aceptar la hipótesis nula sólo implica que la muestra analizada no da suficiente evidencia para refutarla. Sin embargo, rechazar la hipótesis nula implica que la muestra analizada da evidencia para rechazarla. Este rechazo da paso a la aceptación de la hipótesis alterna (H1).”
David R. González-Barreto Estadísticas Industriales Marzo 2010 124
Prin EDA DistEstim Hyp Cont Cap R&RMues
Hipótesis Estadística
• Estadística de prueba- Función de la muestra aleatoria que se utiliza para
tomar una decisión en la prueba de hipótesis.
• Valor crítico - Valor que marca el límite entre aceptación o rechazo de la
Ho.
• Región de aceptación - Rango marcado por el valor o valores críticos que
de contener el valor de la Ho daría paso a la aceptación de la misma.
• Región de rechazo - Rango marcado por el valor o valores críticos que de
contener el valor de la Ho daría paso al rechazo de la misma.
David R. González-Barreto Estadísticas Industriales Marzo 2010 125
Prin EDA DistEstim Hyp Cont Cap R&RMues
Hipótesis Estadística
Rechazo
Región de Aceptación
Rechazo
/2 /2
David R. González-Barreto Estadísticas Industriales Marzo 2010 126
Prin EDA DistEstim Hyp Cont Cap R&RMues
Hipótesis Estadística
acepto Ho
rechazo Ho
decisión correcta error
tipo II
error
tipo I
decisión
correcta
Ho es cierto Ho es falso
David R. González-Barreto Estadísticas Industriales Marzo 2010 127
Prin EDA DistEstim Hyp Cont Cap R&RMues
Hipótesis Estadística
• Error tipo I - Rechazar la Ho cuando se debió aceptar.
• Error tipo II - Aceptar la Ho cuando se debió rechazar.
• Nivel de significancia - Probabilidad de cometer error tipo I.
• - Probabilidad de cometer error tipo II.
• Potencia de la prueba (1 - ) - Probabilidad de rechazar la Ho cuando se debió rechazar.
• Valor P - Nivel de significancia mínima al cual el valor observado de la estadística de prueba es significativo.
David R. González-Barreto Estadísticas Industriales Marzo 2010 128
Prin EDA DistEstim Hyp Cont Cap R&RMues
Hipótesis Estadística
• Pasos a seguir en las Pruebas de Hipótesis
1. Establezca la Ho
2. Escoja la H1 apropiada
3. Escoja el nivel de significancia
4. Seleccione la estadística de prueba y establezca la región crítica
5. Compute el valor de la estadística de prueba para la muestra analizada
6. Decida si acepta o rechaza la Ho
7. Tome la acción pertinente dada la decisión
David R. González-Barreto Estadísticas Industriales Marzo 2010 129
Prin EDA DistEstim Hyp Cont Cap R&RMues
Hipótesis Estadística
1 POBLACION
2
POBLACIONES>2
POBLACIONES
CONTINUOS
O POR
VARIABLE
DISCRETOS
ANOVACONTINUOS
O POR
VARIABLEDISCRETOS
2
D
.
p= proporción
defectuosos
( 1 - 2) = diferencia de
promedios
2/ 2 = razón de varianzas.
(p1 – p2) = diferencia de proporciones
.
David R. González-Barreto Estadísticas Industriales Marzo 2010 130
Prin EDA DistEstim Hyp Cont Cap R&RMues
Concepto del valor P
• El valor p se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería
rechazada. En el caso de la distribución F que usamos en nuestro ANOVA si:
calculada > crítica
• entonces uno rechaza la hipótesis nula Ho en favor de la hipótesis alterna H1. Este concepto se
ilustra en la siguiente Figura.
F
Crítica
F
Calculada
valor p
Como puede notarse en este caso la hipótesis nula Ho no puede ser rechazada
ya que la Fcalculada < Fcrítica, de igual manera el valor p nos daría la misma
decisión bajo la condición:
valor p >
David R. González-Barreto Estadísticas Industriales Marzo 2010 131
Prin EDA DistEstim Hyp Cont Cap R&RMues
Concepto del valor P
• Por lo tanto, el valor p puede ser interpretado como la posibilidad de que la hipótesis nula no sea rechazada. Magnitudes altas del valor p estarán asociadas con no poder rechazar la hipótesis nula mientras que magnitudes bajas del valor p estarán asociadas con el rechazo de la hipótesis nula. Regularmente el valor p es comparado con el nivel establecido para la prueba.
• Usando el valor p como criterio de aceptación o rechazo de una hipótesis es como comúnmente los programas de análisis estadístico le permiten al usuario tomar una decisión. Así que en general, si el valor p es menor que el establecido rechazamos la hipótesis nula de lo contrario no podemos rechazar.
David R. González-Barreto Estadísticas Industriales Marzo 2010 132
Prin EDA DistEstim Hyp Cont Cap R&RMues
Prueba Pareada
• Estas pruebas ocurren cuando se estudia la respuesta de una unidad experimental a dos distintos tratamientos. Por ejemplo, suponga que se conduce un estudio para determinar el efecto de una droga que ayuda en la reducción de la presión arterial. Para medir su efectividad (o su inefectividad), se le provee la droga a una muestra aleatoria de n pacientes. El conjunto de datos consiste de n pares ordenados (xi , yi), donde la xi correspondería a la presión arterial del paciente i, antes del tratamiento mientras que la yi denotaría la presión arterial luego de la droga para el mismo paciente.
David R. González-Barreto Estadísticas Industriales Marzo 2010 133
Prin EDA DistEstim Hyp Cont Cap R&RMues
Prueba Pareada
• La variable di = xi - yi, representa la diferencia en la presión arterial producida por la droga en determinado paciente. Esto es un ejemplo de lo que se conoce como “auto-pareo”, en el cual a una unidad experimental singular se le administran los dos tratamientos.
• En otros casos esos pares son seleccionados. Por ejemplo, en experimentos de sicología gemelos idénticos son utilizados para estas pruebas pareadas. Una vez el par ha sido seleccionado, a una de las dos unidades se le asigna aleatoriamente el tratamiento 1 correspondiendo el tratamiento 2 a la otra unidad. Las ventajas del pareo son intuitivamente claras: reduce la variabilidad en los datos que se debe a otras causas distintas al tratamiento bajo consideración.
David R. González-Barreto Estadísticas Industriales Marzo 2010 134
Prin EDA DistEstim Hyp Cont Cap R&RMues
Prueba Pareada - Ejemplo
• Un estudio se realiza con el objetivo de comparar dos configuraciones de un procesador de computadora. Se midieron los tiempos de ejecución para seis tareas distintas (w1, …, w6).
Las dos configuraciones evaluadas fueron el procesador con y sin “cache”. Los resultados obtenidos se presentan en la siguiente tabla.
Tarea Cache No cache di = xi - yi
W1 69 75 -6
W2 53 83 -30
W3 61 89 -28
W4 54 77 -23
W5 49 83 -34
W6 50 83 -33
David R. González-Barreto Estadísticas Industriales Marzo 2010 135
Prin EDA DistEstim Hyp Cont Cap R&RMues
Prueba Pareada - Ejemplo
Como se puede observar de
los resultados obtenidos de
STATGRAPHICS®, tanto el
valor p como el intervalo de
confianza indican el efecto
significativo que tiene el
cambio de configuración en el
procesador. La configuración
que incluye el “cache” resultó
en una ejecución mucho más
rápida.
Hypothesis Tests for Cache-No_Cache
Sample mean = -25.6667
Sample median = -29.0
t-test
------
Null hypothesis: mean = 0.0
Alternative: not equal
Computed t statistic = -6.04224
P-Value = 0.00178906
Reject the null hypothesis for alpha = 0.05.
T-Test of the Mean
Confidence Intervals
Confidence Intervals for Cache-No_Cache
95.0% confidence interval for mean: -25.6667 +/- 10.9195 [-36.5862,-14.7471]
David R. González-Barreto Estadísticas Industriales Marzo 2010 136
Prin EDA DistEstim Hyp Cont Cap R&RMues
Inferencias sobre los promedios
• Regularmente, la calidad de un producto se mide por una variable cuantitativa xdefinida en cierta población. Se conoce que esta variable estará sujeta a cierto nivel de variación aleatoria, por lo tanto, estudiar el comportamiento de ésta y los parámetros que la describen resulta de vital importancia.
• El reclamo de que > 0 es un ejemplo de una hipótesis estadística que intenta describir o entender dicho comportamiento.
• Cuando el reclamo incluye dos comportamientos el objetivo del estudio podría ser el de medir la diferencia entre los dos promedios ( 1 - 2 > ). De igual forma se podrían hacer reclamos sobre el parámetro de dispersión de la variable de interés. Estos casos se discutirán más adelante.
David R. González-Barreto Estadísticas Industriales Marzo 2010 137
Prin EDA DistEstim Hyp Cont Cap R&RMues
Inferencias sobre los promedios
Ejemplo
• Una empresa manufacturera de lentes de contacto compró una máquina para el llenado de frascos de solución alkalina. Esta máquina fue ajustada para llenar frascos cuya etiqueta indicaba un contenido de 12 onzas. Diez muestras se tomaron para validar que el proceso cumplía con este requisito. Estas observaciones se muestran en la siguiente tabla.
Onzas
11.52 12.54
12.3 12.01
11.1 10.47
10.8 11.02
11.64 12.41
David R. González-Barreto Estadísticas Industriales Marzo 2010 138
Prin EDA DistEstim Hyp Cont Cap R&RMues
Inferencias sobre los promedios
Ejemplo
Hypothesis Tests for Onzas
Sample mean = 11.581
Sample median = 11.58
t-test
------
Null hypothesis: mean = 12.0
Alternative: less than
Computed t statistic = -1.83245
P-Value = 0.0500525
T-Test of the Mean (“Una cola”) T-Test of the Mean (“Dos colas”)
Hypothesis Tests for Onzas
Sample mean = 11.581
Sample median = 11.58
t-test
------
Null hypothesis: mean = 12.0
Alternative: not equal
Computed t statistic = -1.83245
P-Value = 0.100105
Do not reject the null hypothesis for alpha = 0.05.
David R. González-Barreto Estadísticas Industriales Marzo 2010 139
Prin EDA DistEstim Hyp Cont Cap R&RMues
Inferencias sobre los promedios
Ejemplo• Dos catalíticos son analizados para determinar su efecto en el rendimiento de un
proceso químico. El catalítico 1 es el que se utiliza en la actualidad. El catalítico 2tiene menor costo y se adoptaría si el mismo no afecta adversamente elrendimiento del proceso. Un estudio piloto se efectuó resultando en lo siguiente:
Observación Catalítico 1 Catalítico 2
1 91.5 89.19
2 94.18 90.95
3 92.18 90.46
4 95.39 93.21
5 91.79 97.19
6 89.07 97.04
7 94.72 91.07
8 89.21 92.75
David R. González-Barreto Estadísticas Industriales Marzo 2010 140
Prin EDA DistEstim Hyp Cont Cap R&RMues
Inferencias sobre los promedios
Ejemplo
Two Sample T-Test and Confidence Interval
Comparison of Means
-------------------
95.0% confidence interval for mean of Cat1: 92.255 +/- 1.99393
95.0% confidence interval for mean of Cat2: 92.7325 +/- 2.49424
95.0% confidence intervals for the difference between the means:
assuming equal variances: -0.4775 +/- 2.89639
not assuming equal variances: -0.4775 +/- 2.90962
t tests to compare means
Null hypothesis: mean1 = mean2
(1) Alt. hypothesis: mean1 NE mean2
assuming equal variances: t = -0.353591 P-value = 0.728914
not assuming equal variances: t = -0.353591 P-value = 0.729166
(2) Alt. hypothesis: mean1 > mean2
assuming equal variances: t = -0.353591 P-value = 0.635543
not assuming equal variances: t = -0.353591 P-value = 0.635417
(3) Alt. hypothesis: mean1 < mean2
assuming equal variances: t = -0.353591 P-value = 0.364457
not assuming equal variances: t = -0.353591 P-value = 0.364583
David R. González-Barreto Estadísticas Industriales Marzo 2010 141
Prin EDA DistEstim Hyp Cont Cap R&RMues
Inferencias sobre los promedios
Ejemplo
Como se puede observar, tanto de la gráfica
como de ambas pruebas efectuadas, los
promedios no difieren significativamente.
El catalítico 2 podría adoptarse sin el
riesgo de que afecte negativamente el
rendimiento de este proceso.
Cat1
Cat2
Box-and-Whisker Plot
89 91 93 95 97 99
Rendimient
Cata
liti
co
David R. González-Barreto Estadísticas Industriales Marzo 2010 142
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estimado de intervalos
• En muchas ocasiones, un estimado de punto no provee la información suficiente con respecto a un parámetro. Por ejemplo, si nos interesa medir el esfuerzo promedio en tensión de un componente crítico, un valor o estimado de punto no será tan relevante como un intervalo en el cual se espera se encuentre el verdadero valor del parámetro. A estos intervalos los conocemos como intervalos de confianza.
• Un estimado de intervalo de un parámetro desconocido q es un intervalo con formato: l < q < u, donde los puntos extremos l y u dependen del valor numérico del estimado de q para una muestra particular de la distribución muestral de este parámetro. Dado que diferentes muestras producirán diferentes estimados, los puntos extremos del intervalo de cada muestra son variables aleatorias como muestra la siguiente figura.
David R. González-Barreto Estadísticas Industriales Marzo 2010 143
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estimado de intervalos
David R. González-Barreto Estadísticas Industriales Marzo 2010 144
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estimado de intervalos
• Suponga que una población tiene un promedio desconocido y unavarianza conocida . Una muestra de tamaño n de esta población sedenominaría x1, x2, … xn. Un estimador de punto razonable para elpromedio desconocido sería el promedio muestral . La distribución deeste promedio será normal si la población es normal y aproximadamentenormal si las condiciones del teorema de límite central se cumplen. Porlo tanto, la distribución de la estadística
Zx
n/es una distribución normal
estándar
David R. González-Barreto Estadísticas Industriales Marzo 2010 145
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estimado de intervalos
/
2
/
2Distribución de Z
P z Z z/ /2 2
1
P zx
nz
/ /
/2 2
1
P x z n x z n/ /
/ /2 2
1
David R. González-Barreto Estadísticas Industriales Marzo 2010 146
Prin EDA DistEstim Hyp Cont Cap R&RMues
Estimado de intervalos
• De este desarrollo se puede concluir que el intervalo
para el (1- ) % de confianza del promedio m cuando se
tiene una muestra aleatoria de tamaño n y varianza
conocida está dado por:
x z n x z n/ /
/ /2 2
David R. González-Barreto Estadísticas Industriales Marzo 2010 147
Prin EDA DistEstim Hyp Cont Cap R&RMues
Analisis de Varianza (ANOVA)
• Las pruebas de hipótesis estudiadas son métodos que comparan dos tratamientos. Sin embargo, muchos experimentos requieren comparaciones de más de dos tratamientos simultáneamente. Se puede demostrar que si intentamos hacer pruebas para cada pareja de medias o promedios, el error tipo I incrementaría sustancialmente.
• Por ejemplo, un factor con 5 niveles o tratamientos necesitará 10 pruebas si se toman por parejas. Si establece .05 como su error Tipo I, entonces su nivel de confianza para cada prueba individual es 1 - .05 = 0.95.
• Si decimos que las pruebas son independientes, la probabilidad de aceptar la hipótesis nula correctamente en las 10 pruebas será de (0.95)10 = 0.60.
David R. González-Barreto Estadísticas Industriales Marzo 2010 148
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
• El procedimiento apropiado para probar la igualdad de varias medias o
promedios se conoce como análisis de varianza o ANOVA.
• ANOVA - metodología estadística para probar la igualdad de promedios
cuando existen más de dos promedios. Probablemente es la técnica más
útil en el campo de la estadística inferencial.
David R. González-Barreto Estadísticas Industriales Marzo 2010 149
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
• PRESUNCIONES DE ANOVA
– Errores o residuales siguen una distribución normal con
promedio cero y varianza constante.
– Errores son independientes.
• El nombre de análisis de varianza (ANOVA) se deriva de la partición
de la variabilidad total encontrada en sus componentes. Para entender
esa partición primero tenemos que definir unos términos.
David R. González-Barreto Estadísticas Industriales Marzo 2010 150
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
.1y .2y .ay ..y
y..ya.y2.y1.
ya1
ya2
.
.
.
yan
y21
y22
.
.
.
y2n
y11
y12
.
.
.
y1n
a….21
= promedio de las observaciones en el nivel i
yi
yi
y
y
N
= suma de las observaciones en el nivel i
= suma total de las observaciones
= promedio de todas las observaciones
= an = número total de observaciones
2
1 1
..a
i
n
j
ijTOTAL yySS
David R. González-Barreto Estadísticas Industriales Marzo 2010 151
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
2
1 1
.. ..a
i
n
j
iijiTOTAL yyyySS
.
1 1
.
2
1 1
.
2
1
.
..2
..
iij
a
i
n
j
i
a
i
n
j
iij
a
i
iTOTAL
yyyy
yyyynSS
0....
1
.n
ynyynyyy i
iii
n
j
iij
2
.
2
1
.
2
1 1
.... iij
a
i
i
a
i
n
j
ij yyyynyy
Ecuación fundamental de la descomposición de la suma de cuadrados
David R. González-Barreto Estadísticas Industriales Marzo 2010 152
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
• En palabras podemos expresar la ecuación previa de la siguiente manera:
ERROROSTRATAMIENTTOTAL SSSSSS
Puede demostrarse que con los grados de libertad sucede lo
mismo.
ERROROSTRATAMIENTTOTALglglgl
N-1 = a-1 + N-a
David R. González-Barreto Estadísticas Industriales Marzo 2010 153
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
• Ya teniendo los componentes de la suma de cuadrados con sus
correspondientes grados de libertad podemos construir la ANOVA.
ERROR
TRAT
MS
MS .
Fuentes Suma de
Cuadrados
gl Promedio de Cuadrados Fc
Tratamientos SSTRAT. a-1 MSTRAT.=SSTRAT./(a-1)
Error SSERROR N-a MSERROR=SSERROR/(N-a)
Total SSTOTAL N-1
David R. González-Barreto Estadísticas Industriales Marzo 2010 154
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
• Entonces la hipótesis que tratará de probar Anova será la siguiente:
a210...:H
j i,i1 una menos al para ...:H
j
• Una forma equivalente para establecer la hipótesis sería:
0T...TT:Ha210
ii1 una menos al para 0T:H
David R. González-Barreto Estadísticas Industriales Marzo 2010 155
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA
• Una vez terminada la ANOVA y rechazada la H0 algunas pruebas nos
permiten determinar entre cuales tratamientos o niveles en específico
existe la diferencia de promedios.
• La Diferencia Significativa Mínima (LSD) es una de éstas. La misma
consiste de :
1. Calcular LSD =ji
Enn
MSaNt11
,2/
2. Calcular.. ji yy
3. Si LSDyy ji ..
Concluir quei
yj
son diferentes.
David R. González-Barreto Estadísticas Industriales Marzo 2010 156
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA - Ejemplo
• Un manufacturero de papel produce fundas
para cargar compras. El está interesado en
mejorar el esfuerzo en tensión que resisten
las mismas. Se sospecha que el % de
madera en la pulpa utilizada para la
manufactura puede afectar el esfuerzo en
tensión. La siguiente tabla muestra los
resultados de su experimento.
% de madera en la pulpa
5% 10% 15% 20%
7 12 14 19
8 17 18 25
15 13 19 22
11 18 17 23
9 19 16 18
10 15 18 20
David R. González-Barreto Estadísticas Industriales Marzo 2010 157
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA - Ejemplo
ANOVA Table for Esfuerzo by Conc
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Between groups 382.792 3 127.597 19.61 0.0000
Within groups 130.167 20 6.50833
-----------------------------------------------------------------------------
Total (Corr.) 512.958 23
5
10
15
20
Box-and-Whisker Plot
7 10 13 16 19 22 25
Esfuerzo
Co
nc
David R. González-Barreto Estadísticas Industriales Marzo 2010 158
Prin EDA DistEstim Hyp Cont Cap R&RMues
ANOVA – Ejemplo
Multiple Range Tests for Esfuerzo by Conc
--------------------------------------------------------------------------------
Method: 95.0 percent LSD
Conc Count Mean Homogeneous Groups
--------------------------------------------------------------------------------
5 6 10.0 X
10 6 15.6667 X
15 6 17.0 X
20 6 21.1667 X
--------------------------------------------------------------------------------
Contrast Difference +/- Limits
--------------------------------------------------------------------------------
5 - 10 *-5.66667 3.07243
5 - 15 *-7.0 3.07243
5 - 20 *-11.1667 3.07243
10 - 15 -1.33333 3.07243
10 - 20 *-5.5 3.07243
15 - 20 *-4.16667 3.07243
--------------------------------------------------------------------------------
* denotes a statistically significant difference.
David R. González-Barreto Estadísticas Industriales Marzo 2010 159
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• La insatisfacción de los clientes es causada por la variabilidad del producto:
las características del producto no ejecutan de acuerdo a las expectativas o
ejecutan de manera diferente de unidad a unidad. La variabilidad del
producto es el resultado de la variabilidad en el proceso que lo crea.
• Por tanto, la clave para lograr productos de alta calidad es limitar la
variabilidad del proceso.
David R. González-Barreto Estadísticas Industriales Marzo 2010 160
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Ningún proceso puede ser perfectamente repetible, alguna variabilidad
siempre existirá y ésta a su vez será transmitida al producto. El objetivo es mantener el proceso estable y predecible a través del tiempo, a esto le
llamamos un proceso en control.
• La herramienta que usamos para „monitorear‟ la estabilidad del proceso es
el gráfico de control.
David R. González-Barreto Estadísticas Industriales Marzo 2010 161
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Para datos continuos, el monitorear la estabilidad del proceso requiere dos
gráficos: el primero maneja la localización de la distribución, mientras el
segundo trabaja con la variabilidad del proceso.
• El gráfico más común utilizado para monitorear la localización es el X -
barra ( ). Los gráficos para la variabilidad incluyen el S (desviación
estándar) y el gráfico R (del rango).
x
David R. González-Barreto Estadísticas Industriales Marzo 2010 162
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Los gráficos de control son una herramienta importante en el mejoramiento
de procesos. Estos gráficos proveen señales visuales que indican cuándo
eventos excepcionales o condiciones fuera de control ocurren en el
proceso. Usar nuestros planes de respuesta o realizar análisis para
encontrar la raíz de la señal, permite que el proceso, así como el producto
que resulta del mismo, puedan ser mejorados de forma sistemática y
continua.
David R. González-Barreto Estadísticas Industriales Marzo 2010 163
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Tipos de variabilidad
– Intrínseca o natural - efecto cumulativo de pequeñas e
inevitables causas en el proceso.
– Externa (causa asignable) - comúnmente provienen de
fuentes externas controlables. Generalmente son mayor que la
variabilidad intrínseca y, por lo tanto, representan un nivel
inaceptable en la ejecutoria del proceso.
David R. González-Barreto Estadísticas Industriales Marzo 2010 164
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Un proceso que su única causa de variabilidad es natural, se considera que
opera en control estadístico.
• Un proceso que opera en presencia de causas asignables de variabilidad
se dice está fuera de control estadístico.
• Mediante el uso de gráficos de control podemos identificar y distinguir entre
las causas de variabilidad intrínseca y externa del proceso.
David R. González-Barreto Estadísticas Industriales Marzo 2010 165
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
# de muestra o sequencia (tiempo)
característica
de calidad LCS
LCI
LC
}
}
k w
k w
w
wwLCS
wLC
wwLCI
David R. González-Barreto Estadísticas Industriales Marzo 2010 166
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
Realidad
En control
Fuera de
control
En control Decisión
correcta
Dec
isió
n
Fuera de
control
Decisión
correcta
David R. González-Barreto Estadísticas Industriales Marzo 2010 167
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Selección de los límites de control
– Alejando los límites de la línea central se disminuye la
probabilidad de error tipo I pero se aumenta la probabilidad de
error tipo II.
– Aunque comúnmente se usan 3 w como límites, la selección de
estos puede depender de factores económicos. Si las pérdidas
asociadas con dejar el proceso operar en estado fuera de
control superan por mucho los costos de investigar y
posiblemente corregir las causas asignables, múltiples menores
de sigma (2.5 ó 2) serían apropiados.
David R. González-Barreto Estadísticas Industriales Marzo 2010 168
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Tamaño de la muestra y frecuencia del muestreo
– Lo más deseable para poder detectar desplazamientos en elproceso sería tomar muestras grandes frecuentemente. Peroesto no es lo mejor desde el punto de vista económico. En laindustria se tiende a favorecer muestras pequeñas perofrecuentes, especialmente en procesos con un alto volumen deproducción.
– Además de las Curvas Características Operacionales (O. C.)otro criterio para determinar el tamaño de muestra y lafrecuencia del muestreo es el largo promedio de corrida (ARL)del gráfico de control.
David R. González-Barreto Estadísticas Industriales Marzo 2010 169
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• ARL = número promedio de puntos que serán graficados antes de
que un punto indique condición de fuera de control.
p = probabilidad de que un punto salga de los límites de control
p
1ARL
David R. González-Barreto Estadísticas Industriales Marzo 2010 170
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
Límites de control ARL en Control
+ 3 sigmas 0.0027 370
+ 2 sigmas 0.045 22
+ 1 sigma 0.32 3
Cambio en promedio 1- ARL fuera de control
3 sigmas 0.5 0.5 2
2 sigmas 0.84 0.16 6.25
1 sigma 0.975 0.025 40
David R. González-Barreto Estadísticas Industriales Marzo 2010 171
Prin EDA DistEstim Hyp Cont Cap R&RMues
Fundamentos Gráficos de Control
LCS
LC
LCI/2
/2
David R. González-Barreto Estadísticas Industriales Marzo 2010 172
Prin EDA DistEstim Hyp Cont Cap R&RMues
Fundamentos Gráficos de Control
/2
/2LCS
LC
LCI
Orden de producción
Cara
cteríst
ica d
e c
alid
ad
1 -
David R. González-Barreto Estadísticas Industriales Marzo 2010 173
Prin EDA DistEstim Hyp Cont Cap R&RMues
Fundamentos Gráficos de Control
/2
/2LCS
LC
LCI
Orden de producción
Cara
cteríst
ica d
e c
alid
ad
1 -
12
3
David R. González-Barreto Estadísticas Industriales Marzo 2010 174
Prin EDA DistEstim Hyp Cont Cap R&RMues
Fundamentos Gráficos de Control
LCS
LC
LCI
Cambio en promedio
David R. González-Barreto Estadísticas Industriales Marzo 2010 175
Prin EDA DistEstim Hyp Cont Cap R&RMues
Fundamentos Gráficos de Control
LCS
LC
LCI
Cambio en dispersión
David R. González-Barreto Estadísticas Industriales Marzo 2010 176
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
• Subgrupos racionales - Este concepto establece que las muestrasdeben ser seleccionadas de forma tal que si hay causas asignables, laposibilidad de diferencias entre muestras o subgrupos se maximicemientras que la posibilidad de diferencias debido a causas asignablesdentro de las muestras se minimice.
• Nota: Un ejemplo de un subgrupo racional inadecuado sería formar unamuestra (subgrupo) que tenga observaciones del final de un turno y elprincipio de otro. Esto haría difícil detectar una diferencia entre turnos.
David R. González-Barreto Estadísticas Industriales Marzo 2010 177
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
En la manufactura de pistones para motores de carro, una característica de calidadimportante es el diámetro del pistón. El proceso podría estar controlado con undiámetro promedio de 74 mm. La desviación estándar de los pistones es 0.1mm (n =5).
1. Construya una gráfica de control para x con:
límites a 3 3 w
límites a /2 = 0.001
2. ¿A 3 , cuál es la probabilidad de error tipo I?
3. ¿Para los límites 3 , cuál es el ARL?
4. ¿Cuánto será el ARL, si n = 5, el proceso se sale de control y ademásla media se desplaza de 74.000 a 74.134mm?
5. ¿Si n = 10, cuál sería el ARL?
David R. González-Barreto Estadísticas Industriales Marzo 2010 178
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
Solución:
w = 74mm, 045.05
1.0
nw
1 (a) LCS = w + k w 74 + 3(0.045) = 74.134
LC = w = 74.00
LCI = w - k w 74 - 3(0.045) = 73.866
David R. González-Barreto Estadísticas Industriales Marzo 2010 179
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
1 (b) LCS = w + /2 w 74 + 3.09(0.045) = 74.139
LC = w = 74.00
LCI = w - /2 w 74 – 3.09(0.045) = 73.861
David R. González-Barreto Estadísticas Industriales Marzo 2010 180
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control
# de muestra o sequencia (tiempo)
característica de calidad LCS
LCI
LC
}
}
k w
k w
w
LCS (1b) = 74.139
LCS (1a) = 74.134
LCS (1a) = 73.866
LCS (1b) = 73.861
LC = 74.0
David R. González-Barreto Estadísticas Industriales Marzo 2010 181
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
2. /2 = 3 (3) = 0.99865, 1 - = /2 = 0.00135
= 0.00135 (2) = 0.0027
3. Para obtener el ARL primero construiremos las curvas O.C. para
30027.0
2/Z
3700027.0
11
pARL
Es el largo promedio de la corrida del gráfico x
cuando el proceso está en
control estadístico. O sea que, aunque el proceso esté en control se verá una
falsa alarma de fuera de control cada 370 muestras.
David R. González-Barreto Estadísticas Industriales Marzo 2010 182
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
4. El desplazamiento coincide con el límite de control superior, por lo
tanto, la probabilidad de que x esté entre los límites de control es
0.50. De manera que, la probabilidad de que esté fuera es p = 1 –
0.50 = 0.50:
25.0
1ARL
Esto es que el gráfico de control requerirá en promedio dos muestras de
tamaño n = 5 para detectar el desplazamiento de :
134.74 a 00.74
10
En promedio, con dos muestras se podrá detectar el desplazamiento.
5. Se puede demostrar que la probabilidad de detectar el cambio cuando
el tamaño de muestra se incrementa a n = 10, es mayor que en el caso
anterior cuando n = 5. Por lo tanto, se espera un ARL < 2.
David R. González-Barreto Estadísticas Industriales Marzo 2010 183
Prin EDA DistEstim Hyp Cont Cap R&RMues
Base Estadística de los Gráficos
de Control para Variables
El promedio muestral de una característica de calidad normalmente
distribuida N ( , ) es:
n
xxxx n...21
nNx xx donde ,~
Existe una probabilidad 1 - de que el promedio muestra x caiga entre:
xz2
Por teorema de límite central asumimos normalidad en la distribución de x .
Cuando no sabemos y , los podemos estimar con muestras preliminares.
Al menos 20 muestras con n observaciones de la característica de calidad
medida. Entonces el estimado de , el promedio del proceso es:
m
xxxx m...21
David R. González-Barreto Estadísticas Industriales Marzo 2010 184
Prin EDA DistEstim Hyp Cont Cap R&RMues
Base Estadística de los Gráficos
de Control para Variables
Un estimador de la desviación estándar ( ) cuando n < 10 es: x
...
donde ˆ 21
2 m
RRRR
d
R m
minmax1 xxR
d2 = parámetro de la distribución de rango relativo (W = R/ )
Su valor depende de n.
Antes de tratar de controlar el promedio hay que controlar la variabilidad ya que, los límites
de control gráfico x dependen de la variabilidad del proceso.
David R. González-Barreto Estadísticas Industriales Marzo 2010 185
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control R
Se utiliza para controlar la variabilidad del proceso cuando n < 10.
Los límites de control para el gráfico R son:
4
2
33ˆ3 DRd
RdRRLCS R
RLC
3
2
33ˆ3 DRd
RdRRLCI R
D3 y D4 son valores tabulados.
David R. González-Barreto Estadísticas Industriales Marzo 2010 186
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control X-Barra
Se usa para controlar el promedio del proceso.
Los límites de control son:
RAxRnd
xLCS 2
2
3
xLC
RAxRnd
xLCI 2
2
3
A2 es un valor en la tabla.
David R. González-Barreto Estadísticas Industriales Marzo 2010 187
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control S
Se utiliza para controlar la variabilidad del proceso cuando n 10.
Cuando es desconocida un estimador será:
1
2
12
n
xx
s
n
li
y los límites de control serán:
sBcc
ssLCS 4
2
4
4
13
sLC
3
2
4
4
13 Bcc
ssLCI
B4 y B3 son valores tabulados y m
l ism
s1
David R. González-Barreto Estadísticas Industriales Marzo 2010 188
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control S
Entonces los límites de control para el gráfico x son:
sAxnc
sxLCS 3
4
3
xLC
sAxnc
sxLCI 3
4
3
David R. González-Barreto Estadísticas Industriales Marzo 2010 189
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
Se desea establecer control estadístico para el ancho de tabletas. Se toman
25 muestras de 5 observaciones cada una.
Muestra X1 X2 X3 X4 X5
x R
1 20 22 21 23 22 21.6 3
2 19 18 22 20 20 19.8 4
3 25 18 20 17 22 20.4 8
4 20 21 22 21 21 21 2
5 19 24 23 22 20 21.6 5
6 22 20 18 18 19 19.4 4
7 18 20 19 18 20 19 2
8 20 18 23 20 21 20.4 5
9 21 20 24 23 22 22 4
10 21 19 20 20 20 20 2
11 20 20 23 22 20 21 3
12 22 21 20 22 23 21.6 3
13 19 22 19 18 19 19.4 4
14 20 21 22 21 22 21.2 2
15 20 24 24 23 23 22.8 4
*En la tabla se presentan las primeras quince muestras
David R. González-Barreto Estadísticas Industriales Marzo 2010 190
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
X-bar Chart for Ancho
Subgroup
X-b
ar
Centerline = 20.84
UCL = 22.85
LCL = 18.83
0 5 10 15 20 25
18
19
20
21
22
23
Range Chart for Ancho
0 5 10 15 20 25
Subgroup
0
2
4
6
8
Ran
ge
Centerline = 3.48
UCL = 7.36
LCL = 0.00
Luego de eliminar la muestra 3 y
recalcular los límites del gráfico R, nos
percatamos de que las muestras 22 y
23 del gráfico están fuera de los límites
de control. Una vez conseguimos las
causas asignables de estos, los
eliminamos y recalculamos los límites
de control del gráfico.
David R. González-Barreto Estadísticas Industriales Marzo 2010 191
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
X-bar Chart for Ancho
Subgroup
X-b
ar
Centerline = 20.86
UCL = 22.76
LCL = 18.96
0 5 10 15 20 25
18
19
20
21
22
23
Range Chart for Ancho
Subgroup
Ran
ge
Centerline = 3.29
UCL = 6.96
LCL = 0.00
0 5 10 15 20 25
0
2
4
6
8
x
Al graficarse los restantes puntos
dentro de los límites recalculados,
notará que el punto número 15 está
todavía fuera de control en el gráfico
del promedio.
Por esta razón necesitaríamos
recalcular nuestros límites
nuevamente. Una vez todos los
puntos se encuentren dentro de los
límites de control y no muestren
ningún patrón sistemático,
asumiremos los límites recién
calculados como los límites de control
del proceso.
De este momento en adelante
trazaremos los puntos del proceso en
tiempo real haciendo uso de los
límites estimados. De encontrar
alguna señal de que el proceso se
encuentra fuera de control hay que
investigar la causa.
David R. González-Barreto Estadísticas Industriales Marzo 2010 192
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
*En la tabla se presentan las primeras quince muestras
Ilustración de los gráficos de control x y S usando 25 muestras pero de
tamaño variable.
Muestra X1 X2 X3 X4 X5 x S
1 74.030 74.002 74.019 73.992 74.008 74.010 0.0148
2 73.995 73.992 74.001 73.996 0.0046
3 73.988 74.024 74.021 74.005 74.002 74.008 0.0106
4 74.002 73.996 73.993 74.015 74.009 74.003 0.0091
5 73.992 74.007 74.015 73.989 74.014 74.003 0.0122
6 74.009 73.994 73.997 73.985 73.996 0.0099
7 73.995 74.006 73.994 74.000 73.999 0.0055
8 73.985 74.003 73.993 74.015 73.988 73.997 0.0123
9 74.008 73.995 74.009 74.005 74.004 0.0064
10 73.998 74.000 73.990 74.007 73.995 73.998 0.0063
11 73.994 73.998 73.994 73.995 73.990 73.994 0.0029
12 74.004 74.000 74.007 74.000 73.996 74.001 0.0042
13 73.983 74.002 73.998 73.994 0.0100
14 74.006 73.967 73.994 74.000 73.984 73.990 0.0153
15 74.012 74.014 73.998 74.008 0.0087
David R. González-Barreto Estadísticas Industriales Marzo 2010 193
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control - Ejemplo
X-bar Chart for Ancho
Subgroup
X-b
ar
Centerline = 74.00
UCL = 74.01
LCL = 73.99
0 5 10 15 20 25
73.98
73.99
74
74.01
74.02
Range Chart for Ancho
Subgroup
Ran
ge
Centerline = 0.02
UCL = 0.05
LCL = 0.00
0 5 10 15 20 25
0
0.01
0.02
0.03
0.04
0.05
David R. González-Barreto Estadísticas Industriales Marzo 2010 194
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva O.C.
La probabilidad de error tipo II para el gráfico de control x está dada por:
kUCLxLCLP 01\
Dado que n
Nx2
,~ y sus límites de control son:
nUCL 30
nLCL 30
n
kLCL
n
kUCL 00
n
kn
n
kn0000 33
nknk 33
David R. González-Barreto Estadísticas Industriales Marzo 2010 195
Prin EDA DistEstim Hyp Cont Cap R&RMues
Curva O.C. - Ejemplo
• Si n = 5 y se quiere saber la probabilidad de
detectar un desplazamiento de 1 = 0 + 2
en la primera muestra después del
desplazamiento.
• la probabilidad de detectar el
desplazamiento:
• La curva característica operacional para
varios tamaños de muestras (n) se presenta
a continuación.
Plot
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0 .5 1 1.5 2 2.5 3 3.5
k
oc_n=1
oc_n=5
oc_n=7
oc_n=8
oc_n=10
oc_n=15
0708.037.747.152353
9292.00708.011
David R. González-Barreto Estadísticas Industriales Marzo 2010 196
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control para
Medidas Individuales• Existen muchas situaciones donde el tamaño de muestra para monitorear el proceso es 1
(n = 1). Algunos ejemplos de estas situaciones se describen a continuación:
– La inspección es automatizada permitiendo que cada unidad
manufacturada sea analizada.
– La razón de producción es muy lenta, haciendo prácticamente imposible o
indeseable que tamaños de muestras mayores de 1 (n > 1), puedan
acumularse para ser analizadas.
– En algunos procesos, como por ejemplo, la fabricación de papel, se toman
medidas en múltiples localizaciones a través del rollo. Por ejemplo,
podemos tomar medidas del espesor del rollo, esto produciría una
desviación estándar que es muy pequeña si el objetivo es el de controlar el
espesor del rollo a lo largo del mismo.
David R. González-Barreto Estadísticas Industriales Marzo 2010 197
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control para
Medidas Individuales
El gráfico de medidas individuales usa el rango movible de dos
observaciones consecutivas para estimar la variabilidad del proceso. El
rango movible se define como: 1iii xxMR .
Los parámetros para el gráfico de control de medidas individuales son:
2
3d
MRxLCS
Línea central = x
2
3d
MRxLCS
David R. González-Barreto Estadísticas Industriales Marzo 2010 198
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control para
Medidas Individuales - Ejemplo
La viscosidad de un primer de pintura es una importante característica de
calidad. El producto se produce en lotes y como producir cada lote toma
varias horas, el tiempo de producción es muy lento para permitir que se
haga más de una muestra.
Lote Viscosidad
x
Rango Movible
MR
1 33.75
2 33.05 0.70
3 34.00 0.95
4 33.81 0.19
5 33.46 0.35
6 34.02 0.56
7 33.68 0.34
8 33.27 0.41
9 33.49 0.22
10 33.20 0.29
11 33.62 0.42
12 33.00 0.62
13 33.54 0.54
14 33.12 0.42
15 33.84 0.72
52.33x 48.0MR
David R. González-Barreto Estadísticas Industriales Marzo 2010 199
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control para
Medidas Individuales - Ejemplo
X Chart for Viscocidad
0 3 6 9 12 15
Observation
32
32.5
33
33.5
34
34.5
35
X
Centerline = 33.52
UCL = 34.80
LCL = 32.24
MR(2) Chart for Viscocidad
0 3 6 9 12 15
Observation
0
0.4
0.8
1.2
1.6
MR
(2)
Centerline = 0.48
UCL = 1.57
LCL = 0.00
David R. González-Barreto Estadísticas Industriales Marzo 2010 200
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control para
Medidas Individuales - Ejemplo
En la siguiente tabla se muestran 15 lotes adicionales para el ejemplo de la
viscosidad de la pintura.
Lote Viscosidad
x
Rango Movible
MR
16 33.50 0.34
17 33.25 0.25
18 33.40 0.15
19 33.27 0.13
20 34.65 1.38
21 34.80 0.15
22 34.55 0.25
23 35.00 0.45
24 34.75 0.25
25 34.50 0.25
26 34.70 0.20
27 34.29 0.41
28 34.61 0.32
29 34.49 0.12
30 35.03 0.54
David R. González-Barreto Estadísticas Industriales Marzo 2010 201
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control para
Medidas Individuales - Ejemplo
X Chart for Viscocidad1
0 5 10 15 20 25 30
Observation
32
33
34
35
36
X
Centerline = 33.92
UCL = 35.01
LCL = 32.83
MR(2) Chart for Viscocidad1
0 5 10 15 20 25 30
Observation
0
0.3
0.6
0.9
1.2
1.5
MR
(2)
Centerline = 0.41
UCL = 1.34
LCL = 0.00
David R. González-Barreto Estadísticas Industriales Marzo 2010 202
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control para
Medidas Individuales - Ejemplo• Algunos analistas recomiendan no construir el gráfico de los rangos
movibles. Ellos señalan que estos no muestran realmente cambios en la
variabilidad del proceso. Más bien muestran cambios en el promedio del
proceso. Esto se muestra claramente en las figuras anteriores donde
cambios en el promedio alrededor del lote #20 se perciben en ambos
gráficos, en el de medidas individuales y en el de los rangos movibles.• Nota: En estos gráficos, de medidas individuales, hemos hecho la presunción de que las observaciones
provienen de una distribución normal. Esta presunción es crítica para este gráfico. Si mediante cualquier prueba
encontramos evidencia de que esta presunción no se cumple, tendríamos que determinar los límites de control
para las medidas individuales basándonos en las percentilas de la distribución apropiada. En este caso, utilizar
las fórmulas discutidas para calcular los límites sería incorrecto.
David R. González-Barreto Estadísticas Industriales Marzo 2010 203
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
El gráfico de control EWMA es una buena alternativa a los gráficos
tradicionales Shewhart, cuando nos interesa detectar desplazamientos muy
pequeños en el proceso. Este gráfico se utiliza típicamente con
observaciones individuales pero como veremos es posible crear subgrupos
cuyo tamaño de muestra n > 1. La estadística EWMA se define como:
donde 0 < < 1 es una constante y el valor inicial necesario para la primera
muestra se define como el valor deseado
z0 = 0
1)1( iii zxz
David R. González-Barreto Estadísticas Industriales Marzo 2010 204
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
Otra alternativa usada para el valor inicial es xz0
.
La siguiente ecuación muestra que la estadística EWMA a la que llamamos
z, es un promedio pesado de los promedios muestrales previos:
22
1
21
)1()1(
)1()1(
iiii
iiii
zxxz
zxxz
Por ejemplo, si = 0.2 entonces los pesos asignados a las observaciones
previas serán 0.16, 0.128, 0.1024,…. Mientras que el peso asignado a la
observación actual será de 0.2. Debido a que estos pesos declinan de forma
geométrica algunas personas conocen este gráfico como el de promedio
geométrico movible.
David R. González-Barreto Estadísticas Industriales Marzo 2010 205
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
Si las observaciones individuales xi son independientes con varianza 2 los
límites del gráfico EWMA estarán dados por:
i
i
kLCI
LC
kLCS
2
0
0
2
0
)1(1)2(
)1(1)2(
David R. González-Barreto Estadísticas Industriales Marzo 2010 206
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
En estas ecuaciones K sirve para determinar el ancho de los límites que se
desea, mientras que i representa la muestra bajo consideración. Como estos
límites dependen de la muestra bajo consideración los mismos no son
constantes como veremos en el ejemplo que se presenta a continuación. Sin
embargo a medida que i aumenta los límites tienden a estabilizarse de la
siguiente manera:
)2(
)2(
0
0
0
kLCI
LC
kLCS
No obstante la mayoría de los autores recomiendan utilizar la definición
original para mantener los límites exactos en los valores pequeños de i.
David R. González-Barreto Estadísticas Industriales Marzo 2010 207
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
Ejemplo
Los siguientes son datos para el peso de partículas tomadas en un
laboratorio. Se presume = 0.10 y k = 2.7
Muestra Observación
1 9.45
2 7.99
3 9.29
4 11.66
5 12.16
6 10.18
7 8.04
8 11.46
9 9.2
10 10.34
11 9.03
12 11.47
13 10.51
14 9.4
15 10.08
*En esta tabla se presentan las primeras quince observaciones.
David R. González-Barreto Estadísticas Industriales Marzo 2010 208
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
Ejemplo
EWMA Chart for Peso
0 5 10 15 20 25 30
Observation
8.8
9.2
9.6
10
10.4
10.8
11.2
EW
MA
Centerline = 10.02
UCL = 11.14
LCL = 8.89
David R. González-Barreto Estadísticas Industriales Marzo 2010 209
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
• Como dijimos anteriormente, estos gráficos son muy efectivos detectando
cambios pequeños en el proceso. El diseño de los mismos envuelve
determinar la constante K así como la constante . Estudios han
determinado que valores de en el intervalo 0.05 < < 0.25 trabajan muy
bien en la práctica. Los valores = 0.05, = 0.10 y = 0.20 son los más
frecuentemente utilizados. Una práctica adecuada es seleccionar valores
pequeños de para detectar cambios más pequeños. También se ha
encontrado que k = 3 trabaja bastante bien en la práctica especialmente
para valores grandes de . Sin embargo, cuando < 0.10 los estudios han
encontrado que k debe considerarse dentro del siguiente intervalo 2.6 < k <
2.8.
David R. González-Barreto Estadísticas Industriales Marzo 2010 210
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráfico de Control EWMA
• Un detalle que es importante señalar es que el gráfico tradicional Shewhartreacciona más rápido que el EWMA para desplazamientos grandes. Por loque algunos autores han sugerido un esquema de control que incluyaambos gráficos simultáneamente.
EWMA con n > 1
• Por lo general el gráfico EWMA se utiliza con observaciones individuales.Sin embargo, si los subgrupos racionales consisten de más de unaobservación, n > 1, entonces todo lo que necesitamos hacer es reemplazarxi por y por en las ecuaciones previamente discutidas.
nix
David R. González-Barreto Estadísticas Industriales Marzo 2010 211
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control por Atributos
• Cuando los datos son de tipo discreto, los gráficos de control están
asociados con modelos de distribuciones discretas. Los gráficos más
conocidos para esta clasificación de datos lo son: el gráfico p, para la
fracción de defectuosos, y el gráfico c, para el control de defectos.
• Los modelos asociados con cada uno de estos son el binomial y el Poisson,
respectivamente.
David R. González-Barreto Estadísticas Industriales Marzo 2010 212
Prin EDA DistEstim Hyp Cont Cap R&RMues
Gráficos de Control por Atributos
• Los límites de control estándar para ambos gráficos se muestran a
continuación:
• Para el gráfico p , donde p-barra es
la fracción de defectuosos promedio
• Para el gráfico c , donde c-barra es el
promedio de defectos.
n
ppp
)1(3
cc 3
David R. González-Barreto Estadísticas Industriales Marzo 2010 213
Prin EDA DistEstim Hyp Cont Cap R&RMues
Plan de Control
Product:
Line:
Voice of the CustomerVoice of the
Process
Lower
Spec
Limit
Target
Upper
Spec
Limit
units Data TypeSample
Frequency
Instrument
Used
Gage
Capability
Process Cpk or
PPM
Monitoring
System
Response
Plan
Cri
tica
l
Process Steps
[Area name here] Control PlanPrioritization Method Used:
(e.g. FMEA, Business Matrix, etc.)
Reference Documents
No. and Revision:
Product
Characteristic
Measurement System Control ToolsMeasurement
David R. González-Barreto Estadísticas Industriales Marzo 2010 214
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
• Capacidad - La habilidad de un proceso para producir productos dentro
de las especificaciones establecidas. Un proceso se dice que es capaz
cuando la gran mayoría del producto confeccionado por el mismo está
dentro de las especificaciones.
• Indices de la capacidad del proceso - Miden la capacidad de un
proceso.
David R. González-Barreto Estadísticas Industriales Marzo 2010 215
Prin EDA DistEstim Hyp Cont Cap R&RMues
Variabilidad
– La voz del proceso – se representa por la variabilidad
observada en el proceso. El proceso nos dice „lo que
puede lograr‟.
– La voz del cliente – está representada por las
especificaciones del producto. El cliente nos dice „lo
que desea obtener‟.
– La capacidad del proceso nos indica si la voz del
proceso podrá complacer la voz del cliente.
David R. González-Barreto Estadísticas Industriales Marzo 2010 216
Prin EDA DistEstim Hyp Cont Cap R&RMues
Variabilidad
Esp.
Inf.
Esp.
Sup.
Proceso Controlado usando
la filosofía de estar lo más
cercano al valor nominal.
Proceso Controlado usando
la filosofía de cualquier
valor dentro de las
especificaciones es
aceptable.
David R. González-Barreto Estadísticas Industriales Marzo 2010 217
Prin EDA DistEstim Hyp Cont Cap R&RMues
Esp.
Inf.
Esp.
Sup.
Esp.
Inf.
Esp.
Sup.
Variabilidad
Menor Variabilidad Provee
- Un proceso predecible
- Mejora habilidad de detectar cambios
- Menos pérdida, retrabajo, menor costo
- Productos y servicios que ejecutan mejor
El objetivo principal del esfuerzo de C4I es reducir la varianza del proceso
Reducción de
Varianza
Proceso proporciona
unidades fuera de
especificaciones
Proceso proporciona
unidades dentro de
especificaciones
David R. González-Barreto Estadísticas Industriales Marzo 2010 218
Prin EDA DistEstim Hyp Cont Cap R&RMues
Variabilidad
• Visión Tradicional
– Cualquier valor dentro de las
especificaciones es satisfactorio.
• Visión Moderna
– En cualquier momento en que
una característica se desvía del
valor nominal (target) existe una
pérdida. A mayor desviación,
mayor será la pérdida.
Esp.
Inf.
Esp.
Sup.
Pérdida Pérdida
Esp.
Inf.
Esp.
Sup.
Valor Nominal
Esp.
Inf.
Esp.
Sup.
Pérdida Pérdida
Pérdida
Valor Nominal
David R. González-Barreto Estadísticas Industriales Marzo 2010 219
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
Process-Capability Ratio (Cp index)
6
LEILESC
P
Si es desconocida puede ser estimada por S , en cuyo caso:
S
LEILESC
P 6
LES = “límite de especificación superior”
LEI = “límite de especificación inferior”
David R. González-Barreto Estadísticas Industriales Marzo 2010 220
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
• Cp - razón de la variabilidad del proceso (6 sigma) al ancho permitido por
las especificaciones del producto (LES - LEI).
• Debido a que el índice Cp solo considera la variabilidad del proceso, sin
incluir la medida de tendencia central o promedio, a este índice se le
conoce como la capacidad potencial del proceso.
David R. González-Barreto Estadísticas Industriales Marzo 2010 221
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
Ancho del proceso
Especificaciones del producto
LEI Nominal LES
David R. González-Barreto Estadísticas Industriales Marzo 2010 222
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
Para especificaciones de un solo lado:
3
3
LEIC
LESC
LP
uP
CPu y CPL se obtienen cuando estimamos y .
David R. González-Barreto Estadísticas Industriales Marzo 2010 223
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
• El Cp
no toma en consideración la localización del proceso con relación a
los límites de especificación. Asume que está centralizado. La localización
del proceso con relación a los límites de especificación la da el:
CPk = PCRk = min (CPu y CPL)
• Cpk es la razón de la mitad del ancho del proceso (3 sigma) al
ancho de las especificaciones del producto.
David R. González-Barreto Estadísticas Industriales Marzo 2010 224
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
LEI LESCp = 1
David R. González-Barreto Estadísticas Industriales Marzo 2010 225
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
LEI LESCp = 1
David R. González-Barreto Estadísticas Industriales Marzo 2010 226
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
LEI LESCpk = 1
David R. González-Barreto Estadísticas Industriales Marzo 2010 227
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
LEI LESCpk = 1
David R. González-Barreto Estadísticas Industriales Marzo 2010 228
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
LEI LESCpk = 2
David R. González-Barreto Estadísticas Industriales Marzo 2010 229
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
Efecto de la no normalidad
LESLEI
LEI LES
David R. González-Barreto Estadísticas Industriales Marzo 2010 230
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
¿Será el proceso capaz?
• Cp:
– Calcule la desviación estándar,
– Calcule Cp:
6
LEILESCp
Si Cp < 1.0, el proceso no tiene la capacidad potencial
Si 1.0 < Cp < 1.33, el proceso es justamente capaz
Si Cp > 1.33, el proceso es potencialmente capaz
David R. González-Barreto Estadísticas Industriales Marzo 2010 231
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
¿Será el proceso capaz?
• Cpk:
– Calcule el promedio y la desviación estándar,
– Calcule Cpk:
3
)(),(min LEIxxLESCpk
Si Cp < 1.0, el proceso no es capaz
Si 1.0 < Cp < 1.33, el proceso es justamente capaz
Si Cp > 1.33, el proceso es capaz
x
David R. González-Barreto Estadísticas Industriales Marzo 2010 232
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
¿Será el proceso capaz?
• Cpm:
– Calcule el promedio y la desviación estándar,
– Calcule Cpm:
22 )(6 Tx
LEILESCpm
x
A mayor Cpm mejor el proceso
David R. González-Barreto Estadísticas Industriales Marzo 2010 233
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
Cpk, Rendimiento y “PPM’s” para un proceso centralizado
Cpk Rendimiento* “Defective per million (ppm)*”
0.3 63.188% 368,120
0.4 76.986% 230,139
0.5 86.639% 133,614
0.6 92.814% 71,861
0.7 96.427% 35,729
0.8 98.360% 16,395
0.9 99.307% 6,934
1.0 99.730% 2,700
1.1 99.903% 967
1.2 99.968% 318
1.3 99.990% 96
1.4 99.997% 27
1.5 99.999% 6.8
1.6 >99.999% 1.6
1.7 >99.999% 0.34
1.8 >99.999% 0.07
1.9 >>99.999% 0.01
2.0 >>>99.999% 0.002
2.1 >>>>99.999% 0.0003
2.2 >>>>>99.999% 0.0000
*Presume un proceso centralizado
David R. González-Barreto Estadísticas Industriales Marzo 2010 234
Prin EDA DistEstim Hyp Cont Cap R&RMues
Análisis de Capacidad
El intervalo de confianza de Cp con un (1- )100% de confiabilidad es:
1616
1,2
2
1,2
n
x
s
LEILESC
n
x
s
LEILES n
p
n
El intervalo de confianza de Cpk con un (1- )100% de confiabilidad es:
12
1
ˆ9
11ˆ
12
1
ˆ9
11ˆ
22/22/nCn
ZCCnCn
ZCpk
pkpk
pk
pk
David R. González-Barreto Estadísticas Industriales Marzo 2010 235
Prin EDA DistEstim Hyp Cont Cap R&RMues
Repetibilidad y Reproducibilidad
(R & R)• En cualquier proceso que envuelva medidas, es altamente probable
que la variabilidad observada sea resultado no sólo del producto, pero también del instrumento de medir y la persona que lo mida.
• Repetibilidad - está asociada con la precisión inherente del instrumento de medir.
• Reproducibilidad - está asociada con la precisión de varios operadores midiendo las piezas con un mismo instrumento de medir.
David R. González-Barreto Estadísticas Industriales Marzo 2010 236
Prin EDA DistEstim Hyp Cont Cap R&RMues
R & R
componente de la
variabilidad total
causado por error de
medición
componente de la
variabilidad total
inherenteal producto
222
mediciónproductototal
222
ilidadreproducibdadrepetibilimedicion
David R. González-Barreto Estadísticas Industriales Marzo 2010 237
Prin EDA DistEstim Hyp Cont Cap R&RMues
R & R - Ejemplo
Operador A Operador B Operador C
Pieza Medidas Medidas Medidas
# 1 2 1 2 1 2
1 21 20 20 20 19 21
2 24 23 24 24 23 24
3 20 21 19 21 20 22
4 27 27 28 26 27 28
5 19 18 19 18 18 21 6 23 21 24 21 23 22
7 22 21 22 24 22 20
8 19 17 18 20 19 18
9 24 23 25 23 24 24
10 25 23 26 25 24 25
11 21 20 20 20 21 20
12 18 19 17 19 18 19
13 23 25 25 25 25 25
14 24 24 23 25 24 25
15 29 30 30 28 31 30
16 26 26 25 26 25 27 17 20 20 19 20 20 20
18 19 21 19 19 21 23
19 25 26 25 24 25 25
20 19 19 18 17 19 17
David R. González-Barreto Estadísticas Industriales Marzo 2010 238
Prin EDA DistEstim Hyp Cont Cap R&RMues
R & R - Ejemplo
ANOVA Table
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
Operators 2.21667 2 1.10833
Parts 1202.5 19 63.2895
Operators*Parts 33.45 38 0.880263 0.79 0.7815
Residual 67.0 60 1.11667
--------------------------------------------------------------------------------
Total 1305.17 119
ANOVA Table
Source Sum of Squares Df Mean Square
----------------------------------------------------------
Operators 2.21667 2 1.10833
Parts 1202.5 19 63.2895
Residual 100.45 98 1.025
----------------------------------------------------------
Total 1305.17 119
David R. González-Barreto Estadísticas Industriales Marzo 2010 239
Prin EDA DistEstim Hyp Cont Cap R&RMues
R & R - Ejemplo
Gage Report
3 operators 20 parts 2 trials
Measurement Unit Analysis and Study Variation
----------------------------------------------------------------------
5.15 Percent Study Percent
Std. dev. Variation Contribution
Repeatability 5.21398 29.72 8.84
Reproducibility 0.85726 4.89 0.24
R & R 5.28398 30.12 9.07
Part-to-Part 16.7262 95.35 90.93
95.0 Confidence Intervals
----------------------------------------------------------------------
Lower 5.15 Upper
Limit Std. dev. Limit
Repeatability 4.57508 5.21398 6.06192
Reproducibility 0.0 0.85726 5.3235
R & R 5.1677 5.28398 5.16218
Part-to-Part 12.0411 16.7262 24.8213