Download - No Slide Titleacademic.uprm.edu/dgonzalez/adiestramientos/Estadisticas... · Prin EDA Estim Dist Mues Hyp Cont Cap R&R Variabilidad • ¿Por qué ocurre la variabilidad? ... –Datos

David R. González-Barreto Estadísticas Industriales Marzo 2010 1

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estadísticas Industriales

Presentado en:

Stryker, Puerto Rico



Variabilidad

• Virtualmente, todos los procesos y sistemas del mundo real exhiben

variabilidad. Las estadísticas son fundamentales en el mejoramiento de la

calidad debido a que las técnicas estadísticas se utilizan para describir y

entender la variabilidad. En efecto estas técnicas se han utilizado para

reducir: el re-trabajo, los desperdicios, la necesidad de inspección y los

costos de garantía.



Variabilidad

• ¿Por qué ocurre la variabilidad?

– En términos generales, la variabilidad es el resultado de cambios en las condiciones de los procesos y/o sistemas en donde las medidas se efectúan. En manufactura estos cambios se pueden deber a cambios en las propiedades de los materiales, diferencias en la manera en que las personas realizan su trabajo, diferencias en los parámetros del proceso y finalmente también puede deberse al sistema de medida.

– El campo de las probabilidades y estadísticas consiste de métodos para describir y modelar la variabilidad y para tomar

decisiones cuando ésta está presente.



Clasificación de los datos

• Los datos tienen dos clasificaciones: datos contínuos o por variable

y datos categóricos o por atributo.

– Datos por variable - decimos que la escala podría ser

infinitamente subdivisible y que está determinada por el

instrumento de medida.

– Datos por atributo - decimos que la escala es meramente

un conteo, ejemplo de esto sería la clasificación del número de

artículos defectuosos encontrados en una muestra.



Definiciones

• Estadísticas - Es la ciencia y el arte de recopilar, mostrar e interpretar

datos con el propósito de probar teorías y hacer inferencias acerca de todo

tipo de fenómenos.

• Análisis Exploratorio de Datos (Exploratory Data Analysis –

EDA) – Es el arte de mostrar los datos con un formato atractivo, que a su

vez proporcione información de interés para el ingeniero o científico.



Definiciones

• Entre las herramientas más utilizadas encontramos:

Diagrama de Punto (Dot Diagram)

Histograma de Frecuencia

Diagrama de Pareto

Gráficos de Caja (Boxplots)

Sencillo

Múltiple

Diagrama de Dispersión (Scatter Diagram)



Diagrama de Punto

• El diagrama de punto es un gráfico muy útil para mostrar conjuntos

pequeños de datos, regularmente hasta alrededor de veinte observaciones.

El mismo permite observar fácilmente la localización o la tendencia central

así como la dispersión o variabilidad en los datos. Estos diagramas, con

frecuencia, nos ayudan a comparar dos o más conjuntos de datos.



Diagrama de Punto - Ejemplo

Considere los siguientes datos que se refieren al esfuerzo en

tensión de un tipo de cemento cuando se le añade un polímero (P).

16.85 16.40 17.21 16.35 16.52

17.04 16.96 17.15 16.59 16.57

El siguiente sería el diagrama de punto correspondiente a estos

valores. Dot Diagram

P

Fre

que

ncy

16.3 16.5 16.7 16.9 17.1 17.3 17.5

0

1




Suponga que los siguientes diez valores corresponden al esfuerzo

en tensión de muestras de cemento sin el polímero.

17.50 17.63 18.25 18.00 17.86

17.75 18.22 17.90 17.96 18.15

. . ... . . . . .

---+---------+---------+---------+---------+---------+---P

. . . .. .. . :

---+---------+---------+---------+---------+---------+---SP

16.45 16.80 17.15 17.50 17.85 18.20




• En el diagrama de punto anterior puede notarse que el cemento al que se le añade el polímero (P) resulta en un esfuerzo en tensión menor al cemento (SP) común considerado. No obstante, podríamos decir que la variabilidad inherente dentro de cada grupo

es fundamentalmente la misma.

• Cuando el número de datos disponibles es relativamente grande,construir un diagrama de punto no es muy eficiente. Otras técnicasque se discutirán a continuación resultarán ser mucho másefectivas.



Histograma

• Una distribución de frecuencia es una forma compacta de resumir los

datos. Se obtiene de dividir el rango de los datos en intervalos comúnmente

llamados celdas. El número de celdas dependerá del número de

observaciones así como de la dispersión encontrada.

• A la representación gráfica de una distribución de frecuencia es a lo que

llamamos histograma.



Histograma - Ejemplo

La siguiente tabla muestra el octanaje de varias marcas de

gasolina. 88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 96.5 93.3

94.7 91.1 91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7

84.3 86.7 88.2 90.8 88.3 98.8 94.2 92.7 93.2 91.0

90.1 93.4 88.5 90.1 89.2 88.3 85.3 87.9 88.6 90.9

89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9

89.8 89.6 87.4 88.4 88.9 91.2 89.3 84.4 92.7 91.8

91.6 90.4 91.1 92.6 89.8 90.6 91.1 90.4 89.3 89.7

90.3 91.6 90.5 93.7 92.7 92.2 92.2 91.2 91.0 92.2

90.0 90.7




Histogram for Octanaje

82 86 90 94 98 102

Octanaje

0

10

20

30

40

freq

uen

cy




• La siguiente gráfica presenta la distribución acumulativa de los datos

nuevamente para el ejemplo del octanaje.

Histogram for Octanaje

Octanaje

freq

uen

cy

82 86 90 94 98 102

0

20

40

60

80

100



Histograma

• En la práctica se ha encontrado que utilizar entre cinco y veinte celdas

produce resultados satisfactorios. A medida que el número de

observaciones aumenta, el número de celdas también debe aumentar.

Algunos analistas (e.g. Montgomery) sugieren que este número debe ser

aproximado a la raíz cuadrada del número de observaciones.



Diagrama de Pareto

• Una variación importante al histograma cuando se utilizan datos

categóricos lo es el diagrama de Pareto. Este gráfico es altamente utilizado

en los esfuerzos de mejoramiento continuo de la calidad en donde las

categorías representan, por ejemplo, tipos de defectos, modos de falla y

problemas del proceso. Las categorías son ordenadas en forma

descendente.

• El nombre de este diagrama se debe a un economista italiano cuya ley (Ley

de Pareto) puede interpretarse dentro del ambiente industrial de la

siguiente forma: “la mayoría de los defectos se debe a sólo un puñado de

las categorías”.



Diagrama de Pareto - Ejemplo

La siguiente tabla muestra defectos estructurales en las puertas de

un tipo de automóvil.

Categoría Frecuencia

Abolladuras 4

Fallos en pintura 6

Fallos en lubricación 5

Fallos de contorno 30

Fuera de secuencia 8

Fallos en terminación 3




Pareto Chart for Frecuencia

freq

uen

cy

0

10

20

30

40

50

60

Fallos de contornoFuera de secuencia

Fallos en pinturaFallos en lubricació

AbolladurasFallos en terminació

53.57

67.86

78.5787.50

94.64100.00




• En el Diagrama de Pareto anterior podemos observar que las primeras tres

categorías ordenadas resultan en alrededor del 79% de las fallas totales.

• Variaciones al Diagrama de Pareto incluyen:

• “Diagramas de Pareto Pesados”

• “Diagramas de Pareto Anidados”



Diagrama de Caja (Boxplot)

• Un gráfico de caja es una representación esquemática de la mediana muestral, de las cuartilas inferior y superior, y de la observación máxima y mínima de un conjunto de datos. Como muestra la figura en la página siguiente, se construye una caja cuyos extremos corresponden a las cuartilas inferior y superior y unas líneas verticales que salen de los extremos de la caja para representar la observación máxima y mínima respectivamente. Finalmente, una línea corta la caja y representa la mediana muestral.




Cuartila – 75%

Cuartila – 25%

Observación Mínima

Observación Máxima

Mediana




• Un gráfico de caja provee una representación gráfica simple de la forma del

conjunto de datos. Note que la mitad de las observaciones están

contenidas en la caja y la otra mitad fuera de ella. Si un histograma

muestra simetría, entonces las líneas del “boxplot” deben ser de un largo

similar y la mediana debe estar localizada en la vecindad del centro de la

caja. Si los datos están sesgados, las líneas no serán de igual largo y la

mediana no se localizará cerca del centro de la caja. Muchos paquetes

estadísticos representan valores espúreos (“outliers”) con asteriscos fuera

de las líneas de los valores máximos.



Diagrama de Caja - Ejemplo

Los datos para la radiación emitida por 42 hornos de microondas

se presentan en la siguiente tabla.

0.15 0.09 0.18 0.10 0.05 0.12 0.08

0.05 0.08 0.10 0.07 0.02 0.01 0.10

0.10 0.10 0.02 0.10 0.01 0.40 0.10

0.05 0.03 0.05 0.15 0.10 0.15 0.09

0.08 0.18 0.10 0.20 0.11 0.30 0.02

0.20 0.20 0.30 0.30 0.40 0.30 0.05




Box-and-Whisker Plot

Radiacion

0 0.1 0.2 0.3 0.4




• Como puede observarse, las radiaciones emitidas con valor igual a 0.4 son

identificadas por este gráfico como valores espúreos. También se puede

notar del gráfico que la distribución de las radiaciones parece sesgarse

hacia los valores altos.

• Los diagramas de caja son muy útiles para hacer comparaciones entre

conjuntos o poblaciones de datos. En el siguiente ejemplo se muestra este

uso al comparar dos poblaciones de bombillas.




Un estudio se realiza para comparar el efecto de dos distintos

filamentos (Tipo A, Tipo B) en el número de horas de servicio de unas bombillas. Diez observaciones para cada tipo de filamento

aparecen en la siguiente tabla.

A B

1293 1643 1061 1138

1380 1466 1065 1143

1614 1627 1092 1094

1497 1383 1017 1270

1340 1711 1021 1028




Este boxplot muestra claramente cómo el filamento Tipo A

redunda en largos de vida mucho mayores que el Tipo B, pero a su vez induce una mayor variabilidad.

A

B


1000 1200 1400 1600 1800

Horas

Tip

o



Diagrama de Dispersión

• Los gráficos estudiados hasta el momento nos ayudan a entender la

distribución de una variable. Los diagramas de dispersión son útiles para

estudiar la relación entre dos variables. Esta gráfica presenta simplemente

pares ordenados (xi , yi), con el propósito de detectar alguna relación entre

las variables.




Relación positiva - los puntos en el diagrama siguen una trayectorialineal ascendente.

Relación negativa - los puntos en el diagrama siguen una trayectorialineal descendente, o sea, mientras una de las variables disminuye la otraaumenta.

Relación no lineal – los puntos en el diagrama siguen una trayectoriacurvilínea.

• Relación no sistemática – los puntos en el diagrama muestran un patrón aleatorio que no sigue ninguna de las relaciones antes indicadas. Esto puede ser interpretado como la independencia entre ambas variables.




Ejemplo• En la tabla que se presenta a continuación y representa la pureza del

oxígeno producida por un proceso químico mientras que x es el porcentaje

de hidrocarbonos presentes en el condensador de la unidad de destilación.




Ejemplo

Observación x y

1 0.99 90.01

2 1.02 89.05

3 1.15 91.43

4 1.29 93.74

5 1.46 96.73

6 1.36 94.45

7 0.87 87.59

8 1.23 91.77

9 1.55 99.42

10 1.40 93.65

11 1.19 93.54

12 1.15 92.52

13 0.98 90.56

14 1.01 89.54

15 1.11 89.85

16 1.20 90.39

17 1.26 93.25

18 1.32 93.41

19 1.43 94.98

20 0.95 87.33




Ejemplo

Plot of Y vs X

0.87 1.07 1.27 1.47 1.67

X

87

90

93

96

99

102

Y




Ejemplo• La inspección de este diagrama indica que aunque ninguna curva

contendría exactamente todos los puntos, una relación lineal positiva

parece existir entre estas dos variables.

• Nota de cautela: El que este diagrama muestre una relación aparente

entre las variables no puede tomarse como que existe una causalidad entre

éstas.



Población Muestra

x1

x2

Parámetros Estadísticas

x3

x4

xn

:

.

Muestra vs. Población

,.......,,, 2 rSSx



Medidas de Tendencia Central

• Promedio muestral

– El valor del promedio muestral tiene mayor precisión que cada

observación individual. Por lo tanto, en la mayoría de los casos

éste será representado con un dígito más que los utilizados para

las observaciones individuales.

n

n

ii

x

x 1




• Mediana

– La mediana es el punto en el cual la muestra es dividida en dos

mitades. Si x(1) , x(2) , …, x(n) representa una muestra ordenada

en forma ascendente, entonces la mediana se define como la

observación del medio o la observación ([n + 1] / 2) cuando n es

impar y el promedio de las dos observaciones del medio si n es

par.




En términos matemáticos,

• La ventaja fundamental de la mediana es que ésta no es influenciada por

valores extremos.

, n parxx

, n imparx

x n/n/

/n

2

~122

21




• Moda

– La moda es la observación que ocurre con mayor frecuencia en

la muestra. Cuando los dos valores más frecuentes ocurren

igual número de veces, decimos que los datos siguen una

distribución bimodal.



Cuartilas y Percentilas

• La mediana de una muestra o una población divide los datos en dos

mitades iguales. Los datos también pueden dividirse en más de dos partes.

Cuando un conjunto de datos ordenados se divide en cuatro partes iguales,

los puntos en los cuales ocurre esa división son llamados cuartilas.




• La primera cuartila o cuartila inferior, q1, corresponde al valor que

tiene aproximadamente una cuarta parte (25%) de las observaciones bajoel mismo y aproximadamente 75% de las observaciones por encima de él.La segunda cuartila q

2, tiene aproximadamente el 50% de las

observaciones bajo su valor y corresponde a la mediana. Finalmente, la

tercera cuartila o cuartila superior, q3, tiene aproximadamente tres

cuartas partes (75%) de las observaciones bajo su valor. Como en el casode la mediana, las cuartilas pueden no ser únicas. Cuando esto ocurre,una forma simple de manejarlo es tomar el promedio como la cuartila

cuando más de una observación satisface la definición.




Ejemplo

Las siguientes observaciones representan el tiempo en horas hasta

falla de un material eléctrico de insulación. 204 228 252 300 324 444 624 720 816 912

1176 1296 1392 1488 1512 2520 2856 3192 3528 3710




Ejemplo

La mediana sería:

~x q2

912 1176

21044

La primera cuartila:

q1

324 444

2384

La cuartila superior:

q3

1512 2520

22016




Ejemplo

Note que los valores de la mediana, cuartila inferior y cuartila

superior corresponden a los extremos y la línea cortante de la

caja en este gráfico.


0 1 2 3 4(X 1000)

Tiempo




• Cuando un conjunto ordenado de datos es subdividido en cien partes

iguales, los puntos en los cuales ocurre esa división son llamados

percentilas (pk).



Medidas de Variabilidad

• Rango

– Una medida muy simple de la variabilidad es el rango muestral,

que se define como la diferencia entre la observación mayor y la

menor en la muestra.

r = max (xi) – min (xi)




• Rango

– El rango muestral es fácil de obtener, pero ignora toda la

información existente en la muestra no contenida en las dos

observaciones consideradas. Cuando el tamaño de muestra es

pequeño, digamos n < 10, la información perdida al calcular el

rango no es tan significativa. En general, se prefiere una

medida de variabilidad que considere todas las observaciones

en lugar de una que considere solo unas pocas.




• El rango entre cuartilas (“interquartile range” – IQR) se define como la

diferencia entre las cuartilas superior e inferior. El IQR es menos sensitivo

a valores extremos en la muestra que el rango muestral ordinario.

IQR = q3 – q1




• Varianza muestral y desviación estándar muestral

– Las más importantes medidas de variabilidad lo son: la varianza

muestral y la desviación estándar muestral. Si x1 , x2 , …, xn es

una muestra de n observaciones, entonces la varianza muestral

estará dada por:

n

i

i

n

xxs

1

22

1

)(




• La desviación estándar muestral, s, es la raíz cuadrada positiva de

la varianza muestral.

• Las unidades de la varianza muestral son el cuadrado de las unidades de la

variable original. La desviación estándar tiene la propiedad deseable de

medir la variabilidad en las unidades originales de la variable de interés x.




• Coeficiente de variación

– En ocasiones es deseable expresar la variación como una

fracción del promedio. Una medida no dimensional llamada el

coeficiente muestral de variación se usa con este propósito.

– Este coeficiente es útil cuando comparamos dos o más

conjuntos de datos que difieren considerablemente en la

magnitud de las observaciones.

x

scv



Distribuciones

• La distribución de probabilidad o simplemente la distribución de una variable aleatoria X, es una descripción del comportamiento de los posibles valores de X y sus respectivas probabilidades. En muchas ocasiones la distribución de probabilidad de la variable de interés es el resumen más útil para el analista del experimento o proceso bajo estudio.

• Las distribuciones también son clasificadas de acuerdo a los datos considerados. Es decir, tenemos distribuciones discretas o por

atributo y distribuciones continuas o por variable.



Distribución Binomial

• Un experimento de n intentos donde

los intentos son independientes,

cada intento tiene solamente dos posibles

resultados llamados: éxito o fracaso y

la probabilidad de éxito en cada intento,

denominada p, permanece constante

– El número de éxitos, x, tiene una distribución binomial con

parámetros p y n.



Distribución Binomial

• La función de probabilidad de x es:

• Si x es una variable aleatoria binomial con parámetros p y n, entonces:

nxppx

nnpxf

xnxx ,...,1,0,1,;

pnpXV

npXE

x

x

1)(

)(

2



Distribución Geométrica

• En una serie de pruebas Bernoulli, con probabilidad de éxito constante, p,

la variable aleatoria x representa el número de intentos hasta que ocurra elprimer éxito. Entonces x sigue una distribución geométrica con

parámetro p

,...2,1,1;1

xpppxfx

x



Distribución Geométrica

• Si x es una variable aleatoria con parámetro p, entonces el promedio y la

varianza de x son:

22 /1)(

/1)(

ppXV

pXE

x

x



Distribución Poisson

• Dado un intervalo de números reales, asuma que el conteo ocurre

aleatoriamente a lo largo del intervalo. Si el intervalo se dividiera en sub-

intervalos de tamaño pequeño de modo que:

la propabilidad de más de un conteo en un sub-intervalo es cero,

la probabilidad de un conteo en un sub-intervalo es igual para

todos los sub-intervalos y proporcional al largo del sub-intervalo

el conteo en cada sub-intervalo es independiente de otros sub-

intervalos




• Si un número promedio de conteos en el intervalo es > 0, la variable

aleatoria x que representa el número de conteos en el intervalo sigue una

distribución Poisson con parámetro y la función de probabilidad de x es

,...2,1,0,!

; xx

exf

x

x




• Si x es una variable aleatoria de distribución Poisson con parámetro ,

entonces el promedio y la varianza de x son

)(

)(

2 XV

XE

x

x



Distribución Normal

• La distribución más utilizada para el modelaje de experimentos aleatorioses la distribución normal. Esto es así porque muchos fenómenos de lanaturaleza y de procesos de manufactura tienen un “comportamientonormal”.

• Puede demostrarse además, que cuando un experimento consiste de unaserie de intentos independientes (n) y cada uno de ellos resulta en un valorobservado de una variable aleatoria proveniente de una distribuciónparticular, entonces, la variable aleatoria que representa el promedio o eltotal de los n intentos se aproximará a comportarse normalmente. Esteconcepto se conoce como el Teorema de Límite Central.




• La distribución normal consta de dos parámetros. El de tendencia central,

conocido como y el de dispersión, en este caso representado por la

desviación estándar .

• La función de probabilidad para la distribución normal está dada por:

0 y parámetroscon

2

1,;

2

2

2 xexf

x

x




• Una variable aleatoria con = 0 y 2 = 1 se le conoce como una normal estandarizada y se denota como z. Donde, z = (x - ) / para el caso de las observaciones individuales. Cuando trabajamos con promedios,

• Interpretamos z como el número de desviaciones estándar a que se encuentra x del promedio . Magnitudes altas de z corresponden a valores de x no típicos.

n

xz




68%

95.5%

99.73%




x

2 = 1

2 = 9

2 = 1fx(x)

5 15



Pruebas para Determinar

Normalidad• En ocasiones se quiere determinar o corroborar si una muestra de interés

proviene de una población con cierta distribución probabilística. Para esto

existen varias pruebas tanto numéricas como gráficas. Una de las pruebas

más más utilizadas para determinar si los datos provienen de una

distribución normal es la Kolmogorov-Smirnov.



Prueba para Determinar Normalidad

EJEMPLOAnalice la siguiente muestra de 60 pesos de tabletas y determine si sería correcto

inferir que la distribución que mejor representa los pesos individuales de las tabletas

es la distribución normal.

0.563 0.548 0.55 0.554 0.55 0.556

0.556 0.547 0.55 0.55 0.552 0.552

0.556 0.556 0.544 0.547 0.55 0.55

0.559 0.552 0.549 0.547 0.549 0.554

0.552 0.552 0.551 0.549 0.551 0.544

0.555 0.555 0.55 0.554 0.557 0.546

0.558 0.554 0.554 0.555 0.556 0.551

0.558 0.549 0.55 0.552 0.559 0.556

0.559 0.545 0.548 0.55 0.562 0.55

0.551 0.556 0.551 0.559 0.554 0.556

Ho: Los pesos de las tabletas siguen una distribución Normal.

Hi: Los pesos de las tabletas no siguen una distribución Normal.




Normalidad• La prueba Kolmogorov-Smirnov utiliza la diferencia vertical máxima (Max. Diff.)

entre la distribución empírica y la teórica para determinar la bondad de ajuste

de la muestra observada. La prueba Kolmogorov-Smirnov es preferida sobre

la de Chi Cuadrada especialmente cuando el tamaño de la muestra es pequeño.

}Max. Diff.Empirical Dist.

Theoretical Dist.




Normalidad• En todas las pruebas la forma de decidir si la hipótesis bajo consideración,

datos provienen de una distribución normal, es idéntica. El “software”

reportará un valor p, que de ser bajo (i.e. < .05) indicaría que la hipótesis se

rechaza o que los datos no provienen de una distribución normal.




Normalidad• Un método gráfico para determinar si la distribución de los datos bajo

consideración es normal, es el trazo de cuantilas normales (normal

probability plot).

• Este trazo debe mostrar un comportamiento lineal para decidir

afirmativamente que los datos son normales.




Normalidad• Otra herramienta gráfica para evaluar la normalidad de unos datos es el

trazo de probabilidad normal.

• En esta herramienta se trazan los datos de interés contra su respectiva

frecuencia acumulada observada (pares ordenados) en un papel que tiene

su escala vertical diseñada de tal forma que si las observaciones trazadas

tienen un comportamiento lineal entonces decidimos que los datos

provienen de un fenómeno con distribución normal.




Normalidad• Para determinar los pares de coordenadas a trazarse en el papel:

– Ordene de menor a mayor las observaciones x(j),

– Calcule la frecuencia acumulada observada para cada x(j), y

= [(j – 0.5)/tamaño de muestra].




Normalidad - Ejemplo

• Se analizaron 60 pesos de tabletas. Los resultados fueron los siguientes:



Planes de Muestreo



Planes de Muestreo

• Indice

Definiciones

Relación Productor – Consumidor

Curva O.C.

Planes de Muestreo Sencillo

Riesgo del Consumidor

Riesgo del Productor

Estándar Militar 105 E

Muestreo Secuencial



Definición

• Definición de planes de muestreo – Herramienta estadística en la que se

llevan a cabo los siguientes pasos:

Una muestra aleatoria se toma de un lote.

Una o más características de calidad de las

unidades en la muestra son inspeccionadas.

A base del resultado de lo inspeccionado se dicta

la sentencia sobre aceptar o rechazar el lote.



Aspectos Importantes

• Aspectos importantes sobre los planes de muestreo:

• No estiman la calidad del lote, sólo lo sentencian.

• No proveen ninguna forma directa de control de lacalidad.

• Su uso más efectivo es como una herramientapara asegurarse de que lo producido por elproceso cumple con los requerimientos.

• Tipos de planes de muestreo

• Variables (cuantitativa)

• Por atributo (cualitativa)



Planes de Muestreo Sencillos

• Planes de muestreo sencillos

• Seleccione una muestra de n unidades de un lote

tamaño N.

• Si encuentra c o menos unidades defectuosas en

la muestra, acepte el lote.

• Si encuentra más de c unidades defectuosas (d)

en la muestra, rechace el lote.



Ventajas y Desventajas

• Ventajas de los planes de muestreo

Consume menos tiempo y dinero que la inspección del 100%

de los lotes.

Menos daños al producto debido a la reducción del manejo.

Reduce errores de inspección por concepto de fatiga humana

(dependiendo del plan de muestreo).

• Desventajas de los planes de muestreo

• Riesgo de rechazar lotes buenos y/o aceptar los que se

debieron rechazar.

• Se obtiene información reducida sobre las características de

calidad del proceso.

• No contribuyen a reducir la variabilidad del proceso.



Relación Productor-Consumidor

RELACION PRODUCTOR-CONSUMIDOR

• Cuando usamos planes de muestreo existe un conflicto de interés entre el productor y el consumidor. Por un lado el productor quiere que todos los lotes buenos (que no excedan cierta proporción de piezas defectuosas predeterminada p0) sean aceptados. Por otro lado, el consumidor quiere que todos los lotes malos (que excedan p0) sean rechazados. Este conflicto sólo puede ser resuelto con un plan de muestreo cuya curva característica operacional (OC) sea ideal según discutiremos más adelante.



Curva Característica Operacional (OC)


• Las curvas OC miden la ejecutoria de los planes de muestreo. En éstas, se

traza la probabilidad de aceptar (pa) un lote contra la proporción de

defectuosos (p) del mismo. Es por esto que las curvas OC son utilizadas

para determinar el poder de discernir o discriminar lotes con distintos

niveles de unidades defectuosas que tienen los planes de muestreo.




Curva OC Plan de Muestreo Sencillo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Fracción de defectuosos

Pro

ba

bil

ida

d d

e A

ce

pta

r




• Una curva OC ideal es aquella donde la probabilidad de aceptar lotes

buenos (p p0) es 1 y la probabilidad de aceptar lotes malos (p > p0) es 0.

En la práctica, obtener una Curva OC ideal para un plan de muestreo no es

común. Lo más cercano que un plan de muestreo estará de obtener una

curva OC ideal será al aumentar significativamente el tamaño de muestra

del mismo.




Proporción de defectuosos (p)P0

1

(Pa)

0




• Existen dos tipos de Curvas OC:

– Tipo A – usadas para lotes finitos (pequeños) en cuyo caso (p) está

dada por la distribución probabilística Hipergeométrica.

– Tipo B – usadas para lotes infinitos (grandes) en cuyo caso (p) está

dado por la distribución probabilística Binomial.

• Si ambas curvas son similares.

• La curva OC tipo B tiende a caer por encima de la tipo A.

• El poder de discriminación del plan de muestreo aumentará a

medida que aumente el tamaño de la muestra (n).

10.0N

n



Curva Característica Operacional (OC) Ejemplo

Se desea construir la curva OC para el siguiente plan de muestreo:

N = 10,000 n = 89 c= 2 p = 0.01

Como el lote es grande (infinito) y 10.0N

n uso la distribución Binomial para calcular

los puntos de la Curva OC tipo B.

Pa {d defectuosos} = dnd p1p

!dn!d

!n

Pa {d < c} = d89d

c

0d

99.001.0!d89!d

!89

Pa (d < 2 / p = 0.01)

=9397.099.001.0

!87!2

!8999.001.0

!88!1

!8999.001.0

!89!0

!89 872881890




Plan de Muestreo: N = 10,000 n = 89 c = 2

Fracción de Defectuosos (p) Probabilidad de Aceptar el Lote (Pa)

0.005 0.9897

0.010 0.9397

0.020 0.7366

0.030 0.4985

0.040 0.3042

0.050 0.1721

0.060 0.0919

0.070 0.0468

0.080 0.0230

0.090 0.0109





0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Proporción defectuosos en Lote (p)

Pro

bab

ilid

ad

de A

cep

tar




• Si variamos el tamaño de muestra (n), la curva OC del plan de muestreo de interés

sería como se presenta a continuación:

Dos Planes de Muestreo Sencillo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Proporción defectuosos del Lote (p)

Pro

bab

ilit

idad

de A

cep

tar

Plan 1

Plan 2

n = 50, c =1

n=200, c=4




• Para distintos valores de c, la curva OC del plan de muestreo de interés sería como

se presenta a continuación:

Dos Planes de Muestreo Sencillo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Proporción defectuosos del Lote (p)

Pro

ba

bil

itid

ad

de

Ac

ep

tar

Plan 1

Plan 2

n = 89, c =2

n=89, c=0



Puntos de Interés

• En todo plan de muestreo estarán presentes los siguientes puntos deinterés tanto para el productor como para el consumidor:

– Riesgo del productor ( ) = la probabilidad de rechazar un lote que debióhaber sido aceptado.

– AQL (Acceptable Quality Level) = nivel más pobre de calidad, o lamáxima fracción defectuosa del proceso del productor que elconsumidor consideraría aceptable como el promedio del proceso.

– Riesgo del consumidor ( ) = probabilidad de aceptar un lote que debióhaber sido rechazado.

– LTPD (Lost Tolerance Percent Defective) = un nivel de calidad del lotetan pobre que el consumidor solo lo podría aceptar por error.



Puntos de Interés

• Se debe siempre recordar que es a AQL como es a LTPD. El nivel de

protección que un plan de muestreo ofrezca a cada una de las partes en la

relación Productor-Consumidor dependerá de los dos puntos antes

mencionados (AQL, 1 - ), (LTPD, ). Estos puntos de interés pueden ser

vistos en la Curva OC del plan de muestreo diseñado.



Puntos de Interés


Fracción de defectuosos

Pro

babilid

ad d

e A

cepta

r

AQL LTPD

(AQL, 1 - )

(LTPD, )



Diseño e Implantación

Diseño e Implantación de Planes de Muestreo

• El objetivo principal de diseñar un plan de muestreo es el determinar

tamaño de muestras (n) y límite de aceptación (c), para dictar sentencia

sobre un lote, que cumpla el nivel de riesgo estipulado por el productor, el

consumidor o ambos.




Plan de Muestreo Sencillo

Plan de Muestreo Sencillo

• Suponga que se toma una muestra aleatoria de

tamaño n de un lote de tamaño N. Al inspeccionar

la muestra, si hay más de c unidades defectuosas

rechazo el lote, de lo contrario lo acepto. Existen

varias formas de diseñar un plan de forma tal que

el interés del consumidor o del productor sea

protegida.




Planes de muestreo basados en el riesgo del productor• Cuando el riesgo del productor ( ) y el nivel de calidad aceptable (AQL)

asociado con éste son estipulados como la base del plan de muestreo sedesea diseñar un plan de muestreo sencillo cuya Curva OC pase por lacoordenada (AQL, 1 - ). Para diseñar dicho plan siga los siguientespasos:

Seleccione el límite de aceptación (c).

Utilice la distribución probabilística Poisson (presumiendo Curva OC tipo B,p < 0.10) para determinar la cantidad promedio de unidades defectuosaspor muestra ( ).

Determine el tamaño de la muestra (n).

AQLnn p

AQLn



Diseño e Implantación - Ejemplo

Diseñe un plan de muestreo sencillo que satisfaga el riesgo del productor de 5% para

lotes que tienen una fracción de defectuoso de 1.5%.

= 0.05 AQL = 0.015

Para c = 1 obtenemos de la distribución Poisson un = 0.355

2467.23015.0

355.0

AQL

355.0n

El plan diseñado indica que se debe tomar una muestra aleatoria de 24 unidades y aceptar

el lote como bueno si no encuentra más de 1 unidad defectuosa.

Para c = 3

9207.91015.0

366.1n

Para c = 6

n

Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo

estipulado del productor ( = 5%, AQL = 1.5%)



Diseño e Implantación - Ejemplo

Comparación Planes de Muestreo

0

0.2

0.4

0.6

0.8

1

0 0.05 0.1 0.15

Fracción de defectuosos (p)

Pro

bab

ilid

ad

de

Acep

tar

Plan 1

Plan 2



Riesgo del Consumidor

Planes de muestreo basados en el riesgo del consumidor

• Cuando el riesgo del consumidor ( ) y el nivel de calidad aceptable (LTPD) asociada con éste,

son estipulados como la base del plan de muestreo, se desea diseñar un plan de muestreo

sencillo cuya Curva OC pase por la coordenada (LTPD, ). Para diseñar dicho plan siga los

siguientes pasos:

Seleccione el límite de aceptación (c).

Utilice la distribución probabilística Poisson para determinar la cantidad promedio de unidades

defectuosas por muestra ( ).

Determine el tamaño de la muestra (n).LTPDnn p

LTPDn



Riesgo del Consumidor - Ejemplo

Diseñe un plan de muestreo sencillo que satisfaga el riesgo del consumidor de 10% para

lotes que tienen una fracción de defectuoso de 8%.

= 0.10 LTPD = 0.08

Para c = 1 obtenemos de la distribución Poisson un = 3.890

4962.4808.0

890.3

LTPD

890.3n

Para c = 3

8451.8308.0

681.6n

Para c = 6

n

Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo

estipulado del consumidor ( = 10%, LTPD = 8%).



Riesgo del Consumidor - Ejemplo

Comparación Planes de Muestreo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.05 0.1 0.15

Fracción de defectuosos (p)

Pro

ba

bil

ida

d d

e A

ce

pta

r

Plan 1

Plan 2



Riesgos del Productor y el Consumidor

Planes de muestreo basados en los riesgos del productor y elconsumidor

• Diseñar un plan de muestreo que satisfaga exactamente ambas partes, el productory el consumidor; es prácticamente imposible. Una alternativa es satisfacerexactamente una de las partes (Productor o Consumidor) y tratar de satisfacer lomás cercano posible a lo estipulado por la otra parte (por tanteo). Otra alternativamás fácil pero menos exacta es utilizar una herramienta gráfica llamadaNomograma. Para obtener un plan de muestreo que cumpla con lo estipulado porambas partes mediante el uso del Nomograma siga los siguientes pasos:

– Trace una línea que conecte AQL con (1 - ) y otra línea conectandoLTPD con .

– Identifique el plan de muestreo dado por la intersección de las doslíneas dentro del Nomograma.



Riesgos del Productor y el Consumidor -

Ejemplo

Diseñe un plan de muestreo sencillo que satisfaga tanto el riesgo del productor de 5%

para lotes que tienen una fracción de defectuoso de 2% como el riesgo del consumidor de

10% para lotes que tienen una fracción de defectuoso de 8%.

= 0.05, AQL = 0.02, = 0.10, LTPD = 0.08

En base al punto de intersección de las dos líneas (desde 0.95 hasta 0.02 y desde 0.10

hasta 0.08) se obtiene el siguiente plan de muestreo sencillo:

n = 98 c = 4



Riesgos del Productor y el Consumidor -

Ejemplo



Estándar Militar 105E (ANSI/ASQC Z1.4)

• Están basados en el AQL, en el tamaño del lote y en el nivel de inspección.

• El nivel de inspección I requiere aproximadamente la mitad de la inspección que el nivel II y se utiliza cuando se requiere menor discriminación.

• El nivel de inspección III requiere aproximadamente el doble de la inspección del nivel II y se utiliza cuando se necesita mayor discriminación.

• Existen cuatro niveles de inspección especial: S-1, S-2, S-3 y S-4. Estos niveles producirán tamaños de muestra muy pequeños y sólo deben ser utilizados cuando se puedan o se necesite aceptar riesgos grandes.



Estándar Militar 105E

• Sus curvas O. C. son del tipo B.

• Debido a que estos planes están orientados al AQL, se

enfocan en el riesgo del productor. Por lo tanto, el poder

discriminatorio del plan de muestreo (la forma de la

curva O. C.) se obtiene mediante la selección del nivel

de inspección.



Estándar Militar 105E - Reglas de

intercambio



Estándar Militar 105E

• Procedimiento

– Escoga el AQL

– Escoga el nivel de inspección

– Determine el tamaño del lote

– De acuerdo a la tabla que sigue, encuentre la letra para buscar

el tamaño de la muestra

– Determine el tipo de plan de muestreo apropiado (sencillo,

doble, múltiple)

– Busque en la tabla correcta para encontrar el tipo de plan a

utilizarse



Estándar Militar 105E – Tabla de letras



Estándar Militar 105E – Inspección Normal



Estándar Militar 105E – Inspección ajustada



Estándar Militar 105E – Inspección reducida



Estándar Militar 105E - Ejemplo

• N = 2000

• AQL = 0.65%

• Nivel de inspección general II

– Solución

• De la tabla de las letras: letra K

• De la tabla de inspección normal: n = 125, c = 2

• De la tabla de inspección ajustada: n = 125, c = 1

• De la tabla de inspección reducida: n = 50, c = 1, r

= 3



Muestreo Secuencial

• El muestreo secuencial está basado en el “sequential

probability ratio test” (SPRT) desarrollado por Wald.

• Para cada punto en la gráfica del muestreo el eje de x

corresponde al número de artículos inspeccionados

hasta el momento, mientras que el eje de y representa el

número total de defectuosos encontrados hasta ese

momento.



Muestro secuencial

• Si el punto trazado se mantiene dentro de las líneas de

aceptación y rechazo, otro artículo debe ser

inspeccionado.

• Tan pronto como un punto esté sobre o por encima de la

línea de rechazo, el lote se rechaza.

• Por otro lado, si un punto cae sobre o por debajo de la

línea de aceptación, el lote se acepta.



Muestreo secuencial

• Para diseñar un plan de muestreo secuencial es

necesario especificar las siguientes dos coordenadas:

(p1, 1 - ) , (p2, 1 - ).



Muestreo secuencial

• Las ecuaciones para las dos líneas basadas en las dos

coordenadas están dadas por:

kpps

pp

ppk

kh

kh

snh

snhXA

/1/1log

1

1log

1log

1log

donde

line) (rejection X

line) e(acceptanc

21

21

12

2

1

2R

1



Muestreo secuencial



Muestreo Secuencial - Ejemplo

• Supongamos que queremos encontrar un plan de

muestreo secuencial en el que:

p1 = 0.01, = 0.05, p2 = 0.06, y = 0.10

Entonces:

80066.0

)94.0)(01.0(

)99.0)(06.0(log

1

1log

21

12

pp

ppk




57.1

80066.0/05.0

90.0log

/1

log

22.1

80066.0/10.0

95.0log

/1

log

2

1

kh

kh




028.0

80066.0/94.0/99.0log

/1/1log21

kpps

Entonces, las líneas de aceptación y rechazo son:

(rechazo) 028.057.1X

n)(aceptació 028.022.1

Rn

nXA



Muestreo Secuencial – Ejemplo

• En lugar de trazar un gráfico para determinar la disposición del lote, en el

muestreo secuencial utilizamos una tabla en la que los datos se obtienen

sustituyendo los valores de n en las ecuaciones para las líneas de

aceptación y rechazo y calculando los números de aceptación y rechazo.

Por ejemplo, el cálculo para n = 45 es:

(rechazo) 83.2)45(028.057.1

028.057.1X

n)(aceptació 0.040.028(45)-1.22

028.022.1

Rn

nXA




InspeccionadosNúmero de

aceptación

Número de

rechazoInspeccionados

Número de

aceptación

Número de

rechazo

1 a b 24 a 3

2 a 2 25 a 3

3 a 2 26 a 3

4 a 2 27 a 3

5 a 2 28 a 3

6 a 2 29 a 3

7 a 2 30 a 3

8 a 2 31 a 3

9 a 2 32 a 3

10 a 2 33 a 3

11 a 2 34 a 3

12 a 2 35 a 3

13 a 2 36 a 3

14 a 2 37 a 3

15 a 2 38 a 3

16 a 3 39 a 3

17 a 3 40 a 3

18 a 3 41 a 3

19 a 3 42 a 3

20 a 3 43 a 3

21 a 3 44 0 3

22 a 3 45 0 3

23 a 3 46 0 3

"a" - aceptación no es posible

"b" - rechazo no es posible



Hipótesis Estadística

• Supuestos o conjeturas acerca de una o más poblaciones de interés. Prueba para verificar si el reclamo sobre cierto parámetro de la población de interés es igual al establecido de la hipótesis nula (Ho).

• “El aceptar la hipótesis nula sólo implica que la muestra analizada no da suficiente evidencia para refutarla. Sin embargo, rechazar la hipótesis nula implica que la muestra analizada da evidencia para rechazarla. Este rechazo da paso a la aceptación de la hipótesis alterna (H1).”




• Estadística de prueba- Función de la muestra aleatoria que se utiliza para

tomar una decisión en la prueba de hipótesis.

• Valor crítico - Valor que marca el límite entre aceptación o rechazo de la

Ho.

• Región de aceptación - Rango marcado por el valor o valores críticos que

de contener el valor de la Ho daría paso a la aceptación de la misma.

• Región de rechazo - Rango marcado por el valor o valores críticos que de

contener el valor de la Ho daría paso al rechazo de la misma.




Rechazo

Región de Aceptación

Rechazo

/2 /2




acepto Ho

rechazo Ho

decisión correcta error

tipo II

error

tipo I

decisión

correcta

Ho es cierto Ho es falso




• Error tipo I - Rechazar la Ho cuando se debió aceptar.

• Error tipo II - Aceptar la Ho cuando se debió rechazar.

• Nivel de significancia - Probabilidad de cometer error tipo I.

• - Probabilidad de cometer error tipo II.

• Potencia de la prueba (1 - ) - Probabilidad de rechazar la Ho cuando se debió rechazar.

• Valor P - Nivel de significancia mínima al cual el valor observado de la estadística de prueba es significativo.




• Pasos a seguir en las Pruebas de Hipótesis

1. Establezca la Ho

2. Escoja la H1 apropiada

3. Escoja el nivel de significancia

4. Seleccione la estadística de prueba y establezca la región crítica

5. Compute el valor de la estadística de prueba para la muestra analizada

6. Decida si acepta o rechaza la Ho

7. Tome la acción pertinente dada la decisión




1 POBLACION

2

POBLACIONES>2

POBLACIONES

CONTINUOS

O POR

VARIABLE

DISCRETOS

ANOVACONTINUOS

O POR

VARIABLEDISCRETOS

2

D

.

p= proporción

defectuosos

( 1 - 2) = diferencia de

promedios

2/ 2 = razón de varianzas.

(p1 – p2) = diferencia de proporciones

.



Concepto del valor P

• El valor p se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería

rechazada. En el caso de la distribución F que usamos en nuestro ANOVA si:

calculada > crítica

• entonces uno rechaza la hipótesis nula Ho en favor de la hipótesis alterna H1. Este concepto se

ilustra en la siguiente Figura.

F

Crítica

F

Calculada

valor p

Como puede notarse en este caso la hipótesis nula Ho no puede ser rechazada

ya que la Fcalculada < Fcrítica, de igual manera el valor p nos daría la misma

decisión bajo la condición:

valor p >



Concepto del valor P

• Por lo tanto, el valor p puede ser interpretado como la posibilidad de que la hipótesis nula no sea rechazada. Magnitudes altas del valor p estarán asociadas con no poder rechazar la hipótesis nula mientras que magnitudes bajas del valor p estarán asociadas con el rechazo de la hipótesis nula. Regularmente el valor p es comparado con el nivel establecido para la prueba.

• Usando el valor p como criterio de aceptación o rechazo de una hipótesis es como comúnmente los programas de análisis estadístico le permiten al usuario tomar una decisión. Así que en general, si el valor p es menor que el establecido rechazamos la hipótesis nula de lo contrario no podemos rechazar.



Prueba Pareada

• Estas pruebas ocurren cuando se estudia la respuesta de una unidad experimental a dos distintos tratamientos. Por ejemplo, suponga que se conduce un estudio para determinar el efecto de una droga que ayuda en la reducción de la presión arterial. Para medir su efectividad (o su inefectividad), se le provee la droga a una muestra aleatoria de n pacientes. El conjunto de datos consiste de n pares ordenados (xi , yi), donde la xi correspondería a la presión arterial del paciente i, antes del tratamiento mientras que la yi denotaría la presión arterial luego de la droga para el mismo paciente.



Prueba Pareada

• La variable di = xi - yi, representa la diferencia en la presión arterial producida por la droga en determinado paciente. Esto es un ejemplo de lo que se conoce como “auto-pareo”, en el cual a una unidad experimental singular se le administran los dos tratamientos.

• En otros casos esos pares son seleccionados. Por ejemplo, en experimentos de sicología gemelos idénticos son utilizados para estas pruebas pareadas. Una vez el par ha sido seleccionado, a una de las dos unidades se le asigna aleatoriamente el tratamiento 1 correspondiendo el tratamiento 2 a la otra unidad. Las ventajas del pareo son intuitivamente claras: reduce la variabilidad en los datos que se debe a otras causas distintas al tratamiento bajo consideración.



Prueba Pareada - Ejemplo

• Un estudio se realiza con el objetivo de comparar dos configuraciones de un procesador de computadora. Se midieron los tiempos de ejecución para seis tareas distintas (w1, …, w6).

Las dos configuraciones evaluadas fueron el procesador con y sin “cache”. Los resultados obtenidos se presentan en la siguiente tabla.

Tarea Cache No cache di = xi - yi

W1 69 75 -6

W2 53 83 -30

W3 61 89 -28

W4 54 77 -23

W5 49 83 -34

W6 50 83 -33



Prueba Pareada - Ejemplo

Como se puede observar de

los resultados obtenidos de

STATGRAPHICS®, tanto el

valor p como el intervalo de

confianza indican el efecto

significativo que tiene el

cambio de configuración en el

procesador. La configuración

que incluye el “cache” resultó

en una ejecución mucho más

rápida.

Hypothesis Tests for Cache-No_Cache

Sample mean = -25.6667

Sample median = -29.0

t-test

------

Null hypothesis: mean = 0.0

Alternative: not equal

Computed t statistic = -6.04224

P-Value = 0.00178906

Reject the null hypothesis for alpha = 0.05.

T-Test of the Mean

Confidence Intervals

Confidence Intervals for Cache-No_Cache

95.0% confidence interval for mean: -25.6667 +/- 10.9195 [-36.5862,-14.7471]



Inferencias sobre los promedios

• Regularmente, la calidad de un producto se mide por una variable cuantitativa xdefinida en cierta población. Se conoce que esta variable estará sujeta a cierto nivel de variación aleatoria, por lo tanto, estudiar el comportamiento de ésta y los parámetros que la describen resulta de vital importancia.

• El reclamo de que > 0 es un ejemplo de una hipótesis estadística que intenta describir o entender dicho comportamiento.

• Cuando el reclamo incluye dos comportamientos el objetivo del estudio podría ser el de medir la diferencia entre los dos promedios ( 1 - 2 > ). De igual forma se podrían hacer reclamos sobre el parámetro de dispersión de la variable de interés. Estos casos se discutirán más adelante.




Ejemplo

• Una empresa manufacturera de lentes de contacto compró una máquina para el llenado de frascos de solución alkalina. Esta máquina fue ajustada para llenar frascos cuya etiqueta indicaba un contenido de 12 onzas. Diez muestras se tomaron para validar que el proceso cumplía con este requisito. Estas observaciones se muestran en la siguiente tabla.

Onzas

11.52 12.54

12.3 12.01

11.1 10.47

10.8 11.02

11.64 12.41




Ejemplo

Hypothesis Tests for Onzas

Sample mean = 11.581

Sample median = 11.58

t-test

------


Alternative: less than


P-Value = 0.0500525

T-Test of the Mean (“Una cola”) T-Test of the Mean (“Dos colas”)

Hypothesis Tests for Onzas

Sample mean = 11.581

Sample median = 11.58

t-test

------


Alternative: not equal


P-Value = 0.100105

Do not reject the null hypothesis for alpha = 0.05.




Ejemplo• Dos catalíticos son analizados para determinar su efecto en el rendimiento de un

proceso químico. El catalítico 1 es el que se utiliza en la actualidad. El catalítico 2tiene menor costo y se adoptaría si el mismo no afecta adversamente elrendimiento del proceso. Un estudio piloto se efectuó resultando en lo siguiente:

Observación Catalítico 1 Catalítico 2

1 91.5 89.19

2 94.18 90.95

3 92.18 90.46

4 95.39 93.21

5 91.79 97.19

6 89.07 97.04

7 94.72 91.07

8 89.21 92.75




Ejemplo

Two Sample T-Test and Confidence Interval

Comparison of Means

-------------------

95.0% confidence interval for mean of Cat1: 92.255 +/- 1.99393

95.0% confidence interval for mean of Cat2: 92.7325 +/- 2.49424

95.0% confidence intervals for the difference between the means:

assuming equal variances: -0.4775 +/- 2.89639

not assuming equal variances: -0.4775 +/- 2.90962

t tests to compare means

Null hypothesis: mean1 = mean2

(1) Alt. hypothesis: mean1 NE mean2

assuming equal variances: t = -0.353591 P-value = 0.728914

not assuming equal variances: t = -0.353591 P-value = 0.729166

(2) Alt. hypothesis: mean1 > mean2



(3) Alt. hypothesis: mean1 < mean2






Ejemplo

Como se puede observar, tanto de la gráfica

como de ambas pruebas efectuadas, los

promedios no difieren significativamente.

El catalítico 2 podría adoptarse sin el

riesgo de que afecte negativamente el

rendimiento de este proceso.

Cat1

Cat2


89 91 93 95 97 99

Rendimient

Cata

liti

co



Estimado de intervalos

• En muchas ocasiones, un estimado de punto no provee la información suficiente con respecto a un parámetro. Por ejemplo, si nos interesa medir el esfuerzo promedio en tensión de un componente crítico, un valor o estimado de punto no será tan relevante como un intervalo en el cual se espera se encuentre el verdadero valor del parámetro. A estos intervalos los conocemos como intervalos de confianza.

• Un estimado de intervalo de un parámetro desconocido q es un intervalo con formato: l < q < u, donde los puntos extremos l y u dependen del valor numérico del estimado de q para una muestra particular de la distribución muestral de este parámetro. Dado que diferentes muestras producirán diferentes estimados, los puntos extremos del intervalo de cada muestra son variables aleatorias como muestra la siguiente figura.




• Suponga que una población tiene un promedio desconocido y unavarianza conocida . Una muestra de tamaño n de esta población sedenominaría x1, x2, … xn. Un estimador de punto razonable para elpromedio desconocido sería el promedio muestral . La distribución deeste promedio será normal si la población es normal y aproximadamentenormal si las condiciones del teorema de límite central se cumplen. Porlo tanto, la distribución de la estadística

Zx

n/es una distribución normal

estándar




/

2

/

2Distribución de Z

P z Z z/ /2 2

1

P zx

nz

/ /

/2 2

1

P x z n x z n/ /

/ /2 2

1




• De este desarrollo se puede concluir que el intervalo

para el (1- ) % de confianza del promedio m cuando se

tiene una muestra aleatoria de tamaño n y varianza

conocida está dado por:

x z n x z n/ /

/ /2 2



Analisis de Varianza (ANOVA)

• Las pruebas de hipótesis estudiadas son métodos que comparan dos tratamientos. Sin embargo, muchos experimentos requieren comparaciones de más de dos tratamientos simultáneamente. Se puede demostrar que si intentamos hacer pruebas para cada pareja de medias o promedios, el error tipo I incrementaría sustancialmente.

• Por ejemplo, un factor con 5 niveles o tratamientos necesitará 10 pruebas si se toman por parejas. Si establece .05 como su error Tipo I, entonces su nivel de confianza para cada prueba individual es 1 - .05 = 0.95.

• Si decimos que las pruebas son independientes, la probabilidad de aceptar la hipótesis nula correctamente en las 10 pruebas será de (0.95)10 = 0.60.



ANOVA

• El procedimiento apropiado para probar la igualdad de varias medias o

promedios se conoce como análisis de varianza o ANOVA.

• ANOVA - metodología estadística para probar la igualdad de promedios

cuando existen más de dos promedios. Probablemente es la técnica más

útil en el campo de la estadística inferencial.



ANOVA

• PRESUNCIONES DE ANOVA

– Errores o residuales siguen una distribución normal con

promedio cero y varianza constante.

– Errores son independientes.

• El nombre de análisis de varianza (ANOVA) se deriva de la partición

de la variabilidad total encontrada en sus componentes. Para entender

esa partición primero tenemos que definir unos términos.



ANOVA

.1y .2y .ay ..y

y..ya.y2.y1.

ya1

ya2

.

.

.

yan

y21

y22

.

.

.

y2n

y11

y12

.

.

.

y1n

a….21

= promedio de las observaciones en el nivel i

yi

yi

y

y

N

= suma de las observaciones en el nivel i

= suma total de las observaciones

= promedio de todas las observaciones

= an = número total de observaciones

2

1 1

..a

i

n

j

ijTOTAL yySS



ANOVA

2

1 1

.. ..a

i

n

j

iijiTOTAL yyyySS

.

1 1

.

2

1 1

.

2

1

.

..2

..

iij

a

i

n

j

i

a

i

n

j

iij

a

i

iTOTAL

yyyy

yyyynSS

0....

1

.n

ynyynyyy i

iii

n

j

iij

2

.

2

1

.

2

1 1

.... iij

a

i

i

a

i

n

j

ij yyyynyy

Ecuación fundamental de la descomposición de la suma de cuadrados



ANOVA

• En palabras podemos expresar la ecuación previa de la siguiente manera:

ERROROSTRATAMIENTTOTAL SSSSSS

Puede demostrarse que con los grados de libertad sucede lo

mismo.

ERROROSTRATAMIENTTOTALglglgl

N-1 = a-1 + N-a



ANOVA

• Ya teniendo los componentes de la suma de cuadrados con sus

correspondientes grados de libertad podemos construir la ANOVA.

ERROR

TRAT

MS

MS .

Fuentes Suma de

Cuadrados

gl Promedio de Cuadrados Fc

Tratamientos SSTRAT. a-1 MSTRAT.=SSTRAT./(a-1)

Error SSERROR N-a MSERROR=SSERROR/(N-a)

Total SSTOTAL N-1



ANOVA

• Entonces la hipótesis que tratará de probar Anova será la siguiente:

a210...:H

j i,i1 una menos al para ...:H

j

• Una forma equivalente para establecer la hipótesis sería:

0T...TT:Ha210

ii1 una menos al para 0T:H



ANOVA

• Una vez terminada la ANOVA y rechazada la H0 algunas pruebas nos

permiten determinar entre cuales tratamientos o niveles en específico

existe la diferencia de promedios.

• La Diferencia Significativa Mínima (LSD) es una de éstas. La misma

consiste de :

1. Calcular LSD =ji

Enn

MSaNt11

,2/

2. Calcular.. ji yy

3. Si LSDyy ji ..

Concluir quei

yj

son diferentes.



ANOVA - Ejemplo

• Un manufacturero de papel produce fundas

para cargar compras. El está interesado en

mejorar el esfuerzo en tensión que resisten

las mismas. Se sospecha que el % de

madera en la pulpa utilizada para la

manufactura puede afectar el esfuerzo en

tensión. La siguiente tabla muestra los

resultados de su experimento.

% de madera en la pulpa

5% 10% 15% 20%

7 12 14 19

8 17 18 25

15 13 19 22

11 18 17 23

9 19 16 18

10 15 18 20



ANOVA - Ejemplo

ANOVA Table for Esfuerzo by Conc

Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Between groups 382.792 3 127.597 19.61 0.0000

Within groups 130.167 20 6.50833

-----------------------------------------------------------------------------

Total (Corr.) 512.958 23

5

10

15

20


7 10 13 16 19 22 25

Esfuerzo

Co

nc



ANOVA – Ejemplo

Multiple Range Tests for Esfuerzo by Conc

--------------------------------------------------------------------------------

Method: 95.0 percent LSD

Conc Count Mean Homogeneous Groups

--------------------------------------------------------------------------------

5 6 10.0 X

10 6 15.6667 X

15 6 17.0 X

20 6 21.1667 X

--------------------------------------------------------------------------------

Contrast Difference +/- Limits

--------------------------------------------------------------------------------

5 - 10 *-5.66667 3.07243

5 - 15 *-7.0 3.07243

5 - 20 *-11.1667 3.07243

10 - 15 -1.33333 3.07243

10 - 20 *-5.5 3.07243

15 - 20 *-4.16667 3.07243

--------------------------------------------------------------------------------

* denotes a statistically significant difference.



Gráficos de Control

• La insatisfacción de los clientes es causada por la variabilidad del producto:

las características del producto no ejecutan de acuerdo a las expectativas o

ejecutan de manera diferente de unidad a unidad. La variabilidad del

producto es el resultado de la variabilidad en el proceso que lo crea.

• Por tanto, la clave para lograr productos de alta calidad es limitar la

variabilidad del proceso.




• Ningún proceso puede ser perfectamente repetible, alguna variabilidad

siempre existirá y ésta a su vez será transmitida al producto. El objetivo es mantener el proceso estable y predecible a través del tiempo, a esto le

llamamos un proceso en control.

• La herramienta que usamos para „monitorear‟ la estabilidad del proceso es

el gráfico de control.




• Para datos continuos, el monitorear la estabilidad del proceso requiere dos

gráficos: el primero maneja la localización de la distribución, mientras el

segundo trabaja con la variabilidad del proceso.

• El gráfico más común utilizado para monitorear la localización es el X -

barra ( ). Los gráficos para la variabilidad incluyen el S (desviación

estándar) y el gráfico R (del rango).

x




• Los gráficos de control son una herramienta importante en el mejoramiento

de procesos. Estos gráficos proveen señales visuales que indican cuándo

eventos excepcionales o condiciones fuera de control ocurren en el

proceso. Usar nuestros planes de respuesta o realizar análisis para

encontrar la raíz de la señal, permite que el proceso, así como el producto

que resulta del mismo, puedan ser mejorados de forma sistemática y

continua.




• Tipos de variabilidad

– Intrínseca o natural - efecto cumulativo de pequeñas e

inevitables causas en el proceso.

– Externa (causa asignable) - comúnmente provienen de

fuentes externas controlables. Generalmente son mayor que la

variabilidad intrínseca y, por lo tanto, representan un nivel

inaceptable en la ejecutoria del proceso.




• Un proceso que su única causa de variabilidad es natural, se considera que

opera en control estadístico.

• Un proceso que opera en presencia de causas asignables de variabilidad

se dice está fuera de control estadístico.

• Mediante el uso de gráficos de control podemos identificar y distinguir entre

las causas de variabilidad intrínseca y externa del proceso.




# de muestra o sequencia (tiempo)

característica

de calidad LCS

LCI

LC

}

}

k w

k w

w

wwLCS

wLC

wwLCI




Realidad

En control

Fuera de

control

En control Decisión

correcta

Dec

isió

n

Fuera de

control

Decisión

correcta




• Selección de los límites de control

– Alejando los límites de la línea central se disminuye la

probabilidad de error tipo I pero se aumenta la probabilidad de

error tipo II.

– Aunque comúnmente se usan 3 w como límites, la selección de

estos puede depender de factores económicos. Si las pérdidas

asociadas con dejar el proceso operar en estado fuera de

control superan por mucho los costos de investigar y

posiblemente corregir las causas asignables, múltiples menores

de sigma (2.5 ó 2) serían apropiados.




• Tamaño de la muestra y frecuencia del muestreo

– Lo más deseable para poder detectar desplazamientos en elproceso sería tomar muestras grandes frecuentemente. Peroesto no es lo mejor desde el punto de vista económico. En laindustria se tiende a favorecer muestras pequeñas perofrecuentes, especialmente en procesos con un alto volumen deproducción.

– Además de las Curvas Características Operacionales (O. C.)otro criterio para determinar el tamaño de muestra y lafrecuencia del muestreo es el largo promedio de corrida (ARL)del gráfico de control.




• ARL = número promedio de puntos que serán graficados antes de

que un punto indique condición de fuera de control.

p = probabilidad de que un punto salga de los límites de control

p

1ARL




Límites de control ARL en Control

+ 3 sigmas 0.0027 370

+ 2 sigmas 0.045 22

+ 1 sigma 0.32 3

Cambio en promedio 1- ARL fuera de control

3 sigmas 0.5 0.5 2

2 sigmas 0.84 0.16 6.25

1 sigma 0.975 0.025 40



Fundamentos Gráficos de Control

LCS

LC

LCI/2

/2




/2

/2LCS

LC

LCI

Orden de producción

Cara

cteríst

ica d

e c

alid

ad

1 -




/2

/2LCS

LC

LCI

Orden de producción

Cara

cteríst

ica d

e c

alid

ad

1 -

12

3




LCS

LC

LCI

Cambio en promedio




LCS

LC

LCI

Cambio en dispersión




• Subgrupos racionales - Este concepto establece que las muestrasdeben ser seleccionadas de forma tal que si hay causas asignables, laposibilidad de diferencias entre muestras o subgrupos se maximicemientras que la posibilidad de diferencias debido a causas asignablesdentro de las muestras se minimice.

• Nota: Un ejemplo de un subgrupo racional inadecuado sería formar unamuestra (subgrupo) que tenga observaciones del final de un turno y elprincipio de otro. Esto haría difícil detectar una diferencia entre turnos.



Gráficos de Control - Ejemplo

En la manufactura de pistones para motores de carro, una característica de calidadimportante es el diámetro del pistón. El proceso podría estar controlado con undiámetro promedio de 74 mm. La desviación estándar de los pistones es 0.1mm (n =5).

1. Construya una gráfica de control para x con:

límites a 3 3 w

límites a /2 = 0.001

2. ¿A 3 , cuál es la probabilidad de error tipo I?

3. ¿Para los límites 3 , cuál es el ARL?

4. ¿Cuánto será el ARL, si n = 5, el proceso se sale de control y ademásla media se desplaza de 74.000 a 74.134mm?

5. ¿Si n = 10, cuál sería el ARL?




Solución:

w = 74mm, 045.05

1.0

nw

1 (a) LCS = w + k w 74 + 3(0.045) = 74.134

LC = w = 74.00

LCI = w - k w 74 - 3(0.045) = 73.866




1 (b) LCS = w + /2 w 74 + 3.09(0.045) = 74.139

LC = w = 74.00

LCI = w - /2 w 74 – 3.09(0.045) = 73.861




# de muestra o sequencia (tiempo)

característica de calidad LCS

LCI

LC

}

}

k w

k w

w

LCS (1b) = 74.139

LCS (1a) = 74.134

LCS (1a) = 73.866

LCS (1b) = 73.861

LC = 74.0




2. /2 = 3 (3) = 0.99865, 1 - = /2 = 0.00135

= 0.00135 (2) = 0.0027

3. Para obtener el ARL primero construiremos las curvas O.C. para

30027.0

2/Z

3700027.0

11

pARL

Es el largo promedio de la corrida del gráfico x

cuando el proceso está en

control estadístico. O sea que, aunque el proceso esté en control se verá una

falsa alarma de fuera de control cada 370 muestras.




4. El desplazamiento coincide con el límite de control superior, por lo

tanto, la probabilidad de que x esté entre los límites de control es

0.50. De manera que, la probabilidad de que esté fuera es p = 1 –

0.50 = 0.50:

25.0

1ARL

Esto es que el gráfico de control requerirá en promedio dos muestras de

tamaño n = 5 para detectar el desplazamiento de :

134.74 a 00.74

10

En promedio, con dos muestras se podrá detectar el desplazamiento.

5. Se puede demostrar que la probabilidad de detectar el cambio cuando

el tamaño de muestra se incrementa a n = 10, es mayor que en el caso

anterior cuando n = 5. Por lo tanto, se espera un ARL < 2.



Base Estadística de los Gráficos

de Control para Variables

El promedio muestral de una característica de calidad normalmente

distribuida N ( , ) es:

n

xxxx n...21

nNx xx donde ,~

Existe una probabilidad 1 - de que el promedio muestra x caiga entre:

xz2

Por teorema de límite central asumimos normalidad en la distribución de x .

Cuando no sabemos y , los podemos estimar con muestras preliminares.

Al menos 20 muestras con n observaciones de la característica de calidad

medida. Entonces el estimado de , el promedio del proceso es:

m

xxxx m...21



Base Estadística de los Gráficos

de Control para Variables

Un estimador de la desviación estándar ( ) cuando n < 10 es: x

...

donde ˆ 21

2 m

RRRR

d

R m

minmax1 xxR

d2 = parámetro de la distribución de rango relativo (W = R/ )

Su valor depende de n.

Antes de tratar de controlar el promedio hay que controlar la variabilidad ya que, los límites

de control gráfico x dependen de la variabilidad del proceso.



Gráficos de Control R

Se utiliza para controlar la variabilidad del proceso cuando n < 10.

Los límites de control para el gráfico R son:

4

2

33ˆ3 DRd

RdRRLCS R

RLC

3

2

33ˆ3 DRd

RdRRLCI R

D3 y D4 son valores tabulados.



Gráfico de Control X-Barra

Se usa para controlar el promedio del proceso.

Los límites de control son:

RAxRnd

xLCS 2

2

3

xLC

RAxRnd

xLCI 2

2

3

A2 es un valor en la tabla.



Gráficos de Control S

Se utiliza para controlar la variabilidad del proceso cuando n 10.

Cuando es desconocida un estimador será:

1

2

12

n

xx

s

n

li

y los límites de control serán:

sBcc

ssLCS 4

2

4

4

13

sLC

3

2

4

4

13 Bcc

ssLCI

B4 y B3 son valores tabulados y m

l ism

s1



Gráficos de Control S

Entonces los límites de control para el gráfico x son:

sAxnc

sxLCS 3

4

3

xLC

sAxnc

sxLCI 3

4

3




Se desea establecer control estadístico para el ancho de tabletas. Se toman

25 muestras de 5 observaciones cada una.

Muestra X1 X2 X3 X4 X5

x R

1 20 22 21 23 22 21.6 3

2 19 18 22 20 20 19.8 4

3 25 18 20 17 22 20.4 8

4 20 21 22 21 21 21 2

5 19 24 23 22 20 21.6 5

6 22 20 18 18 19 19.4 4

7 18 20 19 18 20 19 2

8 20 18 23 20 21 20.4 5

9 21 20 24 23 22 22 4

10 21 19 20 20 20 20 2

11 20 20 23 22 20 21 3

12 22 21 20 22 23 21.6 3

13 19 22 19 18 19 19.4 4

14 20 21 22 21 22 21.2 2

15 20 24 24 23 23 22.8 4

*En la tabla se presentan las primeras quince muestras




X-bar Chart for Ancho

Subgroup

X-b

ar

Centerline = 20.84

UCL = 22.85

LCL = 18.83

0 5 10 15 20 25

18

19

20

21

22

23

Range Chart for Ancho

0 5 10 15 20 25

Subgroup

0

2

4

6

8

Ran

ge

Centerline = 3.48

UCL = 7.36

LCL = 0.00

Luego de eliminar la muestra 3 y

recalcular los límites del gráfico R, nos

percatamos de que las muestras 22 y

23 del gráfico están fuera de los límites

de control. Una vez conseguimos las

causas asignables de estos, los

eliminamos y recalculamos los límites

de control del gráfico.





Subgroup

X-b

ar

Centerline = 20.86

UCL = 22.76

LCL = 18.96

0 5 10 15 20 25

18

19

20

21

22

23


Subgroup

Ran

ge

Centerline = 3.29

UCL = 6.96

LCL = 0.00

0 5 10 15 20 25

0

2

4

6

8

x

Al graficarse los restantes puntos

dentro de los límites recalculados,

notará que el punto número 15 está

todavía fuera de control en el gráfico

del promedio.

Por esta razón necesitaríamos

recalcular nuestros límites

nuevamente. Una vez todos los

puntos se encuentren dentro de los

límites de control y no muestren

ningún patrón sistemático,

asumiremos los límites recién

calculados como los límites de control

del proceso.

De este momento en adelante

trazaremos los puntos del proceso en

tiempo real haciendo uso de los

límites estimados. De encontrar

alguna señal de que el proceso se

encuentra fuera de control hay que

investigar la causa.




*En la tabla se presentan las primeras quince muestras

Ilustración de los gráficos de control x y S usando 25 muestras pero de

tamaño variable.

Muestra X1 X2 X3 X4 X5 x S

1 74.030 74.002 74.019 73.992 74.008 74.010 0.0148

2 73.995 73.992 74.001 73.996 0.0046

3 73.988 74.024 74.021 74.005 74.002 74.008 0.0106

4 74.002 73.996 73.993 74.015 74.009 74.003 0.0091

5 73.992 74.007 74.015 73.989 74.014 74.003 0.0122

6 74.009 73.994 73.997 73.985 73.996 0.0099

7 73.995 74.006 73.994 74.000 73.999 0.0055

8 73.985 74.003 73.993 74.015 73.988 73.997 0.0123

9 74.008 73.995 74.009 74.005 74.004 0.0064

10 73.998 74.000 73.990 74.007 73.995 73.998 0.0063

11 73.994 73.998 73.994 73.995 73.990 73.994 0.0029

12 74.004 74.000 74.007 74.000 73.996 74.001 0.0042

13 73.983 74.002 73.998 73.994 0.0100

14 74.006 73.967 73.994 74.000 73.984 73.990 0.0153

15 74.012 74.014 73.998 74.008 0.0087





Subgroup

X-b

ar

Centerline = 74.00

UCL = 74.01

LCL = 73.99

0 5 10 15 20 25

73.98

73.99

74

74.01

74.02


Subgroup

Ran

ge

Centerline = 0.02

UCL = 0.05

LCL = 0.00

0 5 10 15 20 25

0

0.01

0.02

0.03

0.04

0.05



Curva O.C.

La probabilidad de error tipo II para el gráfico de control x está dada por:

kUCLxLCLP 01\

Dado que n

Nx2

,~ y sus límites de control son:

nUCL 30

nLCL 30

n

kLCL

n

kUCL 00

n

kn

n

kn0000 33

nknk 33



Curva O.C. - Ejemplo

• Si n = 5 y se quiere saber la probabilidad de

detectar un desplazamiento de 1 = 0 + 2

en la primera muestra después del

desplazamiento.

• la probabilidad de detectar el

desplazamiento:

• La curva característica operacional para

varios tamaños de muestras (n) se presenta

a continuación.

Plot

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

0 .5 1 1.5 2 2.5 3 3.5

k

oc_n=1

oc_n=5

oc_n=7

oc_n=8

oc_n=10

oc_n=15

0708.037.747.152353

9292.00708.011



Gráficos de Control para

Medidas Individuales• Existen muchas situaciones donde el tamaño de muestra para monitorear el proceso es 1

(n = 1). Algunos ejemplos de estas situaciones se describen a continuación:

– La inspección es automatizada permitiendo que cada unidad

manufacturada sea analizada.

– La razón de producción es muy lenta, haciendo prácticamente imposible o

indeseable que tamaños de muestras mayores de 1 (n > 1), puedan

acumularse para ser analizadas.

– En algunos procesos, como por ejemplo, la fabricación de papel, se toman

medidas en múltiples localizaciones a través del rollo. Por ejemplo,

podemos tomar medidas del espesor del rollo, esto produciría una

desviación estándar que es muy pequeña si el objetivo es el de controlar el

espesor del rollo a lo largo del mismo.




Medidas Individuales

El gráfico de medidas individuales usa el rango movible de dos

observaciones consecutivas para estimar la variabilidad del proceso. El

rango movible se define como: 1iii xxMR .

Los parámetros para el gráfico de control de medidas individuales son:

2

3d

MRxLCS

Línea central = x

2

3d

MRxLCS




Medidas Individuales - Ejemplo

La viscosidad de un primer de pintura es una importante característica de

calidad. El producto se produce en lotes y como producir cada lote toma

varias horas, el tiempo de producción es muy lento para permitir que se

haga más de una muestra.

Lote Viscosidad

x

Rango Movible

MR

1 33.75

2 33.05 0.70

3 34.00 0.95

4 33.81 0.19

5 33.46 0.35

6 34.02 0.56

7 33.68 0.34

8 33.27 0.41

9 33.49 0.22

10 33.20 0.29

11 33.62 0.42

12 33.00 0.62

13 33.54 0.54

14 33.12 0.42

15 33.84 0.72

52.33x 48.0MR





X Chart for Viscocidad

0 3 6 9 12 15

Observation

32

32.5

33

33.5

34

34.5

35

X

Centerline = 33.52

UCL = 34.80

LCL = 32.24

MR(2) Chart for Viscocidad

0 3 6 9 12 15

Observation

0

0.4

0.8

1.2

1.6

MR

(2)

Centerline = 0.48

UCL = 1.57

LCL = 0.00





En la siguiente tabla se muestran 15 lotes adicionales para el ejemplo de la

viscosidad de la pintura.

Lote Viscosidad

x

Rango Movible

MR

16 33.50 0.34

17 33.25 0.25

18 33.40 0.15

19 33.27 0.13

20 34.65 1.38

21 34.80 0.15

22 34.55 0.25

23 35.00 0.45

24 34.75 0.25

25 34.50 0.25

26 34.70 0.20

27 34.29 0.41

28 34.61 0.32

29 34.49 0.12

30 35.03 0.54





X Chart for Viscocidad1

0 5 10 15 20 25 30

Observation

32

33

34

35

36

X

Centerline = 33.92

UCL = 35.01

LCL = 32.83

MR(2) Chart for Viscocidad1

0 5 10 15 20 25 30

Observation

0

0.3

0.6

0.9

1.2

1.5

MR

(2)

Centerline = 0.41

UCL = 1.34

LCL = 0.00




Medidas Individuales - Ejemplo• Algunos analistas recomiendan no construir el gráfico de los rangos

movibles. Ellos señalan que estos no muestran realmente cambios en la

variabilidad del proceso. Más bien muestran cambios en el promedio del

proceso. Esto se muestra claramente en las figuras anteriores donde

cambios en el promedio alrededor del lote #20 se perciben en ambos

gráficos, en el de medidas individuales y en el de los rangos movibles.• Nota: En estos gráficos, de medidas individuales, hemos hecho la presunción de que las observaciones

provienen de una distribución normal. Esta presunción es crítica para este gráfico. Si mediante cualquier prueba

encontramos evidencia de que esta presunción no se cumple, tendríamos que determinar los límites de control

para las medidas individuales basándonos en las percentilas de la distribución apropiada. En este caso, utilizar

las fórmulas discutidas para calcular los límites sería incorrecto.



Gráfico de Control EWMA

El gráfico de control EWMA es una buena alternativa a los gráficos

tradicionales Shewhart, cuando nos interesa detectar desplazamientos muy

pequeños en el proceso. Este gráfico se utiliza típicamente con

observaciones individuales pero como veremos es posible crear subgrupos

cuyo tamaño de muestra n > 1. La estadística EWMA se define como:

donde 0 < < 1 es una constante y el valor inicial necesario para la primera

muestra se define como el valor deseado

z0 = 0

1)1( iii zxz




Otra alternativa usada para el valor inicial es xz0

.

La siguiente ecuación muestra que la estadística EWMA a la que llamamos

z, es un promedio pesado de los promedios muestrales previos:

22

1

21

)1()1(

)1()1(

iiii

iiii

zxxz

zxxz

Por ejemplo, si = 0.2 entonces los pesos asignados a las observaciones

previas serán 0.16, 0.128, 0.1024,…. Mientras que el peso asignado a la

observación actual será de 0.2. Debido a que estos pesos declinan de forma

geométrica algunas personas conocen este gráfico como el de promedio

geométrico movible.




Si las observaciones individuales xi son independientes con varianza 2 los

límites del gráfico EWMA estarán dados por:

i

i

kLCI

LC

kLCS

2

0

0

2

0

)1(1)2(

)1(1)2(




En estas ecuaciones K sirve para determinar el ancho de los límites que se

desea, mientras que i representa la muestra bajo consideración. Como estos

límites dependen de la muestra bajo consideración los mismos no son

constantes como veremos en el ejemplo que se presenta a continuación. Sin

embargo a medida que i aumenta los límites tienden a estabilizarse de la

siguiente manera:

)2(

)2(

0

0

0

kLCI

LC

kLCS

No obstante la mayoría de los autores recomiendan utilizar la definición

original para mantener los límites exactos en los valores pequeños de i.




Ejemplo

Los siguientes son datos para el peso de partículas tomadas en un

laboratorio. Se presume = 0.10 y k = 2.7

Muestra Observación

1 9.45

2 7.99

3 9.29

4 11.66

5 12.16

6 10.18

7 8.04

8 11.46

9 9.2

10 10.34

11 9.03

12 11.47

13 10.51

14 9.4

15 10.08

*En esta tabla se presentan las primeras quince observaciones.




Ejemplo

EWMA Chart for Peso

0 5 10 15 20 25 30

Observation

8.8

9.2

9.6

10

10.4

10.8

11.2

EW

MA

Centerline = 10.02

UCL = 11.14

LCL = 8.89




• Como dijimos anteriormente, estos gráficos son muy efectivos detectando

cambios pequeños en el proceso. El diseño de los mismos envuelve

determinar la constante K así como la constante . Estudios han

determinado que valores de en el intervalo 0.05 < < 0.25 trabajan muy

bien en la práctica. Los valores = 0.05, = 0.10 y = 0.20 son los más

frecuentemente utilizados. Una práctica adecuada es seleccionar valores

pequeños de para detectar cambios más pequeños. También se ha

encontrado que k = 3 trabaja bastante bien en la práctica especialmente

para valores grandes de . Sin embargo, cuando < 0.10 los estudios han

encontrado que k debe considerarse dentro del siguiente intervalo 2.6 < k <

2.8.




• Un detalle que es importante señalar es que el gráfico tradicional Shewhartreacciona más rápido que el EWMA para desplazamientos grandes. Por loque algunos autores han sugerido un esquema de control que incluyaambos gráficos simultáneamente.

EWMA con n > 1

• Por lo general el gráfico EWMA se utiliza con observaciones individuales.Sin embargo, si los subgrupos racionales consisten de más de unaobservación, n > 1, entonces todo lo que necesitamos hacer es reemplazarxi por y por en las ecuaciones previamente discutidas.

nix



Gráficos de Control por Atributos

• Cuando los datos son de tipo discreto, los gráficos de control están

asociados con modelos de distribuciones discretas. Los gráficos más

conocidos para esta clasificación de datos lo son: el gráfico p, para la

fracción de defectuosos, y el gráfico c, para el control de defectos.

• Los modelos asociados con cada uno de estos son el binomial y el Poisson,

respectivamente.



Gráficos de Control por Atributos

• Los límites de control estándar para ambos gráficos se muestran a

continuación:

• Para el gráfico p , donde p-barra es

la fracción de defectuosos promedio

• Para el gráfico c , donde c-barra es el

promedio de defectos.

n

ppp

)1(3

cc 3



Plan de Control

Product:

Line:

Voice of the CustomerVoice of the

Process

Lower

Spec

Limit

Target

Upper

Spec

Limit

units Data TypeSample

Frequency

Instrument

Used

Gage

Capability

Process Cpk or

PPM

Monitoring

System

Response

Plan

Cri

tica

l

Process Steps

[Area name here] Control PlanPrioritization Method Used:

(e.g. FMEA, Business Matrix, etc.)

Reference Documents

No. and Revision:

Product

Characteristic

Measurement System Control ToolsMeasurement



Análisis de Capacidad

• Capacidad - La habilidad de un proceso para producir productos dentro

de las especificaciones establecidas. Un proceso se dice que es capaz

cuando la gran mayoría del producto confeccionado por el mismo está

dentro de las especificaciones.

• Indices de la capacidad del proceso - Miden la capacidad de un

proceso.



Variabilidad

– La voz del proceso – se representa por la variabilidad

observada en el proceso. El proceso nos dice „lo que

puede lograr‟.

– La voz del cliente – está representada por las

especificaciones del producto. El cliente nos dice „lo

que desea obtener‟.

– La capacidad del proceso nos indica si la voz del

proceso podrá complacer la voz del cliente.



Variabilidad

Esp.

Inf.

Esp.

Sup.

Proceso Controlado usando

la filosofía de estar lo más

cercano al valor nominal.

Proceso Controlado usando

la filosofía de cualquier

valor dentro de las

especificaciones es

aceptable.



Esp.

Inf.

Esp.

Sup.

Esp.

Inf.

Esp.

Sup.

Variabilidad

Menor Variabilidad Provee

- Un proceso predecible

- Mejora habilidad de detectar cambios

- Menos pérdida, retrabajo, menor costo

- Productos y servicios que ejecutan mejor

El objetivo principal del esfuerzo de C4I es reducir la varianza del proceso

Reducción de

Varianza

Proceso proporciona

unidades fuera de

especificaciones

Proceso proporciona

unidades dentro de

especificaciones



Variabilidad

• Visión Tradicional

– Cualquier valor dentro de las

especificaciones es satisfactorio.

• Visión Moderna

– En cualquier momento en que

una característica se desvía del

valor nominal (target) existe una

pérdida. A mayor desviación,

mayor será la pérdida.

Esp.

Inf.

Esp.

Sup.

Pérdida Pérdida

Esp.

Inf.

Esp.

Sup.

Valor Nominal

Esp.

Inf.

Esp.

Sup.

Pérdida Pérdida

Pérdida

Valor Nominal




Process-Capability Ratio (Cp index)

6

LEILESC

P

Si es desconocida puede ser estimada por S , en cuyo caso:

S

LEILESC

P 6

LES = “límite de especificación superior”

LEI = “límite de especificación inferior”




• Cp - razón de la variabilidad del proceso (6 sigma) al ancho permitido por

las especificaciones del producto (LES - LEI).

• Debido a que el índice Cp solo considera la variabilidad del proceso, sin

incluir la medida de tendencia central o promedio, a este índice se le

conoce como la capacidad potencial del proceso.




Ancho del proceso

Especificaciones del producto

LEI Nominal LES




Para especificaciones de un solo lado:

3

3

LEIC

LESC

LP

uP

CPu y CPL se obtienen cuando estimamos y .




• El Cp

no toma en consideración la localización del proceso con relación a

los límites de especificación. Asume que está centralizado. La localización

del proceso con relación a los límites de especificación la da el:

CPk = PCRk = min (CPu y CPL)

• Cpk es la razón de la mitad del ancho del proceso (3 sigma) al

ancho de las especificaciones del producto.




LEI LESCp = 1




LEI LESCpk = 1




LEI LESCpk = 2




Efecto de la no normalidad

LESLEI

LEI LES




¿Será el proceso capaz?

• Cp:

– Calcule la desviación estándar,

– Calcule Cp:

6

LEILESCp

Si Cp < 1.0, el proceso no tiene la capacidad potencial

Si 1.0 < Cp < 1.33, el proceso es justamente capaz

Si Cp > 1.33, el proceso es potencialmente capaz





• Cpk:

– Calcule el promedio y la desviación estándar,

– Calcule Cpk:

3

)(),(min LEIxxLESCpk

Si Cp < 1.0, el proceso no es capaz

Si 1.0 < Cp < 1.33, el proceso es justamente capaz

Si Cp > 1.33, el proceso es capaz

x





• Cpm:

– Calcule el promedio y la desviación estándar,

– Calcule Cpm:

22 )(6 Tx

LEILESCpm

x

A mayor Cpm mejor el proceso




Cpk, Rendimiento y “PPM’s” para un proceso centralizado

Cpk Rendimiento* “Defective per million (ppm)*”

0.3 63.188% 368,120

0.4 76.986% 230,139

0.5 86.639% 133,614

0.6 92.814% 71,861

0.7 96.427% 35,729

0.8 98.360% 16,395

0.9 99.307% 6,934

1.0 99.730% 2,700

1.1 99.903% 967

1.2 99.968% 318

1.3 99.990% 96

1.4 99.997% 27

1.5 99.999% 6.8

1.6 >99.999% 1.6

1.7 >99.999% 0.34

1.8 >99.999% 0.07

1.9 >>99.999% 0.01

2.0 >>>99.999% 0.002

2.1 >>>>99.999% 0.0003

2.2 >>>>>99.999% 0.0000

*Presume un proceso centralizado




El intervalo de confianza de Cp con un (1- )100% de confiabilidad es:

1616

1,2

2

1,2

n

x

s

LEILESC

n

x

s

LEILES n

p

n

El intervalo de confianza de Cpk con un (1- )100% de confiabilidad es:

12

1

ˆ9

11ˆ

12

1

ˆ9

11ˆ

22/22/nCn

ZCCnCn

ZCpk

pkpk

pk

pk



Repetibilidad y Reproducibilidad

(R & R)• En cualquier proceso que envuelva medidas, es altamente probable

que la variabilidad observada sea resultado no sólo del producto, pero también del instrumento de medir y la persona que lo mida.

• Repetibilidad - está asociada con la precisión inherente del instrumento de medir.

• Reproducibilidad - está asociada con la precisión de varios operadores midiendo las piezas con un mismo instrumento de medir.



R & R

componente de la

variabilidad total

causado por error de

medición

componente de la

variabilidad total

inherenteal producto

222

mediciónproductototal

222

ilidadreproducibdadrepetibilimedicion



R & R - Ejemplo

Operador A Operador B Operador C

Pieza Medidas Medidas Medidas

# 1 2 1 2 1 2

1 21 20 20 20 19 21

2 24 23 24 24 23 24

3 20 21 19 21 20 22

4 27 27 28 26 27 28

5 19 18 19 18 18 21 6 23 21 24 21 23 22

7 22 21 22 24 22 20

8 19 17 18 20 19 18

9 24 23 25 23 24 24

10 25 23 26 25 24 25

11 21 20 20 20 21 20

12 18 19 17 19 18 19

13 23 25 25 25 25 25

14 24 24 23 25 24 25

15 29 30 30 28 31 30

16 26 26 25 26 25 27 17 20 20 19 20 20 20

18 19 21 19 19 21 23

19 25 26 25 24 25 25

20 19 19 18 17 19 17



R & R - Ejemplo

ANOVA Table

Source Sum of Squares Df Mean Square F-Ratio P-Value

--------------------------------------------------------------------------------

Operators 2.21667 2 1.10833

Parts 1202.5 19 63.2895

Operators*Parts 33.45 38 0.880263 0.79 0.7815

Residual 67.0 60 1.11667

--------------------------------------------------------------------------------

Total 1305.17 119

ANOVA Table

Source Sum of Squares Df Mean Square

----------------------------------------------------------

Operators 2.21667 2 1.10833

Parts 1202.5 19 63.2895

Residual 100.45 98 1.025

----------------------------------------------------------

Total 1305.17 119



R & R - Ejemplo

Gage Report

3 operators 20 parts 2 trials

Measurement Unit Analysis and Study Variation

----------------------------------------------------------------------

5.15 Percent Study Percent

Std. dev. Variation Contribution

Repeatability 5.21398 29.72 8.84

Reproducibility 0.85726 4.89 0.24

R & R 5.28398 30.12 9.07

Part-to-Part 16.7262 95.35 90.93

95.0 Confidence Intervals

----------------------------------------------------------------------

Lower 5.15 Upper

Limit Std. dev. Limit

Repeatability 4.57508 5.21398 6.06192

Reproducibility 0.0 0.85726 5.3235

R & R 5.1677 5.28398 5.16218

Part-to-Part 12.0411 16.7262 24.8213



R & R – Ejemplo

Download - No Slide Titleacademic.uprm.edu/dgonzalez/adiestramientos/Estadisticas... · Prin EDA Estim Dist Mues Hyp Cont Cap R&R Variabilidad • ¿Por qué ocurre la variabilidad? ... –Datos

Top Related