INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Probabilidad &
Estadística Básica
Medir Controlar Mejorar Analizar Definir Reconocer
Six Sigma Entrenamiento Green Belt
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Acerca de este Módulo … Probabilidad La Probabilidad nos permite cuantificar la posibilidad de un
resultado específico o de un conjunto de resultados de un suceso
aleatorio. Es útil para planificar en ambientes de incertidumbre. Nos
permite enumerar las permutaciones o combinaciones posibles de ítems
de una población.
Estadística básica La Estadística básica es una colección de técnicas
útiles para tomar decisiones sobre un proceso o población basado en un
análisis de información contenida en una muestra de esa población.1
Es la ciencia de tomar decisiones bajo incertidumbre.2
1 Douglas C. Montgomery, Introduction to Statistical Quality Control, Third Edition, 1997
2 Edward Dudewicz, Juran’s Quality Control Handbook, Fourth Edition, 1988
\DataFile\yieldsim.xls
\DataFile\StatTables.xls
\DataFile\ProbTheorems.pdf
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Qué aprenderemos …
1. Teoría de Probabilidad Básica
2. Definiciones de Estadística Básica
– Mediciones de Tendencia Central
– Mediciones de Variación
– Distribución Normal
– Transformación Normal Estándar
3. Uso de Tablas Estadísticas
– Distribuciones acumuladas
– Distribución acumulada inversa
4. Distribuciones de probabilidad discretas
– Binomial
– Poisson
– e-dpu Rationale
– Aproximación Normal a la Binomial
5. Capacidad de Proceso Básica
– Definiciones y Principios
– Precisión, Exactitud &
Desplazamiento
– Capacidad e Inspección
6. Usar Z para calcular Cp & Pp
7. Ejemplos de Capacidad
– Datos Variables
– Datos por Atributos
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Definiciones de Probabilidad
0 1 Pa
Experimento aleatorio
- el proceso de observar el resultado de un suceso al azar
Resultados elementales
- todos los resultados posibles de un experimento aleatorio
Espacio de muestra
- colección de todos los resultados elementales
P no a = (1-Pa )
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Dado que la Teoría de Probabilidad fue desarrollada
originalmente para estudiar el juego…..
¿Cuáles son los resultados elementales de tirar un solo
dado?
Resultados Elementales
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
200 Tiradas de un dado
(Simulado por computadora)
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5 6
Determinando Resultados
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
¿Cuáles son los Resultados
Elementales para un Par de Dados?
Determinar Resultados
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
0
5
10
15
20
25
30
35
2 3 4 5 6 7 8 9 10 11 12
¿Cómo compara esto
con las tiradas de un
dado?
200 Tiradas de un par de dados
(Simulado por computadora) Determinando resultados
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Un evento es el conjunto de resultados elementales que satisfacen
una condición dada.
Ejemplo: el evento que la suma de dos dados sea 7
(1,6) (2,5) (3,4) (4,3) (5,2) (6,1)
La probabilidad de un evento es la suma de las probabilidades de
los resultados elementales que satisfacen dicha condición.
6
36
1
6166666or or .
Evento Determinando Resultados
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
P (E o F) = P (E) + P (F) – P (E y F) Probabilidad de E dado F o P (E/F) Probabilidad de E y F = P(E/F) P(F) Si E y F son independientes, P(E y F) = P(E)*P(F)
P (E|F) P (E y F)
P F =
( )
Determinando Resultados
Probabilidad Condicional
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Aplicando las reglas de la
Probabilidad
1. Cuál es la probabilidad de sacar tres caras seguidas al arrojar
una moneda?
2. Cuál es la probabilidad de sacar tres ases seguidos de un mazo
de cartas si se reponen las cartas y el mazo barajado después de
cada extracción?
3. Cuál es la probabilidad de sacar tres ases seguidos de un mazo de cartas si no se reponen las cartas después de cada extracción?
Determinando Resultados
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
La Importancia de la
Estadística Básica
• Las estadísticas tienen una marcad influencia en nuestras vidas …
– Cada día hay una nueva encuesta
– Se usa muestreo para llevar a cabo muchos aspectos de un censo
– La mayor parte de los indicadores económicos se basan en
muestras
– El rating de la TV se basa en muestras
– Las tasas de seguro se determinan por medio de las estadísticas
• La física cuántica ha demostrado que las probabilidades determinan la
estructura y la operación de todo lo que nos rodea.
• La estadística es un facilitador importante de Six Sigma.
Vivimos en un mundo estadístico
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Tipos de Estadísticas
Estadística Descriptiva
Es el proceso de describir la información de la cual disponemos.
Resumimos la información de una muestra o población para dar
un entendimiento o descripción clara de los datos.
Estadística Inferencial
Es el proceso de utilizar información de un conjunto de datos más
pequeño (muestra) para sacar conclusiones o inferencias sobre
un grupo más grande (población).
Normalmente sólo tenemos información de una muestra, no de
toda la población, y tenemos que deducir las características de la
población a partir de la muestra. Queremos que estas
conclusiones sean matemáticamente correctas.
Definiciones
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Tipos de Datos Atributo
Si - no
Bueno - malo
Aceptar - rechazar
Discreta
Múltiplos de unidades enteras
No pueden ser divididas conservando su significado
Contar o clasificar
Continua
Puede ser divididas conservando su significado e ir incrementando
cada vez más su precisión : peso, longitud, voltaje, tiempo, etc.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Moda - el valor más frecuente o más probable
Mediana – el cincuentavo percentil
(la mitad de los valores están encima y la mitad
por debajo de la mediana)
m
å
= media de la población
X X X X
N
j
j 1 1 2 3 , , . . . X
Definiciones
Media - la suma de todos los miembros dividida por el tamaño de la
población (media)
Mediciones de Tendencia
Central - Localización
= media de la muestra
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Población Versus Muestra
Definiciones
Las Estadísticas deducen información sobre los parámetros de la
población.
Población Muestras
Tamaño N n
Situación Media (Media) m x
Dispersión: Variación
Varianza s2 s2
Desvío Estándar s s
Rango R = X Max-X Min
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Cuantificando la Dispersión Definiciones
X
x1
x2
xn
Podríamos sumar las diferencias entre cada valor x y la media de
los valores x . Sin embargo, esto siempre daría cero. Por lo tanto,
elevamos al cuadrado la diferencia entre cada x y x , para
eliminar las negativas y resaltar los puntos singulares y después
tomar las medias de los resultados.
Se define esto como la varianza o s2. Evidentemente, 2ss
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
1n
)XX(ˆs
n
1i
2
s
ia
F r e c u e n c ia
Valores de X
0
2
4
6
8
10
12
14
50 60 70 80 90 100 110
75 80 75 65 70 85 70 70 85 70 60 80 80 80 65 80 75 75 70 85 70 75 75 75 85 80 55 70 70 85 65 70 80 75 65 75 85 90 80 65 70 75 75 80 80 75 95 90 60 65
Mediciones variables de x:
Cantidad de casos = 50
Media & Mediana = 75
Desvío estándar = 8.3299
Rango = 40
Varianza = 69.388
Mínimo = 55
Máximo= 95
i
n
ˆX
n
1iiX
m
Atributos del Histograma – Locación
y Dispersión
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Sigma Cuadrado es una medida de la dispersión de la
población sobre la media
Las varianzas no son unidades de interés; los desvíos (o
desviaciones) estándar están en las unidades de interés
Las varianzas son aditivas; Las desviaciones estándar no son
aditivas...
…por lo tanto s12 + s2
2 + s32 está OK,
pero, s1 + s2 + s3 NO está OK
Mediciones de Variabilidad -
Varianza
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
La Desviación Estándar es una medida de la dispersión de la
población en torno a la media
s = desviación estándar de población
m = media de la población
N = población total
s = estimación de desviación estándar
n = tamaño de muestra
( ) ( ) ( ) ( ) ( )
N
X X X X X
N
2 2
3
2
2
2
1 ... + + s
m m m m
( ) ( ) ( ) ( ) n - 1
X X X X X X X X n
2 2
3
2
2
2
1 ... + + = s = s
Desviación Estándar = Sigma
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Distribución Normal
Cada curva aquí mostrada tiene:
• Un área bajo la curva de uno
• Una media de cero
• Una desviación típica de s
Por lo tanto, el mismo % de la
población está por debajo de
cada curva para n σ’s de la
media.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Área bajo la curva = 1
s = 1
m = 0
Cualquier distribución
normal puede convertirse
en una distribución normal
estándar.
f z ez
( )
1
2
2
2
La fórmula de la función
densidad de probabilidad es …
Función de Densidad de Probabilidad
m3s m2s m1s m m+1s m+2s m+3s
68.26%
95.46%
99.73%
Distribución Normal Estándar
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
La Distribución Normal
Estándar
Permite la conversión de cualquier valor X en un valor Z . Este valor nos permite encontrar el porcentaje de la población que está por encima o por debajo de ese valor.
XZ
m
s
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Determinando Probabilidad Acumulada Usando Tablas de Probabilidades
X = 27
m = 28
Buscar para s = 1.5 y 2.5 en las Tablas!
.1587P 11
28-27Z
1
s
0.3085 P 5.2
28-27Z
2
s
s
m-XZ
s = 1, vs.σ = 2 para X = 27 & m = 28
\DataFile\StatTables.xls
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad Normal
Acumulada
Determine la probabilidad normal acumulada desde menos infinito
hasta el valor X = 27
Media = 28.0
Desviación Estándar = 1.00
Desarrollo:
Abra Minitab
Vaya a Calc > Probability
Distributions > Normal…
El cuadro de diálogo Normal
Distribution aparece como se
muestra
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad Normal Acumulada
(Cont’d)
1. Seleccione Cumulative
Probability
2. Tipee 28.0 en Mean:
3. Tipee 1.00 en Standard
deviation:
4. Seleccione Input
constant:
5. Tipee 27.0 (el valor de X)
en Input constant
6. Seleccione OK
1
3 2
5
4
Lea P( X <= 27.00 ) = 0.1587 en la ventana Session Window
6
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad Normal
Acumulada (Cont’d)
Determine la probabilidad normal acumulada desde menos infinito
hasta el valor X = 27
Media = 28.0
Desviación Estándar = 2.00
Desarrollo:
Abra Minitab
Vaya a Calc > Probability
Distributions > Normal…
El cuadro de diálogo Normal
Distribution aparece como se
muestra
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad Normal
Acumulada (Cont’d)
1. Seleccione Cumulative
Probability
2. Tipee 28.0 en Mean:
3. Tipee 2.00 en Standard
deviation:
4. Seleccione Input
constant:
5. Tipee 27.0 (el valor de X)
en Input constant
6. Seleccione OK
1
3 2
5
4
Lea P( X <= 27.00 ) = 0.3085 en la ventana Session Window
6
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Determinando Probabilidad Acumulada
Inversa Usando Tablas de Probabilidades
X = 27
m = 28
Buscar para s = 1.5 y 2.5 en las Tablas!
s = 1, vs. σ = 2 para X = 27 & m = 28
2728)1*1(* ZX
1- Z indica tablaLa 1587.P
++
ms
2728)2*5.(* ZX
.5- Zindica tablaLa 3085.P
++
ms\DataFile\StatTables.xls
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad
Normal Acumulada Inversa
Media = 28.0 Desviación Estándar = 1.00
Desarrollo: Abra Minitab Vaya a Calc > Probability
Distributions > Normal… El cuadro de diálogo Normal
Distribution aparece como se muestra
Determine la ordenada X que corresponde a la
probabilidad normal acumulada de 0.1587.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad Normal Acumulada
Inversa(Cont’d)
1. Seleccione Inverse
cumulative probability
2. Tipee 28.0 en Mean:
3. Tipee 1.00 en Standard
deviation:
4. Seleccione Input
constant:
5. Tipee 0.1587 (el valor de
la probabilidad normal
acumulada) en Input
constant:
6. Seleccione OK
1
3 2
5
4
Lea X = 27.0 en la Ventana de Sesión
6
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad Normal
Acumulada Inversa (Cont’d)
Media = 28.0 Desviación Estándar = 2.00
Desarrollo: Abra Minitab Vaya a Calc > Probability
Distributions > Normal… El cuadro de diálogo Normal
Distribution aparece como se muestra
Determine la ordenada X que corresponde a la
probabilidad normal acumulada de 0.1587.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Probabilidad Normal
Acumulada Inversa(Cont’d)
1. Seleccione Inverse
cumulative probability
2. Tipee 28.0 en Mean:
3. Tipee 2.00 en Standard
deviation:
4. Seleccione Input
constant:
5. Tipee 0.3085 (el valor de
la probabilidad normal
acumulada) en Input
constant:
6. Seleccione OK
1
3 2
5
4
Lea X = 27.0 en la Ventana de Sesión
6
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Diferencias entre probabilidades
acumulativas
A B
Si queremos saber la probabilidad que el
resultado de un suceso esté entre A y B
y conocemos la distribución, podemos
determinar el área de la función de
densidad de probabilidad entre estos
dos valores
Calcule (busque) las
áreas bajo la curva
desde - ∞ :
– Hasta B y
– Hasta A
Halle la diferencia
El resultado es la
probabilidad que el
resultado del evento se
encuentre entre esos
dos valores.
Usando Tablas de Probabilidades
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Distribución Acumulativa
A B 0
A = - 2.3 y B = - 2.1
Calcule el valor de Z para -2.3 y
-2.1 en una tabla normal estándar :
z (-2.3) = 0.0107
z (-2.1) = 0.0179
Por lo tanto, .0072 de la población estará
entre A y B, o sea que hay un 0.72% de
probabilidad que el resultado del evento se
encuentre entre estos dos valores.
s = 1, m = 0
Usando Tablas de probabilidad \DataFile\StatTables.xls
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Intervalos de Probabilidad
Normal Acumulativos ¿Cual es la probabilidad en una distribución normal, que un
valor sea mayor que A = -2.3 y menor o igual que B = -2.1? La media es cero y la desviación estándar es 1.00.
Esto es solo un tema de sumar y/o restar áreas bajo la curva normal apropiada.
Probabilidad (-2.3 < x <= -2.1) = 0.0179 – 0.0107 = 0.0072
Prob (x <= -2.1) = 0.0179 Prob (x <= -2.3) = 0.0107
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
* Normal estándar se define como aquella normal con una media de 0 y desviación estándar de 1.
Distribución Acumulada Inversa Si el 15% de la población total
tiene un valor menor que B,
¿Cual es el valor de B?
A B 0
Calcule el valor z donde hay 0.15
en la tabla acumulada estándar
normal.* Confirme mediante
Minitab
ZP=0.15 = -1.036
Si el 5% de la población total
tiene un valor menor que A,
¿Cual es el valor de A?
Calcule el valor z donde hay un
0.05 en la tabla acumulada
estándar normal* . Confirme
mediante Minitab
ZP=0.05 = -1.645
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Intervalos en distribución
Normal Acumulada Inversa Si el 5% de una población normal corresponde a un valor menor o igual
que A, ¿cuál es el valor de A?.
Media = 0.0.
Desviación estándar = 1.00.
En la Ventana de Sesión
lea x = -1.645
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Minitab: Intervalos en distribución
Normal Acumulada Inversa (Cont’d) Si el 15% de una población normal corresponde a un valor menor o
igual que B, ¿cual es el valor de B?
Media = 0.0.
Desviación estándar = 1.00.
En la Ventana de Sesión
Lea x = -1.036
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Distribución de Probabilidad Normal
Ejercicio
1. ¿Que porcentaje de la población tiene un valor mayor que 118?
2. ¿Que porcentaje de la población tiene un valor menor que 40?
3. ¿Que porcentaje de la población se encuentra entre estos dos valores?
4. ¿Debajo de qué valor se encuentra el cinco por ciento de la población?
5. Prepárese para describir su enfoque y dar las repuestas.
Una población tiene una m de 100 y una s de 10.
Conteste estas preguntas usando Minitab:
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Distribución de Probabilidad
Normal
Solución del Ejercicio 1. ¿Que porcentaje de la población tiene un valor mayor que 118?
Resp: P(x > 118) = 1 – P(x <= 118) = 1 – 0.9641 = 0.0359
2. ¿Que porcentaje de la población tiene un valor menor que 40?
Resp : P(x <= 40) = 0.000 000 001
3. ¿Que porcentaje de la población se encuentra entre estos dos valores?
Resp : P(40 < x <= 118) = 0.9641 – 0.000 000 001 = 0.09641
4. Debajo de que valor se encuentra el cinco por ciento de la población?
Resp : x = 83.6.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Distribuciones Discretas de
Probabilidad
Selección de Distribución Discreta Aplicaciones y Ejemplos
Hipergeométrica Binomial Poisson Aproximación normal de la binomial
Distribuciones Discretas de Probabilidad
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Selección de Distribución
Discreta Inicio n!
r! (n-r)! pr (1-p)n-r P (r) =
Hipergeométrica <0.10 n
N no si Binomial
(or)
np>5 no si
Poisson .1 < p < .9 no
Si Normal
m = np
s np(1-p)
m = l = np
s2 = l
m = np
s np(1-p)
P(r) = Acertado
Todo posible
C d . C N-d n-r r
C N n
=
P (r) = mr e-m
r!
r = cantidad de aciertos
n = cantidad de pruebas
p = probabilidad de aciertos
N = tamaño de la población
d = cantidad de aciertos en
la población
m = media
s = desviación estándar
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Ejercicio del binomial
A – Para un grupo de 15 personas, ¿cual
es la probabilidad que uno o mas de
ellos tenga este tipo de lastimadura
este año?
B - ¿Cual es la probabilidad que ninguno
de ellos tenga este tipo de lastimadura
este año?
Los datos indican que aproximadamente el 4% de los Americanos
se lastiman con una cama, un colchón o almohada cada año.
m = np
s np(1-p)
n!
r! (n-r)! pr (1-p)n-r P (r) =
r = cantidad de aciertos
n = cantidad de pruebas
p = probabilidad de aciertos
N = tamaño de la población
d = cantidad de aciertos en
la población
m = media
s = desviación estándar
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Binomial: Cálculo Manual Los datos indican que aproximadamente el 4% de los Americanos se lastiman con una cama, un colchón o almohada cada año. A – Para un grupo de 15 personas, ¿cual es la probabilidad que uno o mas de ellos tenga este tipo de lastimadura este año? B - ¿Cual es la probabilidad que ninguno de ellos tenga este tipo de lastimadura este año?
( ) ( )( )0xProb11xProb 4579.05421.01
15
0 X 0.040 x 0.9615 = 0.5421
Prob de x=0 lastimados = 0.5421
15
0 ( ) 1
! 15 1
! 15
! 0 15 ! 0
! 15
x x
<0.10 n
N
Inicio
si Binomial
A. Solución: n!
r! (n-r)! pr (1-p)n-r P (r) =
r = cantidad de aciertos = 0
n = cantidad de pruebas = 15
p = probabilidad de acierto = .04
N = tamaño de la población =
Grande
d = cantidad de aciertos en la
población = .04*N = ?
m = media = np = 15*.04 = 6
s= desvío estándar = np(1-p) =
.6*.4 = .4899
0 aciertos en 15
pruebas
B. Solución:
Prob x=0 lastimados = 0.5421
What the Distribution Looks Like.
43210
0.6
0.5
0.4
0.3
0.2
0.1
0.0
X
Pro
ba
bili
ty
Binomial, n=15, p=0.04
Binomial Distribution Plot
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Binomial usando Tablas
<0.10 n
N
Inicio
si Binomial
Como nuestra tabla Binomial en Excel
no incluye el valor p de 0.04, debemos
calcular el valor usando la función
BINOMDIST en Excel:
\DataFile\StatTables.xls
p n r p(r)0.04 15 0 0.542086
Excel Lookup Tables
Luego debemos restar este valor de 1
para obtener p(r 1): 1 - .542086 =
0.457914, que coincide con el valor
obtenido en nuestro cálculo!
r = cantidad de aciertos = 0
n = cantidad de pruebas = 15
p = probabilidad de acierto = .04
N = tamaño de la población =
Grande
d = cantidad de aciertos en la
población = .04*N = ?
m = media = np = 15*.04 = 6
s= desvío estándar = np(1-p) =
.6*.4 = .4899
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Binomial usando Minitab Los datos indican que aproximadamente el 4% de los Americanos se lastiman con una cama, un colchón o almohada cada año. Para un grupo de 15 personas, ¿cuál es la probabilidad que uno o mas de ellos tenga este tipo de lastimadura este año? ¿Cual es la probabilidad que ninguno de ellos tenga este tipo de lastimadura este año?
Desarrollo:
Abrir Minitab
Ir a Calc > Probability
Distributions > Binomial
Aparecerá el cuadro de
Diálogo BinomialDistribution
como se muestra
P(1 <= x) = 1 – P(x = 0)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Binomial usando Minitab
(Cont’d)
1. Seleccione “exact”
Probability
2. Tipee 15 en
Number of trials:
3. Tipee 0.04 en
Probability of
success:
4. Seleccione Input
constant:
5. Tipee 0 en Input
constant:
6. Seleccione OK
1
2
3
4
5
In Session Window, P(x = 0) = 0.5421
P(1 <= 1) = 1 – 0.5421 = 0.4579
6
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Resolver el problema anterior usando Poisson
en vez de Binomial. Los datos indican que
aproximadamente el 4% de los Americanos se
lastiman con una cama, un colchón o almohada
cada año
Ejercicio Poisson
m = l = np
s2 = l
P (r) = mr e-m
r!
<0.10 n
N
Inicio
si Binomial
(o)
no Poisson np>5
np = 15 x .04 = .6
A – Para un grupo de 15 personas, ¿cual
es la probabilidad que uno o mas de
ellos tenga este tipo de lastimadura
este año?
B - ¿Cual es la probabilidad que ninguno
de ellos tenga este tipo de lastimadura
este año?
r = cantidad de aciertos
n = cantidad de pruebas
p = probabilidad de aciertos
N = tamaño de la población
d = cantidad de aciertos en
la población
m = media
s = desviación estándar
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Poisson: Cálculo Manual
Resolver el problema anterior usando Poisson en vez de Binomial.
A. Si 4% de los Americanos se lastiman con una cama, colchón o almohada
cada año, cuál es la probabilidad que uno o más de un grupo de 15 personas
sufrirán esa lastimadura este año?
B. Cuál es la probabilidad que ninguno de ellos sufra esa lastimadura este año?
( ) !
0
Prob r
r e
r
r m m *
6 . 0 15 04 . * m
A. ( ) ( ) 0 Prob 1 1 Prob r r
( )
45118 . 54881 . 1
! 0
6 . 0 e 1 0 r ob Pr 1
0
6 . 0
*
B. ( ) 5488 . 0 0 Prob r
Media de Poisson:
r = cantidad de aciertos = 0
n = cantidad de pruebas = 15
p = probabilidad de acierto = .04
N = tamaño de la población = Grande
d = cantidad de aciertos en la población =
.04*N = ?
m = media = np = 15*.04 = 6
s= desvío estándar = np(1-p) =
.6*.4 = .4899
NOTA : este cuadro difiere del original y estimo que aún en el original está mal
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Poisson Usando
Tablas
La tabla Poisson en Excel no incluye
np = 0.6, así p(r=0) = 0.5488
\DataFile\StatTables.xls
Luego restamos el valor de 1 para
obtener p(r 1):
1 - .5488 = 0.4512, el mismo valor al
obtenido por cálculo manual
Las tablas de Excel son mucho más simples que calcular probabilidades
r = cantidad de aciertos = 0
n = cantidad de pruebas = 15
p = probabilidad de acierto = .04
N = tamaño de la población =
Grande
d = cantidad de aciertos en la
población = .04*N = ?
m = media = np = 15*.04 = 6
s= desvío estándar = np(1-p) =
.6*.4 = .4899
NOTA : este cuadro difiere del original y estimo que aún en el original está mal
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Poisson usando Minitab
Los datos indican que aproximadamente el 4% de los Americanos se lastiman con una cama, un colchón o almohada cada año. • Para un grupo de 15 personas, ¿cuál es la probabilidad que uno o
mas de ellos tenga este tipo de lastimadura este año? • ¿Cual es la probabilidad que ninguno de ellos tenga este tipo de
lastimadura este año??
Desarrollo:
Abrir Minitab
Ir a Calc > Probability
Distributions > Poisson
Aparece el cuadro de diálogo
Poisson Distribution
como se muestra
P(1 <= x) = 1 – P(x = 0)
Media = np = 15*0.04 = 0.6
Poisson es una aproximación a la
Binomial
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Solución Poisson usando Minitab (Cont’d)
1. Seleccione “exact”
Probability
2. Tipee 0.6 en Mean:
3. Seleccione Input
constant:
4. Tipee 0 en Input
constant:
5. Seleccione OK
1
2
3
5
4
En la ventana de sesión P (x = 0) = 0.5488
P(1 <= 1) = 1 – 0.5488 = 0.4512
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Racional para e-dpu
La distribución Poisson se utiliza para describir una situación donde la probabilidad de un defecto en una unidad específica o área dentro de una unidad es baja, pero la probabilidad global de un defecto es alta, la situación más común en aplicaciones. Como vimos antes, la distribución Poisson se define como:
r!
e*(np)Y
npr
P (defecto) baja en cualquier celda, pero
P (defecto) alta en la unidad completa!
Y = probabilidad de ocurrencias
n = cantidad de ensayos
p = probabilidad de una ocurrencia
r = cantidad total de ocurrencias
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Racional para e-dpu
(continuación) Porque los Defectos Por Unidad (dpu) pueden ser descritos como:
• Cantidad de defectos por cantidad de unidades • Cantidad de unidades * la probabilidad de un defecto en cualquier unidad
Los Defectos Por Unidad (dpu) pueden ser sustituidos por np
(dpu) r e- dpu Y =
r!
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Racional para e-dpu
(continuación)
Si r (cantidad de ocurrencias) = “0” (ningún defecto en el producto), rendimiento = 100%, entonces sustituyendo r por “0”
-dpuY = eSi se conocen los “defectos por unidad”, se puede
calcular el RTY
(dpu) r e- dpu Y =
r!
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Distribución Binomial
Características
Distribución de:
r (o x) éxitos en n ensayos con p probabilidad de éxito
Usado con datos modo atributo
m = np
s2 = np (1-p)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
La distribución Binomial
puede
ser aproximada
P a X b P a n p
np p Z
b np
np p ( )
.
( ) ( ) @
+
5
1
.5
1 P
La distribución binominal:
n (n >50) ensayos con
p probabilidad
Se aproxima por la curva normal con
m = np y
s2 = np(1-p)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Aplicación de la Binomial Usando
Minitab Elija una moneda sana
Lance la moneda 100 veces (100
pruebas)
¿Cuál es la probabilidad de observar
mas de 70 caras?
¿Cual es la probabilidad de observar
menos de 30 caras?
Desarrollo:
Abra Minitab
Vaya a Calc > Probability
Distributions > Binomial
La ventana de dialogo Binomial
Distribution aparecera como se muestra
P(70 < x) = 1 – P(x <= 70)
P(x < 30) = P(x <= 29)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Aplicación de la Binomial Usando Minitab
(Continuación)
P(70 < x) = 1 – P(x <= 70) 1. Seleccione Cumulative
probability
2. Tipee 100 en Number of
trials:
3. Tipee 0.5 en Probability
of Success:
4. Seleccione Input
constant:
5. Tipee 70 en Input
constant:
6. Tipee K2 en Optional
storage:
7. Seleccione OK
1
2
3
4 5
6 7
En la Ventana de Sesión, P(x <= 70) = 0.999984
P(70 < x) = 1 – 0.999984 = 0.000016
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Aplicación de la Binomial Usando
Minitab (Continuación)
P(x <= 29) 1. Seleccione
Cumulative
probability
2. Tipee 100 en
Number of trials:
3. Tipee 0.5 en
Probability of
Success:
4. Seleccione Input
constant:
5. Tipee 29 en Input
constant:
6. Tipee K3 en Optional
storage:
7. Seleccione OK
1
2
3
4 5
6 7
En Ventana de Sesión, P(x <= 29) = 0.000016
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Su Turno
Se le requiere a un gerente de una sucursal de banco procesar
el 90% de las aplicaciones de préstamo en dos días o menos.
Si se satisface el requerimiento, ¿cuál será la probabilidad
que, en una muestra de 100 aplicaciones, se procesen en dos
o menos días, 13 de ellas?.
Verifique que la aproximación normal pueda ser usada, luego
calcule la probabilidad usando la aproximación normal.
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Su Turno: Solución Minitab • Se requiere a un gerente de una sucursal de banco procesar el
90% de las aplicaciones de préstamo en dos días o menos.
Si se satisface el requerimiento, ¿cuál será la probabilidad que, en una muestra de 100 aplicaciones, se procesen en dos o menos días, 13 de ellas?.
Desarrollo:
• Falla = Procesar una aplicación en 2 días o menos
• Éxito = Procesar una aplicación en mas de 2 días
• P (Éxito) = 1 – P (Falla) = (1 – 0.90) = 0.10
• Probabilidad de procesar 13 o menos aplicaciones en un máximo de dos días
• P (x <= 13)
INSTITUTO PARA LA CALIDAD © 2010. Prohibida su reproducción total o parcial sin permiso del autor y del Instituto para la Calidad de
la Pontificia Universidad Católica del Perú.
Su Turno: Solución Minitab
(Continuación)
En Ventana de Sesión, P (x <= 13) = 0.8761