programa tronco comÚn ingenierÍa plan de …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/apuntes...

73
FACULTAD DE INGENIERÍA ARQUITECTURA Y DISEÑO PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE ESTUDIOS 2009-2 ASIGNATURA: PROBABILIDAD Y ESTADÍSTICA CLAVE: 11212 APUNTES DE LA ASIGNATURA Ensenada, B.C. 05 de Agosto de 2016.

Upload: phungdat

Post on 19-Sep-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

FACULTAD DE INGENIERÍA ARQUITECTURA Y DISEÑO

PROGRAMA TRONCO COMÚN INGENIERÍA

PLAN DE ESTUDIOS 2009-2

ASIGNATURA: PROBABILIDAD Y ESTADÍSTICA

CLAVE: 11212

APUNTES DE LA ASIGNATURA

Ensenada, B.C. 05 de Agosto de 2016.

Page 2: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

1

UNIDAD 1: ESTADÍSTICA DESCRIPTIVA

INTRODUCCIÓN.

El curso de Probabilidad y Estadística ubicado en el tronco común de las ciencias de la ingeniería, corresponde al área de las ciencias básicas de la ingeniería; y está orientado al estudio de los fundamentos matemáticos y metodologías de la probabilidad, estadística descriptiva e inferencial; para el estudio y caracterización de sistemas y procesos, apoyándose en el uso de tecnología y herramientas computacionales, para el cálculo e interpretación de indicadores que sustentan la toma de decisiones y optimización de los mismos. En esta unidad de aprendizaje se desarrollan habilidades en las técnicas de muestreo, representación y análisis de información, así como actitudes que favorecen el trabajo en equipo; y proporciona las bases fundamentales para incursionar de manera competente en el estudio de las metodologías para la optimización de sistemas y procesos de las ciencias de la ingeniería.

1.0 CONCEPTOS Estadística: Es una colección de métodos para planear experimentos, obtener datos y después organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos. Datos: Son las observaciones recolectadas (como mediciones, géneros, respuestas de encuestas). Población: Es la colección completa de todos los elementos (puntuaciones, personas, mediciones, etc.) a estudiar. Se dice que la colección es completa pues incluye a todos los sujetos que se estudiaran. Censo: Es la colección de datos de cada uno de los miembros seleccionados de una población. Muestra: Es un subconjunto de miembros seleccionados de una población. Variabilidad: Por variabilidad se entiende por observaciones sucesivas de un sistema o fenómeno que no producen el mismo resultado. Parámetro: Es una medición numérica que describe alguna característica de una población. Estadístico: Es una medición numérica que describe alguna característica de una muestra. Datos Cuantitativos: consisten en números que representan conteos o mediciones. Datos cualitativos: Se les llama también categóricos o de atributo, se distinguen en alguna característica no numérica. Datos Discretos: Resultan cuando el número de posibles valores es un número finito o bien un número que puede contarse. Es decir el número de posibles valores 0, 1, 2, 3, etc. Datos Continuos (numéricos): Resultan de un infinito de posibles valores que pueden asociarse a puntos de alguna escala continua, cubriendo un rango de valores sin huecos ni interrupciones.

1.1 Población y muestra. En el proceso de toma de decisiones, éstas deberán basarse en datos que describan el fenómeno estudiado, sin embargo, el recolectar datos sobre las características de todo un grupo de personas u objetos puede resultar impráctico o antieconómico. En vez de examinar todo el grupo, al que se le conoce como población o universo, se examina sólo una pequeña parte del grupo, al que se le llama muestra. Por ejemplo, si quisiéramos saber la estatura promedio de los estudiantes varones de la Facultad de Ingeniería Arquitectura y Diseño de Ensenada (FIAD), todos los estudiantes varones serían la población o universo de estudio, si solo tomamos un grupo de 50 estudiantes varones de la FIE, este grupo sería la muestra. Las poblaciones pueden ser finitas e infinitas. Por ejemplo la manufactura de tablillas de circuitos en una empresa en determinado día (es finito) o el resultado de aventar una moneda al aire (águila o sello) que se pueden obtener lanzando una y otra vez una moneda (es infinita)

Universo

Muestra

Page 3: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

2

1.2 Inferencia estadística.

Si la muestra es representativa de la población, el análisis de la muestra permite inferir conclusiones válidas acerca de la población. A la parte de la estadística que se encarga de las condiciones bajo las cuales dichas inferencias son válidas se le conoce como estadística inferencial o inductiva. Sin embargo, como estas inferencias no pueden ser absolutamente ciertas, dado que no representan el 100% de los datos, se utilizan términos de probabilidad para relacionar las inferencias dadas. A la parte de la estadística que solamente trata de describir y analizar un grupo de datos, sin sacar conclusiones ni hacer inferencia acerca de la población donde fueron tomados, se les conoce como estadística descriptiva o deductiva.

1.3 Técnicas de muestreo.

Para que las conclusiones que se obtienen mediante la inferencia estadística sean validas, las muestras deben elegirse de manera que sean representativas de la población. Al estudio de los métodos de muestreo se le conoce como diseño de experimentos. Una manera de obtener una muestra representativa es mediante el muestreo aleatorio, en el que cualquier miembro de la población tiene la misma posibilidad de ser incluido en la muestra. Para realizar muestreo aleatorio, se pueden utilizar los números aleatorios de las calculadoras, tablas aleatorias o realizar sorteos, asignando números a los miembros y sacando los números de una urna sin que se sepa cuál es. Dentro del muestreo, si se extrae un número de una urna y antes de sacar otro número, este se vuelve a introducir a la urna, este tipo de muestreo se llama muestreo con reposición. Si no se vuelve a introducir se llama muestreo sin reposición.

1.4 Niveles de medición.

En el área de ingeniería, la mayoría de las veces se trabaja con muestras que han sido seleccionadas de una población, en general estos datos se recolectan de dos formas:

a) Estudio observacional implica que el procesos o sistema que se está estudiando solo puede ser observado y los datos solo se capturan conforme se van presentando o en su caso vienen de análisis de datos históricos (capturados anteriormente).

b) Experimento diseñado implica cambios deliberados o intencionados en las variables controlables del sistema, es decir, se diseña de tal forma que se obtienen datos en las condiciones deseadas del sistema o proceso analizado. Por ejemplo al elaborar un pastel, se experimenta el tiempo de horneado utilizando 5 diferentes tipos de harina, para cada tipo de harina, habrá un tiempo de horneado.

Experimento aleatorio es aquel que puede producir resultados diferentes, aun cuando se repita de la misma manera.

1.5 Distribución de frecuencias.

Al organizar una gran cantidad de datos, suele ser útil distribuirlos en clases o categorías y determinar la cantidad de datos que pertenecen a cada clase; esta cantidad se conoce como la frecuencia de clase y a la disposición (orden) de los datos en clases con sus respectivas frecuencias de clases se le conoce como distribución de frecuencia o tabla de frecuencia, es decir una tabla de que clasifica los datos por magnitud, en base al número de veces que ocurre un suceso individual o el número de sucesos que entran en un intervalo dado. A su vez el histograma es la representación gráfica de la tabla de frecuencias por medio de un diagrama de barras donde la altura de cada barra indica el número de veces que el número dado aparece en la serie, o el número de valores que caen dentro de un intervalo.

Page 4: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

3

En el caso de datos discretos, la tabla de frecuencias se elabora ordenando las observaciones en una columna, mientras que en una segunda columna se indica la frecuencia de clase o el número de veces que ocurrió ese suceso. En una tercera columna se indican la frecuencia acumulada, que es la suma de la frecuencia relativa a una clase y las que le anteceden. Ejemplo 1 Un edificio tiene 45 apartamentos con el siguiente número de inquilinos;

2 1 3 5 2 2 2 1 4 2 6 2 4 3 1 2 4 3 1 4 4 2 4 4 2 2 3 1 4 2 3 1 5 2 4 1 3 2 4 4 2 5 1 3 4

Tabla de frecuencias sencilla

Número de personas Frecuencia de clase Frecuencia acumulada

1 8 8 2 14 22 3 7 29 4 12 41 5 3 44 6 1 45

Total: 45

Procedimiento para construir una tabla de frecuencias

1.- Localizar el dato menor y el dato mayor del grupo de datos. 2.- Calcular el rango (diferencia del dato mayor y el dato menor)

3.- Determinar el número de intervalos de clase a utilizar un número aproximado a .n

4.- Determinar el ancho de clase dividiendo el rango entre el número de intervalos calculado en el paso 3. Nota: si el ancho de clase no es un número entero, aumentar el rango a un número que se pueda dividir

entre el número de intervalos de clase .n

5.- Determinar los intervalos de clase, indicando los límites o fronteras de cada uno. 6.- Calcular la marca de clase o punto medio, sumando los límites de clase de cada intervalo y dividiendo esta suma entre 2. 7.- Localizar en el grupo de datos el número de valores que caen dentro de cada intervalo, el cual será su frecuencia. La suma de las frecuencias deberá ser igual a n. 8.- Calcular la frecuencia acumulada, sumando para cada intervalo su frecuencia con todas las frecuencias de los intervalos que lo anteceden. La frecuencia acumulada de la última clase deberá ser igual a n. 9.- Calcular la frecuencia relativa de cada clase, dividiendo su frecuencia entre el número de datos (n), es decir el porcentaje. 10.- Calcular la frecuencia relativa acumulada, es decir, el porcentaje de cada clase se suma y debe ser igual a 1.

Page 5: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

4

Ejemplo 2 Los siguientes son datos de la resistencia a la comprensión de 80 ejemplares de prueba de una aleación aluminio – litio, que se desea probar para la fabricación de partes de avión.

Resultados (en Psi)

105 221 183 186 121 181 180 143

97 154 153 174 120 168 167 141

245 228 174 199 181 158 176 110

163 131 154 115 160 208 158 133

207 180 190 193 194 133 156 123

134 178 76 167 184 135 229 146

218 157 101 171 165 172 158 169

199 151 142 163 145 171 148 158

160 175 149 87 160 237 150 135

196 201 200 176 150 170 118 149

Se elabora la tabla de frecuencias.

1.- 245max X 76min X

2.- Rango= 16976245minmax XX

Nuevo Rango = 250-70=180

3.- # de intervalos = n=80 = 80 9

4.- Ancho de clase = 180/9 = 20 Tabla de frecuencias.

5.Intervalo de clase (Psi)

6.Marca de clase

7.Frecuencia 8.Frecuencia Acumulada

9.Frecuencia Relativa

10. Frec. Relativa Acumulada

70 X <90 80 2 2 0.0250 0.0250

90 X <110 100 3 5 0.0375 0.0625

110 X <130 120 6 11 0.0750 0.1375

130 X <150 140 14 25 0.1750 0.3125

150 X <170 160 22 47 0.2750 0.5875

170 X <190 180 17 64 0.2125 0.80

190 X <210 200 10 74 0.1250 0.925

210 X <230 220 4 78 0.0500 0.975

230 X <250 240 2 80 0.0250 1.0

1.6 Presentación gráfica de datos.

1.6.1 Gráfica de tallo y hoja

Es una forma adecuada de obtener una representación visual informativa de un grupo de datos

,,..., 21 nXXX donde cada número iX tiene al menos dos dígitos. Para construir un diagrama de tallo y

hoja, cada número iX se divide en dos partes: un tallo compuesto por uno o más de los primeros dígitos

y una hoja compuesta por los dígitos restantes. En general deberán elegirse relativamente pocos tallos en comparación con el número de observaciones. La mejor elección suele ser entre 5 y 20 tallos. Una vez que se ha elegido un conjunto de tallos, se enlistan en el margen izquierdo del diagrama. Enseguida

Page 6: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

5

de cada tallo se enlistan todas las hojas correspondientes a los valores de los datos observados en el orden en que se van encontrando en el conjunto de datos. En algunas ocasiones se ordenan las hojas de menor a mayor en cada tallo. A esta forma de presentación suele llamarse representación ordenada de tallo y hoja, la cual hace relativamente sencillo determinar características de los datos tales como los percentiles, los cuartiles y la mediana. Ejemplo 3 Utilizar los datos de la resistencia a la comprensión (ejemplo 1.5.2) para construir un diagrama de tallo y hoja.

Tallo Hoja Frecuencia

7 6 1

8 7 1

9 7 1

10 51 2

11 580 3

12 103 3

13 413535 6

14 29583169 8

15 471340886808 12

16 3073050879 10

17 8544162106 10

18 0361410 7

19 960934 6

20 7108 4

21 8 1

22 189 3

23 7 1

24 5 1

1.6.2 Histograma El histograma es una gráfica de barras que se utiliza para representar datos del tipo numérico con un número muy grande de valores diferentes, es decir cuando los posibles valores que se miden pueden tomar un valor cualesquiera dentro de un intervalo dado, por ejemplo, la longitud de pernos o tornillos, el diámetro de los pistones para motor, etc., en esta clasificación interviene un número de casos donde se miden características físicas como peso, volumen, longitud, etc. En el caso de datos categóricos o discretos como el número de inquilinos del edificio (ejemplo 1.5.1), la base del histograma son precisamente la cantidad de inquilinos y en el eje Y se indica la frecuencia de cada clase como se muestra a continuación.

Page 7: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

6

Ejemplo 4

C1

Frec

uenc

ia

654321

14

12

10

8

6

4

2

0

Histograma para el número de inquilinos por departamento

Histograma de número de inquilinos En el caso de datos continuos como el ejemplo de la resistencia a la compresión del aluminio (psi), el ancho de la base de la barra es importante y ésta representa el ancho de la clase, mientras que la altura representa la frecuencia de clase; se debe mantener una escala tanto en el eje vertical como el horizontal, a diferencia de la gráfica de barras común donde lo que se cuida es la escala del eje vertical y el ancho de barras es en forma arbitraria, cuidando únicamente la estética de la misma. Al igual que la gráfica de barras, se recomienda que la altura del histograma sea 3/4 de la base de todo el histograma. Procedimiento Para Hacer los Histogramas: 1. Seleccionar la escala para hacer la gráfica, se recomienda que la altura sea 3/4 de la base

aproximadamente y dibujar los ejes x-y. 2. Seleccionar la escala de la base, de tal forma que se pueda ajustar todas las clases más una extra de

cada lado, en este caso la base de cada barra representa el ancho de la clase. 3. Seleccionar una escala en el eje de las y, el cual representa la frecuencia o frecuencia relativa, esta

escala debe ser ajustada para representar la frecuencia de clase mayor. 4. Dibujar la primera barra, la cual representa la primera clase, la altura representa la frecuencia de

ocurrencia o frecuencia relativa. 5. Repetir el paso 4 hasta tener todas las barras como se ha mencionado anteriormente.

Page 8: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

7

Ejemplo 1.6.2.2

Histograma de los datos de la compresión del aluminio (del ejemplo 1.5.2) 1.6.3 Polígono de frecuencias. El polígono de frecuencias, a diferencia del histograma, es una gráfica de líneas y como su nombre lo dice, es un área delimitada por varias líneas, las cuales representan los lados. Los vértices son compuestos de las marcas de clase y las frecuencias, tomando en cuenta una clase anterior a la primera y otra posterior a la última con frecuencia cero, la razón de utilizar estas dos clases con frecuencia cero, es para cerrar el polígono con el eje horizontal. Ejemplo 1.6.3

Polígono de frecuencia de la compresión del aluminio 1.6.4 Ojivas Las ojivas porcentuales, son las gráficas de polígono de frecuencias, solo que en lugar de utilizar las frecuencias de cada clase, se utiliza las frecuencias acumuladas relativas en cada clase, a la respectiva distribución se le conoce como distribución de frecuencias acumuladas relativas. A continuación se muestra la ojiva porcentual de los datos de la compresión del aluminio.

80 100

120

140

160

180

200

220 240

0

5

10

15

20

25

70≤X<90 90≤X<110 110≤X<130 130≤X<150 150≤X<170 170≤X<190 190≤X<210 210≤X<230 230≤X<250

0

5

10

15

20

25

X<70 70≤X<90 90≤X<110 110≤X<130 130≤X<150 150≤X<170 170≤X<190 190≤X<210 210≤X<230 230≤X<250 X>250

Frec

uen

cia

Ancho de clase

Ancho de Clase

Fre

cuencia

de c

lase

Page 9: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

8

Ejemplo 1.6.4

Ojiva Porcentual de la compresión del aluminio. 1.6.5 Diagrama Pareto

El diagrama de Pareto es de gran importancia debido a sus aplicaciones en diferentes disciplinas del conocimiento, originalmente, éste fue utilizado para representar el principio del economista Wilfredo Pareto, de donde salió el nombre y quien estableció que aproximadamente el 80% de las riquezas, las poseían el 20% de las personas, mientras que el 20% de éstas las poseían el otro 80% de las personas, este principio describe muy bien la forma en que los bienes están distribuidos dentro de la población y ha sido extrapolado a otros campos como el control de la calidad donde se estableció el “Principio Pareto”, “Pocos vitales, muchos Triviales” o “Regla 80-20” y que establece que el 80% del efecto observado en un sistema o proceso son producidos por el 20% de las causas, mientras que el otro 20% de efecto, es ocasionado por el 80% de las causas restantes, por lo tanto se utiliza para detectar las causas de efectos más importantes en un sistema o proceso. La elaboración es parecida a la gráfica de barras común, solo que en el diagrama Pareto se ordenan de izquierda a derecha, los datos con mayor frecuencia de clase y además se indica por la parte superior mediante una línea, la frecuencia relativa acumulada, esto último para poder ver cuales clases o grupo de datos son los más representativos del fenómeno estudiado. Ejemplo 1.6.5.1

Diagrama Pareto de los datos de la compresión del aluminio (del ejemplo 1.5.2)

0

0.025 0.0625 0.1375

0.3125

0.5875

0.8

0.925 0.975 1

1

0

0.2

0.4

0.6

0.8

1

1.2

X<70 70≤X<90 90≤X<110 110≤X<130 130≤X<150 150≤X<170 170≤X<190 190≤X<210 210≤X<230 230≤X<250 X>250

Compresión del alumínio

Fre

cue

nci

a

Pe

rce

nt

Compresión

Count

Percent 27.5 21.3 17.5 12.5 7.5 5.0 3.8 5.0

Cum %

22

27.5 48.8 66.3 78.8 86.3 91.3 95.0 100.0

17 14 10 6 4 3 4

Other

90≤X<

110

210≤

X<230

110≤

X<130

190≤

X<210

130≤

X<150

170≤

X<190

150≤X<

170

90

80

70

60

50

40

30

20

10

0

100

80

60

40

20

0

Diagrama Pareto

Fre

cuencia

de c

lase

Page 10: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

9

1.7 Medidas de tendencia central

Media: Es el valor promedio de todos las observaciones del conjunto de datos que puede ser una muestra o una población. Por lo general, estos datos son una muestra de observaciones que se ha seleccionado de una población de observaciones más grande. Media muestral. Si se trata de datos de una muestra, la cantidad total de observaciones de esa muestra se denota con

“n”. Si las “n” observaciones de una muestra se denotan por 1x ,

2x …nx , entonces la media muestral

es:

n

xxxX n

...21=

n

xn

i

i1

Media poblacional. Si se trata de datos de una población, la cantidad total de observaciones de esa población se denota “N”.

Si las “N” observaciones de una población se denotan por 1x ,

2x … Nx , entonces la media poblacional

es:

N

xN

i

i 1

Mediana: Es una medida de tendencia central que divide los datos ordenados de menor a mayor, en dos partes iguales, una mitad queda debajo de la mediana y la otra mitad queda arriba de ella. Si el número de observaciones es par, la mediana está a la mitad de dos valores centrales y si el número de observaciones es impar, la mediana es el valor central. Caso 1: Si el número de observaciones es impar:

Mediana 2

1~

nX

Caso 2: Si el número de observaciones es par:

Mediana 2

122~

nyn

X

Moda: Es el valor de los datos que se repite con mayor frecuencia. Comparación entre la media y la mediana Aunque la media y la mediana nos sitúan de alguna forma en el centro, la media es sensible a la magnitud de los valores de cada uno de sus lados mientras que la mediana solo es sensible al número de valores de dichos lados.

Page 11: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

10

Ejemplo 1.7.1 El propietario de una pequeña empresa tiene 15 empleados. 5 ganan $25.000 al año, 7 ganan de $30.000 y 3 de $40.000. El sueldo anual del propietario es de $153.000. (a) Hallar la media y la mediana de los sueldos de las 16 personas de la empresa. (b) Hallar la media y la mediana de los sueldos si se incrementa el sueldo del propietario en $80.000.

a) La media del salario es:

16

000.153$000.40$3000.30$7000.25$5 = 000,38

16

000,608

b) La mediana del salario es:

Número par n=16

9,82

12

,2~

nn

X

El valor 8 es 30,000 y el valor 9 es 30,000

000,30

2

000,30000,30~

X

Salarios Frecuencia Frecuencia Acumulada

25.000 5 5 30.000 7 12 40.000 3 15 153.000 1 16

c) Nuevo Salario Medio:

000.4316

000.688

16

000.80000.608

Nota: La Mediana seguirá siendo la misma.

1.8 Medidas de dispersión

Varianza: Es un valor numérico que describe la variabilidad o dispersión de los datos.

Si 1x ,

2x … nx es una muestra de n observaciones, entonces la varianza muestral es:

1

1

2

2

n

Xx

S

n

i

i

Si 1x ,

2x … Nx es una población de N observaciones, entonces la varianza poblacional es:

N

xN

i

i

1

2

2

Desviación estándar: Es la mediad más usual de la variabilidad y mide qué tan esparcidos están los datos respecto a la media. Es igual a la raíz cuadrada de la varianza.

Page 12: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

11

Desviación estándar muestral

1

1

2

n

Xx

S

n

i

i

1

...22

2

2

1

n

XxXxXxS n

Donde x1, x2,…,x n son observaciones numéricas de la muestra, n su tamaño y �̅� es la media muestral Desviación estándar poblacional

N

XN

i

i

1

2

N

xxx N

22

2

2

1 ...

Donde x1, x2,…,x n son observaciones numéricas de la población, N el tamaño y 𝜇 es la media poblacional Rango: Es la diferencia entre el valor más grande y el más pequeño de un conjunto de datos.

Si las observaciones de una muestra se denotan por 1x ,

2x … nx entonces el rango muestral es:

r = max ii XX min

Significado de la desviación estándar en un grupo de datos.

Consideremos las dos muestras con los siguientes valores numéricos

X S

Serie A 12 10 9 9 10 10 1.22 Serie B 5 10 16 15 4 10 5.52

Ejercicio 1. Conteste las siguientes preguntas. ¿Por qué tienen la misma media? ¿Por qué tienen diferente desviación estándar?

Media para datos agrupados:

X =

n

nn

ffff

XfXfXfXf

...

...

321

332211

n

i

i

n

i

ii

f

Xf

1

1

Donde: nXXX ..., 21 son las marcas de clase

Mediana para datos agrupados: Se calcula utilizando la distribución de frecuencias acumuladas. Varianza muestral para una distribución de frecuencias.

Page 13: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

12

2S

1...

...

21

22

22

2

11

n

nn

fff

XXfXXfXXf

11

1

2

n

i

i

n

i

Ii

f

XXf

Donde: nXXX ..., 21

son las marcas de clase.

La media para datos agrupados es:

X =

80

240222042001018017160221401412061003802

X = 80

4808802000306035201960720300160

X = 13080 / 80= 163.5 La mediana para datos agrupados es:

X~

=

2

122

nyn

valores 41,40

X~

=

2

160160= 160

Varianza muestral para una distribución de frecuencias.

222222 5.163160225.163140145.16312065.16310035.163802 S +

15.16324025.16322045.163200105.16318017 2222 n

2S = 13944.5+12096.8+11353.5+7731.5+269.5+4628.25+13322.5+12769+11704.5

2S = 79

05.878201111.646

S =33.34

Ejemplo 1.8.1 Supongamos que la temperatura (en grados Fahrenheit) medidas a las 6:00 pm Durante un periodo de 35 días son las siguientes:

72 78 86 93 106 107 98 82 81 77 87 82

91 95 92 83 76 78 73 81 86 92 93 84

107 99 94 86 81 77 73 76 80 88 91

Con estos datos construir una tabla de frecuencias con su histograma correspondiente, además de calcular su media, mediana y desviación estándar.

1.- 107max X 72min X

Page 14: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

13

2.-rango=107-72=35 4070110 rangoN

3.-No. de intervalos= "8"691.535

4.-Ancho de clase= 58

40

5.-Intervalo de clase 6.-Marca de clase 7.-Frecuencia 8.-Frecuencia Acumulada

70 X <75 72.5 3 3

75 X <80 77.5 6 9

80 X <85 82.5 8 17

85 X <90 87.5 5 22

90 X <95 92.5 7 29

95 X <100 97.5 3 32

100 X <105 102.5 0 32

105 X <110 107.5 3 35

1.9 MEDIDAS DE POSICIÓN: CUARTILES Y PERCENTILES 1.9.1 Cuartiles. Cuando un conjunto ordenado de datos se divide en cuatro partes iguales, el valor que marca cada una

de estas divisiones se le conoce como cuartil o cuartil inferior, ,1q es un valor que tiene aproximadamente

una cuarta parte (25%) de las observaciones abajo de él y aproximadamente 75% de las observaciones

arriba. El segundo cuartil, 2q , tiene aproximadamente la mitad (50%) de las observaciones abajo de su

valor es exactamente igual a la mediana. El tercer cuartil, ,3q tiene aproximadamente tres cuartas partes

(75%) de las observaciones debajo de su valor. Percentiles

Supongamos “ n ” valores colocados en orden creciente. El Percentil “ k ” que llamamos kP , es el numero

para el cual el “ k ” por ciento de los valores son menores de kP , y el (100-k) por ciento son superiores.

Los Percentiles más utilizados son el 25P , 50P Y 75P , los cuales se corresponden en el cuartil número 1

1q , el cuartil número 2 2q y el cuartil número 3 3q respectivamente. Concretamente kP se define

como siguiente:

0

2

4

6

8

10

72.5 77.5 82.5 87.5 92.5 97.5 102.5 107.5

Fre

cue

nci

a

Temperatura

Histograma de Temperatura

Page 15: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

14

Primero: Calcular 100

kn y partirlo en su parte entera I y su parte decimal D, es decir:

DIkn 100

1IValor Cuando 0D

2

1 IValorValorI Cuando D 0

Ejemplo 1.9.1

Supongamos 50 datos colocados en orden creciente. Hallar 35Pa y 30Pb .

a) Dado 50n y 35k así

I D

0,5.0175.17100

5035100

dadoDkn

Entonces 181 IPk .181835 valorP

b) Dado 50n y 30k

I D

dadokn ,0150.15100

1500100

5030100

0queD

Entonces

2

1615

2

130

valorvalorIvalorvalorIP

Ejercicio encontrar: P25, P50 y P75 para:

a) Los datos para la resistencia a la compresión (ejemplo 1.3) b) Los datos de las temperaturas (ejemplo 1.4)

a)

1442

145143

2

21200.20

1008025

100 25125

PqPkn

5.161

2

163160

2

41400.40

1008050

50250

PqP

181

2

181181

2

61600.60

1008075

75375

PqP

b) 35,,, 755025 nPPP

789175.8100

352525125 valorIvalorPqp

86185.17

1003550

50250 valorPqP

kP

Page 16: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

15

932725.26

1003575

75375 valorPqP

1.9.3 Gráfica de caja. El diagrama de tallo y hoja y el histograma proporcionan una impresión visual acerca de un conjunto de datos, mientras que el promedio y la desviación estándar muéstrales proporcionan información cuantitativa acerca de las características especificas de los datos. El diagrama de caja es una representación gráfica que muestra simultáneamente varias características importantes de los datos, tales la localización o la tendencia central, la dispersión o variabilidad, el apartamiento de la simetría y la identificación de observaciones que se localizan inusualmente lejos del grueso de los datos (a estas observaciones se les conoce como puntos atípicos). Un diagrama de caja muestra los tres cuartiles así como el mínimo y el máximo de los datos, en una caja rectangular alineada sea horizontal o verticalmente. La caja abarca el rango intercuartílico con el lado

izquierdo (o inferior) en el primer cuartil 1q y el lado derecho (o superior) en el tercer cuartil 3q . Se traza

una línea por la caja en el segundo cuartil (que es quincuagésimo percentil o la mediana).Se extiende una línea de ambos extremos hasta los valores más lejanos. Estas líneas suelen llamarse “bigotes”. En algunos programas de computadora los bigotes solo se extienden a lo sumo una distancia de

135.1 qq de los extremos de la caja y las observaciones localizadas después de estos límites se

marcan como puntos atípicos potenciales. Esta variante se conoce como el diagrama de caja modificado. Ejemplo 1.9.2 Construir un diagrama de caja con los datos de la siguiente tabla, los cuales son diámetros (en mm) de las perforaciones en un grupo de 12 sub-ensambles del borde principal de las alas para un avión de transporte comercial.

Tabla de datos para los diámetros: paso 1: Ordenar los datos…

Fórmula: 100

kn

0.3100

12251 q

35.120

24.1203.120

1

q

0.6100

12502 q

60.120

27.1205.120

2

q

0.9100

12753 q

9.120

29.1209.120

3

q

120.5 120.4 120.7

120.9 120.2 121.1

120.3 120.1 120.9

121.3 120.5 120.8

(1)120.1 (5)120.5 (9)120.9

(2)120.2 (6)120.6 (10)120.9

(3)120.3 (7)120.7 (11)121.1

(4)120.4 (8)120.8 (12)121.3

120.1 120.35 120.9

121.3

120.6

Page 17: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

16

Rango Intercuartílico= 55.035.1209.12013 qq

Límite superior (bigote)= 73.12155.05.19.1205.1 133 qqq

Límite inferior (bigote)= 53.11955.05.135.1205.1 131 qqq

NOTA: No tiene valor atípico Ejercicio: Hacer el diagrama de caja para los datos de la resistencia a la compresión. Ejemplo 1.9.3 Un ingeniero de desarrollo de productos está interesado en maximizar la resistencia o la tención de una nueva fibra sintética que se empleará en la manufactura de tela para camisas de hombre. El ingeniero sabe por experiencia que la resistencia es influida por el porcentaje de algodón presente en la fibra. Además él sospecha que elevar el contenido de algodón incrementará la resistencia, al menos inicialmente entre 10% y 40% para que la tela resultante tenga otras características de calidad que se desean (como capacidad para recibir un tratamiento de planchado permanente). El ingeniero decide probar muestras a cinco niveles de porcentaje de algodón: 15, 20, 25, 30 y 35%. Asimismo, decide ensayar cinco muestras a cada nivel de contenido de algodón. Los resultados se muestran en la siguiente tabla:

Porcentaje de algodón

Observaciones 1 2 3 4 5

15 7 7 15 11 9

20 12 17 12 18 18

25 14 18 18 19 19

30 19 25 22 19 23

35 7 10 11 15 11

Con esta información construir el diagrama de caja para cada porcentaje de algodón y decidir cual porcentaje es el que debe utilizarse. “Ordenar los datos para cada porcentaje “

Porcentaje de algodón

Observaciones 1 2 3 4 5

15 7 7 9 11 15

20 12 12 17 18 18

25 14 18 18 19 19

30 19 19 22 23 25

35 7 10 11 11 15

Algodón al 15%

15,7

935.2100

550

min

22

maXX

valorqq

Algodón al 20 %

18,17,12 321 qqq 18,12 maxmin XX

Algodón al 25%

19,18,18 321 qqq 19,14 maxmin XX

11475.3

100575

7225.1100

525

33

11

valorqq

valorqq

Page 18: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

17

Algodón al 30%

23,22,19 321 qqq 25,19 maxmin XX

Algodón al 35%

11,11,10 321 qqq 15,7 maxmin XX

Gráfica de cajas con valores de las medianas mostrados

Gráfica de cajas con valores individuales mostrados

% de Algodón

Re

sist

en

cia

PS

I

3530252015

25

20

15

10

5

% de

30

35

Algodón

15

20

25

11

22

1817

9

Resistencia por porcentaje de Algodón

% de Algodón

Re

sis

ten

cia

PS

I

3530252015

25

20

15

10

5

% de

30

35

Algodón

15

20

25

11

22

1817

9

Resistencia por porcentaje de Algodón

Page 19: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

18

1.10 Sesgo y Curtosis.

El sesgo de una distribución es su grado de asimetría o el grado en el que se aleja de la simetría. Si una curva de frecuencias de una distribución tiene una cola más larga hacia la derecha del máximo central que hacia la izquierda, se dice que la distribución es sesgada a la derecha, o que tiene sesgo positivo. Si ocurre lo contrario, se dice que es sesgada a la izquierda o que tiene un sesgo negativo. Una forma de calcular el sesgo es la siguiente:

𝑠𝑒𝑠𝑔𝑜 = ⌊𝑛

(𝑛 − 1)(𝑛 − 2)∑(

𝑥𝑖 − �̅�

𝑠)3

La curtosis indica que tan puntiaguda es una distribución; pico relativamente alto (leptocúrtica), o si es relativamente aplastada se dice platicúrtica. Si no es puntiaguda ni muy aplastada se llama mesocúrtica.

Distribución puntiaguda con sesgo a la derecha.

Distribución mesocúrtica y con sesgo a la izquierda

Page 20: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

19

Tipos de curtosis.

𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠 = ⌊𝑛(𝑛 + 1)

(𝑛 − 1)(𝑛 − 2)(𝑛 − 3)∑(

𝑥𝑖 − �̅�

𝑠)4

⌋ −3(𝑛 − 1)2

(𝑛 − 2)(𝑛 − 3)

Page 21: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

20

UNIDAD 2: PROBABILIDAD

2.1 CONCEPTOS BÁSICOS Y TEORÍA DE CONJUNTOS

Un conjunto se puede comprender como cualquier colección de objetos bien definidos, llamados elementos o miembros del conjunto. Normalmente se utilizan las letras mayúsculas A, B, X, Y…para nombrar los conjuntos, y las minúsculas a, b, x, y…para los elementos de los conjuntos. La afirmación de

que un elemento “a” pertenece a un conjunto “S” se escribe: Sa

Si cada elemento de un conjunto A, también pertenece a un conjunto B, es decir si Aa implica que

,Ba entonces A se llama subconjunto de B, o se dice que A esta incluido en B y se escribe: BA

Dos conjuntos son iguales o equivalentes si ambos tienen los mismos elementos, es decir si cada elemento de un conjunto está contenido dentro del otro: 𝐴 = 𝐵 𝑠í 𝑦 𝑠𝑜𝑙𝑜 𝑠𝑖 𝐴 ⊆ 𝐵 𝑦 𝐵 ⊆ 𝐴 La negación de que: 𝑎 ∈ 𝐴, 𝐴 ⊆ 𝐵 𝑦 𝐴 = 𝐵 se escribe 𝑎 ∉ 𝐴, 𝐴 ⊈ 𝐵 𝑦 𝐴 ≠ 𝐵 respectivamente. La afirmación 𝐴 ⊆ 𝐵 no excluye la posibilidad de que 𝐴 = 𝐵.

Identificación de conjuntos. Hay dos maneras de identificar un conjunto particular, una forma, sí es posible, es enumerar sus elementos, por ejemplo:

9,7,5,3,1A a esta forma se le llama por extensión.

Donde A es el conjunto que contiene a 1, 3,5 , 7 y 9. La segunda forma llamada por comprensión, consiste en definir las propiedades que caracterizan a los elementos del conjunto, por ejemplo:

XXB : Es un número impar entero, X >0

Se lee ≪ B es el conjunto de X, tal que X es un número par entero y x>0 ≫ Es decir, los dos puntos se lee “tal que” y la coma se lee “y”. Ejemplo 2.1 Consideremos los conjuntos A={1,3,5,7,9}, B={1,2,3,4,5}, C={3,5} Entonces: 𝐶 ⊆ 𝐴 𝑦 𝐶 ⊆ 𝐵, por otra parte 𝐴 ⊈ 𝐵 ya que 7 𝑦 9 ∈ 𝐴, pero 7 𝑦 9 ∉ 𝐵.

Además 𝐵 ⊈ 𝐴 ya que 2 𝑦 4 ∈ 𝐵 pero 2 𝑦 4 ∉ 𝐴. Conjunto Universal y Conjunto Vacio. Cualquier conjunto utilizado en la aplicación de la teoría de conjuntos se supone que está incluido en uno mayor llamado Conjunto universal o Universo. Comúnmente este conjunto se representa con U.

El conjunto sin elementos se llama el Conjunto Vacio, y se representa por . El conjunto vacio es también

un subconjunto del cualquier otro conjunto. Luego ∅ ⊆ 𝐴 ⊆ 𝑈, para cualquier conjunto A. Un Conjunto Disjunto es aquel que no tiene elementos en común con otro. A su vez, el Diagrama de Venn es una representación gráfica de los conjuntos, los cuales se representan por áreas cerradas en el plano. El conjunto universal U se representa por los puntos de un rectángulo, y los otros conjuntos se

representan por los punto se representan por circunferencias dentro del rectángulo. Si A⊆B, entonces la circunferencia que representa a A, estará dentro de la circunferencia que representa a B.

Page 22: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

21

Figura 1. 𝐴 ⊆ 𝐵 (El conjunto A está incluido en el conjunto B)

Si A y B son disjuntos, entonces la circunferencia de A estará separada de la de B.

Figura 2. 𝐴 ⊈ 𝐵 𝑦 𝐴 ≠ 𝐵 (Los conjuntos A y B son disjuntos) Por otra parte, sí A y B son dos conjuntos arbitrarios, es posible que algunos elementos estén dentro de A pero no de B, que algunos elementos estén en B pero no en A, que algunos estén en ambos, y que algunos no estén ni en A ni en B.

Figura 3. Conjuntos arbitrarios

Operaciones con conjuntos. Unión e intersección.

La unión de dos conjuntos A y B, que se representa por A∪B, es el conjunto de todos los elementos que pertenecen a A o B; es decir:

AUB = {x: x ∈ A 𝐨 x ∈ B} Aquí o se usa con el significado de y/o. La operación A∪B se representa con el área sombreada como sigue:

Figura 4. A∪B (La unión del conjunto A y B está sombreada)

U

B

A

U

B

A

U

B

A

U B

A

Page 23: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

22

La intersección de dos conjuntos A y B, que se representa por A∩B, es el conjunto de todos los elementos que pertenecen a ambos A y B; es decir:

A ∩ B = {x: x ∈ A y x ∈ B} La operación A∩B se representa con el área sombreada como sigue:

Figura 5. A∩B (La intersección de A y B está sombreada) Es necesario recordar que los conjuntos A y B son disjuntos si no tienen elementos en común, o usando

la notación A∩B=∅ Ejemplo 2.2: Sea A={1,2,3,4}, B={4,5,6}, C={1,3,5,7}, entonces:

A∪B={1,2,3,4,5,6} A∪C={1,2,3,4,5,7} B∪C={1,3,4,5,6,7} A∩B={4} A∩C={1,3} B∩C={5} Complementariedad, diferencia y diferencia simétrica. Todos los conjuntos bajo consideración, en un momento dado, son subconjuntos del conjunto universal U. El complementario absoluto o simplemente complementario de un conjunto A, representado por A°,

es el conjunto de elementos de U que no pertenecen a A, es decir: A°={x: x∈U, x∉A} Figura 6. A° está sombreado. El complementario relativo de un conjunto B con respecto a uno A o simplemente la diferencia de A y

B, que se representa por A∖B, es el conjunto de elementos que pertenecen a A pero no a B, es decir:

A∖B={x: x∈A, x∉B}

El conjunto A∖B se lee ≪lo que está en A pero no en B≫

Figura 7. A∖B (La diferencia de A y B está rayada) La diferencia simétrica de los conjuntos A y B representada por A⨁B consiste en aquellos elementos que pertenecen a A o a B, pero no a ambos, es decir:

A⨁B= (A∪B)∖(A∩B) o equivalente A⨁B = (A∖B)∪(B∖A) A

U

B A

U =A° A

U

B

A

U

B

Page 24: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

23

Figura 8. A⨁B (La diferencia simétrica está rayada) Ejercicio 2.1: Sea U=P={1,2,3,…} el conjunto Universo, y sea A={1,2,3,4}, B={3,4,5,6,7}, C={6,7,8,9} y D={2,4,6,8…} El conjunto de enteros pares positivos

Encontrar: A°, B°, C°, D°, A∖B, B∖A, B∖C, C∖B, C∖E, A⨁B, B⊕C Algebra de Conjuntos. Los conjuntos bajo las operaciones de unión, intersección y complementariedad cumplen varias propiedades que se indican en la siguiente tabla

Propiedades del Algebra de conjuntos.

A∪A=A Propiedad Idempotente A∩A=A

(A∪B) ∪C=A∪(B∪C) Prop. Asociativa (A∩B) ∩C=A∩(B∩C)

A∪B=B∪A Prop. Conmutativa A∩B=B∩A

A∪(B∩C)=(A∪B) ∩(A∪C) Prop. Distributiva A∩(B∪C)=(A∩B)∪(A∩C)

A∪∅ =A Elemento Universal e infinito

A∩U=A

A∪U=U A∩∅=∅

(A°)°=A Propiedad Involutiva

A∪A°=U Propiedad de Complementariedad

A∩A°=∅

U°=∅ ∅°=U

(A∪B)°=A°∩B° Propiedad de complementariedad

Ley de Morgan

(A∩B)°=A°∪B°

Principio de Inclusión-Exclusión. La notación n(S) o |S|, se usa para indicar el número de elementos en un conjunto S. Así n(D)=7 si D={lunes, martes, miércoles, jueves, viernes, sábado, domingo}, es decir D, es el conjunto de los días de

la semana. También n(∅)=0, ya que el conjunto vacío no tiene elementos. Ahora supongamos que A y B son conjuntos disjuntos finitos.

Entonces A∪B es finito y n(A∪B)=n(A)+n(B) Ejemplo 2.3: se tiene A={1,2,3,4} y B={8,9,10} entonces, n(A)=4 y n(B)=3 A∪B={1,2,3,4,8,9,10} n(A∪B)=7

n(A∪B)=n(A)+n(B)=4+3=7 ∴ n(A∪B)=n(A)+n(B)

Hay también una fórmula para n(A∪B) incluso cuando no son disjuntos, llamada el principio de inclusión-exclusión

n(A∪B)=n(A) + n(B) – n(A∩B) Ejemplo 2.4: Se tiene A={1,2,3,4,5} y B={4,5,6,7,8} n(A)=5 n(B)=5 A∩B={4,5} n(A∩B)=2

A∪B={1,2,3,4,5,6,7,8} n(A∪B)=8

n(A) + n(B) – n(A∩B)= 5 + 5 – 2 = 8 ∴ n(A∪B)=n(A) + n(B) – n(A∩B)

Page 25: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

24

Ejemplo 2.5: Supongamos que el conjunto A es conformado por 30 alumnos de una clase de matemáticas y el conjunto B de una clase de inglés con 35 alumnos, y supongamos que en ambos conjuntos coinciden 20 nombres. Hallar el número de alumnos que:

a) Están en el conjunto A o en B. b) Solo están en A. c) Solo están en B. d) En solo uno de los conjuntos.

Figura 9. n(A∪B) para elementos no disjuntos.

a) n(A∪B) = n(A) + n(B) – n(A∩B) = 30 + 35 – 20 = 45 b) n(A∖B)= n(A) – n(A∩B) = 30 – 20 = 10

c) n(B∖A)= n(B) – n(A∩B) = 35 – 20 = 15

d) n(A⊕B)= n(A∖B) + n(B∖A) = 10 + 15 = 25 Multiplicación de Conjuntos Sean A y B dos conjuntos, el conjunto producto de A y B que se representa AxB (y se lee A por B),

consiste en todos los pares ordenados (a,b) donde a∈A y b∈B; es decir: AxB={ (a,b) : a∈A, b∈B} Ejemplo 2.6: sea A={1,2,3} y B={a,b} AxB={ (1,a), (1,b), (2,a), (2,b), (3,a), (3,b) } Se aplica el siguiente teorema: Supongamos que A y B son finitos. Entonces AxB es finito y

n(AxB) = n(A) x n(B) con el ejemplo anterior tenemos que:

n(A)= 3 y n(B)=2 entonces: n(AxB) = n(A) ∙ n(B) = 3 x 2 = 6 Conjunto Potencia. Para un conjunto dado S, podemos considerar la clase de todos los subconjuntos de S. Esta clase se llama el Conjunto Potencia de S, y se representará por P(S). Si “S” es finito P(S) también lo será. De hecho el número de elementos de P(S) es 2 elevado a la potencia de S, es decir:

n[P(S)] = 2n(S)

Ejemplo 2.7: Supongamos S={1,2,3}, entonces:

P(S)= [∅, {1}, {2}, {3}, {1,2}, {1,3}, {2,3}, {S}], es decir 8 subconjuntos, que es lo mismo que hacer 23 = 8

Principio de la regla de la suma. Supongamos que un suceso A puede ocurrir de “m” maneras y un segundo suceso B puede ocurrir de “n” maneras, y supongamos que ambos sucesos no pueden ocurrir simultáneamente. Entonces A o B pueden ocurrir de m+n maneras.

n(A∪B)= n(A) + n(B) Principio de la regla del producto. Supongamos que un suceso A puede ocurrir de “m” maneras y que independientemente de este suceso existe otro B que puede ocurrir de “n” maneras. Entonces las combinaciones de A y B pueden ocurrir de “mn” maneras.

U B

10 A

15 20

Page 26: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

25

n(AxB) = n(A) ∙ n(B) Ejemplo 2.8: Supongamos que una universidad tiene 3 cursos diferentes de historia, 4 diferentes de literatura y dos diferentes de ciencias, entonces:

a) Hay n = 3 + 4 + 2 = 9 posibilidades de escoger uno de los cursos. b) Hay n = (3) (4) (2) = 24 posibilidades de escoger un curso de cada uno.

Notación Factorial. El producto de los números enteros positivos de1 a n, que se representa como n! se conoce como el factorial de n.

n!= 1⋅2⋅3⋅ … ⋅ (n-2) ⋅ (n-1) ⋅ n Ejemplo 2.9: 2! = 1x2 = 2 5! = 1x2x3x4x5 = 120 1! = 1 0! = 1 2.2 PROBABILIDAD Con frecuencia resulta conveniente cuantificar la posibilidad o veracidad de que ocurrirá un resultado de un experimento aleatorio, por ejemplo Las posibilidades que llueva hoy es de 30%. En este caso la factibilidad de un resultado se cuantifica asignando un número del intervalo [0,1] o un porcentaje de 0 a 100%. En otras situaciones, la interpretación de probabilidad es proporcionada a través de la frecuencia relativa o proporción. Por ejemplo si se analiza muchas veces el fenómeno de no aprobar probabilidad y estadística, donde se observa que el 20 % de los alumnos no aprueba, entonces se puede asignar una probabilidad de no aprobar de 0.20. Para un espacio muestral discreto, la probabilidad de un evento E, que se denota como P(E), es igual a la suma de las probabilidades de los resultados en E. Axiomas de probabilidad. Cuando se da una función de probabilidad P, entonces P(A) es la probabilidad del suceso A, si satisface los siguientes axiomas: Para cualquier suceso A, 1≥ P(A) ≥ 0 Para el suceso seguro S, P(S) = 1

Para dos sucesos incompatibles A y B cualquiera, se cumple: P(A∪B)=P(A) + P(B) Teoremas de probabilidad.

1.- La probabilidad del suceso imposible, o en otras palabras del conjunto vacio ∅ es nula, es decir, P(∅)=0 2.- Para cualquier suceso A se cumple que 0≤P(A)≤1

3.- Si A⊆B entonces P(A) ≤ P(B) 4.- Para dos sucesos cualquiera A y B se verifica que P(A∖B)= P(A) – P(A∩B)

5.- Para dos sucesos cualquiera A y B P(A∪B) = P(A) + P(B) – P(A∩B) Espacios finitos equiprobables. Supongamos que S es un espacio muestral finito con “n” elementos y supongamos que las características físicas del experimento sugieren que a varios resultados se les asignen probabilidades iguales. Entonces S se convierte en un espacio probabilístico ll amado espacio finito equiprobable, si a cada punto p, se le asigna la probabilidad 1/n y si a cada suceso A que contiene r puntos se le asigna la probabilidad r/n. Es decir: P(A)= Número de elementos de A / Número de elementos de S = n(S)/n(A)

Page 27: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

26

Ejemplo: Elegimos de forma aleatoria una carta de una baraja con 52 cartas y consideremos los siguientes sucesos: A={la carta es un corazón} B={ La carta es una figura}

Donde una figura es (J, Q, K). Calcular la P(A), P(B) y P(A B)

P(A)= Número de corazones / Número cartas = 13/52 = 1/4 P(B)= Número de figuras / Número cartas = 12/52 = 3/13

P(A B)= Número de figuras de corazones / Número cartas = 3/52 = 3/13

2.3 ESPACIOS MUESTALES y EVENTOS Experimento aleatorio. Es aquel que puede producir resultados diferentes, aun cuando se repita siempre de la misma manera. Espacio muestral. Es el conjunto de todos los resultados posibles de un experimento aleatorio. El espacio muestral se denota por S. Un resultado particular, es decir, un elemento de S se llama punto muestral. A su vez, un suceso A es un conjunto de resultados o en otras palabras un subconjunto del espacio muestral S.

Dos suceso A y B se llaman mutuamente excluyentes si son incompatibles; es decir si A∩B=∅. Es decir, A y B son excluyentes si no pueden ocurrir simultáneamente. Tres o más sucesos son mutuamente excluyentes si cada dos de ellos son mutuamente excluyentes. Ejemplo : En el evento de tirar un dado y observar el número que sale tenemos que S= {1,2,3,4,5,6}, sea A el suceso de que salga un número par, B que salga impar y C que salga un número primo, entonces: A={2,4,6} B={1,3,5} C={2,3.5} Por lo tanto:

A∪C={1,2,3,4,5,6} B∩C={3,5} C°={1,4,6}

Observar que A y B son mutuamente excluyentes, es decir, A∩B=∅ Ejemplo : Tirar una moneda tres veces y observar la secuencia de águilas (A) y sellos (S) que aparecen. S={AAA, AAS, ASA, SAA, ASS, SSA, SAS,SSS} Encontrar el suceso M de que dos o más águilas aparezcan consecutivamente y el suceso N de que todas las tiradas sean iguales. Además encontrar la unión e intersección de estos dos eventos.

M= {AAA, AAS, SAA}, N= {AAA, SSS}, A∪B= {AAA, AAS, SAA, SSS}, A∩B= {AAA} Eventos. Con frecuencia nos interesamos en un conjunto de resultados relacionados de un experimento. En este caso un evento es un subconjunto del espacio muestral de un experimento aleatorio. Con frecuencia tenemos interés en describir nuevos eventos a partir de combinaciones de los eventos existentes. Dado que los eventos son subconjuntos, es posible usar las operaciones básicas con conjuntos tales como la unión, intersección y el complemento para formar otros eventos de interés. 2.4 Técnicas de conteo. En algunas ocasiones es conveniente conocer las distintas formas de acomodar elementos de un conjunto o eventos de un espacio muestral, para esto debemos conocer las permutaciones y las combinaciones. En una permutación, el orden del acomodo es muy importante y se debe considerar por

Page 28: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

27

ejemplo a la hora de elegir un presidente, un secretario y un tesorero en un comité (no es lo mismo Hugo de presidente, Paco de secretario y Luis de tesorero, que si quedan de la forma Luis de presidente, Hugo de secretario y Paco de tesorero). Para las combinaciones el orden no importa, por ejemplo el formar un comité de tres personas donde no haya posición (Hugo, Paco y Luis es igual a si lo enunciamos Paco, Luis y Hugo porque aquí no interesa el orden). Permutaciones. Considere un conjunto de elementos S={a,b,c}. Una permutación de los elementos, es un arreglo o acomodo de los elementos. Por ejemplo abc, acb, bca, bac, cab, cba son todas las permutaciones de los elementos de S.

El número de permutaciones de n elementos diferentes se encuentra con n!= 1⋅2⋅3⋅ … ⋅ (n-2) ⋅ (n-1) ⋅ n En el caso de subconjuntos de tamaño “r”, el número de permutaciones de n objetos tomados de r en r se representa por: P(n,r) o nPr o 𝑃𝑟

𝑛 y se calcula de la siguiente manera:

P(n,r) = 𝑛 ∗ (𝑛 − 1) ∗ (𝑛 − 2) ∗ … (𝑛 − 𝑟 − 1) =𝑛!

(𝑛−𝑟)!

Ejemplo: Una tarjeta de circuitos impresos tiene ocho sitios diferentes en los que puede instalarse un componente. Si en la tarjeta deben instalarse cuatro componentes diferentes, ¿Cuántos diseños diferentes se pueden hacer? Cada diseño consiste en seleccionar uno de los ocho sitios para el primer componente, uno de los siete sitios restantes para el segundo componente, uno de los seis sitios restantes para el tercer componente y uno de los cinco lugares restantes para el cuarto componente, por lo tanto.

𝑃(8,4) = 8 ∗ 7 ∗ 6 ∗ 5 = 1680 ó 𝑃(8,4) =8!

(8−4)!= 1680

Ejemplo: Hallar el número de permutaciones que se pueden dar con las letras a, b y c tomados de 2 en 2, dicho de otra forma, hallar el número de palabras de 2 letras usando solamente las tres letras dadas sin repetirlas.

P(3,2) = 3∗2∗1

1!= 6 los cuales son: ab, ba, ac, ca, bc, cb

Ahora si deseamos tomar del mismo ejemplo de tres en tres, es decir las palabras que se forman con las tres letras sería: P(3,3)=?

P(3,3) = 3∗2∗1

0!=3∗2∗1

1= 6 o lo que es igual P(3,3) = 3! =6 los cuales son: abc, cba, acb, cab, bca,

bac Ejemplo: Hallar el número de permutaciones de seis objetos A, B, C, D, E, F tomados de 3 en 3, dicho de otra forma, hallar el número de palabras de 3 letras usando solamente las seis letras dadas sin repetirlas.

P(6,3) = 6∗5∗4∗3∗2∗1

3∗2∗1= 6 ∗ 5 ∗ 4 = 120

Permutaciones con repeticiones. Cuando en un conjunto se encuentran algunos elementos repetidos, el número de permutaciones que se pueden formar con los elementos de dicho conjunto se puede encontrar con la formula siguiente:

𝑃(𝑛; 𝑛1, 𝑛2, … , 𝑛𝑟) =𝑛!

𝑛1! 𝑛2! … 𝑛𝑟!

Page 29: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

28

Ejemplo: Supongamos que queremos formar todas las posibles palabras de cinco letras usando la palabra BABBY. El total de letras es n=5 y como hay tres letras B entonces n1=3

𝑃(5,3) =5!

3!=5∗4∗3∗2∗1

3∗2∗1=

120

6= 20 palabras diferentes de 5 letras.

Ejemplo: Hallar todas las posibles palabras de siete letras que se puedan formar usando la palabra BENZENE. El total de letras es n=7, hay tres letras E entonces n1=3 y dos letras n, es decir n2=3

𝑃(7; 3,2) =7!

3! 2!=7∗6∗5∗4∗3∗2∗1

3∗2∗1∗ 2∗1= 420 Palabras diferentes.

Muestreo con reemplazamiento. El elemento escogido de un conjunto S, se vuelve a poner en el conjunto S antes de escoger otro elemento. Como hay “n” diferentes posibilidades de elegir un elemento (ya que se permiten repeticiones), el principio del producto nos dice que hay:

n*n*n*…*n = nr diferentes muestras con reemplazamiento de tamaño r.

Muestreo sin reemplazamiento. En este tipo de muestreo, el elemento no se vuelve a introducir en el conjunto S antes de escoger el siguiente elemento. No hay por tanto repeticiones en la muestra.

𝑃(𝑛, 𝑟) =𝑛!

(𝑛 − 𝑟)!

Combinaciones. Supongamos que tenemos una colección de n objetos. Una combinación de estos n objetos tomados de r en r es cualquier selección r de los objetos, donde el orden no importa. En otras palabras una combinación r de un conjunto de n objetos es cualquier subconjunto de r elementos, por ejemplo los grupos de las letras a,b,c,d tomadas de tres en tres son: abc, abd, acd, bcd, observemos que los siguientes grupos de letras son iguales: abc, acb, bac, cab, cba, bca, lo que muestra que para cada combinación de r objetos existen r! permutaciones. El número de combinaciones de n objetos tomados de r en r se representa por: 𝐶(𝑛, 𝑟) 𝑜 𝑛𝐶𝑟 𝑜 𝐶𝑟

𝑛

𝑃(𝑛, 𝑟) = 𝑟! 𝐶(𝑛, 𝑟) 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 𝐶(𝑛, 𝑟) =𝑃(𝑛, 𝑟)

𝑟! ∴ 𝐶(𝑛, 𝑟) =

𝑛!

𝑟! (𝑛 − 𝑟)!

Como se observa, para encontrar las combinaciones posibles se utiliza la fórmula del coeficiente binomial. Ejemplo: Hallar el número de combinaciones de 4 objetos a,b,c,d tomados de 3 en 3.

𝐶(4,3) =4!

3!(4−3)!=

4!

3!(1)!=4∗3∗2∗1

3∗2∗1∗1= 4 Combinaciones diferentes.

Ejemplo: Hallar el número de comités de 3 personas que se pueden formar con un grupo de 8.

𝐶(8,3) =8!

3!(8−3)!=

8!

3!(5)!=8∗7∗6∗5∗4∗3∗2∗1

3∗2∗1∗5∗4∗3∗2∗1= 56 Comités diferentes.

Ejercicio: Un granjero compra 3 vacas, 2 cerdos y 4 gallinas a un hombre que tiene 6 vacas, 5 cerdos y 8 gallinas. ¿Cuántas elecciones puede hacer el granjero?

Vacas) 𝐶(6,3) =6!

3!(6−3)!=

6!

3!(3)!=6∗5∗4∗3∗2∗1

3∗2∗1∗3∗2∗1= 20 Formas diferentes de escoger 3 vacas de 6.

Page 30: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

29

Cerdos) 𝐶(5,2) =5!

2!(5−2)!=

5!

2!(3)!=5∗4∗3∗2∗1

2∗1∗3∗2∗1= 10 Formas diferentes de escoger 2 cerdos de 5.

Gallinas) 𝐶(8,4) =8!

4!(8−4)!=

8!

4!(4)!=8∗7∗6∗5∗4∗3∗2∗1

4∗3∗2∗1∗4∗3∗2∗1= 70 Formas diferentes de escoger 3 vacas de 6.

Por la regla del producto se tienen: (20)*(10)*(70)=14000 formas diferentes de escoger las 3 vacas, 2 cerdos y 4 gallinas. Diagrama de árbol. Es un esquema utilizado para enumerar todas las operaciones posibles de secuencia de experimentos o sucesos donde cada suceso puede ocurrir de un número finíto de maneras. Ejemplo : Hallar el conjunto producto de AxBxC donde: A={1,2}. B={a,b,c} y C={3,4}

2.5 Probabilidad Condicional e independencia. Para conocer la Probabilidad condicional veamos el siguiente ejemplo: se tiran un par de dados, por lo que el espacio muestral S se compone por 36 pares ordenados (a,b) donde a y b pueden ser cualquier número entre 1 y 6. Así la probabilidad de que salga cualquier punto es 1/36. Hallar la probabilidad de

que salga un dos en uno de los dados, si la suma ha salido 6, es decir hallar P(A E), donde A={salga 2 al

menos en uno de los dados} y E={la suma de los dados es 6}. Tenemos entonces que:

E={(1,5), (2,4), (3,3), (4,2), (5,1)} n(E) = 5 y P(E)=5/36

Inicio

1

a 3

4

b 3

4

c 3

4

2

a 3

4

b 3

4

c 3

4

(1,a,3)

(1,a,4)

(1,b,3)

(1,b,4)

(1,c,3)

(1,c,4)

(2,a,3)

(2,a,4)

(2,b,3)

(2,b,4)

(2,c,3)

(2,c,4)

Page 31: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

30

A={(2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (1,2), (3,2), (4,2), (5,2), (6,2)} n(A)=11 y P(A)=11/36 (𝐴 ∩ 𝐸) = {(2,4), (4,2)} ∴ 𝑛(𝐴 ∩ 𝐸) = 2 y P(𝐴 ∩ 𝐸)=2/36

𝑃(𝐴|𝐸) =𝑛(𝐴 ∩ 𝐸)

𝑛(𝐸)= 2

5 ó 𝑃(𝐴|𝐸) =

𝑃(𝐴 ∩ 𝐸)

𝑝(𝐸)=

236536

=2

5

En algunos modelos, la probabilidad condicional puede calcularse directamente de la descripción del experimento, por ejemplo, si un lote contiene 12 televisiones de los cuales 4 son defectuosos. Encontrar la probabilidad de A, donde A= sacar un televisor defectuoso.

P(A)=4/12 ó P(A)=4

1212

12

Definición de Probabilidad Condicional. Supongamos que E es un suceso de un espacio muestral S

con P(E) 0. La probabilidad de que un suceso A ocurra una vez que ha ocurrido E, o concretamente la

probabilidad condicionada de A dado E, escrito P(A E) se define como sigue:

P(A E): 𝑃(𝐴∩𝐸)

𝑃(𝐸)

Esta fórmula indica que P(A E) mide en cierto modo, la probabilidad relativa de A con respecto al

espacio reducido E. Si S es un espacio equiprobable, además Ay E son sucesos entonces:

P(A E)= 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝐴∩𝐸

𝑛⁄

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝐸𝑛⁄=(𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝐴∩𝐸)

(𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝐸)=𝑛(𝐴∩𝐸)

𝑛(𝐸) ó

𝑃(𝐴∩𝐸)

𝑝(𝐸)

Ahora bien siguiendo con el lote de 12 televisiones de los cuales 4 son defectuosos, si se sacan 3 televisores al azar, uno detrás del otro. Hallar la probabilidad E={los tres televisores sean no defectuosos}.

P(E)= 8

12∗7

11∗6

10=14

55= 0.255

Ejemplo: La producción de tarjetas de circuitos impresos de un día es 850, de las cuales 50 son defectuosas. Se seleccionan dos tarjetas al azar sin remplazo.

a) Encontrar la probabilidad de que la segunda tarjeta sea defectuosa dado que la primera es defectuosa

b) Si se seleccionan 3 tarjetas al azar, encontrar la probabilidad de que las dos primeras tarjetas sean defectuosas y la tercera no lo sea.

a) P(A|E)= 49

849

b) Este evento se puede describir en notación abreviada simplemente como P(ddn), donde d= defectuosa y n= no defectuosa.

P(ddn)= 50

850∗49

849∗800

848= 0.0032

Independencia. En algunos casos, la probabilidad condicional P(B|A) podría ser igual a P(B). En este caso especial, el hecho de saber que el resultado del experimento está en el evento A no afecta la probabilidad de que el resultado esté en el evento B.

Page 32: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

31

El concepto de independencia es una importante relación entre eventos, es decir depende del modelo de probabilidad usado en el experimento aleatorio, en cambio dos eventos mutuamente excluyentes se basa únicamente en los resultados que comprenden los eventos. Dos eventos son independientes si es verdadero cualquiera de los siguientes enunciados equivalentes:

1) 𝑃(𝐴|𝐵) = 𝑃(𝐴) 2) 𝑃(𝐵|𝐴) = 𝑃(𝐵) 3) 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)

2.6 Teorema de Bayes. Si los eventos B1, B2,…, Bk constituyen una división del espacio muestral S, donde P(Bi)≠0 para i=1,2,…,k, entonces para cualquier evento A en S es tal que P(A)≠0.

𝑃(𝐵𝑅 ∖ 𝐴) =𝑃(𝐵𝑅⋂𝐴)

∑ 𝑃(𝐵𝑖⋂𝐴)𝑘𝑖=1

=𝑃(𝐵𝑟)𝑃(𝐴 ∖ 𝐵𝑅)

∑ 𝑃(𝐵𝑖)𝑘𝑖=1 𝑃(𝐴 ∖ 𝐵𝑖)

Para r= 1, 2, …, k. Ejemplo Una fabrica produce un artículo en tres diferentes maquinas. Del total de la producción el 30% es producido por la maquina A, el 50% por la maquina B y el 20% por la maquina C. La probabilidad de que un articulo producido por una maquina especifica sea de primera calidad es: máquina A=0.8 máquina B=0.7 y máquina C=0.9 Si se selecciona un artículo aleatoriamente de la línea de producción.

a) ¿Cuál es la probabilidad de que sea de primera calidad? b) ¿Si el articulo seleccionado es de primera calidad, cual es la probabilidad de que haya sido

producido por la maquina A? a) 30% es producido por la maquina A, el 50% por la maquina B y el 20% por la maquina C.

Page 33: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

32

a) La probabilidad de que el articulo sea de primera calidad es: 0.24+0.35+0.18= 0.77 Lo que significa que la probabilidad de obtener un artículo de primera calidad es del 77%

b) Si el articulo seleccionado es de primera calidad, cual es la probabilidad de que haya sido producido por la maquina A.

Lo que significa que la probabilidad de obtener un artículo de primera calidad que provenga de la maquina A es de 31% Ejercicio Los clientes se encargan de evaluar los diseños preliminares de varios productos. En el pasado, el 95% de los productos que con mayor éxito en el mercado recibieron buenas evaluaciones, el 60% de los productos con éxito moderado recibieron buenas evaluaciones, y el 10% de productos de escaso éxito recibieron buenas evaluaciones. Además, el 40% de los productos ha tenido mucho éxito, el 35% un éxito moderado y el 25% una baja aceptación.

a) Cuál es la probabilidad de que un producto obtenga una buena evaluación. b) Si un nuevo diseño obtiene una buena evaluación, cual es la probabilidad de que se convierta en

un producto de gran éxito. c) Si un producto no obtiene una buena evaluación, cual es la probabilidad de que se convierta en

un producto de gran éxito.

Page 34: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

33

UNIDAD 3: DISTRIBUCIONES DE PROBABILIDAD

3.1 Variables Aleatorias. Sea S el espacio muestral de un experimento, frecuentemente deseamos asignar un número específico a cada resultado del experimento, por ejemplo: la suma de los números de una tirada de un par de dados, el número de ases que se obtienen al sacar 5 cartas de una baraja con 52 cartas, o el tiempo en horas que tarda una bombilla en fundirse. A tales asignaciones de valores numéricos se les llama variable aleatoria. Variable aleatoria de un espacio muestral S, es entonces la regla que asigna un valor numérico a cada resultado de S, o en otras palabras, una función de S en el conjunto R de números reales.

Rx (Rango de la variable aleatoria) se utiliza para indicar el conjunto de números asignados por una variable aleatoria X, es decir el espacio de valores.

Variable aleatoria discreta: son las variables aleatorias que se pueden contar, es decir su rango es

finito.

Ejemplo: X=número de caras que se pueden obtener al tirar 3 monedas, es decir Rx= {0,1,2,3}

Variable aleatoria continua: Son las variables aleatorias donde el espacio de valores es una sucesión de números, como un intervalo o uniones de intervalos, y que algunas veces requiere cálculos.

Ejemplo: se escoge un punto al azar en un circulo de radio r. sea X la distancia del punto desde el centro del circulo, entonces su espacio de valores es un intervalo cerrado cuyos extremos son 0 y r, es decir Rx=[0,r]

3.2 Distribuciones de Probabilidad y Funciones de Masa de Probabilidad de variables discretas. Distribución de probabilidad discreta. La distribución de probabilidad de una variable aleatoria X es una descripción de las probabilidades asociadas con los valores posibles de X. Ejemplo: Se lanza un par de dados; sea X la variable aleatoria de la suma de los puntos obtenidos de estos dados. La siguiente tabla es una distribución de probabilidad de X (suma de los dados).

𝒙 2 3 4 5 6 7 8 9 10 11 12

P(𝑿) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Para una variable aleatoria discreta, es común especificar la distribución con una lista de los valores posibles junto con la probabilidad de cada uno. En algunos casos resulta conveniente expresar la probabilidad en términos de formula. Supongamos una variable aleatoria X que asigna sólo un número finito de valores a un espacio muestral S; digamos: Rx={𝑥1, 𝑥2, … , 𝑥𝑛} Entonces X nos lleva a una función 𝑓 que asigna probabilidades a los puntos de Rx por:

𝒙 𝑥1 𝑥2 … 𝑥𝑛

𝒇(𝒙) 𝑓(𝑥1) 𝑓(𝑥2) … 𝑓(𝑥𝑛)

Page 35: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

34

Y se le conoce como función de masa de probabilidad o simplemente función de probabilidad.

𝑓(𝑥𝑖)= P(X=𝑥𝑖)

Con las siguientes propiedades: 𝑓(𝑥𝑖)≥0 y ∑ 𝑓(𝑥𝑖)ni=1 =1

Algunos tipos de funciones de masa de probabilidad discreta son:

Distribución Binomial Distribución Binomial Negativa

Distribución Geométrica Distribución Hipergeométrica

Distribución Poisson Distribución Ji cuadrada 𝜒2 Valor Esperado de una variable aleatoria finita. La esperanza matemática o valor esperado o simplemente la esperanza de X, que se representa por E(X) o simplemente E, se define como sigue:

𝐸 = 𝐸(𝑋) = 𝑥1𝑓(𝑥1) + 𝑥2𝑓(𝑥2) + ⋯+ 𝑥𝑛𝑓(𝑥𝑛) =∑𝑥𝑖𝑓(𝑥𝑖)

𝑛

𝑖

Es decir:

𝐸 = 𝐸(𝑋) = 𝑥1𝑃1 + 𝑥2𝑃2 +⋯+ 𝑥𝑛𝑃𝑛 =∑𝑥𝑖𝑃𝑖

𝑛

𝑖

Se lanza un par de dados. Sea X la suma de los dos dados, entonces el valor esperado de X es:

𝐸 = 𝐸(𝑋) = 2 (1

36) + 3 (

2

36) + 4 (

3

36) + 5 (

4

36) + 6 (

5

36) + 7 (

6

36) + 8 (

5

36) + 9 (

4

36) + 10 (

3

36) + 11 (

2

36)

+ 12 (1

36) =

69

10= 6.9

Funciones de Distribución Acumulada La función de distribución acumulada de una variable aleatoria discreta X, se denota como:

𝐹(𝑥) = P(X ≤ x) = ∑ 𝑓(𝑥𝑖)

𝑥𝑖≤𝑥

Con las siguientes propiedades:

1) 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑓(𝑥𝑖)𝑥𝑖≤𝑥

2) 0 ≤ 𝐹(𝑥) ≤ 1

3) 𝑆𝑖 𝑥 ≤ 𝑦, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝐹(𝑥) ≤ 𝐹(𝑦)

Al igual que una función de masa de probabilidad, una función de distribución acumulada proporciona probabilidades. Ejemplo: Supóngase que la producción de un día de 850 partes contiene 50 piezas defectuosas. Se seleccionan del lote 2 piezas al azar y sin remplazo. Sea la variable aleatoria X igual al número de piezas defectuosas de la muestra, ¿Cuál es la función de distribución acumulada de X? Primero encontrar la función de masa de probabilidad P(X=0) ó 𝑓(0) = (800/850)(799/849) = 0.886

P(X=1) ó 𝑓(1) = (800/850)(50/849) = 0.111

P(X=2) ó 𝑓(2) = (50/850)(49/849) = 0.003

Page 36: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

35

Entonces calculamos la función de distribución acumulada: 𝐹(0)= P(X≤0)=0.886 𝐹(1)= P(X≤1)=0.886+0.111=0.997

𝐹(2)= P(X≤2)=0.886+0.111+0.003 =1 3.2.1 Distribución uniforme. La variable aleatoria discreta más simple es aquella que solo asume un número finito de posibles valores, cada uno con la misma probabilidad. Una variable aleatoria X que asume cada uno de los valores 𝑥1, 𝑥2, … , 𝑥𝑛 con la misma probabilidad 1/n, normalmente puede ser de interés en la solución de un problema, especialmente en sistema físicos. La distribución uniforme está dada por:

𝑓(𝑥𝑖) = 1/𝑛 Ejemplo: El primer dígito del número de serie de una pieza es igualmente factible que sea cualquiera de los dígitos del 0 al 9. Se selecciona una pieza de un lote grande y X es el primer dígito del número de serie, entonces X tiene una distribución discreta uniforme con probabilidad 0.1 para cada valor en R={0,1,2,3,4,5,6,7,8,l9}, es decir:

𝑓(𝑥) = 1/10 = 0.1 Para cada valor en R La función de masa de probabilidad de X se muestra a continuación:

𝑥 0 1 2 3 4 5 6 7 8 9

P(𝑋 = 𝑥) ó 𝑓(𝑥) 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10

3.2.2 Distribución Binomial. En un experimento donde solo hay dos resultados posibles, por ejemplo, uno que se llame éxito “E” y otro que se llame fracaso “F”, y donde a su vez la repetición n veces del experimento produzca resultados independientes (el resultado de un experimento no depende de otros anteriores) se conocen como experimentos o pruebas de Bernoulli. Sea p la probabilidad de que salga éxito en un experimento de Bernoulli, entonces q=p-1 es la probabilidad de que salga un fracaso. Un experimento binomial se compone de un número fijo de experimentos de Bernoulli, donde B(n,p) denota un experimento binomial con n pruebas y una probabilidad p de que salga éxito. Teorema: La probabilidad de que salgan exactamente x éxitos de un experimento binomial B(n,p) viene dada por:

P(𝑥)=P(𝑥 éxitos)= (𝑛𝑥)p𝑥qn−𝑥

La probabilidad de que salga uno o más éxitos es 1-qn.

Donde: (𝑛𝑥) Es el coeficiente binomial (Es decir una combinación 𝑥 de n elementos)

La probabilidad de obtener al menos 𝑥 éxitos, es decir, x o más éxitos está dada por:

P(𝑥)+P(𝑥 +1)P(𝑥 +2)+…+P(n) Ejemplo: Se tira una moneda 6 veces y decimos que águila es éxito. Éste es un experimento binomial con n=6 y p=q=1/2

a) La probabilidad de que salgan exactamente dos caras (𝑥 =2) es: P(2)= (62) (

1

2)2

(1

2)4

= 15

64 ≈ 0.23

b) La probabilidad de que al menos salgan cuatro caras(es decir, 𝑥 =4, 5 ó 6) es:

Page 37: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

36

P(4) + P(5) + P(6) = (6

4) (1

2)4

(1

2)2

+ (6

5) (1

2)5

(1

2) + (

6

6) (1

2)6

= 15

64 +6

64 +1

64 ≈ 0.34

c) La probabilidad de que no salga cara (es decir, que todos sean fracasos) es:

q6 = (

1

2)6 =

1

64

Así que la probabilidad de que salgan una o más caras es:

1-qn=1-

1

64=1

63≈0.98

Consideremos el experimento binomial B(n,p) que se compone de n experimentos repetidos e independientes con dos resultados, éxito o fracaso, p es la probabilidad de que salga éxito y q=1-p es la probabilidad del fracaso. El número X de x éxitos es una variable aleatoria con la siguiente distribución:

𝑥 0 1 2 … n

P(𝑋) qn

(n

1) q

n-1p (

n

2) q

n-2p

2 … pn

Ejemplo: Las posibilidades de que un bit transmitido a través de un canal de transmisión digital se reciba con error es de 0.1, suponga que los ensayos de transmisión son independientes. Sea X el número de bits con error en los siguientes cuatro bits transmitidos, determine la probabilidad de encontrar 2 bits con error de cuatro transmitidos, es decir P(X=2).

P(X = x) = (𝑛

𝑥)pxqn−x

P(X=x) = (número de resultados que producen X errores)(probabilidad de bit con error)

x(1-probabilidad de

bit con error)n-x

P(X=2) = 6 [(0.1)2(0.9)

2] = 0.0486

Resultados X Cantidad de resultados

P(X=x) Resumen

ssss 0 1 P(X=0) = (40) (0.1)

0 (0.9)

4 = 0.6561 La probabilidad de 0 bit con

error de 4 bits transmitidos es P(X=0)=0.6561

sssc 1 4 P(X=1) = (41) (0.1)

1 (0.9)

3 = 0.2916 La probabilidad de 1 bits con

error de 4 bits transmitidos es P(X=1)=0.2916

sscs 1

scss 1

csss 1

sscc 2 6 P(X=2) = (42) (0.1)

2 (0.9)

2 = 0.0486 La probabilidad de 2 bits con

error de 4 bits transmitidos es P(X=2)=0.0486

sccs 2

ccss 2

scsc 2

cscs 2

cssc 2

sccc 3 4 P(X=3) = (43) (0.1)

3 (0.9)

1 = 0.0036 La probabilidad de 3 bits con

error de 4 bits transmitidos es P(X=3)=0.0036

cccs 3

cscc 3

ccsc 3

cccc 4 1 P(X=4) = (44) (0.1)

4 (0.9)

0 = 0.0001 La probabilidad de 4 bits con

error de 4 bits transmitidos es P(X=4)=0.0001

∑= 1.0

Media, varianza y desviación estándar de una distribución binomial B(n,p)

Page 38: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

37

Media ó números esperados de éxito: μ=np Varianza: σ

2=npq

Desviación estándar: σ=√𝑛𝑝𝑞

3.2.3 Distribuciones Geométrica. Esta distribución es un caso especial de la Binomial, ya que se desea que ocurra un éxito por primera y única vez en el último ensayo que se realiza del experimento, para obtener la fórmula de esta distribución, haremos uso de un ejemplo. Ejemplo: Se lanza 8 veces al aire una moneda cargada 8 de tal manera que la probabilidad de que aparezca águila es de 2/3, mientras que la probabilidad de que aparezca sello es de 1/3, Determine la probabilidad de que en el último lanzamiento aparezca un águila. Solución: Si nosotros trazamos un diagrama de árbol que nos represente los 8 lanzamientos de la moneda, observaremos que la única rama de ese árbol que nos interesa es aquella en donde aparecen 7 sellos seguidos y por último un águila; como se muestra a continuación: s s s s s s s a y si denotamos: x = el número de repeticiones del experimento necesarias para que ocurra un éxito por primera y única vez = 8 lanzamientos p = probabilidad de que aparezca una águila = P( éxito) = 2/3 q = probabilidad de que aparezca un sello = P(fracaso) = 1/3 Entonces la probabilidad buscada sería; P(aparezca un águila en el último lanzamiento)=p(s)* p(s)* p(s)* p(s)* p(s)* p(s)* p(s)* p(a) =q*q*q*q*q*q*q*p

= Luego, la fórmula a utilizar cuando se desee calcular probabilidades con esta distribución sería;

𝑃(𝑥) = 𝑞𝑥−1 𝑝 ó 𝑃(𝑥) = (1 − 𝑝)𝑥−1 𝑝 Donde: P(x) = probabilidad de que ocurra un éxito en el ensayo x por primera y única vez p = probabilidad de éxito q = probabilidad de fracaso Resolviendo el problema de ejemplo; x = 8 lanzamientos necesarios para que aparezca por primera vez una águila p = 2/3 probabilidad de que aparezca una águila q = 1/3 probabilidad de que aparezca un sello

p(x=8) = Ejemplo: Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que: a) el sexto de estos dispositivos de medición sometidos a prueba sea el primero en mostrar una desviación excesiva? b) el quinto de estos dispositivos de medición sometidos a prueba, sea el primero que no muestre una desviación excesiva?

Solución: a) x = 6 que el sexto dispositivo de medición probado sea el primero que muestre una variación excesiva p = 0.05 =probabilidad de que un dispositivo de medición muestre una variación excesiva q = 0.95 =probabilidad de que un dispositivo de medición no muestre una variación excesiva

P (x = 6) = b) x = 5 que el quinto dispositivo de medición probado, sea el primero que no muestre una desviación excesiva

pq x 1

000304803231 18 .)/()/(

038690050950 16 .).().(

Page 39: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

38

p = 0.95 = probabilidad de que un dispositivo de medición no muestre una variación excesiva q = 0.05 = probabilidad de que un dispositivo de medición muestre una variación excesiva

P (x = 5) = Ejemplo: Los registros de una compañía constructora de pozos, indican que la probabilidad de que uno de sus pozos nuevos, requiera de reparaciones en el término de un año es de 0.20. ¿Cuál es la probabilidad de que el quinto pozo construido por esta compañía en un año dado sea el primero en requerir reparaciones en un año?

Solución: x = 5 que el quinto pozo sea el primero que requiera reparaciones en un año p = 0.20 = probabilidad de que un pozo requiera reparaciones en el término de un año q = 0.80 = probabilidad de que un pozo no requiera reparaciones en el término de un año

P (x = 5) = 3.2.4 Distribución Binomial Negativa

Esta distribución también es un caso especial de la distribución Binomial, ya que se trata de que al llevar a cabo varias veces un experimento binomial, se desea determinar la probabilidad de que ocurran r éxitos, solo que el último de ellos debe ocurrir en el X ensayo o repetición del experimento. Para encontrar una fórmula que nos permita calcular probabilidades con esta distribución, partiremos de un ejemplo. Ejemplo: Se lanza al aire 8 veces una moneda cargada de tal manera que la probabilidad de que aparezca águila es de 2/3, mientras que la probabilidad de que aparezca sello es de 1/3, Determine la probabilidad de que aparezcan tres águilas, y la última de ellas que aparezca en el último lanzamiento. Solución: Sí trazamos un diagrama de árbol que nos represente los 8 lanzamientos de la moneda, encontraremos que las ramas que nos interesan son aquellas en donde aparecen 3 águilas y la última de ellas aparece en el último lanzamiento; ejemplos de una rama que nos interesa sería; SAASSSSA, SSASSSAA, ASSASSSA, etc. Entonces la probabilidad se puede determinar de la siguiente forma:

(Probabilidad de que aparezcan tres águilas, donde la última de ellas aparece en el último lanzamiento de la moneda) = (# de ramas del árbol en donde la tercera águila que aparece está en el octavo lanzamiento) (probabilidad asociada a cada rama). Luego, definiendo algunos términos a utilizar; x = número de lanzamientos necesarios para que se obtenga una águila por r-ésima vez = 8 lanzamientos

r = número de veces que aparece un éxito = 3 águilas p = probabilidad de éxito = p(aparezca águila) = 2/3 q = probabilidad de fracaso = p(aparezca sello) = 1/3 Luego, el número de ramas que nos interesan del árbol se podría determinar primero mediante una combinación de los 7 lanzamientos previos necesarios, donde aparezcan las primeras dos águilas:

(7

2) = 21 combinaciones o ramas

La probabilidad de que ocurran exactamente 2 águilas en los primeros 7 lanzamientos se determina como en la distribución binomial

00000590950050 15 .).().(

081920200800 15 .).().(

Page 40: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

39

(𝑛𝑥)p𝑥qn−𝑥 es decir (7

2)(2 3⁄ )

2(1 3⁄ )

7−2

p(X = 2) = 14/729 = 0.01920438

Ésta es la probabilidad de que salgan 2 águilas en los primeros 7 intentos Puesto que los ensayos son independientes, la probabilidad de que ocurran exactamente 2 águilas en los primeros 7 intentos y que en el 8 intento resulte la tercera águila es el producto de las probabilidades de estos dos eventos, es decir,

(72)(2 3⁄ )

2(1 3⁄ )

5 (2 3⁄ ) = (7

2)(2 3⁄ )

3(1 3⁄ )

5

Por lo tanto la función de la distribución binomial negativa es

𝑓(x) = (𝑥 − 1

𝑟 − 1) p𝑟qx−𝑟

¿Cuál es la razón de que se tomen x-1 ensayos y r-1 éxitos al momento de calcular el número de ramas que nos interesan? … Se debe a que en el último ensayo siempre va a haber un éxito, por lo que como éste no se va a mover como lo hacen los éxitos anteriores, entonces no se toma en cuenta para el cálculo de las ramas que nos interesan.

Ejemplo. Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos dispositivos de medición sometidos a prueba sea el tercero en mostrar una desviación excesiva?, b) el séptimo de estos dispositivos de medición sometidos a prueba, sea el cuarto que no muestre una desviación excesiva?

a) X = 6 dispositivos de medición r = 3 dispositivos que muestran desviación excesiva p = P (dispositivo muestre una desviación excesiva) = 0.05 q = P (dispositivo no muestre una desviación excesiva) = 0.95

𝑓(6) = (6−13−1)(0.05)3(0.95)3 = 0.001071718

b) X = 7 dispositivos de medición r = 4 dispositivos que no muestran una desviación excesiva p = P (dispositivo no muestre una desviación excesiva) = 0.95 q = P (dispositivo muestre una desviación excesiva) = 0.05

𝑓(7) = (7−14−1)(0.95)4(0.05)3 = 0.002036265

Ejemplo. Los registros de una compañía constructora de pozos, indican que la probabilidad de que uno de sus pozos nuevos, requiera de reparaciones en el término de un año es de 0.20. a) ¿Cuál es la probabilidad de que el sexto pozo construido por esta compañía en un año dado sea el segundo en requerir reparaciones en un año?, b) ¿Cuál es la probabilidad de que el octavo pozo construido por esta compañía en un año dado sea el tercero en requerir reparaciones en un año?

a) x = 6 pozos r = 2 pozos que requieren reparaciones en un año p = P (pozo requiera reparaciones en un año) = 0.20 q = P (pozo no requiera reparaciones en un año) = 0.80

𝑓(6) = (6−12−1)(0.20)2(0.80)4 = 0.08192

b) X = 8 pozos r = 3 pozos que requieren reparaciones en un año p = P (pozo requiera reparaciones en un año) = 0.20

Page 41: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

40

q = P (pozo no requiera reparaciones en un año) = 0.80

𝑓(8) = (8−13−1)(0.20)3(0.80)5 = 0.05505

3.2.5 Distribución Hipergeométrica

Los experimentos que tienen este tipo de distribución tienen las siguientes características: a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados. b) Las probabilidades asociadas a cada uno de los resultados no son constantes. c) Cada ensayo o repetición del experimento no es independiente de los demás. d) El número de repeticiones del experimento (n) es constante. Ejemplo: En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad K de

objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos?

𝑓(𝑥) =(𝐾𝑥)(

𝑁−𝐾𝑛−𝑥)

(𝑁𝑛)

donde: 𝑓(𝑥)= probabilidad de obtener x objetos defectuosos de entre n seleccionados

(𝐾𝑥)(𝑁−𝐾𝑛−𝑥) =muestras de n objetos en donde hay x que son defectuosos y n-x buenos

(𝑁𝑛)=todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total, es

decir es el espacio muestral 1.- Considerando que en una urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de

seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos? Solución: N = 10 objetos en total K = 3 objetos defectuosos n = 4 objetos seleccionados en muestra x = 2 objetos defectuosos deseados en la muestra

𝑓(2) =(32)(10−3

4−2)

(104)

= (

3!(3 − 2)! 2!

) (7!

(7 − 2)! 2!)

(10!

(10 − 4)! 4!)

6048

20160= 0.30

La probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería de 0.30

Se puede observar además que es la probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes.

!!

!*

xxx

xxx

!!

!xxxx!!

!xx*

!!

!xx

!!

!!!

!*

!!

!

22

4

78910

6723

46

67891025

567

21

123

46

1025

7

21

3

78910

6723

xxx

xxx

Page 42: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

41

Son las formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos. Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes. Ejemplo: Para evitar el tráfico de sustancias ilegales, un oficial de aduana realiza revisiones aleatorias a los viajeros. Sí un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia y si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas; a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos? Solución: a) N = 9+6 =15 total de tabletas K = 6 tabletas de narcótico n = 3 tabletas seleccionadas x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas P (viajero sea arrestado por posesión de narcóticos) = P (de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico)

Otra forma de resolver; P (el viajero sea arrestado por posesión de narcóticos) = 1 – P (de que entre las tabletas seleccionadas no haya una sola de narcótico)

1 − 𝑓(0) = 1 −(60)(

15−63−0 )

(153 )= 1 −

(1)(84)

(455)= 1 − 0.184615 = 0.815385

b) P (no sea arrestado por posesión de narcóticos)

𝑓(0) =(60)(

15−63−0 )

(153 )=(1)(84)

(455)= 0.184615

3.2.6 Distribución de Poisson

En esta distribución, los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc.: - # de defectos de una tela por m

2

- # de aviones que aterrizan en un aeropuerto por día, hora, minuto. - # de bacterias por cm

2 de cultivo

- # de llamadas telefónicas a un conmutador por hora, minuto. - # de llegadas de embarcaciones a un puerto por día, mes. Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o producto, la fórmula a utilizar sería:

𝑃(𝑋 = 𝑥) = 𝑓(𝑥) =𝑒−𝜆𝜆𝑥

𝑥!

donde:

!!

!

22

4

315

0936

315

1926

315

29163321C

C*C

C

C*C

C

C*C)n;tabletasó,x(p

815380455

371

455

20135216

455

120

455

915

455

366.

))(())(())((

Page 43: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

42

𝑃(𝑋 = 𝑥) = 𝑓(𝑥) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de ellos

es

= media o promedio de éxitos por unidad de tiempo, área o producto 𝑒 = 2.718 x = variable que nos denota el número de éxitos que se desea que ocurra Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado. Ejemplo: Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba: a) cuatro cheques sin fondo en un día dado?, b) 10 cheques sin fondos en cualquiera de dos días consecutivos?

Solución: a) X = variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 4.

= 6 cheques sin fondo por día e = 2.718

𝑃(𝑋 = 4) = 𝑓(4) =𝑒−664

4! = 0.13392

b) x= variable que nos define el número de cheques sin fondo que llegan al banco en dos días consecutivos = 10

= 6 * 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos

Nota: siempre debe de estar en función de x o dicho de otra forma, debe “hablar” de lo mismo que x.

𝑃(𝑋 = 10) = 𝑓(10) =𝑒−121210

10! = 0.104837

Ejemplo: En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15 minutos. Solución: a) X= variable que nos define el número de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3

= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

b) X = variable que nos define el número de imperfecciones en la hojalata por cada 5 minutos = 0, 1, 2, 3,

etc.

= 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata

=1-(0.367918+0.367918) = 0.26416 c) X = variable que nos define el número de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3, etc.

= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

32930701

548845060

1

718260601

601

.).)(.(

!

).().().,x(p

.

!

).)((

!

).()(),,x(p)....etc,,,x(p

1

71821

0

71821111011432

110

Page 44: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

43

= 0.0498026 + 0.149408 =0.1992106

Media y Varianza de una Variable Aleatoria Discreta Así como resulta conveniente resumir una muestra de datos con la media y la varianza, la distribución de probabilidad de X se resume con su media y varianza. La media o valor esperado de la variable aleatoria discreta X, denotada como μ ó E(X) es:

𝜇 = 𝐸(𝑋) =∑𝑥𝑖 𝑓(𝑥𝑖)

n

𝑖=1

La varianza de X denotada como σ

2 ó V(X) es

σ2 = 𝑉(𝑋) =∑(𝑥𝑖 − μ)2n

𝑖=1

𝑓(𝑥𝑖)

Ejemplo: Para el caso en el que se plantea la posibilidad de que in bit transmitido a través de un canal de transmisión digital se reciba con error, encontrar su μ y σ

2.

P(X=0) = 0.6561 P(X=1) = 0.2916 P(X=2) = 0.0486 P(X=3) = 0.0036 P(X=4) = 0.0001 μ=0(0.6561)+1(0.2916)+2(0.04869+3(0.0036)+4(0.0001)=0.4 σ

2=

X 𝒙- μ (𝒙- μ)2

𝒇(𝒙) (𝒙 − 𝛍)𝟐 𝒇(𝒙) 0 -0.4 0.16 0.6561 0.104976

1 0.6 0.36 0.2941 0.104976

2 1.6 2.56 0.0486 0.124416

3 2.6 6.76 0.0036 0.024336

4 3.6 12.96 0.0001 0.001296

0.36

σ2 = 𝑉(𝑋) =∑(𝑥𝑖 − μ)2n

𝑖=1

𝑓(𝑥𝑖) = 0.36

!

).()(

!

).()(),x(p),x(p),,x(p

1

71823

0

718233130310

3130

Page 45: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

44

3.3 Distribuciones de probabilidad y Función de densidad de probabilidad de variables continuas.

La distribución de probabilidad de una variable continua presenta las siguientes características: 1. Es generada por una variable continua (X) que puede tomar tanto valores enteros como fraccionarios.

X 1.0, 3.7, 4.0, 4.6, 7.9, 8.0, 8.3, 11.5, ...,

1. Las probabilidades asociadas a cada uno de los valores que toma X deben ser mayores o iguales a cero, dicho de otra forma, la función de densidad de probabilidad deberá estar definida en los cuadrantes I y II.

𝑓(x)0

3. La sumatoria de las probabilidades asociadas a cada uno de los valores que toma X debe ser igual a 1. El

área definida bajo la función de densidad de probabilidad deberá ser de 1. ∫ 𝑓(𝑥)𝑑𝑥 = 1∞

−∞

4. 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥𝑏

𝑎 = área bajo 𝑓(𝑥) de 𝑎 a 𝑏, para 𝑎 y 𝑏 cualesquiera.

Para la función de densidad de una variable aleatoria continua X y cualquier valor x, su probabilidad es cero.

𝑃 (𝑋 = 𝑥) = 0

Función de densidad de probabilidad (Probability Density Function) de variables continuas. Es la función que explica la relación de probabilidad correspondiente a la variable aleatoria continua X, es decir 𝑓(𝑥). La función de densidad de probabilidad siempre tiene el valor positivo y la suma de todos es 1. Algunos tipos de función son las siguientes:

Distribución Exponencial Distribución Normal

Distribución F Distribución t

Distribución Weibull

3.3.1 Distribución Continua Uniforme. Con frecuencia se presentan diversas distribuciones continuas en las aplicaciones reales, la más sencilla de ellas es la distribución continua uniforme que se define con la función de densidad de probabilidad siguiente:

𝑓(𝑥) =1

𝑏 − 𝑎, 𝑎 ≤ 𝑥 ≤ 𝑏

La función de distribución acumulada de una variable aleatoria continua uniforme se obtiene por

integración. Si 𝑎 < 𝑥 < 𝑏 entonces

𝐹(𝑥) = ∫1

𝑏 − 𝑎𝑑𝑢 =

𝑥

𝑏 − 𝑎− 𝑎/(𝑏 − 𝑎)

𝑥

𝑎

Por lo tanto, la descripción completa de la función de distribución acumulada de una variable aleatoria continua uniforme es

Page 46: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

45

𝐹(𝑥) = {

0 𝑥 < 𝑎𝑥 − 𝑎

𝑏 − 𝑎 𝑎 ≤ 𝑥 < 𝑏

1 𝑏 ≤ 𝑥

La media y la varianza de una variable aleatoria continua uniforme X en 𝑎 ≤ 𝑥 ≤ 𝑏 son

𝜇 = 𝐸(𝑋) =𝑎 + 𝑏

2 𝑦 𝜎2 = 𝑉(𝑋) = (𝑏 − 𝑎)2/12

Ejemplo: Sea que la variable aleatoria continua X denote la corriente media en un alambre delgado de cobre en miliamperes (mA), suponga que el rango de X es [0,20 mA], y que la función de densidad de probabilidad de X es 𝑓(𝑥) = 0.05 ≤ 𝑥 ≤ 20. ¿Cuál es la probabilidad de que una medición de la corriente esté entre 5 y 10 mA?

𝑃(5 < 𝑋 < 10) = ∫ 𝑓(𝑥)𝑑𝑥

10

5

= 5(0.05) = 0.25

𝜇 = 𝐸(𝑋) =0 + 20

2= 10𝑚𝐴 𝑦 𝜎2 = 𝑉(𝑋) =

(20 − 0)2

12= 33.33𝑚𝐴2

3.3.2 Distribución Exponencial.

Una distribución continua común en la práctica es la distribución exponencial, la cual está muy relacionada con la distribución de Poisson, ésta última en la cual una variable aleatoria X se define como el número de ocurrencias de algún suceso durante un intervalo específico, por ejemplo el número de defectos que tiene un alambre de cobre, número de clientes en una hora en un banco etc. En el caso de la distribución exponencial, el intervalo específico (distancia entre sucesos), es una variable aleatoria, por ejemplo la distancia entre un primer y segundo defecto en un alambre de cobre, tiempo entre el tercer y cuarto cliente de un banco en una hora etc. Definición:

La variable aleatoria X es igual a la distancia entre conteos sucesivos de un proceso de Poisson con 0 tiene una distribución exponencial con parámetro 0 .

Otros ejemplos pueden ser, la vida útil de algún artículo, el tiempo de duración de una lámpara, televisión, carro, radio, etc. Una variable aleatoria continua X tiene una distribución exponencial sí y únicamente si tiene una función de densidad f (x) como sigue:

f (x) = xe x 0,

donde: 0 es una constante.

La media y la varianza de la distribución exponencial están dadas por:

1,

2

2 1

, respectivamente.

La función acumulativa o de distribución de probabilidad para una variable exponencial es como sigue:

Page 47: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

46

F (a) =

ax dxe

0

F (a) = axe 0

F (a) = ae 1

Como F (a) es la probabilidad de que la variable aleatoria exponencial sea menor o igual a a entonces:

P (X > a) = F (a) = ae 1

Sustituyendo x por a tenemos que la probabilidad de que la variable aleatoria exponencial sea menor o igual a x está dada por:

P (X x) = xe 1

Además P (X x) está dada por:

P (X x) = F (x)

P(X≥x) = 1-F(x) = 1-1+e−λx = e−λx

La siguiente figura representa la distribución exponencial para valores de .

Distribución exponencial.

Ejemplo: En una red de computadoras de una corporación, el acceso de usuarios al sistema puede modelarse como un proceso de Poisson con una relación de 25 accesos por hora. Con esta información determine:

a) ¿Cuál es la probabilidad de que no haya accesos en un intervalo de 6 minutos?

En este caso Lambda λ= 25 accesos y x= 6 min.=0 .1 horas

P(X>0.1hr)= e−λx = e−25(0.1) = 0.082 Es decir, la probabilidad de que no haya accesos en un intervalo de 6 minutos es de 0.082 ó se espera que 8.2% de los accesos no se den en un intervalo de 6 minutos en una hora dada.

b) ¿Cuál es la probabilidad de que el tiempo hasta el siguiente acceso este entre 2 y 3 minutos. Lambda λ= 25 accesos x1= 2 min.=0 .033 horas x2= 3 min.=0 .05 horas Forma 1

x e−λx 1 − e−λx

Page 48: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

47

P(2≤X≤3) = P(0.033 ≤ X ≤ 0.05)= P(X>0.033) – P(X> 0.05)

P(X>0.033) = e−25(0.033) = 0.438

P(X>0.05) = e−25(0.05) = 0.2865

∴ P(0.033 ≤ X ≤ 0.05)= 0.438-0.2865 = 0.151 Forma 2 P(2≤X≤3) = P(X≤3) – P(X≤2)= P(X≤0.05) – P(X≤0.033)

P(X≤0.05) = 1 − e−25(0.05) = 0.713

P(X>0.033) = 1 − e−25(0.033) = 0.562

∴ P(0.033 ≤ X≤ 0.05) = 0.713-0.562 = 0.151 Como se observa, de las dos maneras llegamos al mismo resultado, el cual nos dice que 15.1% de las ocasiones, se esperaría que el tiempo hasta el siguiente acceso este entre 2 y 3 minutos.

Ejemplo: El tiempo entre llamadas telefónicas a una ferretería tiene una distribución exponencial con un tiempo promedio entre llamadas de 15 min.

a) ¿Cuál es la probabilidad de que no haya llamadas en un intervalo de 30 min.? Lambda λ= 4 llamadas/hora x1= 30 min.=0 .5 horas

P(X>0.5) =e−λx = e−4(0.5) = 0.1353

b) ¿Cuál es la probabilidad de que la primera llamada se realice dentro de los 5 y 10 minutos después de abrir?

Lambda λ= 4 llamadas/hora x1= 5 min.= 0 .083 horas x2= 10 min.= 0 .167 horas P(5 min.≤ X ≤ 10 min.)= P(0.083 hr.≤ X ≤ 0.167 hr.)= P(X>0.083) – P(X>0.167)

P(X>0.083) = e−λx = e−4(0.083) = 0.7175

P(X>0.167) = e−λx = e−4(0.167) = 0.5128 ∴ P(0.083 hr.≤ X≤ 0.167 hr.)= 0.7175 – 0.5128 = 0.2047 Segunda forma: P(5 min.≤ X ≤ 10 min.)= P(X≤ 10min.) – P(X ≤ 5 min.)=

P(X ≤ 10 min.)= P(X ≤ 0.167 hr.) = 1 − e−4(0.167) = 0.487

P(X ≤ 5 min.)= P(X ≤ 0.083 hr.) = 1 − e−4(0.083) = 0.282

∴ P(5 min.≤ X ≤ 10 min.)= 0.487 – 0.282 = 0.2047 Ejemplo: La vida útil de un diodo emisor de luz tiene una distribución exponencial con aproximadamente 100 horas. Si un diodo es seleccionado al azar, calcule las siguientes probabilidades:

En este ejemplo la media se calcula como

1

a) Que el diodo tenga una vida útil mayor o igual a 100 horas. b) Que el diodo tenga una vida útil menor o igual a 100 horas. c) Que el diodo tenga una vida útil mayor que 50 horas. d) Que el diodo tenga una vida útil menor que 300 horas. e) Que el diodo tenga una vida útil entre 20 y 200 horas.

Page 49: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

48

f) Grafique la distribución y localice el intervalo 2 .

a) P (X 100) = 100

100

1

e = (2.7182818)

100100

1

= 0.3678

La probabilidad de que el diodo tenga una vida útil mayor o igual a 100 horas es igual a 0.3678.

b) P (X 100) = 1 - 100

100

1

e = 1 - (2.7182818)

100100

1

= 0.6321

La probabilidad de que el diodo tenga una vida útil menor o igual a 100 horas es igual a 0.6321.

c) P (X > 50) = 50

100

1

e = (2.7182818)

50100

1

= 0.6065

La probabilidad de que el diodo tenga una vida útil mayor de 50 horas es igual a 0.6065.

d) P (X < 300) = 1 - 300

100

1

e = 1 - (2.7182818)

300100

1

= 0.9502

La probabilidad de que el diodo tenga una vida útil menor que 300 horas es igual a 0.9502.

e) P (20 X 200) = P ( X 200) - P ( X 20)

=

20

100

1200

100

1

11 ee = 0.8646 - 0.1812 = 0.6834

La probabilidad de que el diodo tenga una vida útil entre 20 y 200 horas es igual a 0.6834.

f) La siguiente figura muestra la distribución y localización del intervalo 2 .

3.3.3 Distribución Normal

Una de las distribuciones de variable aleatoria continua más comunes en la práctica, es la distribución normal, la cual tiene forma de campana además de propiedades importantes como la de simetría. Adicionalmente, es una de las más utilizadas dentro de la estadística. La siguiente figura muestra la forma de una distribución normal.

2

2

Page 50: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

49

|

Distribución Normal. Una gran parte de la teoría de estadística, está basada en la distribución normal, es decir se parte del supuesto de que una variable aleatoria está distribuida normalmente y se empieza a desarrollar la teoría, como en el caso de verificación de pruebas de hipótesis, análisis de varianza y regresión, temas que se estudian en Estadística Inferencial. De las variables que podrían tener una distribución normal, son por ejemplo; el contenido de los refrescos envasados por un proceso, el nivel de azúcar de los mismos, el diámetro de un tornillo manufacturado por un torno automático, la longitud de un alambre que es cortado por una máquina preparadora de alambres, la resistencia o la ruptura de algún espécimen de latón, entre muchos otros. En general la distribución normal podría ser un buen modelo de comportamiento de procesos aleatorios, y puede ser modelado matemáticamente por las distribuciones. Los parámetros de la distribución normal son la media y la varianza:

E(X)= μ y V(X)=σ2 La media puede modelar el comportamiento de la variable aleatoria y determinar la localización de la distribución; de la varianza se obtiene la desviación estándar, la cual determina el ancho de la distribución. La siguiente figura muestra varias distribuciones con diferentes medias y varianzas, además se puede observar la propiedad de simetría, donde la media es el eje simétrico.

Distribuciones normales con medias y desviaciones estándar diferentes.

f (x)

X

3

10

5

20

4

30

10 20 30

Page 51: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

50

Nótese como en la primera distribución con media 10, la dispersión es menor ya que su desviación estándar es menor, en comparación con la segunda, donde la desviación estándar es 5 y se aprecia una dispersión (error) mas grande. Comparando medias se aprecia, que estas indican la posición de la distribución, a la izquierda o derecha. Definición.

Sea X una variable aleatoria continua, entonces se dice que está normalmente distribuida sí y únicamente si la función de densidad de probabilidad f (x) está dada por:

xexf

x2

2

1

2

1)(

donde: = Media,

= Desviación estándar, = 3.141592654, e = Base de logaritmos naturales, 2.7182818.

Nótese que la función de densidad de probabilidad de la distribución normal, depende de la media y la desviación estándar, por esto las formas presentadas en la figura anterior toman diferentes alturas y anchos, pero en general tienen forma de campana. Utilizando la teoría sobre variables aleatorias continuas, para el cálculo de que una variable normal tome

valores dentro de un intervalo dado, es decir )( bxaP , esta probabilidad se calcularía con una

integral definida sobre el intervalo [ a, b ] de la función de densidad de probabilidad, el cual está representado matemáticamente como sigue:

dxebxaPb

a

x

2

2

1

2

1)( .

Desde el punto de vista de cálculo de probabilidades, esta tarea de integrar la función de densidad de probabilidad, para cada distribución normal, es muy tediosa y consume demasiado tiempo, por lo que se buscó otra forma de calcular probabilidades normales sin tener que integrar y se encontró que cualquier distribución normal puede ser transformada (estandarizada) a través de un cambio de variable del valor Z como sigue:

XZ ,

Donde = Media, = Desviación estándar, X= Variable aleatoria normal, Z= Variable aleatoria

normal estándar. Al estandarizar una variable aleatoria X a Z, esta última presenta una media igual a cero y una desviación estándar igual a uno. Por cuestión práctica, para decir que X tiene una distribución normal con media

y varianza 2 , únicamente se escribirá ),(~ 2NX . Por lo tanto también )1,0(~ NZ para Z.

Dado que cualquier variable aleatoria normal puede ser transformada a Z y ésta siempre tendrá una media cero y desviación estándar de uno, entonces el cálculo de probabilidades para cualquier distribución normal, se hará a través de la distribución normal estándar y la tabla de distribución normal estándar acumulada. A continuación se resumen algunos resultados de utilidad en lo que respecta a la distribución normal.

Page 52: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

51

|

En la distribución normal, aproximadamente el 68.27 % de los datos están ± a una desviación estándar de la media, el 95.45% a 2σ y el 99.73% a 3σ. Ejemplo: Las mediciones de la corriente en una tira de alambre, siguen una distribución normal con una

media de 10 miliamperes (μ=10 mA) y una varianza de 4 miliamperes (2 =4 mA), es decir, su

desviación estándar es de 2 mA (σ=2 mA). Resuelva los siguientes incisos. a) ¿Cuál es la probabilidad de que una medición exceda los 13 mA? En este caso X denota la corriente eléctrica. La probabilidad que se pide es P(X>13mA). Para esto procedemos a estandarizar la variable aleatoria X mediante la formula

XZ entonces 𝑧 =

13−10

2= 1.5

El valor 13 se transforma a 1.5 mediante la estandarización, y se llama con frecuencia a 1.5 el valor z asociado con una probabilidad. Ahora nos interesa encontrar la probabilidad de que X>13mA o dicho de otra manera que Z>1.5, es decir: P(X>13mA)=P(Z>1.5) En este caso z=1.5 se busca en la tabla de distribución normal estándar acumulada, resultando en una probabilidad de 0.93319, sin embargo esta probabilidad es la acumulada hasta 1.5 es decir P(Z≤1.5), entonces, si nos interesa que exceda de 1.5, es decir la diferencia, restamos esta probabilidad a 1. Por lo tanto: P(X>13) = P(Z>1.5) = 1 – P(Z≤1.5) = 1- 0.93319 = 0.06681 La probabilidad de que al medir la corriente en el alambre, esta exceda los 13 mA, es de 0.06681 o dicho de otra forma, aproximadamente el 6.68% de las mediciones excederán los 13 mA. Lo anterior se puede observar en la siguiente figura.

μ μ+1σ μ +2σ μ +3σ μ -1σ μ- 2σ μ -3σ

68.27

% 95.45

% 99.73

%

Page 53: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

52

Corriente en mA

f(x)

14121086

9

8

7

6

5

4

3

2

1

0

13

Mean 9.824

StDev 2.330

N 50

Normal

Distribución Normal

b) ¿Cuál es la probabilidad de que una medición de la corriente, esté entre 9 y 11 mA?

𝑃(9 < 𝑋 < 11) = 𝑃 (9−10

2) < 𝑍 < 𝑃 (

11−10

2) Se convierten en valores estándares.

𝑃(−0.5 < 𝑍 < 0.5) = 𝑃(𝑍 < 0.5) − 𝑃(𝑍 < −0.5) = 0.69146 − 0.30854 = 0.38292

Es decir, la probabilidad de que al medir el alambre, la corriente este entre 9 y 11 mA, es de 0.382 ó aproximadamente el 38.29% de las mediciones, estarán entre 9 y 11 mA.

Corriente en mA

f(x)

14121086

9

8

7

6

5

4

3

2

1

0

9 11

Normal

Distribución Normal

c) Encontrar el valor para el que la probabilidad de 0.98, de que una medición de la corriente esté por

debajo de dicho valor; es decir se necesita el valor de x, tal que P(X<x)=0.98

P(X≤11)=0.69146

P(Z≤0.5)=0.69146

P(X≤9)=0.30854

P(Z≤0.5)=0.30854

P(9<X<11)=0.38292

P(-0.5<Z<0.5)=0.38292

P(X>13)=0.06681

P(X≤13)=0.93319

P(Z>1.5)=0.06681

P(Z≤1.5)=0.93319

Page 54: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

53

| P(X<x) = 0.98 = P(Z<z) = 0.98 Buscamos en la tabla de distribución normal estándar acumulada el valor de z que se aproxime a 0.98 y vemos que 0.97982 corresponde a z=2.05, es decir (Z<z)=0.97982 ∴ z=2.05, despejando de la formula de estandarización tenemos:

𝑧 =x−μ

σ es decir 2.05 =

x−10

2 entonces x = 2.05(2) + 10 = 14.1 mA

Es decir, aproximadamente el 98% de las mediciones de corriente en el alambre, serán menores o igual a 14.1 mA. Ejemplo: La resistencia a la tensión del papel empleado para hacer bolsas para víveres, es una característica de calidad. Se sabe que la resistencia tiene una distribución normal con media μ=40 lb/pulg

2 y desviación estándar σ=2 lb/pulg

2, lo cual se denota X~N(40,2).

El comprador de las bolsas requiere que estas tengan una resistencia de por lo menos 35 lb/pulg2.

¿Cuál es la probabilidad de que una bolsa hecha con este papel cumpla con la especificación o la exceda? P(X≥35)=? Se busca P(X≥35)= 1- P(x<35)

|

z =x−μ

σ =

35−40

2 entonces z = −2.5

P(X<35) = P(Z<-2.5) = 0.0062 El valor de z en la tabla es de 0.0062 Por consiguiente, la probabilidad de que el papel cumpla o exceda la especificación mínima de 35 lb/pulg

2 es de:

P(X≥35) = 1-P(X<35) = 1-0.0062= 0.9938

P(X<x)=0.98

Z=?

P(X>35) =?

𝛍=40

35

Page 55: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

54

En otras palabras, se esperaría que aproximadamente el 99.38% del papel cumpla o exceda las 35 lb/pulg

2.

Ejemplo: El diámetro de un eje en un propulsor de almacenamiento óptico tiene una distribución normal con una media de μ=0.2508 pulgadas y desviación estándar σ=0.0005 y se denota X~N(0.2508, 0.0005). Las especificaciones de los ejes son 0.2500 ± 0.0015 pulgadas. ¿Qué proporción de los ejes cumple con las especificaciones? μ=0.2508 pulgadas σ=0.0005 Espec.: 0.2500 ± 0.0015 pulg. (de 0.2485 a 0.2515 pulg. se considera dentro de especificación)

| P(0.2485≤X≤0.2515) = P(X<0.2515) – P(X<0.2485) Se procede a estandarizar los valores de x

P(X<0.2515)= P(Z≤z) entonces se obtiene z= (0.2515−0.2508

0.0005) = 1.4

Se busca en la tabla y la probabilidad acumulada de Z≤1.4 es de 0.91924 Por su parte

P(X<0.2485)= P(Z≤z) entonces se obtiene z= (0.2485−0.2508

0.0005) = -4.6

Se busca en la tabla y la probabilidad acumulada de Z≤-4.6 es aproximadamente 0, ya que al ser tan negativo, está muy a la izquierda de la distribución. Por lo tanto P(0.2485≤X≤0.2515) = 0.91924-0= 0.91924 Se podría esperar que el 91.92% de los ejes estén dentro de la especificación pedida. Ejercicio: Se observo que los gastos semanales de una empresa por concepto de reparación y mantenimiento durante un largo periodo, se aproxima a una distribución normal con una media de 400 dólares y una desviación estándar de 20 dólares.

a) Si se destina un presupuesto de 450 dólares para la siguiente semana, ¿Cuál es la probabilidad de que los costos reales rebasen el presupuesto?

b) ¿Qué presupuesto debe destinarse a reparaciones y mantenimiento por semana con el fin de que la probabilidad de rebasar el presupuesto cierta semana sea de solo 0.1?

Ejercicio: Una máquina automática expendedora de refrescos puede ajustarse para que despache un promedio μ onzas por vaso. Si el número necesario de onzas para llenar un vaso tiene una distribución normal con una σ=0.3 onzas, encuentre el valor de μ necesario para llenar un vaso de 8 onzas, de tal forma que el líquido se derrame solo el 1% del tiempo.

P(0.2485<X<0.2515) =?

𝛍=0.2508

0.2485 0.2515

Page 56: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

55

UNIDAD 4: TEORIA DE ESTIMACIÓN.

INTERVALOS DE CONFIANZA

La Estimación Puntual, consiste en encontrar estadísticos y sus propiedades para hacer la mejor aproximación numérica de un parámetro. Hemos visto que los estadísticos muéstrales más comunes

como la media X̅, la varianza S2 sólo dan un valor numérico posible del parámetro correspondiente μ y σ

2

respectivamente, es decir X̅ y S2 son estimadores puntuales de μ y σ

2. Sin embargo, en la vida real, en el

proceso de toma de decisiones, es deseable contar un rango de posibles valores que pueden tomar estos parámetros, es decir un intervalo.

Dada la información de una muestra aleatoria, La Estimación por Intervalos de parámetros, consiste en encontrar estadísticos que representen los límites inferior y superior de los posibles valores que éstos pueden tomar con un nivel de probabilidad establecido antes de sacar la muestra. Para lograr calcular dichos límites, es necesario conocer la distribución de probabilidad de los estimadores o funciones de éstos y así establecer el nivel de probabilidad, la cual es convertida en el ámbito de confianza en el momento que los estadísticos que representan los límites son reemplazados con los valores muestrales.

INTERVALO DE CONFIANZA PARA μ, CUANDO σ ES CONOCIDA.

Considere una variable aleatoria X, con una muestra aleatoria de tamaño n, el valor de X̅ (media muestral) se puede usar para estimar μ (que puede ser desconocido) por ejemplo con un nivel de confianza de 95% de la siguiente manera:

P(μ − E ≤ X̅ ≤ μ + E) O su equivalente:

P(X̅ − E ≤ μ ≤ X̅ + E) Donde el margen de error o simplemente error E, es la diferencia entre la media poblacional y la media

muestral, es decir: E = X̅ − μ

A (X̅ − E, X̅ + E) se le llama intervalo de confianza aleatorio de μ con un nivel de confianza del 95 %. En la siguiente figura se muestra que algunos intervalos [x̅ − E, x̅ + E] contendrá a 𝛍. Sin embargo habrá algunos intervalos que no contendrán a la verdadera μ, entonces, es conveniente especificar con una

cierta confianza, cual intervalo si contiene a μ; este nivel de confianza ó 𝛄 (gamma) puede ser por ejemplo una probabilidad de 0.95, por lo tanto a la diferencia a uno (0.05) se le conoce como nivel de error o α (alfa), es decir 1-α =γ ó 1-γ=α, por ejemplo 1-0.05 =0.95 ó 1-0.95=0.05 respectivamente. Ejemplo 1. Supongamos que X, es una variable aleatoria normal con media μ, cuyo valor desconocemos y desviación estándar σ=2. De una muestra aleatoria con remplazamiento de 25 valores

x̅ − E x̅ + E x̅

μ

No contiene a μ

Page 57: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

56

de X, obtenemos una media muestral �̅� =10. Determinar el margen de error E para un intervalo de confianza del 95% para μ y hallar el correspondiente intervalo de confianza. Partimos por definir la siguiente ecuación, para el intervalo de confianza aleatorio con un nivel de confianza del 95%.

P(μ − E ≤ X̅ ≤ μ + E) = 0.95 En este caso utilizamos la formula de transformación Z, pero como estamos trabajando con medias, dividiremos σ, es decir:

Z =X̅−μ

σ/√n o bien Z =

E

σ/√n donde: E = X̅ − μ

Ahora, el denominador para el problema sería σ/√n = 2/5= 0.4

P(μ − E ≤ X̅ ≤ μ + E) = 0.95 Estandarizando se obtiene:

P (−E

0.4≤X̅−μ

0.4≤

E

0.4) = 0.95 o bien P (−

E

0.4≤ Z ≤

E

0.4) = 0.95

Dado que estamos permitiendo un 5 % de error en la probabilidad, es conveniente especificar lo siguiente

| Cuando buscamos el 95 % de confianza, implica un 5 % de error, el cual se reparte 2.5 % a la derecha e izquierda, de tal forma que el error queda a los extremos de la distribución. En estos casos buscamos en la tabla de distribución normal estándar acumulada el valor z correspondiente a una probabilidad de 0.975 y encontramos que z es 1.96, Es decir 1.96 es el valor crítico de z correspondiente a una probabilidad del 0.95, ya repartiendo un 2.5% a cada extremo. Ahora bien, sustituimos en la formula

Z =E

σ/√n donde 1.96 =

E

0.4 por lo tanto E = (1.96)*(0.4)= 0.784

P(X̅ − E ≤ μ ≤ X̅ + E) = 0.95

P(10 − 0.784 ≤ μ ≤ 10 + 0.784)=0.95 P(9.216 ≤ μ ≤ 10.784) = 0.95 Con esto se tiene un confianza del 95 % de que la media μ de X es algún valor del intervalo 9.216 hasta

10.784; lo que significa que la media de x̅ toma los posibles valores X̅ . En otras palabras el 95 % de los intervalos [x̅ − 0.784, x̅ + 0.784] contendrá a 𝛍. Ejemplo 2. Construir un intervalo de confianza para el ejemplo 1, con un nivel de confianza del 99%.

P(X̅ − E ≤ μ ≤ X̅ + E) = 0.99

P(μ − E ≤ X̅ ≤ μ + E) = 0.95

2.5 % error 2.5 % error

97.5% o 0.975 es la probabilidad acumulada error

Page 58: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

57

Por lo tanto 𝛂=0.01, la cual se debe repartir en ambos lados de la distribución 𝛂/2=0.005, entonces buscamos el valor de z, donde la probabilidad acumulada es de 0.99+0.005=0.995 y encontramos que z es 2.58, entonces caculamos E:

Z =E

σ/√n donde 2.58 =

E

0.4 por lo tanto E = (2.58)*(0.4)= 1.032

∴ P(10 − 1.032 ≤ μ ≤ 10 + 1.032)=0.99 P(8.968 ≤ μ ≤ 11.032) = 0.99 Es decir, se tiene un confianza del 99 % de que la media μ de X es algún valor del intervalo 8.968 hasta

11.032; lo que significa que la media de x̅ toma los posibles valores X̅ . En otras palabras el 99 % de los intervalos [x̅ − 1.032, x̅ + 1.032] contendrá a μ.

TAMAÑO DE LA MUESTRA.

Para determinar el tamaño de la muestra que se necesita para obtener el margen de error deseado para un nivel de confianza dado se realiza lo siguiente:

De la formula Z =X̅−μ

σ/√n o bien Z =

E

σ/√n es decir Z =

E√n

σ despejamos √n=

E n = (

E)2 Para el

calculo del tamaño de la muestra. Ejemplo 3. Supongamos que X es una variable aleatoria normal con media μ y σ=2 y que queremos obtener un intervalo de confianza del 95% para μ con un margen de error no mayor de 0.05, ¿de qué tamaño debe ser la muestra para conseguirlo?

n = (Zσ

E)2 entonces n = (

(1.96)(2)

0.05)2 = 61.47 ≅ 62 muestras

En general, a mayor tamaño de muestra, menor es el margen de error para un nivel de confianza dado. Por otra parte, un valor n grande, en ocasiones es poco práctico o antieconómico, entonces se puede obtener un margen de error menor o igual por ejemplo de 0.05, disminuyendo el nivel de confianza. Supongamos del ejemplo anterior que solamente se pueden obtener 36 muestras y queremos un margen de error menor o igual a 0.05 entonces resolvemos:

E =Zσ

√n obtenemos Z =

E√n

σ para el ejemplo 1.5 =

(0.05)√36

2

Buscamos en la tabla de distribución normal estándar acumulada el valor de z=1.5 P(-1.5≤Z≤1.5)=0.8664 Es decir con un tamaño de muestra n=36 y un margen de error de E=0.05, se manejaría un nivel de confianza γ=0.8664, es decir α=0.1336 (nivel de error de 13.36%)

Page 59: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

58

| Ejercicio 1. Se quiere hacer una estimación por intervalo del contenido neto promedio en gramos de bolsas de azúcar llenadas por una máquina automática. Se toma una muestra aleatoria de 50 bolsas resultando un peso promedio de =112 gramos, la desviación estándar se sabe que es igual a 25 gramos.

a) Hallar el intervalo de confianza del 85% para la media μ del contenido neto de las bolsas de azúcar.

b) ¿Cuál debe ser el tamaño de la muestra para obtener un intervalo de confianza del 85% para el contenido neto promedio con un margen de error igual a 2.5%?

c) Supongamos que el tamaño de la muestra no puede ser mayor que 100, ¿Cuál es el margen de error más pequeño posible?

INTERVALO DE CONFIANZA PARA LAS PROPORCIONES. En ciertos fenómenos se halla una población que se divide en dos grupos. Los miembros de uno de esos grupos se llamarán exitosos, donde p=a la proporción desconocida de éxitos en una población. Para estos fenómenos, el intervalo de confianza para p tendrá la siguiente forma:

[p̂ − E, p̂ + E] Donde p̂ es la proporción de éxitos obtenidos en una muestra aleatoria y E es el margen de error.

p̂ tiene como media μp̂= p y desviacion estandar σp̂ = √

p̂(1−p̂)

n

Y se aproxima a una distribución normal cuando n≥30.

𝑍 =p̂−p

σp̂ o bien 𝑍 =

E

σp̂ por lo que el error es E = z ∗ σp̂

Ejemplo 4. En una muestra aleatoria de 900 votantes, el 55% prefiere al candidato demócrata de presidente. Hallar el intervalo de confianza aproximado para la proporción de todos los votantes que prefieren al candidato demócrata con un nivel de confianza de a) 90% y b)99%. a) γ=90% y p̂ = 0.55

Buscamos en la tabla de distribución normal estándar acumulada el valor próximo de z=0.95 que corresponde a 1.65

γ = 0.86638

-z=-1.5

Nivel de confianza de 86.638%

α=0.0668 α=0.0668

z=-1.5

Page 60: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

59

| Entonces

𝑍 =p̂−p

σp̂= E = z ∗ σp̂

σp̂ = √p̂(1−p̂)

n sustituyendo σp̂ = √

0.55(1−0.55)

900= 0.0166

E = z ∗ σp̂ E = 1.65 ∗ 0.0166 = 0.0274

El correspondiente intervalo de confianza del 90% es: [0.55-0.0274, 0.55+0.0274] = 0.90 [0.523≤p≤ 0.577]=0.90 [0.523, 0.577]

b) γ=99% y p̂ = 0.55 Buscamos en la tabla de distribución normal estándar acumulada el valor critico de Z a un nivel de confianza γ=0.99, es z= 2.58

| Entonces

σp̂ = √0.55(1−0.55)

900= 0.0166

E = z ∗ σp̂ E = 2.58 ∗ 0.0166 = 0.043

El correspondiente intervalo de confianza del 99% es: [0.55-0.043, 0.55+0.043] = 0.99 [0.507≤p≤ 0.593]=0.99 [0.507, 0.593]

γ = 0.90

-z=-1.65

0.95 de probabilidad acumulada

α=0.05 α=0.05

z=1.65

0.95 de probabilidad acumulada

γ = 0.99

-z=-2.58

0.995 de probabilidad acumulada

α=0.005 α=0.005

z=2.58

0.995 de probabilidad acumulada

Page 61: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

60

Ejemplo 5. Suponga que una encuesta establece que [0.52,0.57] es el intervalo de confianza del 98% para la proporción de votantes de prefieren al candidato A.

a) ¿Qué porcentaje de la muestra prefieren al candidato A? b) ¿Cuál es el margen de error?

a) γ=0.98 p̂=?

p̂=0.52+0.57

2= 0.545 ∴ el 54.5% por ciento de los votantes prefieren al candidato A.

b) E=? E= 0.57-0.54.5= 0.025 ó E=0.545-0.52=0.25

INTERVALOS DE CONFIANZA PARA μ CUANDO σ ES DESCONOCIDA. Cuando la desviación estándar σ de la variable aleatoria X es desconocida, se usan los valores de la desviación estándar muestral.

𝐒 = √∑(𝐗𝐢 − 𝐗)

𝟐

𝐧 − 𝟏

Supongamos que la variable aleatoria X se distribuye normalmente y tiene como media μ. Sea X̅ la media muestral correspondiente a muestras aleatorias de tamaño n, y sea S la correspondiente desviación estándar muestral, entonces se utiliza la variable aleatoria t en lugar de Z:

t =X̅ − μ

S√n⁄

Con esta variable aleatoria podemos establecer un intervalo de confianza para μ cuando σ no se conoce, tomando su lugar S, y en el caso de Z entra t. El margen de error se calcula de la siguiente manera:

E =t ∗ 𝑆

√n

Ejemplo 6. La media de una muestra aleatoria de 10 calificaciones de un examen es 75 (con escala de 0 a 100), y la desviación estándar muestral S=8.4; aceptando que el conjunto de todas las calificaciones están distribuidos aproximadamente como normal, hallar un intervalo de confianza del 95% para la calificación media. Para buscar el valor crítico de t, debemos calcular los grados de libertad (ν) mediante n-1 y el nivel de error α, el cual normalmente se divide entre 2 (α/2) para repartir el error en los dos extremos de la distribución. Entonces: n=10 ∴ grados de libertad ν = n-1 = 10-1=9 tα 2⁄ , n-1 = t 0.025, 9 Buscamos en la tabla de la distribución t y encontramos que el valor critico de t es 2.262 con un α=0.025 y ν=9

Page 62: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

61

Calculamos el error E= t *S

√n es decir 2.262 *

8.4

√10 = 6.009

Calculamos el intervalo de confianza del 95%.

P[75-(2.262 *8.4

√10) ≤μ≤75+(2.262 *

8.4

√10)]=0.95

P[75-6.009 ≤μ≤75+6.009)]=0.95 P[68.99≤μ≤81.009]=0.95 Es decir, con un 95% de confianza, se esperaría que el promedio real de las calificaciones estén entre 69 y 81. Ejemplo 7. Se realizó un muestreo de 8 trozos de una misma tela para determinar su resistencia a la tensión (Libras/pulg

2). Los resultados fueron los siguientes: 24.4, 18.9, 12.8, 20.5, 19.1, 15.2, 21.7 y 14.6

Si se supone que la población de la que provienen estas resistencias a la tensión es aproximadamente normal, ¿Cuál será el intervalo de confianza del 98% para la media μ? Para buscar el valor crítico de t, debemos calcular los grados de libertad (ν) mediante n-1 y el nivel de error α=0.02, el cual se divide entre 2 (α/2) para repartir el error en los dos extremos de la distribución. α 2⁄ = 0.02/2= 0.01 Entonces: se calcula la media y la desviación estándar muestral

X̅=18.4 S=3.93 y como n=8 ∴ grados de libertad ν = n-1 = 8-1=7 Buscamos en la tabla de la distribución t tα 2⁄ , n-1 = t 0.01, 7 y encontramos que el valor critico de t es 2.998 con un α=0.01 y ν=7

Calculamos el error E= t *S

√n es decir 2.998 *

3.93

√8 = 4.165

Calculamos el intervalo de confianza del 98%.

P(X̅ − E ≤ μ ≤ X̅ + E) = 0.98

P[18.4 - (2.998 *3.93

√8) ≤μ≤18.4+(2.998 *

3.93

√8)]=0.98

P[18.4 – 4.165 ≤μ≤ 18.4 + 4.165]=0.98 P[14.235≤μ≤22.565]=0.98 Ejercicio 2. Se realiza un muestreo de 41 sacos de alimento balanceado para ganado, lo que arroja una media muestral de 75.82 kg y una varianza muestral de 16.16 kg

2. Hallar un intervalo de confianza del

99% para la media poblacional y para la desviación estándar poblacional. Ejercicio 3. Se analizó una marca particular de margarina dietética para determinar el nivel de ácido graso polinsaturado (en porcentaje). Un amuestra de 6 paquetes dio como resultado los siguientes datos: 16.8, 17.2, 17.4, 16.9, 16.5, 17.1 Encuentre un intervalo de confianza del 99% para la media poblacional y para la desviación estándar poblacional.

Page 63: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

62

INTERVALO DE CONFIANZA SOBRE LA VARIANZA

En estos casos el intervalo de confianza sobre la varianza poblacional se determina de la siguiente manera:

P((n−1)S2

χα/2, n−12 ≤ σ2 ≤

(n−1)S2

χ1−α/2, n−12 ) = γ

En donde χ2 es la distribución chi cuadrada y χ

2 =

(n−1)S2

σ2

Ejemplo 8. Se mide la resistencia a la tensión de una fibra sintética dado que esta es una característica de calidad importante para el fabricante. Después de analizar 16 ejemplares de prueba de la fibra se obtienen los siguientes resultados:

X̅=49.86 psi y S2=2.76 (psi)

2

Utilizar esta información para encontrar un intervalo de confianza del 95% para σ

2.

Entonces γ=0.95 y α=0.05 ∴ α/2=0.025 y 𝓋 = n-1 = 16-1=15 Procedemos a buscar el valor crítico de Chi cuadrada χ

α/2, n−12 , es decir χ

0.025, 152 = 27.49 (0.025 en renglones y 15 en columnas)

Además buscamos en la misma tabla χ 1−α/2, n−12 es decir χ

0.975, 152 =6.27

(0.975 en renglones y 15 en columnas) Sustituimos en la formula

P((15) ∗(2.76)

27.49 ≤ σ2 ≤

(15)∗(2.76)

6.27 ) = 0.95

P(1.506 ≤ σ2 ≤ 6.603 ) = 0.95 Es decir, se espera que con un 95% de confianza, la varianza se encuentre entre 1.506 y 6.603. En otras palabras, el 95% de las veces, se espera que la varianza se encuentre entre 1.506 y 6.603 (psi)

2

Ejemplo 9. Se efectuó una prueba de impacto en 20 muestras de tubería PVC, para verificar si se cumple la norma ASTM, la cual especifica que este material debe resistir más de 1.0 lb/pulgada

2. El

promedio y la desviación estándar muestral obtenidos es de

X̅=1.25 y S=0.25, es decir S2=0.0625

Encontrar un intervalo de confianza del 99% para σ

2.

Entonces γ=0.99 y α=0.01 ∴ α/2=0.005 y 𝓋 = n-1 = 20-1=19 Procedemos a buscar el valor crítico de Chi cuadrada

χα/2, n−12 , es decir χ

0.005, 192 = 38.58

Además buscamos en la misma tabla χ 1−α/2, n−12 es decir χ

0.995, 192 =6.84

Sustituimos en la formula

Page 64: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

63

P((19) ∗(0.0625)

38.58 ≤ σ2 ≤

(19)∗(0.0625)

6.84 ) = 0.99

P(0.0308 ≤ σ2 ≤ 0.1736 ) = 0.99 Es decir, se espera que con un 99% de confianza, la varianza se encuentre entre 0.0308 y 0.1736. En otras palabras, el 99% de las veces, se espera que la varianza se encuentre entre 0.0308 y 0.1736 lb/pulgada

2.

Ejercicio 4. Una máquina produce varillas metálicas usadas en el sistema de suspensión de un automóvil. Se selecciona una muestra aleatoria de 15 varillas y se mide el diámetro en cm. dando como resultado:

X̅=8.234 y S=0.0253 Encontrar un intervalo de confianza del 95% para σ

2 del diámetro de las varillas elaboradas por ésta

máquina.

INTERVALO DE CONFIANZA PARA LAS DIFERENCIAS DE MEDIAS CON VARIANZAS CONOCIDAS.

En ciertas ocasiones se requiere determinar si la media poblacional de un grupo de datos es estadísticamente igual a otro grupo, esto es que debido a la variación aleatoria, la 𝛍𝟏 de un grupo 1, sea aproximadamente igual a la 𝛍𝟐de un grupo 2, o en su caso determinar que estadísticamente no son iguales. En estas situaciones se necesita determinar un intervalo de confianza para esta diferencia entre medias de 2 grupos, esto se logra con la siguiente fórmula:

P(X̅1 − X̅2 − Zα2⁄ √

σ12

n1+

σ22

n2 ≤ 𝛍𝟏− 𝛍𝟐 ≤ X̅1 − X̅2 + Zα

2⁄ √

σ12

n1+

σ22

n2) = γ

Ejemplo 10. Un grupo de ingenieros realiza pruebas con dos aleaciones de aluminio para determinar cuál es la más resistente a la tensión en largueros de aluminio usados en la fabricación del ala de un avión de transporte comercial. A su vez se desea utilizar la más económica, pero dando prioridad a la más resistente. Se realizaron pruebas de resistencia a las dos aleaciones diferentes y se conocen las desviaciones estándar por experiencias pasadas con el proceso de fabricación de largueros y el procedimiento de prueba. Los datos con los que se cuenta son los siguientes:

Aleación de aluminio

Tamaño de muestra

Media muestral de la resistencia

(lb/pulgadas2)

Desviación estándar

(lb/pulgadas2)

Precio por libra

en dlls.

Tipo 1 n1 = 10 X̅1 = 87.6 σ1=1.0 $5.0

Tipo 2 n2 = 12 X̅2 = 74.5 σ2=1.5 $6.5

Si μ

1 y μ2 denotan las verdaderas medias de la resistencia a la tensión para los dos tipos de aleaciones,

encontrar un intervalo de confianza del 90% para la diferencia de la resistencia media o promedio 𝛍𝟏− 𝛍𝟐. Es decir se necesita probar si la diferencia que existe entre la media de la aleación tipo 1 y la del tipo 2, es tan grande que se puedan considerar diferentes, y con ello determinar cual tiene la mayor resistencia. Se sustituye en la formula

Page 65: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

64

P(87.6 − 74.5 − 1.65 √1.0

10+2.25

12 ≤ 𝛍𝟏− 𝛍𝟐 ≤ 87.6 − 74.5 + 1.65 √

1.0

10+2.25

12) = 0.90

P([87.6 − 74.5 − 1.65 (0.536) ≤ 𝛍𝟏− 𝛍𝟐 ≤ 87.6 − 74.5 + 1.65 (0.536)]) = 0.90 P([12.215 ≤ 𝛍𝟏− 𝛍𝟐 ≤ 13.984]) = 0.90 Es decir, el intervalo que se espera de la diferencias entre la μ

1 y μ2 de ambas aleaciones, es de 12.215

hasta 13.984. dicho en otra forma, siendo la aleación 1 la que tiene una mayor resistencia, se espera que ésta tenga una diferencia mayor de 12.215 y hasta 13.984 lb/pulgadas

2 con respecto a la tipo 2, por lo

tanto El grupo de ingenieros deberían optar por utilizar el larguero de aluminio con la aleación tipo 1, ya que se espera que sea más resistente que la tipo 2 y además es la más económica. Nota: Observe que este intervalo no incluye al cero, por lo que se puede decir que las medias son diferentes. De hecho puede afirmarse que se tiene una confianza del 90% de que la resistencia a la tensión de la aleación tipo 1, excede a la de tipo 2 entre 12.22 y 13.98 lb/pulgadas

2

Ejercicio 5. Se usan dos máquinas para llenar botellas de plástico con un volumen neto de llenado de 16.0 onzas. Puede suponerse que el volumen neto de llenado es normal, con una desviación estándar de σ2=0.020 y σ2=0.025 onzas. Uno de los miembros del personal de ingeniería sospecha que ambas máquinas hacen el llenado con el mismo volumen neto medio, sea este volumen 16 onzas o no. Se toma una muestra aleatoria de 10 botellas de la producción de cada máquina, cuyos resultados se muestran enseguida: Máquina 1: 16.03, 16.04, 16.05, 16.05, 16.02, 16.01, 15.96, 15.98, 16.02 y 15.99 Máquina 2: 16.02, 15.97, 15.96, 16.01, 15.99, 16.03, 16.04, 16.02, 16.01 y 16.00 Encuentre un intervalo de confianza del 95% para la diferencia de las medias. Proponga una interpretación práctica para este intervalo.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS DESCONOCIDAS.

Siguiendo con la diferencia de medias, en ciertas ocasiones se requiere determinar si la media poblacional de un grupo de datos es estadísticamente no diferente a otro grupo, esto es que debido a la variación aleatoria, la 𝛍𝟏 de un grupo 1, sea aproximadamente igual a la 𝛍𝟐de un grupo 2, o en su caso determinar que estadísticamente no son iguales. Sin embargo en muchas ocasiones no se conoce la verdadera varianza y ésta se debe estimar. En estas situaciones se necesita determinar un intervalo de confianza para esta diferencia entre medias de 2 grupos utilizando la variable aleatoria t en lugar de z, esto se logra con la siguiente fórmula:

P

(

X̅1 − X̅2 − [(tα 2⁄ ,n1+n2−2 )

(Sp)√1

n1+

1

n2] ≤ 𝛍𝟏− 𝛍𝟐 ≤

X̅1 − X̅2 + [(tα 2⁄ ,n1+n2−2 )(Sp)√

1

n1+

1

n2]

)

= γ

Donde:

Sp = √(n1 − 1)S1

2 + (n2 − 1)S22

n1 + n2 − 2

Ejemplo 11. En un artículo de la revista Hazardous Waste and Hazardous Material, se reportaron los resultados obtenidos de un análisis del peso del calcio en el cemento estándar y del cemento dopado con

Page 66: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

65

plomo. Los niveles reducidos de calcio indicarían que el mecanismo de hidratación del cemento se bloquea y permitiría que el agua atacara varios lugares en la estructura del cemento. 10 muestras de

cemento estándar tuvieron un peso promedio porcentual de calcio de X̅1 = 90.0 con una desviación estándar de S1=5.0 y 15 muestras del cemento dopado con plomo tuvieron un peso promedio porcentual

de calcio de X̅2= 87.0, con una desviación estándar muestral de S2=4.0. suponer que el peso porcentual del calcio sigue una distribución normal. Encontrar un intervalo de confianza del 95% para la diferencia de medias μ

1− μ2 para los dos tipos de cemento.

Sp = √(9)(25)+(14)(16)

23 Sp=4.42

√1

n1+

1

n2 = √

1

10+

1

15 =0.408

Buscamos el valor crítico de t cuando: tα

2⁄ , n1 − n2 − 2 es decir t0.05

2⁄ ,10 − 15 − 2 encontrando t=2.069

Sustituimos en la formula:

P(90 − 87 − [(2.069)(4.42)(0.408)] ≤ 𝛍𝟏− 𝛍𝟐 ≤

90 − 87 + [(2.069)(4.42)(0.408)] ) = 0.95

P(−0.73 ≤ 𝛍𝟏− 𝛍𝟐 ≤ 6.73) = 0.95 Nota: Observe que este intervalo SI incluye al cero, por lo que se puede decir que estadísticamente las medias no son diferentes. De hecho puede afirmarse que se tiene una confianza del 95% de que la concentración de calcio en el cemento estándar comparándolo con el cemento dopado con plomo, no son diferentes. Lo anterior se puede ver de la siguiente manera:

El cemento estándar tiene en promedio más concentración de calcio X̅1 = 90.0 y el que contiene plomo

X̅2= 87.0, al parecer el estándar es la mejor opción, sin embargo, recuerde que estamos tratando con medias muestrales, y nos interesa conocer el intervalo esperado que tendrán las medias poblacionales verdaderas y como el intervalo encontrado incluye al cero, esto significa que va a ver ocasiones en que la diferencia en concentración de calcio entre los dos cementos va a ser cero (no son diferentes). Inclusive al haber números negativos, hay la posibilidad que en muestras futuras, el cemento con plomo tenga mayor concentración de calcio. Por lo tanto estadísticamente no son diferentes.

Page 67: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

66

UNIDAD 5: PRUEBA DE HIPOTESIS Se ha visto anteriormente como estimar un parámetro a partir de datos muestrales. Sin embargo, en muchos problemas de ingeniería es necesario decidir si se acepta o se rechaza un enunciado acerca de algún Parámetro. A dicho enunciado se le llama Hipótesis, y al procedimiento para tomar decisiones acerca de la hipótesis se le llama Prueba de Hipótesis. Típicamente la prueba de hipótesis es considerada en la etapa de análisis de datos de un experimento comparativo, en el cuál a un ingeniero le interesa comparar, por ejemplo, la media de una población con un valor dado. Hipótesis estadística es un enunciado acerca de los parámetros de una o más poblaciones. Una prueba de hipótesis Es un método estadístico para determinar cuándo aceptar una estimación, es decir una suposición sobre una población en base a un análisis de una muestra estudiada.

Tipos de Hipótesis.

Hipótesis Nula (Ho) Es una hipótesis que parte de que no hay cambio o diferencia respecto a ciertas aseveraciones. Por ejemplo la media de estatura de un grupo Ho: 𝛍𝟏= 𝟏. 𝟕𝟓 𝐦. Hipótesis Alternativa (Ha) Es una hipótesis para probar ciertas aseveraciones de diferencia mediante muestras. Por ejemplo H1: 𝛍𝟏≠ 𝟏. 𝟕𝟓 𝐦 En este caso μ

1 puede ser mayor o menor y se le denomina hipótesis alternativa de dos colas.

H1: 𝛍𝟏 > 𝟏. 𝟕𝟓 𝐦 ó Ho: 𝛍𝟏 < 𝟏. 𝟕𝟓 𝐦 En este caso μ

1 puede ser solamente mayor (o lo contrario menor) y se le denomina hipótesis alternativa

de una cola. Es importante recordar que las hipótesis son siempre enunciados acerca de la población, no sobre la muestra. Ejemplo. Suponga que se tiene interés en la rapidez de combustión del propulsor sólido utilizado para impulsar los sistemas de expulsión de la tripulación de un avión. Entonces la rapidez de combustión es una variable aleatoria que puede describirse con una distribución de probabilidad. Suponga que el interés se enfoca en la media de la rapidez de combustión. Específicamente quiere decirse si la media de la rapidez de combustión es 50 cm/s o no. Esto se expresa de la siguiente manera.

𝑯𝟎: 𝜇 = 50 𝑐𝑚/𝑠 Hipótesis nula

𝑯𝟏: 𝜇 ≠ 50 𝑐𝑚/𝑠 Hipótesis alterna En pruebas de hipótesis, comúnmente es la hipótesis nula la que se desea probar, el rechazo de la hipótesis nula lleva siempre a aceptar la hipótesis alternativa.

Probar la hipótesis nula, implica tomar una muestra aleatoria, calcular un estadístico (X̅, S, S2), que en

estos casos se conoce como estadístico de prueba y que sirve para tomar una decisión acerca de 𝑯𝟎.

Suponga que se prueba una muestra de n=10 observaciones y se obtiene X̅ de la rapidez de la

combustión. La media muestral es una estimación de la verdadera media poblacional 𝜇, entre más cerca

X̅ del valor hipotético 𝜇 = 50 𝑐𝑚/𝑠, más evidencia de que la verdadera 𝜇 es en realidad 50 𝑐𝑚/𝑠, es decir se apoyaría la hipótesis nula 𝑯𝟎. Por otra parte una media muestral que se aleje de 50 𝑐𝑚/𝑠, es evidencia de que la verdadera media

poblacional 𝜇 es diferente de 50 𝑐𝑚/𝑠, es decir es evidencia a favor de la hipótesis alternativa 𝑯𝟏.

Page 68: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

67

Suponga de nuevo que si 48.5 ≤ X̅ ≤ 51.5, no se rechaza la hipótesis nula 𝑯𝟎: 𝜇 = 50 𝑐𝑚/𝑠, y cuando

X̅ < 48.5 ó X̅ > 51.5 se rechazará la hipótesis nula. Esto se ve en la sig. Figura. En esta ejemplificación los valores menores de 48.5 y mayores de 51.5 representan la región crítica de la prueba. En el otro sentido, los valores que van desde 48.5 hasta 51.5 forman una región en la que hipótesis nula no puede rechazarse, a esta región se le llama región de aceptación. A los límites entre las regiones críticas y la región de aceptación se les llama valores críticos. En este ejemplo 48.5 y 51.5 serían los valores críticos. Este tipo de prueba conlleva dos posibles conclusiones incorrectas. Suponga que la verdadera media

poblacional es 𝜇 = 50 𝑐𝑚/𝑠, sin embargo, en base a las observaciones de la muestra se obtiene que X̅ cae fuera de la región de aceptación, es decir cae en la región crítica. En tal caso se rechazaría la hipótesis nula (Ho) en favor de la hipótesis alternativa (H1), cuando de hecho (Ho) en realidad es verdadero. A este tipo de conclusión incorrecta se llama Error tipo 1(Rechazo de la hipótesis nula cuan ésta es verdadera). Suponga ahora, que la verdadera media poblacional es diferente a 50 cm/s, es decir 𝜇 ≠ 50 𝑐𝑚/𝑠, y que

la media que se obtiene de la muestra, X̅, cae en la región de aceptación. En este caso no se rechazaría (Ho) cuando es falsa. A este tipo de conclusión incorrecta se le llama Error Tipo II, y se define como la aceptación de la hipótesis nula cuando ésta es falsa. Por tanto, cuando se prueba cualquier hipótesis estadística, cuatro situaciones diferentes determinan si la decisión final es correcta o incorrecta y se muestran en la siguiente tabla.

La probabilidad de incurrir en un error tipo I se denota por α, es decir:

𝛼 = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)

A la probabilidad del error tipo I, (𝛼) también se le llama nivel de significancia. Continuando con el ejemplo del al propulsión, suponga que la desviación estándar es 𝜎 = 2.5 𝑐𝑚/𝑠. La probabilidad de incurrir en un error tipo I (Es decir, el nivel de significancia de la prueba), es igual a la suma de las áreas sombreadas a continuación.

Se rechaza 𝑯𝟎

𝜇 ≠ 50 𝑐𝑚/𝑠

Se rechaza 𝑯𝟎

𝜇 ≠ 50 𝑐𝑚/𝑠 No se rechaza 𝑯𝟎

𝜇 = 50 𝑐𝑚/𝑠

48.5 51.5 𝜇 = 50

Región crítica Región crítica Región de aceptación

Page 69: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

68

| Entonces para encontrar 𝛼 procedemos de la siguiente manera

𝛼 = 𝑃(X̅ < 48.5, cuando μ = 50) + 𝑃(X̅ > 51.5, cuando μ = 50) Como estamos trabajando con media muestral, procedemos a estandarizar los valores críticos de 48.5 y 51.5 encontrando lo siguiente:

Z1 =X̅−μ

σ/√n es decir Z1 =

48.5−50

σ/√10= −1.89

Z2 =X̅−μ

σ/√n es decir Z2 =

51.5−50

σ/√10= 1.89

Por lo tanto 𝛼 = 𝑃(Z < −1.89) + 𝑃(Z > 1.89)

𝛼 = (0.02938) + (0.02938) = 0.0588

| Esto significa que 5.76% de todas las muestras aleatorias llevarían al rechazo de la hipótesis nula 𝑯𝟎: 𝜇 = 50 𝑐𝑚/𝑠, cuando la verdadera media de la rapidez de combustión es en realidad 50 cm/s.

¿Cómo le podríamos hacer para reducir el error tipo I?, observe que si se amplía la región de aceptación,

por ejemplo, si los valores críticos fueran 48 y 52, 𝛼 sería más pequeño como se observa a continuación.

Z1 =X̅−μ

σ/√n es decir Z1 =

48−50

σ/√10= −2.53

Z2 =X̅−μ

σ/√n es decir Z2 =

52−50

σ/√10= 2.53

Por lo tanto

𝛍 = 𝟓𝟎

-z=?

α/2=? α/2=?

z=?

𝛍 = 𝟓𝟎

-z=-1.89

α/2=0.02938 α/2=0.02938

z=1.89

48.5 51.5

Page 70: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

69

𝛼 = 𝑃(Z < −2.53) + 𝑃(Z > 2.53) 𝛼 = (0.0057) + (0.0057) = 0.0114

También podría reducirse 𝛼 si se incrementa el tamaño de la muestra, por ejemplo n=16. Determine este

nuevo valor de 𝛼. Al evaluar un procedimiento de prueba de hipótesis, también es importante examinar la probabilidad de un error tipo II, el cual se denota por 𝛽, es decir:

𝛽 = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼) = 𝑃(𝑁𝑜 𝑝𝑢𝑒𝑑𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0, 𝑐𝑢𝑎𝑛𝑑𝑜 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)

Para calcular 𝛽, es necesario tener una hipótesis alternativa específica, por ejemplo para el caso del propulsor, supongamos que es importante rechazar la hipótesis nula 𝑯𝟎: 𝜇 = 50 𝑐𝑚/𝑠 siempre que la

rapidez de combustión media 𝜇 sea mayor por ejemplo de 52 cm/s.

Continuando con los valores críticos de 48.5 y 51.5, se incurrirá en un error tipo II si la media muestral X̅ está entre 48.5 y 51.5, e inclusive menor a 48.5 cuando 𝜇 = 52.

Los valores de Z correspondientes a 48.5 y 51.5 cuando 𝜇 = 52 𝑐𝑚/𝑠 son:

Z0 =X̅−μ

σ/√n es decir Z0 =

51.5−52

σ/√10= −0.63

Por lo tanto

𝛽 = 𝑃(Z < −0.63) = 0.2643 Es decir, si se está probando 𝑯𝟎: 𝜇 = 50 𝑐𝑚/𝑠, contra 𝑯𝟏: 𝜇 ≠ 50 𝑐𝑚/𝑠, y el verdadero valor de la media fuera 𝜇 = 52 𝑐𝑚/𝑠, la probabilidad de que no pueda rechazarse la hipótesis nula falsa es 0.2643, por

simetría, si el verdadero valor de la media es 𝜇 = 48 𝑐𝑚/𝑠, el valor de

𝛽, también será 0.2643.

Procedimiento para prueba de hipótesis

1. Por el contexto del problema, identificar el parámetro de interés 2. Establecer la hipótesis nula H0 3. Especificar la hipótesis alternativa H1

4. Elegir un nivel de significación α 5. Establecer un estadístico de prueba apropiado 6. Establecer la región de rechazo del estadístico 7. Decidir si deberá rechazarse o no H0 y contextualizar la decisión.

48.5 51.5

𝛍 = 𝟓𝟐

Error tipo II, si la media verdadera fuera

𝜇 = 52 y X̅ fuera menor que 51.5

Page 71: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

70

Ejemplo. Los sistemas de expulsión de una tripulación de un avión son impulsados por una carga propulsora solida. La rapidez de combustión de esta carga es una característica importante; las especificaciones requieren que la rapidez de combustión media debe ser de 50 cm/segundo. Se sabe que la desviación estándar de la rapidez de combustión es σ=2cm/seg. El analista decide especificar una probabilidad del error tipo I o nivel de significancia de α=0.05, Se selecciona una muestra aleatoria de n=25 y se obtiene un promedio muestral de 51.3 cm/seg., ¿A qué conclusión deberá llegarse?

1. El parámetro de interés es 𝜇, la media de la rapidez de combustión.

2. 𝑯𝟎: 𝜇 = 50 𝑐𝑚/𝑠 3. 𝑯𝟏: 𝜇 ≠ 50 𝑐𝑚/𝑠

4. 𝛼 = 0.05

5. El estadístico de prueba es Z0 =X̅−μ0

σ/√n también conocido como zeta calculada

6. Se rechaza 𝑯𝟎 si Z0 > 1.96 o si Z0 < −1.96 Esto por que como 𝛼/2 = 0.025 al repartirse a las dos colas, entonces el valor de Z para la probabilidad de 0.025 es -Z0.025= -1.96 del lado izquierdo y Z0.025= 1.96 del lado derecho. Nota: al valor crítico también se le llama zeta de tabla

7. Se realiza el cálculo del estadístico de prueba (zeta calculada)

Z0 =51.3−50

2/√25= 3.25

|

8. Conclusión puesto que Z0 = 3.25 > 1.96, se rechaza 𝑯𝟎: 𝜇 = 50 𝑐𝑚/𝑠 en el nivel de significancia 0.05, expresado con mayor detalle, se concluye que la media de la rapidez de combustión difiere de 50 cm/s, con base en una muestra de 25 mediciones. De hecho, hay evidencias fuertes de que la rapidez de combustión media excede 50 cm/s.

Ejercicio. La resistencia a la tensión media de una fibra sintética es una característica importante de la calidad para un fabricante quien desea probar la hipótesis de que la resistencia media es de 50 psi utilizando un α=0.05. Por experiencia pasada, el fabricante está dispuesto a asumir que la resistencia a la tensión tiene una distribución normal. Se selecciona una muestra aleatoria de 16 ejemplares de prueba de

𝛍 = 𝟓𝟎

-z=-1.96

α/2=0.025 α/2=0.025

z=1.96

Valor crítico o Zeta de tabla

Z0=3.25

Estadístico de prueba o zeta calculado

El estadístico de prueba cae en la región crítica

Page 72: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

71

la fibra y se determinan sus resistencias a la tensión. Realizar la prueba de hipótesis a la tensión pertinente con las siguientes mediciones de la resistencia: 48.89, 52.16, 49.2, 51.76, 52.07, 49.72, 48.1, 50.75, 49.29, 48.0, 47.9, 49.86, 51.66, 49.96, 46.94, 51.57

Page 73: PROGRAMA TRONCO COMÚN INGENIERÍA PLAN DE …ing.ens.uabc.mx/docencia/apuntes/tronco_ing/Apuntes 11212 PYE.pdf · fundamentos matemáticos y metodologías de la ... representación

72

Devore, J. L. (2008). Probabilidad y Estadística para Ingeniería y Ciencias. Mexico DF:

Cengage Learning .

Devore, L. (2015). e-Study Guidefor: Probability and Statistics for Engineering Science.

Cram101 Textbook Reviews.

Gutierrez, E. Probabilidad y Estadistica: Aplicaciones a la Ingeniería y Ciencias. 2014: Editoria

Patria.

Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2008). Introduccion a la Probabilidad y

Estadística. Mexico DF: CENGAGE LEARNING.

Mendenhall, W., Wackerly, D., & Sheaffer, R. (1990). Esatdística Matemática con Aplicaciones.

Mexico DF: Grupo Editorial Iberoamerica.

Montgomery, G. C., & Runger, G. C. (1996). Probabilidad y Estadística aplicadas a la

Ingeniería. México DF: MC GrawHill.

Spiegel, M. R., & Stephens, L. J. (2009). Estadística. Mexico DF: MC GrawHill.

Triola, M. (2015). Probabilidad y Estadística. Perason.

Walpole, R. E., & Myers, R. H. (1992). Probabilidad y Estadística. Mexico DF: MC Graw Hill.