estadistica - probabilidades

39
1 Probabilidades y distribuciones de probabilidad.. Capítulo 2 PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD 2.1. Introducción. J. Bernoulli fue el primero en estudiar este tema en forma sistemática con un enfoque científico. Observando los resultados del lanzamiento de una moneda un número grande de veces, notó que el número de caras y sellos tendía a igualarse. Es decir, que la frecuencia relativa de la obtención de caras se acercaba más al número de sellos, cuanto mayor era el número de lanzamientos. O bien, ambas frecuencias relativas se parecían cada vez más a 0.5. Otro tanto le ocurría en el lanzamiento de dados: la frecuencia relativa es un 1 tendía a 1/6. Repitió una y otra vez este tipo de experimentos con monedas, dados y cartas, y siempre llegaba a la misma conclusión. Imaginó haber encontrado un fenómeno más general y así dio comienzo la teoría de probabilidades. Sus resultados teóricos se corresponden razonablemente con la realidad. Sin embargo, debe marcarse siempre una clara distinción entre los resultados empíricos y los teóricos. El uso comenzó en la teoría de juegos de azar, en el siglo XVII en Francia, y gracias a estos se hizo popular entre los “geómetras” de aquel entonces. Hoy se emplea en el campo de los seguros, control de calidad, genética, investigación operativa y muchos más. En la ciencia experimental se presenta también un tipo similar de incertidumbre y de regularidad a largo plazo. Por ejemplo en genética es incierto saber si un descendiente será hembra o macho, sin embargo, a largo plazo podremos determinar el porcentaje que serán machos y los que serán hembras y posteriormente cuando ocurre un hecho en las mismas condiciones podremos predecir dicho resultado. En el lenguaje corriente se utiliza el termino "probabilidad" para designar el grado de confianza que una persona tiene sobre la ocurrencia de un determinado suceso futuro.

Upload: julio-cesar-otoya-peralta

Post on 27-Dec-2015

143 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: estadistica - probabilidades

1

Probabilidades y distribuciones de probabilidad..

Capítulo 2

PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

2.1. Introducción.

J. Bernoulli fue el primero en estudiar este tema en forma sistemática con un enfoque científico. Observando los resultados del lanzamiento de una moneda un número grande de veces, notó que el número de caras y sellos tendía a igualarse. Es decir, que la frecuencia relativa de la obtención de caras se acercaba más al número de sellos, cuanto mayor era el número de lanzamientos. O bien, ambas frecuencias relativas se parecían cada vez más a 0.5. Otro tanto le ocurría en el lanzamiento de dados: la frecuencia relativa es un 1 tendía a 1/6. Repitió una y otra vez este tipo de experimentos con monedas, dados y cartas, y siempre llegaba a la misma conclusión. Imaginó haber encontrado un fenómeno más general y así dio comienzo la teoría de probabilidades. Sus resultados teóricos se corresponden razonablemente con la realidad. Sin embargo, debe marcarse siempre una clara distinción entre los resultados empíricos y los teóricos. El uso comenzó en la teoría de juegos de azar, en el siglo XVII en Francia, y gracias a estos se hizo popular entre los “geómetras” de aquel entonces. Hoy se emplea en el campo de los seguros, control de calidad, genética, investigación operativa y muchos más.

En la ciencia experimental se presenta también un tipo similar de incertidumbre y de regularidad a largo plazo. Por ejemplo en genética es incierto saber si un descendiente será hembra o macho, sin embargo, a largo plazo podremos determinar el porcentaje que serán machos y los que serán hembras y posteriormente cuando ocurre un hecho en las mismas condiciones podremos predecir dicho resultado.

En el lenguaje corriente se utiliza el termino "probabilidad" para designar el grado de confianza que una persona tiene sobre la ocurrencia de un determinado suceso futuro.

La probabilidad es una parte de nuestra vida cotidiana. Por ejemplo, Cuando escuchamos una predicción de un 70% de posibilidades de lluvia, cambiamos nuestros planes de salir el día de campo y nos quedamos viendo televisión o escuchando música. En el campo de la salud pública los indicadores tales como tasas y porcentajes que son expresados en tanto por uno se pueden interpretar como la probabilidad de la ocurrencia de un hecho o evento. Por ejemplo:

La tasa bruta de mortalidad en el Perú es aproximadamente 9 defunciones por mil habitantes (9/1000). Si la tasa mencionada se expresa en tanto por uno, se puede interpretar como que la probabilidad de morir por cualquier causa de una persona elegida al azar es de 0.009.

La tasa de incidencia de cáncer de pulmón en una determinada población es de 70.6/ 100,000, es decir, que en un determinado periodo de cada 100,000 personas aproximadamente 71 hicieron cáncer de pulmón en dicha población. Otra interpretación que se podría dar si esta tasa se expresa en tanto por uno sería que la

Page 2: estadistica - probabilidades

2

Probabilidades y distribuciones de probabilidad..

probabilidad de que una persona elegida al azar se enferme de cáncer de pulmón es de 0.000706.

2.2. Definición de algunos términos.

A continuación se da a conocer una serie de definiciones (para poder usar un idioma común) que posteriormente van a permitir dar una definición de la probabilidad de la ocurrencia de un evento.

2.2.1. Experimento aleatorio. Es todo proceso que consiste de la ejecución de un acto (o prueba) una o más veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se puede predecir con certeza.

Ejemplo 2.1. Son experimentos aleatorios:

ε 1 : Lanzar una moneda no cargada sobre una superficie plana y se observa la parte superior.

ε 2 : Evaluar el estado nutricional de un niño menor de 5 años elegido al azar de una comunidad.

ε3 : Un Geólogo realiza un análisis de campo para ayudar a efectuar un diagnóstico correcto, de un estudio cualquiera (como puede ser tipo de rocas).

2.2.2. Elemento. Es uno de los resultados posibles del experimento o prueba clínica. A veces se lo llama resultado o dato.

Ejemplo 2.2. Consideremos los experimentos aleatorios del ejemplo 2.1.

- En el experimento ε 1, el fenómeno se presenta de dos maneras y que puede ser cara ( C ) ó sello (S).- En el experimento ε 2, como resultado de la evolución del niño se le puede clasificar como Nutrido (N) o desnutrido (D).- En el experimento ε 3, el biólogo empleando diversas técnicas de laboratorio, se puede llegar a uno de dos diagnósticos: el paciente tiene diabetes (D ) ó no tiene Diabetes (ND)..

2.2.2. Espacio muestral. Está formado por el conjunto de todos los resultados posibles de un experimento aleatorio. Este conjunto se denota por .Cada resultado posible de un experimento aleatorio es un elemento del espacio muestral y se denomina también punto muestral.

Ejemplo 2.3. Sea el experimento aleatorio de lanzar una moneda y un dado a la vez, y observar los resultados posibles. En este caso espacio muestral es el conjunto:

1 = {1C, 2C, 3C, 4C, 5C, 6C, 1S, 2S, 3S, 4S, 5S, 6S

Ejemplo 2.4. El experimento consiste en observar en un determinado periodo, el número de casos de una enfermedad que se presentan en una comunidad de 1000 habitantes. Estos resultados pueden ser:

2 = { 0, 1, 2, 3, 4,…, 1000 enfermos

Page 3: estadistica - probabilidades

3

Probabilidades y distribuciones de probabilidad..

Ejemplo 2.5. El experimento consiste en evaluar el estado nutricional de tres niños menores de 5 años elegidos al azar de una comunidad. En esta situación, el experimento se repite tres veces, y en cada repetición hay dos resultados posibles (N ó D). El espacio muestral puede escribirse como el conjunto de ternas ordenadas:

2 = {NNN, NND, NDN, NDD, DNN, DND, DDN, DDD

NOTA. Los espacios muestrales de experimentos aleatorios que consisten de dos o más pruebas sucesivas se obtienen también de un diagrama tipo árbol, como el la figura 2.1, para 2

1ª. Evaluación 2ª. Evaluación 3ª. Evaluación Resultados Posibles

N NNN

N

N D NND

N NDN

D

D NDD

N DNN

N

D D DND

N DDN

D

D DDD

Figura 2.1. Diagrama del árbol.

2.2.3. Eventos. Se denomina evento a cualquier subconjunto de un espacio muestral y lo denotaremos por A, B, C, D, E, etc. Así si A es un evento entonces A .En particular y (conjunto vacío) son eventos. Al espacio muestral se le llama evento seguro y a evento imposible.

Ejemplo 2.3. Consideremos el espacio muestral asociado al experimento definido en el ejemplo 2.4 ( 3 ).

3 = {NNN, NND, NDN, NDD, DNN, DND, DDN, DDD

De este experimento podemos estar interesados en la ocurrencia de una serie de eventos, por ejemplo:A : Que ocurra exactamente un niño desnutrido., B : Que ocurra al menos dos niños desnutridos.El listado de los elementos que le corresponden a estos eventos son:

Page 4: estadistica - probabilidades

4

Probabilidades y distribuciones de probabilidad..

A = {NND, NDN, DNN B = {NDD, DND, DDN, DDD

2.3. Principios básicos de probabilidades.Cuando se hacen afirmaciones como "Juan probablemente ganara la partida de tenis", "tengo el 50% de posibilidad de obtener un número par al lanzar un dado". En cada caso se expresa un resultado del cual no se tiene plena certeza, pero en virtud de la información que se tiene del pasado o de la compresión de la estructura del experimento, se logra cierto grado de confianza en la validez de la aseveración.

2.3.1. Probabilidad teórica de la ocurrencia de un Evento. Si los resultados del experimento aleatorio son igualmente probables, el espacio muestral asociado a este experimento se denomina espacio equiprobable y la probabilidad de la ocurrencia de un evento A se define como el cociente entre el número esperado de veces que ocurra el evento A y el número total de casos posibles en que el experimento puede ocurrir.

P( A )=Numero esperado de veces en que el experimento ocurre favorable a ANumero total de total en que el experimento puede ocurrir

Esta definición primaria de probabilidad se calcula en forma teórica.

La probabilidad de un evento varía entre 0 y 1 (siempre está expresado en tanto por uno). Una probabilidad igual a 1 indica nuestra absoluta certeza de que el evento ocurrirá, mientras que una probabilidad nula indica nuestra absoluta certeza de que el evento no ocurrirá. Valores intermedios señalan estados de mayor o menor confianza en la ocurrencia del suceso.

2.3.2. Probabilidad empírica.La probabilidad que se ha estado considerando están basadas en un conocimiento a priori de las frecuencias favorables de un evento y de todos los resultados posibles que puede ocurrir.En algunas ocasiones, la única forma de determinar una probabilidad es repitiendo un experimento muchas veces, para ver la frecuencia con que ocurrirían los posibles resultados. Mientras más se repita el experimento aparece un modelo de regularidad, esto es, habrá una estabilidad de la fracción FrA (frecuencia relativa).

La probabilidad empírica de ocurrencia de un evento A es igual a su frecuencia relativa (FrA ). O sea, el cociente entre el número de veces en que ocurrió el evento A (F A y el número total de experimentos (Ft).

Fr A=F A /Ft

Ejemplo 2.4. De la población de pacientes de un laboratorio se eligieron N = 1000 personas al azar, y se encontró que 38 padecían de hipoglucemia. Calcular la probabilidad de que si se escoge un paciente al zar este padezca la enfermedad.

Solución. Frecuencia empírica = 38/1000 = 0.038 Probabilidad teórica = prevalencia

Page 5: estadistica - probabilidades

5

Probabilidades y distribuciones de probabilidad..

Ejemplo 2.5. Al realizar una comprobación de los valores predichos por la CPK(creatino - fosfo kinasa), se encontró que 64 de ellos fueron mal clasificados como positivos y 36 como falsos negativos, del total de 400 historias clínicas analizadas. Calcular la probabilidad de acertar en el pronóstico.

Solución. Frecuencia empírica de aciertos = (VP + VN)/ Total = (400 -64 – 36) / 400 = 0.75

Ejemplo 2.6. Se efectúa un diagnóstico a partir de los análisis clínicos del paciente. Los resultados posibles son (+) con una probabilidad p y (-) con una probabilidad q. Se cumple la relación p + q =1 pues p = TP/ N y q = TN/ N, de allí p + q = (TP + TN)/ N =1. Se efectúa otro diagnóstico a otro paciente, las probabilidades p y q se mantienen iguales y constantes y el espacio muestral formado por este segundo caso es

= {(+ , +) (+ , -), (- , +), (- , -)

con P( +, +) = p2 ; P( +, -) = P( -, +) = p.q y P( - -) = q2 . ( TP: Total de positivos; TN: Total de negativos). Se cumple que P() = p2 +p.q +q.p + q2 =( p + q )2 = 1. Lo anterior se cumple pues la ocurrencia de un resultado no incide en el siguiente ni es influenciado por el anterior.

Observaciones.

1. La probabilidad de que ocurra un evento seguro es una certeza y vale 1.

P()=1

2. La probabilidad de un evento imposible o nulo es cero, es decir,P(φ )=0

De (1) y (2) se dice que 0≤P(A )≤1

3. Si A y B son dos eventos cualesquiera, entonces la probabilidad de que tenga lugar uno de los dos eventos, es:

P( A∪B )=P( A )+P(B)−P (A∩B )

4. Si A y B son eventos mutuamente excluyentes, entonces:

P( A∪B )=P( A )+P(B) A∩B=φ

5. Si A⊂B entonces P( A )≤P(B)

6. Si A1, A2,..., An son eventos excluyentes o disjuntos dos a dos, es decir Ai∩A j=φ ∀ i≠ j , entonces:

P( A1∪A2∪. ..∪An )=P( A1)+P( A2)+. . ..+P( An)

7. Para tres eventos A, B y C cualesquiera,

P( A∪B )=P( A )+P(B)+P(C )−P (A∩B )−P(A∩C )−P(B∩C )+P( A∪B∪C )

Page 6: estadistica - probabilidades

6

Probabilidades y distribuciones de probabilidad..

8. Si A y A' son dos eventos complementarios, entonces:

P( A )+P(A ' )=1 P( A )=1-P( A ' )

Ejemplo 2.7. Los empleados de una cierta compañía han elegido a cinco de ellos para que les representen en el consejo administrativo y de personal sobre productividad. Los perfiles de los cinco elegidos son:

1. hombre edad 302. hombre 323. mujer 454. mujer 205. hombre 40

Este grupo decide elegir un vocero, la elección se efectúa sacando de un sombrero uno de los nombres impresos. Nuestra pregunta es, ¿cuál es la probabilidad de que el vocero sea mujer o cuya edad esté por arriba de 35 años?-

Utilizando el teorema 1, podemos establecer la respuesta a nuestra pregunta como:

P(mujer o mayor de 35 años) = P(mujer) + P(mayor de 35 años) - P(mujer y mayor de 35) =

=

25 +

25 -

15 =

35

Ejemplo 2.8. Suponga que en un sorteo la probabilidad de ganar el primer premio es 2/5 y la de ganar el segundo premio es 3/8. Si la probabilidad de ganar al menos uno de los 2 premios es 3/4, calcular la probabilidad de ganar:

a) sólo uno de los dos premios, b) ninguno de los dos premios.

Solución.Sean los eventos: A: " ganar el primer premio" y B: "ganar el segundo premio".Se tiene P(A) = 2/5 , P(B) = 3/8 , y P(AB) = 3/4.

Sustituyendo estos valores en: P( A∪B )=P( A )+P(B)−P (A∩B )

Resulta: P( A∩B )=2

5+ 3

8− 3

4= 1

40

Las probabilidades de cada una de las partes de se indican en la figura siguiente:

A B

A´ B´

Page 7: estadistica - probabilidades

7

Probabilidades y distribuciones de probabilidad..

a) la probabilidad de ganar sólo uno de los dos premios es:

P [( A∩B ' )∪(A '∩B )]=1540

+1440

=2940

b) La probabilidad de no ganar ninguno de los premios es:

P [( A'∩B' ) ]=1040

Ejemplo 2.9. En un concurso para auxiliar de la cátedra de Bioestadística se presentan 3 candidatas. La primera: A por ser profesional tiene dos veces más posibilidades de ganar que una alumna avanzada B. Y esta a su vez el triple de ganarle a C que es de otra especialidad. Se pide calcular las respectivas probabilidades de ganar y la probabilidad de que A no gane.

Solución. Si P( C) = p entonces P(B) =3 P( C) = 3p y P(A) = 2 P(B) = 6 pEl evento seguro es que alguna de las tres va a ganar:

1 = P(A) + P(B) + P( C) = 6p + 3p + p = 10pY no es posible que gane más de una, por lo tanto los tres eventos son mutuamente excluyentes.De donde se obtiene p =1/10 y con eso se pueden obtener:

P(A) = 6/10; P(B) =3/10 y P( C) = 1/10

La probabilidad de que no gane A es igual a la de que ganen B o C. Esto es:

P(A´) =1 – P(A)= 1 - 6/10 = 4/10 =0.4

o P(B U C) = P( B) + P( C) = 3/10 + 1/10 = 4 / 10 = 0.4

2.3.5. Probabilidad condicional.A la probabilidad de que ocurra un evento B luego de que ha sucedido un evento A , se se llama "probabilidad condicional" y se escribe P(B/A). Está expresión, se lee: " probabilidad de que B ocurra dado que ocurrió A”.

Definición. La probabilidad condicional de B, dado A, se define

P(B/A )=P (A∩B)

P (A ) , si P( A )>0

Ejemplo 2.10. En un estudio sanitario se ha llegado a la conclusión de que la probabilidad de que una persona sufra problemas coronarios es el 0.10. Además, la probabilidad de que una persona sufra problemas de obesidad es el 0.25 y la probabilidad de que una persona sufra a la vez problemas de obesidad y coronarios es del 0.05. Calcular la probabilidad de que una persona sufra problemas coronarios si está obesa.

Solución. Definamos los siguientes eventos:

A: “Que una persona sufra problemas coronarios”

Page 8: estadistica - probabilidades

8

Probabilidades y distribuciones de probabilidad..

B: “Que una persona sufra problemas de obesidad”

A ∩ B: “Que una persona sufra a la vez problemas coronarios y de obesidad”.

P (A ∩ B ) = 0.05 P (B) = 0.25

Entonces, P (A /B) = 0.05 / 0.25 = 0,20

2.3.5.1. Regla de la multiplicación de probabilidades.

Teorema 1. Si en un experimento pueden ocurrir los eventos A y B, entonces

P( A∩B )=P( A )P (B /A )

Así, la probabilidad de que se presenten ambos es igual a la de que se dé A multiplicada por la de que ocurra B, dado que ocurrió A.

También se puede escribir: P(B∩A )=P(B )P( A /B )

Teorema 2. Si en un experimento, los eventos A1, A2 ,..., AK , pueden ocurrir, entonces:

P( A1∩A2∩A3∩. . .∩Ak )=P (A1 )P( A2/ A1 )P (A3 /A1∩A2) . .. P(A K /A1∩A2∩.. .∩AK )

Ejemplo 2.11. El resultado de la evaluación nutricional de 100 niños, se da a continuación:

DiagnósticoNutricional

Número de niños

NormalDesnutrido

6040

Total 100Si de este grupo, seleccionamos dos niños al azar sin reposición, ¿Cuál es la probabilidad de que el primer niño sea normal y el segundo sea desnutrido?.-

Page 9: estadistica - probabilidades

9

Probabilidades y distribuciones de probabilidad..

Solución. Definamos los siguientes eventos:

A: Que el primer niño sea normal

B: Que el segundo niño sea desnutrido

A ∩ B: Que el primer niño sea normal y el segundo desnutrido

B / A : Que el segundo niño sea desnutrido dado que el primer fue normal

De acuerdo a la regla de la multiplicación de probabilidades se tiene:

P( A∩B )=P( A )×P(B/ A )=(60/100)×(40 /99)=0 .24

2.3.6. Independencia.Se dice entonces que dos eventos son independientes cuando la ocurrencia de uno de ellos, no modifica la ocurrencia del otro, ni esta influenciado por este. Si se realiza una serie de pruebas repetidas, las pruebas son independientes, cuando el resultado de una de ellas no está influenciado por el resultado de la prueba anterior, ni tampoco influenciará el resultado de la prueba siguiente.

Se dice que dos eventos A y B son independientes cuando la probabilidad de que ambos ocurran es igual al producto de sus probabilidades mutuas (independencia estadística). O sea:

Si se cumple, P( A∩B )=P( A )P (B ) entonces son independientes.

- Se puede generalizar con: Sean k eventos A1, A2 ,..., AK todos independientes entre sí, entonces se cumple que:

P( A1∩A2∩A3∩. . .∩Ak )=P (A1 )P( A2)P( A3 )…P( AK )

Si se realiza una prueba k veces, donde cada resultado es un evento independiente de los demás, la probabilidad de ocurrencia de un resultado común a todos ellos es el producto de sus probabilidades.

Ejemplo 2.12. En un grupo de diez de dos años de edad, siete están vacunados contra una enfermedad específica y tres no lo están. Si se eligen dos niños al azar, ¿cuál es la probabilidad de que el primero esté vacunado y el segundo también lo esté? , si:

a) La elección se hace con reposición,b) La elección se hace sin reposición.

Solución. Empecemos definiendo los siguientes eventos:A: El primer niño elegido está vacunado

B: El segundo niño elegido está vacunado

a) Si la elección es con reposición, tenemos:

Page 10: estadistica - probabilidades

10

Probabilidades y distribuciones de probabilidad..

P(A) = 7 /10 (es la probabilidad que el primer niño elegido esté vacunado) P(B) = 7 /10 (es la probabilidad que el segundo niño elegido esté vacunado) P(B / A) = 7/10 (es la probabilidad que el segundo niño elegido esté vacunado

dado que el primer niño también lo estuvo)

Por consiguiente: P( A∩B )=P( A )×P(B/ A )=7 /10×7 /10=49 /100=0 . 49

Como vemos, el haber elegido en primer lugar un niño vacunado no afecta la probabilidad de que el segundo niño elegido sea vacunado, es decir se cumple:

P(B/A )=P(B )También, la probabilidad de que ambos niños elegidos sean vacunados cumplen con la regla:

P( A∩B )=P( A )×P(B )Luego se dice que los eventos A y B son independientes.

b) En cambio, si la elección es sin reposición se tiene:

P(A) = 7 / 10, P(B / A) = 6 / 9

Por lo tanto P( A∩B )=P( A )×P(B/ A )=7 /10×6 /9=42/90 (1)

Además, se tiene que:P( A )×P(B)=7/10×7 /10=49/100 (2)

De (1) y (2) se tiene que:P( A∩B )≠P( A )×P(B )

Por consiguiente los eventos A y B no son independientes.

2.3.7. Teorema de Probabilidad total y de Bayes.

Teorema 1. (Probabilidad total)

Si los eventos B1, B2, ... , Bk constituyen una partición del espacio muestral , de tal forma

que P(Bi) >0 para i =1, 2, ..., k, entonces para cualquier evento A en ,

P( A )=∑i=1

K

P(Bi )· P(A /Bi )

Ejemplo 2.13. En una sala de una clínica especializada solo se tratan tres tipos de enfermedades. Se sabe que en promedio ingresan un 50% de pacientes con la afección K, 30% con la enfermedad L y el resto con la afección M (datos obtenidos con las estadísticas de los últimos dos años). Realizando un relevamiento de historias clínicas se dedujo que un 70% de los ingresados con la enfermedad K se curan, mientras que para

Page 11: estadistica - probabilidades

11

Probabilidades y distribuciones de probabilidad..

L y M, se obtuvieron 80% y 90% respectivamente. ¿Cuál es la probabilidad que se haya dado de alta a un paciente?

Solución.a) Sean: B 1 : pacientes con la enfermedad K , P( B1) = 0.5 y la P(C / B1) = 0.7 B 2 : pacientes con la enfermedad L , P( B2) = 0.3 y la P(C / B2) = 0.8 B 3 : pacientes con la enfermedad M , P( B3) = 0.2 y la P(C / B3) = 0.9 C : pacientes curados y dados de alta C / Bi : pacientes curados y dados de alta que se internaron con la afección i.

P(C / B1) = 0.7 C

B 1

P(B 1) = 0.5 C ´

P(C / B1) = 0.8 C

P(B 2) = 0.3 B 2

C ´

P(B 3) = 0.2 P(C / B1) = 0.9 C

B 3

C ´

Luego la probabilidad de que el paciente sea dado de alta es:

P(C )=P(B1 )P (C/B1 )+P(B2 )P(C/B2 )+P(B3 )P (C/B3 )= = 0 .5×0 .7 + 0 . 3×0 . 8 + 0. 2×0. 9 =0 .77

Como una consecuencia del teorema anterior, haciendo substituciones adecuadas, se obtiene el otro teorema. En efecto, de la definición resulta:

P(Bi )⋅P (A/Bi )=P( A∩Bi )=P (Bi∩A )=P( A )⋅P(B i /A )Despejando,

P(Bi /A )={P(Bi )⋅P( A/Bi )} / P (A )Y reemplazando P(A) con el teorema de probabilidad Total, se obtiene el Teorema de Bayes.

Teorema 2. (Regla de Bayes)

Page 12: estadistica - probabilidades

12

Probabilidades y distribuciones de probabilidad..

Si los eventos B1, B2 ,..., Bk constituyen una partición del espacio muestral , de tal forma que P(Bi) >0 para i =1, 2, ..., k, entonces para cualquier evento A en tal que P(A) >0,

P(Bi / A )=P(Bi )⋅P(A / Bi )

∑i=1

k

P(B i)⋅P(A / Bi)

Donde:P(B i) : son las llamadas probabilidades “a priori” por ser las que tienen los

eventos B i antes de saber que ha ocurrido el evento A.

P(A ∩ B i ) : son las probabilidades conjuntas.

P(A / B i ) : son las probabilidades condicionales

P( B i / A) : son las llamadas probabilidades “a posteriori” porque son las que tienen los eventos B i , luego de saber que ha ocurrido el evento A.

Ejemplo 2.14. Con respecto al ejemplo 2.13, En la fecha, se dio de alta a un paciente: ¿Cuál es la probabilidad que se haya internado por la enfermedad K ?

Solución. Mediante la fórmula de Bayes, tenemos:

P(B1 /A )=P(B1 )⋅P(A / B1 )P(B1 )⋅P(A / B1 )+P(B2 )⋅P (A / B2 )+P(B3 )⋅P(A / B3 )

=0 . 5×0 . 70 . 5×0 . 7+0 . 3×0. 8+0 . 2×0 . 9

=0 .350 .77

=0 .4546

Esto es, la probabilidad de que el paciente dado de alta haya ingresado con la enfermedad K es de 0.4546.

Ejercicio. En una bioterio existen tres razas de ratones (R 1, R 2, R 3) en las proporciones: 25%, 30% y 45% respectivamente. Sabemos que cierta enfermedad ataca al 5% de los ratones de la raza R 1, al 10% de R 2 y al 15% de los de R 3. se elige un ratón al azar. Si el ratón elegido está afectado de la enfermedad, ¿Cuál es la probabilidad de que sea de la raza R 3?.

2.6. Distribuciones de Probabilidad de tipo discreto. Característica. Aplicaciones.

2.6.1. Distribución Binomial.

La distribución binomial es una distribución de probabilidad discreta aplicable como modelo a diversas situaciones de toma de decisiones, siempre y cuando pueda suponerse que el proceso de muestreo se ajuste a un proceso Bernoulli. Un proceso Bernoulli es un proceso de muestreo en el que:

Page 13: estadistica - probabilidades

13

Probabilidades y distribuciones de probabilidad..

1) Sólo son posibles dos resultados mutuamente excluyentes en cada ensayo u observación. Por conveniencia, a estos resultados se les denomina éxito y fracaso.

2) Los resultados del conjunto de ensayo u observaciones, constituyen eventos independientes.

3) ) La probabilidad de éxito, que se denota mediante p, permanece constante de un ensayo a otro.

Puede utilizarse la distribución binomial para determinar la probabilidad de obtener un número determinado de éxitos en un proceso Bernoulli. Se requieren tres valores: el número especifico de éxitos (X), el número de ensayos u observaciones (n) y la probabilidad de éxito en cada uno de los ensayos ( p). La fórmula para determinar la probabilidad de un número determinado de éxitos X para una distribución binomial es:

P(X=x )=(nx ) px qn− x

, donde q = 1 - p

X = 0, 1, 2, …, n

Teorema. Si X. B(n ,p), entonces,

a) μ=E (X )=np , b) σ2=V ( X )=np(1−p )

Ejemplo 2.21. Suponga que en una población el 51 por ciento de todos los nacimientos son varones. Si de esta población se selecciona aleatoriamente cinco registros de nacimientos. ¿Cuál es la probabilidad de que:

a) Ninguno de los registros sea varón?.b) Exactamente dos de los registros sean varones?.

Solución. Sea la variable aleatoria X: número de registros de nacimientos varones que pueden ocurrir en 5 registros. La distribución binomial de esta variable queda definida como:

P(X=x )=(5x )( 0.51)x(0 .49 )5− x

RX = { 0, 1, 2, 3, 4, 5

Luego:

a) P(X=0 )=(50 ) ·(0 .51 )0 ·(0 .49)5=1×1×(0 .49 )5=0. 0282

b) P(X=2)=(52 )·(0 .51)2 ·(0 . 49 )3=10×0 .2601×0 .117649=0 .306

Ejemplo 2.22. La proporción de fumadores en una ciudad es 4 de cada 10 personas. Si de esta ciudad se seleccionan aleatoriamente 10 personas, se pide:

Page 14: estadistica - probabilidades

14

Probabilidades y distribuciones de probabilidad..

a) ¿Cuál es la probabilidad de que al menos cuatro personas sean fumadores?-b) ¿Cuál es la probabilidad de que a los mucho tres personas sean fumadores?-c) ¿determinar el número esperado de personas que fuman?

Solución. Sea la v.a X: "número de fumadores que pueden ocurrir en 10 personas”

P(X=x )=(10x )( 0. 4 )x(0 .6 )10−x

X = 0, 1, 2, 3, 4, ..., 10. Entonces X ~ B(15, 0.3)

a) Se pide encontrar P(X≥4 )=0 .6177

b) P(X≤4 )=1−P(X≥5)=1−0 . 3669=0 . 6331c) El número esperado de personas que fuman esta dado por: E(X) = n·p = 10x0.4= 4.2.6.2. Distribución de Poisson.

La distribución de Poisson fue desarrollado en Paris por el francés Simeón Denis Poisson (1781 - 1840), en los inicios del siglo XVII, como un caso particular de la Binomial aplicado a los casos raros.

Se denominan procesos de tipo Poisson, o poissonianos, a todo experimento consistente en una serie de pruebas repetidas dentro de un continuo (espacio o tiempo), caracterizado por tener resultados que se pueden clasificar en si verifican o no, cierta propiedad o atributo, siendo aleatorios e independientes del lugar que ocurren dentro del espacio o tiempo.

Son ejemplos de este tipo de proceso, un recuento celular en cámara de Neubauer o Homocitómetro, la llegada de pacientes a una cola o línea de espera, los accidentes ocurridos en una carretera, el número de piezas defectuosas por lote en un proceso de producción y muchos otros casos. Esta distribución se aproxima a la Binomial cuando la probabilidad de éxito es muy pequeña, por eso muchos la llaman: la “Binomial de los eventos o sucesos raros”.

Para imaginar casos de la vida real donde se le puede encontrar, se debe considerar un medio continuo como la sangre, orina, agua de mar o de río, el aire, el tiempo, dentro del cual ocurre un número total elevado de pequeñas cantidades discretas tales como los glóbulos blancos, rojos o plaquetas en la sangre, residuos en orina, plancton en el agua de mar, partículas de tierra en la de río, ralladura de limón en la pasta de una torta, etc.

Otro modelo que produce casos poisson son los que ocurren en el tiempo, como las llamadas telefónicas que llegan a la central telefónica de la UNP entre las 8 a.m a 12 a.m., emisión de partículas radioactivas, la demanda diaria de los pacientes esperando ser atendidos en el hospital "Cayetano Heredia"- Piura, autos que llegan a una estación de combustible, etc. En estos casos, se debe suponer: (a) los eventos ocurren en forma independiente, (b) la probabilidad que un evento ocurra en un corto intervalo de tiempo sea proporcional a la longitud del intervalo, y (c) la duración del evento es tan pequeña que hace insignificante a su probabilidad de ocurrencia. Entonces, si se cumplen estos tres supuestos la probabilidad de que ocurran exactamente x eventos o sucesos en un intervalo de tiempo finito es la de Poisson.

Page 15: estadistica - probabilidades

15

Probabilidades y distribuciones de probabilidad..

En términos generales, cuando un proceso del tipo Poisson tiene una “intensidad” promedio ( > 0) en el medio continuo, la probabilidad de que ocurran exactamente x sucesos eventos, se obtiene con:

p( x )=P (X=x )= e−λ ·λx

x! , x = 0, 1, 2, ... ,

donde es el promedio eventos para el tiempo o dimensión especifico de interés.

Un proceso es de tipo Poisson, cuando los eventos puntuales se producen individual o colectivamente al azar dentro de un continuo (espacio o tiempo).

Teorema. Si X ~ P(), entonces: a) E(X) = b) V(X) =

Ejemplo 2.23. La escasez de glóbulos rojos se puede determinar examinando al microscopio una muestra de sangre. Suponiendo que un volumen pequeño determinado contenga por termino medio 4 glóbulos rojos en personas normales, cual es la probabilidad de que una muestra de personas normales,

a) Contenga exactamente tres glóbulos rojosb) No tenga glóbulos rojos?

Solución.a) Sea X el número de glóbulos rojos que tiene una persona normal en un volumen pequeño determinado.

X ~ P(), donde = 4 es el promedio de glóbulos rojos. La distribución de Poisson quedará definida en este caso como:

P(X=x )= e−4 ·4 x

x! x = 0, 1, 2, ... ,

La probabilidad de que exactamente contenga 3 glóbulos rojos en el volumen pequeño determinado es:

P(X=3)= e−4×43

3!=0 . 1953

Utilizando la tabla de la distribución probabilidad acumulada de poisson, se tiene:P(X=3)=P(X≤3)−P (X≤2 )=0 .433−0 .238=0 .195

b) La probabilidad de que no tenga glóbulos rojos es:

P(X=0 )= e−4×40

0!=0. 018

Page 16: estadistica - probabilidades

16

Probabilidades y distribuciones de probabilidad..

Ejemplo 2.24. Se sabe que en cierta área de una ciudad el número promedio de homicidios es de 4 por día. Suponiendo que el número de homicidios sigue una distribución de Poisson, encuentre la probabilidad de que en un día dado halla:

a) No más de un homicidio.b) Más de dos homicidios

Solución.

a) Se tiene que: P(X≤1)=P (X=0 )+P(X=1)Para encontrar el valor de esta probabilidad acumulada se utiliza la tabla de la distribución de Poisson acumulada, para λ = 4 y X = 1. Entonces el valor que le corresponde a dicha probabilidad es:

P(X≤1)=0.091

b) Se pide encontrar P(X>2) . P(X>2)=1-P (≤2 )=1-0 .238=0. 762

La distribución de Poisson como una aproximación de la distribución binomial

En algunas ocasiones, si deseamos evitar la tediosa tarea de calcular distribuciones binomiales de probabilidad, podemos utilizar la distribución de Poisson. La distribución de Poisson puede ser una razonable aproximación en forma de límite de la Binomial cuando el número de ensayos n es grande y la probabilidad p Binomial de tener éxito es

pequeña (Es decir, si n→∞ , p→0 y np permanece constante). De aquí que, si n es

grande y p es cercano a 0, la distribución de poisson puede utilizarse, con λ=np , para aproximar distribuciones binomiales.

La distribución de Poisson es una buena aproximación de la distribución binomial cuando n 20 y p 0.05. En los casos en que se cumplen esta condición la formula de Poisson resulta ser:

P(X=x )=e−np(np )x

x!

Ejemplo 2.25. Si la probabilidad de un individuo sufra una reacción por una inyección de un determinado suero es 0.01. Determinar la probabilidad de que de un total de 1000 individuos, más de dos individuos sufran una reacción.

Solución.

Sea X el número de individuos que sufren una reacción por una inyección de un suero en los 1000 individuos. Los posibles valores de X son 0, 1, 2, 3,..., 1000 y se distribuyen según el modelo binomial: B(1000, 0.01), esto es:

P(X=x )=(1000x )( 0. 01)x(0 . 99 )1000− x

x = 0, 1, 2,..., 1000

Page 17: estadistica - probabilidades

17

Probabilidades y distribuciones de probabilidad..

La probabilidad de que más de dos individuos tengan una reacción por una inyección de un determinado suero es:

P(X>2)=P( X≥3 )=1−P( X≤2 )=1−∑x=0

2

(1000x )(0 . 01)x(0 .99)1000−x=1−0 .00268

= 0.99732Si utilizamos la distribución de Poisson como aproximación a la distribución binomial, se tiene: = np = 1000(0.01) = 10

P(X=x )=(1000x )( 0.01)x(0 . 99 )1000− x≃

e−10(10 )x

x!

Luego, P(X>2)=1−P (X≤2 )≃1−0 .00277=0 . 99723

Como podemos darnos cuenta, diferencia entre las dos distribuciones de probabilidad es pequeña.2.7. Distribuciones de Probabilidad de tipo continuo.

2.7.1. Distribución Normal.

Hasta este del capítulo, nos hemos ocupado por el análisis de las distribuciones de probabilidad discretas. En la presente sección fijaremos nuestra atención a los casos en que la variable puede tomar cualquier valor que éste en un intervalo de valores dado, y en los cuales la distribución de probabilidad es continua (Tal como ocurre con la mayoría de las magnitudes clínicas que son del tipo continuo, cuya distribución teórica de la variable se llama función de densidad ).

Una distribución de probabilidad continua que es muy importante es la distribución normal. Varios matemáticos han contribuido a su desarrollo, entre los que podemos contar al astrónomo -matemático del siglo XIX Karl Gauss. En honor a su trabajo, la distribución de probabilidad normal a menudo también se le lama distribución gaussiana.

Existen dos razones básicas por las cuales la distribución normal ocupa un lugar tan prominente en la estadística. Primero, tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras. Segundo, la distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, incluyendo características humanas (pesos, alturas, IQ, nivel de colesterol, presión sanguínea, etc.).

2.7.1.1. Definición. Se dice que la variable aleatoria X tiene distribución normal con media y varianza 2, y se escribe X ~ N(,2), si su función de densidad es dada por:

f ( x )= 1√2π·σ

·e−(x−μ)2

2σ2

−∞<x<∞

donde −∞<μ<∞ , > 0. Su gráfica es la figura siguiente.

Page 18: estadistica - probabilidades

18

Probabilidades y distribuciones de probabilidad..

f(x)

X

Figura 2.2. Gráfica de la función de densidad normal

Observe durante un momento la figura 2.2. Este gráfico pone de manifiesto varias características importantes de una distribución normal de probabilidad.

1. La curva tiene un pico, por tanto, es unimodal. Tiene la forma de campana.2. La curva es simétrica con respecto al eje vertical X = .3. El área total bajo la curva normal es igual a uno, por lo tanto a cada lado del eje

de eje de simetría es igual a 0.5.4. La curva normal tienen dos puntos de inflexión simétricos en X = µ ± σ. 5. Debido a la simetría de la distribución normal, la media coincide con la mediana

y con la moda.6. Los dos extremos de la distribución normal de probabilidad se extienden

indefinidamente y nunca tocan el eje horizontal.

2.7.1.2. Distribución normal estándar y uso de la tabla normal.Considerando la diversidad de variables cuya distribución es aproximadamente normal, se hace necesario emplear una función densidad normal que sea independiente de los valores y unidades que puedan tomar dichas variables. Para esto se define la variable estandarizada, z, de la siguiente forma:

Z= X−μσ

que mide el número de desviaciones estándares que un valor x se desvía de la media .

Para está variable estandarizada, se define la función de densidad estandarizada:

f ( z )=1

√2π·e

− z2

2

−∞<z<∞

La variable estándar Z tiene media igual a cero y la varianza igual a 1. (z)

Page 19: estadistica - probabilidades

19

Probabilidades y distribuciones de probabilidad..

0 z

Figura 2.3. Curva normal estandarizada.

Además, función de distribución acumulada de la normal estándar es:

φ ( z )=P(Z≤z )=∫−∞

z 1

√2 π· e

−t2

2 dt

(z)

0 z Z

Figura 2.4. Área bajo la curva normal estandarizada.

No es necesario tener una tabla distinta para cada curva normal posible. En lugar de ello podemos utilizar la distribución de probabilidad normal estándar para encontrar áreas (probabilidades) bajo cualquier curva normal.

Si la variable aleatoria X tiene distribución N( , 2 ), entonces, la variable aleatoria Z = ( X - ) / tiene distribución N( 0, 1).

Luego,

P(a≤X≤b )=P[ a−μσ

≤ Z≤b−μσ ]=φ( b−μ

σ)−φ( a−μ

σ)

Ejemplo 2.26. Utilizando la tabla de probabilidad normal estándar, hallar:

a) P( Z 1.2) b) P(0.81 Z 1.94) c) P(Z -1.28) d) P(-0.46 Z 2.21) e) P(-2.04 Z -1.98) f) P(Z -0.68)

Solución.a) Directamente de la tabla normal estándar se obtiene:

P( Z 1.2) = 0.5 + P( 0 Z 1.2) = 0.5 + 0.38849 = 0.8849

0.8849

0 1.2 Z

b) P(0.81 Z 1.94) = P(0 Z 1.94) - P( 0 Z 0.81) =

Page 20: estadistica - probabilidades

20

Probabilidades y distribuciones de probabilidad..

-3 0 0.81 1.94 3 Z

c) P(Z -1.28) =

-3 -1.28 0 3 Z

d) P(-0.46 Z 2.21) =

-3 -0.46 0 2.21 3 Z

e) P(-2.5 Z -1.98) =

-3 - 2.5 -1.98 0 3 Z

f) P(Z -0.68) =

-3 - 0.68 0 3 Z

Ejemplo 2.27. Hallar el valor de Zo tal que P(Z≤zo )=0 . 95 .

Solución.

Page 21: estadistica - probabilidades

21

Probabilidades y distribuciones de probabilidad..

El interés en este caso, es encontrar el valor de z o dado que se conoce la probabilidad

P(Z≤zo )=0 . 95 .De acuerdo a la definición del evento, z o es positivo y el área de 0.95 que le corresponde lo ilustrado en la figura 2.5

0.95

0 z 0 Z

Figura 2.5.

El área que corresponde entre 0 y z o es de 0.95 – 0.50 = 0.45. En el cuerpo de la tabla de una distribución normal estándar, ubicamos la probabilidad 0.45 y el valor más próximo por defecto a este valor es 0.4495 y le corresponde un valor de Z igual a 1.64.

Por lo tanto, z o = 1.64.

Ejemplo 2.28. Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas están distribuidos normalmente con una media de 66 mg / dl y una desviación estándar de 42 mg / dl.

a) ¿Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en sangre mayor o igual a 72 mg / dl?

b) ¿Cuantos niños presentan un nivel de glucosa en sangre entre 62 mg / dl y 72 mg / dl?.

c) ¿Debajo de que valor se encuentra el 10% de los niveles de glucosa en sangre extraída a los niños en ayunas?

Solución.

Sea la v.a X: nivel de glucosa en sangre extraída a niños en ayuna. Se sabe además que X ~ N [66 mg / dl , (42 mg / dl)2] . Donde los valores poblacionales son µ =66 mg / dl y σ = 42 mg / dl.a)

P(X≥72)=P [ X−μσ

≥72−6642 ]=P(Z≥0 . 25)=0 .5−P(0≤Z≤0. 25 )=0 .5−0 .0987=0 . 4013

b) P(62≤X≤72 )=P[62−66

24< X−μ

σ<72−66

24 ]=P (−0. 17<Z<0 . 25)=0. 1662

Luego el número esperado de niños en ayunas que presentan un nivel de glucosa en sangre entre 62 mg / dl y 72 mg / dl es aproximadamente de: 150 x 0.1662 = 25 niños. c) Sea x0 el valor de nivel de glucosa en sangre debajo del cual se encuentra el 10% de

los valores. Es decir P(X≤X0 )=0. 1

Page 22: estadistica - probabilidades

22

Probabilidades y distribuciones de probabilidad..

X0 66 X -1.28 0 Z

Luego:

P(X≤x0 )=P[ X−6624

≥x0−66

24 ]=P [Z≤ x0−66

24 ]=0 .1

Se observa en la tabla de la normal estandarizada que −1 .28=

x0−66

24 , de donde

resulta:x0=35.28 mg / dl

Ejercicio. Los límites de tolerancia del componente Sulfato de Neomicina en un antibiótico fueron fijados en (40 ; 60) mg. Se sabe que el valor promedio histórico de fabricación 50 mg con una desviación estándar de 4 mg y además los valores del componente de sulfato están distribuidos aproximadamente en forma normal. Calcular el número esperado de comprimidos defectuosos en un lote de 9000.

2.7.1.3. Aproximación Normal a probabilidades Binomiales.

Cuando el número de observaciones o ensayos n es relativamente grande, puede utilizarse la distribución normal para aproximar las probabilidades binomiales. Una regla aceptable para determinar cuando puede utilizarse la aproximación normal a las probabilidades binomiales es tener en cuenta que tanto np 5 como nq 5. Hemos visto que cuando p es muy pequeña y n es grande, la aproximación de Poisson a la Binomial es buena.

Ejemplo 2.29. La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es 0.4. Si se sabe que 100 personas han contraído está enfermedad, ¿cuál es la probabilidad de que menos de 30 sobrevivan?-

Solución.Sea la variable aleatoria binomial X que representa el número de pacientes que sobreviven.

Los posibles valores de X son 0, 1, 2, 3, ..., 100. en este caso la distribución binomial es:

P(X=x )=(100x )( 0.4 )x(0 . 6 )100−x

x = 0, 1, 2,..., 100

La probabilidad exacta calculada por la fórmula Binomial es P(X<30)=P (X≤29 )= 0.0147753

Page 23: estadistica - probabilidades

23

Probabilidades y distribuciones de probabilidad..

Dado que n =100 es grande, deben obtenerse resultados bastantes precisos utilizando la aproximación de la curva normal con:

μ=np=100×0 . 4=40 y σ=√npq=√100×0 .4×0 .6=4 .899

Entonces la probabilidad de que menos de 30 pacientes de 100 sobrevivan, es:P(X<30)=P (X≤29 )=P(X≤29+1/2 )=P(X≤29.5 )

≃ P (X−404 .899

≤29.5−404 .899

)=P(Z≤−2 .14 )=0 .0162

La probabilidad aproximada obtenida 0.0162 es muy parecida a la exacta 0.014772.7.2. Distribución Chi-Cuadrado.

Definición.- Se dice que la variable aleatoria continua X se distribuye según Chi-cuadrado con r grados de libertad, y se representa por X ~ 2(r), si su función de densidad es:

f (X )={ 2−r/2

Γ (r /2)· X r /2−1 · e−x /2

0 , si x<0

, si x≥0

donde r es un número entero positivo.

f(2)

r=1

r=6

r=15

0 10 20 2

Figura 2.6. Gráfica de la distribución chi-cuadrado.

Si X ~ 2(r) entonces, su media y su varianza respectivamente son: = E(X) = r y 2 = V(X) = 2r

Si la variable aleatoria X ~ 2(r), entonces, en la tabla de probabilidades chi-cuadrado se puede encontrar una probabilidad 1 - o un valor 2

(1-, r) , mediante la relación

P(X≤ χ(1−α, r)2 )=1−α

f(2)

Page 24: estadistica - probabilidades

24

Probabilidades y distribuciones de probabilidad..

Figura 2.7. Área bajo la curva

1 - chi - cuadrado.

0 2 (1-, r) 2

Ejemplo 2.30. Si X ~ 2(26), determinar:

a) P [ X≤17 .29 ] , b) P [ X≥38 .89 ] , c) P [13 .84≤X≤45 .64 ] d) P [ X≤40 ]

Solución.-

a) P [ X≤17 .29 ] = 0.10

b) P [ X≥38 .89 ] =

c) P [13 .84≤X≤45 .64 ] =

d) P [ X≤40 ] =

Ejemplo 2.31. Si X ~ 2 (r), hallar:

a) a tal que P [ X>a ]=0 .005 , si r = 30

b) a y b tales que P [a≤X≤b ]=0 . 95 , P [ X≤b ]=0 .975 , si r = 13

c) a tal que P [ X≤a ]=0 . 015 , si r = 8

Solución.

a) Directamente se observa de la tabla chi, que a = 53.672

b) De P [ X≤b ]=0 . 975 , se tiene P [ X>b ]=0 .025 resultando b = 24.7356

Por otra parte, 0 .95=P [a≤X≤b ]=P( X≥a )−P( X≥b ) , de donde resulta,

P(X≥a )=0 . 95+0 . 025=0. 975 , entonces, a = 5.01.

c) Por interpolación se tiene a = 1.8267

2.7.3. Distribución t de Student.

Page 25: estadistica - probabilidades

25

Probabilidades y distribuciones de probabilidad..

Definición. La variable aleatoria continua T se distribuye según t-student con r grados de libertad y se representa por T ~ t (r), si su función de densidad es,

f ( t )=Γ [(r+1 )/2 ]Γ (r /2 )√π·r

·(1+ t2

r )−( r+1)/2

−∞< t<∞ ,

donde r es un número positivo.

La gráfica de la distribución t se representa en la figura 2.8.

T

0

Figura 2.8. Gráfica de la distribución t - Student.

La distribución t- Student tiene las siguientes propiedades: Si la v.a T ~ t (r), entonces su media y su varianza son respectivamente:

μ=E (T )=0 σ 2=V (T )= r

r−2 , r > 2. Su gráfica tiene forma de campana de Gauss, simétrica en cero. La varianza de la distribución t es mayor que de la distribución N(0, 1). Pero

cuando r→+∞ , la varianza de la t tiende a 1. La distribución t se aproxima a una distribución N(0, 1), cuando r→+∞ . La

aproximación es buena, si r≥30 .

Si la v.a T ~ t(r), en la tabla de probabilidades t-Student se puede encontrar una probabilidad 1- o un valor t(1-, r) , mediante la relación

P(T≤t1−α , r )=1−α

1 -

" Si Z y V son dos variables aleatorias independientes tales que Z está normalmente distribuida con media cero y varianza 1, y V está distribuida como chi-cuadrado con r grados de libertad, entonces, la variable aleatoria

T= Z

√V /rtiene distribución t- Student con r grados de libertad"

Page 26: estadistica - probabilidades

26

Probabilidades y distribuciones de probabilidad..

T 0 t(1-, r)

Figura 2.9. Área de la distribución t.

Ejemplo 2.32. Si T tiene distribución t-Student con 18 grados de libertad, hallar:

a) P(T >1. 734 ) b) P(T≤2 .10 ) c) P(T≤−2 . 878) d) P(−1. 330≤T≤2.552)

e) P(T >2)

Solución.

a) P(T >1. 734 )= 0.05

b) P(T≤2 .10 )= 1- P(T >2. 10 )=

c) P(T≤−2 . 878)= P(T >2. 878 )=

d) P(−1. 330≤T≤2.552)=

e) Por interpolación resulta p0=0 . 968

Ejemplo 2.33. Si X tiene distribución t con 10 grados de libertad, hallar el valor c tal que:

a) P(X>c )=0 .01 b) P(X≤c )=0 .995 c) P(X≤c )=0 .05

d) P(−c≤X≤c )=0 . 95 e) P(X>c )=0 .08

Solución.

a) P(X>c )=0 .01 , entonces, c = 2.764

b) P(X≤c )=0 .995 , implica, P(X>c )=0 .005 , luego c = 3.169

c) P(X≤c )=0 .05 ,

d) P(−c≤X≤c )=0 . 95 , implica, P(X>c )=0 .025 , luego c =

e) Por interpolación se obtiene c = 1.548

Page 27: estadistica - probabilidades

27

Probabilidades y distribuciones de probabilidad..

2.7.4. Distribución F.Definición. Se dice que una variable aleatoria continúa X tiene distribución F con r1 y r2 grados de libertad y se representa por X ~ F(r1, r2), si su función de densidad es:

f ( x )=

Γ ( r1+r2

2 ) ·( r1

r2)r1 /2

Γ ( r1

2 )·Γ( r2

2 )·

xr1 /2−1

(1+ r1

r2

·x )( r1+r 2 )/2

, 0≤x<∞

donde r1 y r2 , son números enteros positivos. Su gráfica es la figura 3.8.

f(x)

1.0

F(2,4)

F(10,2)

0.5 F(12, 15)

X

0 1 2 3 4 5

Figura 2.10. Gráfica de la distribución F.

Si la variable aleatoria X ~ F(r1, r2), en la tabla de probabilidades F se puede encontrar

una probabilidad 1- o un valor F(1−α , r1 , r2) , mediante la relación:

P [X≤F(1−α, r1, r2 ]=1−α

Si U y V son dos variables aleatorias independientes tales que U ~ χ2 (r1)

y V ~ χ2(r 2) , entonces, la variable aleatoria:

X=U /r1

V /r2

tiene distribución F con r1 y r2 grados de libertad.

Page 28: estadistica - probabilidades

28

Probabilidades y distribuciones de probabilidad..

Para determinar valores de F correspondientes a áreas 1- = 0.005, 0.01, 0.025, 0.05, o

para determinar valores de F(1−α , r1 , r2)

<1 se usa el teorema siguiente:

Teorema. Si X ~ F(r1, r2), entonces, 1/ X tiene distribución F con grados de libertad r2 y r1, es decir,

F(1− α , r1 , r 2)

= 1F( α , r 2 , r1)

Ejemplo 2.34. Si X ~ F (4, 5) hallar:

a) P(X>11. 4 ) b) P(X≤7 .39 ) c) P(X≤8 ) d) P(X≤0 . 0645)

Solución.

a) P(X>11. 4 )= 0.01

b) P(X≤7 .39 )= 1- P(X>7 . 39 )=

c) Por interpolación: resulta P(X≤8 )=0 . 977

d) P(X≤0 . 0645)=1−P(X>0 . 0645 )

Debemos calcular P(X>0. 0645 ). En efecto, tenemos:

P(X>0. 0645 )=P[ 1X≤ 1

0 .0645 ]=P(X '≤15 . 50)=1−P(X '>15 .50 )=1−0 .010=0 . 99

donde X '= 1

X~ F (5,4 )

. Luego P(X≤0 . 0645)=1−P(X>0 . 0645 )=1−0 . 99=0 .01

Ejemplo 2.35. Si X ~ F (6, 10) , hallar el valor de c tal que:

a) P(X>c )=0 .01 b) P(X≤c )=0 .95 c) P(X≤c )=0 .025

Solución.

a) P(X>c )=0 .01 , entonces c = 5.39

b) De P(X≤c )=0 .95 , se obtiene P(X>c )=0 .05 , luego se tiene, c =

c) P(X≤c )=0 .025 , implica que P(X>c )=0 .975 .

c=F (0 . 975, 6, 10 )=1

F(0 .025 ,10 ,6 )= 1

5 . 46=0 .1831