clase repaso bioestadistica urv 2010

Post on 24-Jun-2015

729 Views

Category:

Education

2 Downloads

Preview:

Click to see full reader

DESCRIPTION

Clase repaso bioestadistica URV 2010

TRANSCRIPT

Bioestadística FMCS Reus

Curs 2010-11 1

REPÀSPROBABILITAT

Bioestadística FMCS Reus

Curs 2010-11 2

Repàs probabilitat

elementsdtotalNombre

AticacaracterisambelementsNombreAp

'__

____)(

)(1)( ApAp

)()()()( BApBpApBAp

Bioestadística FMCS Reus

Curs 2010-11 3

Repàs probabilitat

)(

)()(

Bp

BApBAp

)()()()()( ABpApBApBpBAp

Bioestadística FMCS Reus

Curs 2010-11 4

Repàs probabilitat

)()()()()()()( 2211 kk ABpApABpApABpApBp

BABABAB k 21

A

A1B AkA2

Bioestadística FMCS Reus

Curs 2010-11 5

Repàs probabilitat

iii ABpAp

BAp

Bp

BApBAp

)()(

)(

)(

)()(

Teorema de Bayes:

Bioestadística FMCS Reus

Curs 2010-11 6

Exercici

La probabilitat de ser del grup A es d’un 40%

El 60% dels individus del grup A desenvolupen una malaltia

El 30% dels individus que no pertanyen al grup A desenvolupen una malaltia

Si agafem a l’atzar un individu malalt quina es la probabilitat que pertanyi al grup A?

Quina es la probabilitat de que un individu o pertany al grup A o estigui malalt (o les dues coses a la vegada)?

Bioestadística FMCS Reus

Curs 2010-11 7

Exercici

30'0)(;60'0)(;40'0)( AMpAMpAp

)()(

)(

)(

)()(

MApMAp

MAp

Mp

MApMAp

24,06'04'0)()()( AMpApMAp

5714'042'0

24'0

3'06'06'04'0

6'04'0

)()()()( MApMpApMAp

58'024'042'040'0

Bioestadística FMCS Reus

Curs 2010-11 8

REPÀSVARIABLE ALEATORIA

Bioestadística FMCS Reus

Curs 2010-11 9

Distribució Binomial

Un experiment binomial es aquell que compleix aquestes característiques:

N proves idèntiques A cada prova dos resultats possibles (Èxit o fracàs) La probabilitat d’èxit (p) o fracàs (1-p) es constant a cada prova El resultat de cada prova es independent al de altres proves El nostre interès estarà en la variable aleatòria X, el nombre

d'èxits a cada prova

xnxnx ppxXp -)1()(

Distribució binomial

X~B(n,p)

E(X)=np V(X)=np(1-p)

Bioestadística FMCS Reus

Curs 2010-11 10

Distribució Poisson

El nombre de successos que ocorren en un interval de temps, de longitud, de espai segueix una distribució de Poisson si

La probabilitat de un succés es la mateixa en tot l’interval La probabilitat de un succés no depèn dels successos

ocorreguts amb anterioritat

Distribució Poisson

X~P(λ) λ:Nombre mig de successos en un interval

E(X)=λ V(X)=λ

!)(

-

x

exXp

x

Bioestadística FMCS Reus

Curs 2010-11 11

Propietats Esperança i Variança

Propietats esperança: E(k) = k E(X+Y)=E(X)+E(Y) E(kX)=kE(X) E(k1X+k2Y)=k1E(X)+k2E(Y)

Propietats variança: V(k) = 0 V(X+Y)=V(X)+V(Y) V(kX)=k2V(X) V(k1X+k2Y)=k1

2V(X)+k22V(Y)

Bioestadística FMCS Reus

Curs 2010-11 12

Exercici

La probabilitat de una reacció al·lèrgica es del 1% Quina es la probabilitat de que en una mostra de

10 individus hi hagi alguna reacció al·lèrgica? Quina es la probabilitat de que en una mostra de

100 individus hi hagi mes de 3 reaccions al·lèrgiques?

Bioestadística FMCS Reus

Curs 2010-11 13

Exercici

N=10P=0’01 X: Nombre de persones amb reacció al·lèrgica X~B(10,0’01)

P(X≥1)= 1-P(X=0) = 1 – 0’9044 = 0’0966

Quina es la probabilitat de que en una mostra de 10 individus hi hagi alguna reacció al·lèrgica?

Bioestadística FMCS Reus

Curs 2010-11 14

Exercici

N=120 P=0’01 X: Nombre de persones amb reacció al·lèrgica X~B(120,0’01)

X~B(120,0’01)

N gran

X~Poisson(λ=120·0’01)X~Poisson(λ=1’2)

Quina es la probabilitat de que en una mostra de 100 individus hi hagi mes de 3 reaccions al·lèrgiques?

Bioestadística FMCS Reus

Curs 2010-11 15

Exercici

X~Poisson(λ=1’2)

p(X>2) = 1 – [ p(X=0) + p(X=1) + p(X=2) ] =

= 1 – [ 0’3012 + 0’3614 + 0’2169] =

= 1 – 0’8795 = 0’1205

Bioestadística FMCS Reus

Curs 2010-11 16

Distribución normal o de Gauss

Està caracteritzada per dos paràmetres:

La mitjana, μ, la desviació típica, σ.

σ

)μx(21

2

2

eπ2σ

1=)x(f

--

X ~ N( µ, σ)

Bioestadística FMCS Reus

Curs 2010-11 17

);(N∈X σμ

0 µ xi

σ P (x ≥ x i)

)1;0(NZ ∈

1 P (z ≥ zi)

0

-X

Z

P(X>a)

a

P(Z > (a-µ) / σ )

a-µ

σ

Bioestadística FMCS Reus

Curs 2010-11 18

Distribución normal o de Gauss

P(a≤X≤b)=p(X≥a) – p(X≥b)

P(Z>-a) = p(Z<a)

P(Z<a) = 1 - p(Z>a)

P(Z>-a) = 1 - p(Z>a)

Bioestadística FMCS Reus

Curs 2010-11 19

Exercici

El pes de les persones d'una determinada població es distribueix normalment amb una mitjana de 80 kg. i una desviació típica 10 kg.

1. Quina és la probabilitat de que una persona pesi entre 70 i 85 kg?

2. Quina és la probabilitat de que una persona pesi més de 95 Km

Bioestadística FMCS Reus

Curs 2010-11 20

Exercici

X~N(80,10) Z~N(0,1)10

80-- XXZ

a a - 80

10

P(X>a) P(Z > (a-80) / 10 )

1) P(70>X>85)

2) P(X>95)

Bioestadística FMCS Reus

Curs 2010-11 21

Exercici

10

80X10

80X10

8070

X: N(80,10)

P(70 < X < 85) = P (X > 70) – P (X >85) =

= P ( > ) - P ( > )

= P (Z > -1) – P (Z > 0’5) =

= [1 – P(Z>1)] – P(Z>0’5) =

10

8085

Bioestadística FMCS Reus

Curs 2010-11 22

P(z) 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,4960 0,4920 0,4880 0,4841 0,4801 0,4761 0,4721 0,4681 0,4641

0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

0,2 0,4207 0,4168 0,4129 0,4091 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483

0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776

0,6 0,2743 0,2709 0,2676 0,2644 0,2611 0,2579 0,2546 0,2514 0,2483 0,2451

0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2207 0,2177 0,2148

0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

1,0 0,1587 0,1563 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170

1,2 0,1151 0,1131 0,1112 0,1094 0,1075 0,1057 0,1038 0,1020 0,1003 0,0985

1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823

1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681

1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455

1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367

1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294

1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

Distribució normal (0;1) P ( X ≥ a ) a

Bioestadística FMCS Reus

Curs 2010-11 23

Exercici

10

80X10

80X10

8070

X: N(80,10)

P(70 < X < 85) = P (X > 70) – P (X >85) =

= P ( > ) - P ( > )

= P (Z > -1) – P (Z > 0’5) =

= [1 – P(Z>1)] – P(Z>0’5) =

= [1 – 0’1687] – 0’3086 = 0’8313 – 0’3086 = 0’5227

10

8085

Bioestadística FMCS Reus

Curs 2010-11 24

Exercici

10

80X10

8095

X: N(80,10)

P (X > 95) =

= P ( > )

= P (Z > 1’5) = 0’0668

Bioestadística FMCS Reus

Curs 2010-11 25

P(z) 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,4960 0,4920 0,4880 0,4841 0,4801 0,4761 0,4721 0,4681 0,4641

0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

0,2 0,4207 0,4168 0,4129 0,4091 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483

0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776

0,6 0,2743 0,2709 0,2676 0,2644 0,2611 0,2579 0,2546 0,2514 0,2483 0,2451

0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2207 0,2177 0,2148

0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

1,0 0,1587 0,1563 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170

1,2 0,1151 0,1131 0,1112 0,1094 0,1075 0,1057 0,1038 0,1020 0,1003 0,0985

1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823

1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681

1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455

1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367

1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294

1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233

Distribució normal (0;1) P ( X ≥ a ) a

Bioestadística FMCS Reus

Curs 2010-11 26

REPÀSPROVES D’HIPÒTESIS

Bioestadística FMCS Reus

Curs 2010-11 27

Repas proves d’hipòtesi

Una prova d’hipòtesis consta de quatre elements:

Hipòtesis Nul·la (H0) Hipòtesis alternativa (Hα) El estadístic de la prova La regió de rebuig o regió crítica

Bioestadística FMCS Reus

Curs 2010-11 28

Repàs proves d’hipòtesi

• Hipòtesis Nul·la (H0) H0: µ = a

• Hipòtesis alternativa (Hα) Hα : µ ≠ a

• El estadístic de la prova (σ coneguda)

• Sota la hipòtesi H0 certa

• La regió de rebuig o regió crítica

Rebuig de H0 si z Є (-∞,-zα/2) o z Є (zα/2,∞)

Acceptació de H0 si z Є (-zα/2,zα/2)

Si α=0.05 z α/2= z 0.025=1.96

nNX ,:

)1,0(-X-X

2N

n

EEZ

EE: Desviació estándar de la mitjana.

Bioestadística FMCS Reus

Curs 2010-11 29

Repàs proves d’hipòtesi

• Hipòtesis Nul·la (H0) H0: µ ≤ a

• Hipòtesis alternativa (Hα) Hα : µ > a

• El estadístic de la prova (σ coneguda)

• Sota la hipòtesi H0 certa

• La regió de rebuig o regió crítica

Rebuig de H0 si z Є (zα,∞)

Acceptació de H0 si z Є (-∞,zα)

Si α=0.05 z α= z 0.05=1.645

nNX ,:

)1,0(-X-X

2N

n

EEZ

EE: Desviació estándar de la mitjana.

Bioestadística FMCS Reus

Curs 2010-11 30

Contrastos unilateral i bilateral

La posició de la regió crítica depèn de com es facin les hipòtesis.

Unilateral Unilateral

Bilateral

H0: µ ≤ aH1: µ ≥ a

H0: µ ≥ aH1: µ ≤ a

H0: µ = aH1: µ ≠ a

- z/2 z/2

- z z

Bioestadística FMCS Reus

Curs 2010-11 31

Exercici

Sigui X una variable aleatòria amb desviació Standard = 2

Volem testar:

• Si la mitjana de X es 40

• Si la mitjana de X es igual o menor que 40

Agafem una mostra de 16 elements.

Calculem la seva mitjana i ens dona 40’90

Bioestadística FMCS Reus

Curs 2010-11 32

Exercici

• Hipòtesis Nul·la (H0) H0: µ = 40 H0: µ ≤ 40

• Hipòtesis alternativa (Hα) Hα : µ ≠ 40 Hα : µ > 40

• El estadístic de la prova (σ coneguda)

• Sota la hipòtesi H0 certa 162,40: NX

)1,0(

162

04-X-X22

N

n

Z

8'15'0

90'0

162

4090'40

90'40

2

z

X

Bioestadística FMCS Reus

Curs 2010-11 33

Exercici

Pel test bilateral, la regió de rebuig o regió crítica es:

Rebuig de H0 si z Є (-∞,-zα/2) o z Є (zα/2,∞)

Acceptació de H0 si z Є (-zα/2,zα/2)

Si α=0.05 z α/2= z 0.025=1.96

Rebuig de H0 si z Є (-∞, -1’96) o z Є (1’96,∞)

Acceptació de H0 si z Є (-1’96,1’96)

1’80 esta dintre de la regió de acceptació.

Acceptem la hipòtesi nul·la, la mitjana es igual a 40

Bioestadística FMCS Reus

Curs 2010-11 34

Exercici

Pel test unilateral, la regió de rebuig o regió crítica és:

Rebuig de H0 si z Є (zα,∞)

Acceptació de H0 si z Є (-∞ ,zα)

Si α=0.05 z α= z 0.25=1.645

Rebuig de H0 si z Є (1’645,∞)

Acceptació de H0 si z Є (-∞, -1’645)

1’80 esta dintre de la regió de rebuig.

Rebutgem la hipòtesi nul·la,

Acceptem hipòtesi alternativa, la mitjana es major que 40

Bioestadística FMCS Reus

Curs 2010-11 35

Tipus de error, poder i nivell de confiança

DecisióPoblació real

H0 és falsa H0 és certa

Es refusa la H0 Decisió correcte1- (poder)

Risc (error tipus I)

No es refusa la H0 Risc (error tipus II)

Decisió correcte1- (confiança)

[ ] [ ]certaésH|HrefusarobPr=ItipuserroruncometreobPr=α 00

[ ] [ ]falsaésH|HrefusaesnoobPr=IItipuserroruncometreobPr=β 00

[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00

1- és el nivell de confiança

[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00

1- és el nivell de confiança

[ ] [ ]falsaésH|HrefusaesnoobPr=IItipuserroruncometreobPr=β 00

[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00

1- és el nivell de confiança

[ ] [ ]certaésH|HrefusarobPr=ItipuserroruncometreobPr=α 00

[ ] [ ]falsaésH|HrefusaesnoobPr=IItipuserroruncometreobPr=β 00

[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00

1- és el nivell de confiança

[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00

1- és el nivell de confiança

Bioestadística FMCS Reus

Curs 2010-11 36

Contrast per al paràmetre p

n

p1p

ppz

oo

o

- z

1 -

z

1 -

- z/2 z/2

1 -

Hipòtesi nul·la

Ha

Hipòtesi alternativa

Ha

Tipus de contrast

Estadístic de contrast

Regió d’acceptació

P = Po P ≠ pobilater

al

segueix una llei N(0,1)

(-z/2,z/2)

P po P > pounilater

al(-∞,z)

P ≥ po P < ppunilater

al(-z,+∞)

Bioestadística FMCS Reus

Curs 2010-11 37

REPÀSCOMPARACIÓ DUES

MITJANES

Bioestadística FMCS Reus

Curs 2010-11 38

Resum de la comparació de dues mitjanes observades• Hipòtesis Nul·la (H0) H0: µA- µB = 0• Hipòtesis alternativa (Hα) Hα : µA- µB ≠ 0• El estadístic de la prova

• Sota la hipòtesi H0 certa

• La distribució del estadístic de la prova i la formula del estimador de EE depèn de:

• La mida de les mostres• La normalitat de X en els dos grups• La variança de X sigui igual en els grups

^^

BA XX

EE

d

EE

EE: Desviació estándar de la diferencia de mitjanes

Bioestadística FMCS Reus

Curs 2010-11 39

Resum de la comparació de dues mitjanes observadesEstratègia:

coneguda (1) desconeguda

nA i nB 30 (2) nA i/o nB < 30

Distribució Normalvariàncies homogènies (2

A = 2B) (3)

variàncies NO homogènies (2A 2

B)(4) Distribució no Normal proves no paramètriques

Bioestadística FMCS Reus

Curs 2010-11 40

1 coneguda

2 desconeguda, n gran

3 desconeguda, n petita, X normal, 2A = 2

B

desconeguda, n petita, X normal, 2A 2

B

EEBA nnBA 22

+ = EE B

2

A

2

ns

ns BA

EE BA n

sns

22

ˆˆ

2 - +

2BB

2AA

= nn

s1)-n(+s1)-n( s

BA

2

)1,0(NEE

dZ

)1,0()2( _ NnntEE

dT grann

bA

)2( bA nntEE

dT

Bioestadística FMCS Reus

Curs 2010-11 41

Exercici

Un grup de 16 individus que segueix una dieta A te una mitjana de IMC de 27 amb una desviació estàndard de 4.

Un grup de 13 individus que segueix una dieta B te una mitjana de IMC de 27 amb una desviació estàndard de 5.

Tenen els dos grups el mateix IMC amb una significació α=0’05 ?

Quin es el grau de significació?

Bioestadística FMCS Reus

Curs 2010-11 42

• Hipòtesis Nul·la (H0) H0: µA- µB = 0• Hipòtesis alternativa (Hα) Hα : µA- µB ≠ 0• El estadístic de la prova

• Sota la hipòtesi H0 certa

• Situació: desconeguda • n petita, • X normal, 2

A = 2B

^^

BA XX

EE

d

EE

EE: Desviació estándar de la diferencia de mitjanes

Exercici

Bioestadística FMCS Reus

Curs 2010-11 43

desconeguda, n petita, X normal, 2A = 2

B

EE BA n

sns

22

ˆˆ

2 - +

2BB

2AA

= nn

s1)-n(+s1)-n( s

BA

2

)2( bA nntEE

dT

Exercici

Bioestadística FMCS Reus

Curs 2010-11 44

Resultats

Estimació de la variància comuna (2) a partir de la mitjana ponderada pels graus de llibertat de les variàncies s2

A i s2B

'444427

120

2 - 13 165 1)-(134 1)-(16

s2

5;B 23; ;31

4;A 27; ;61

sXn

sXn

2

BB

2

AA

27 2 - 13 16 gl

Bioestadística FMCS Reus

Curs 2010-11 45

+ = EE ns

ns

O

2

P

2

Càlcul de l’Error Estàndard

1'659 13

16

EE 4'4444'444

22

Bioestadística FMCS Reus

Curs 2010-11 46

-

EE

d t ⇒

- d

tyy

yy

27

O

2

P

2

O P

O P

ns

ns

Càlcul de l’estadístic de contrast: t de Student

2'411 1'659

4 t ⇒

432-72 d

Bioestadística FMCS Reus

Curs 2010-11 47

Resultats

El grau de significació es aquell valor de α tal que

411,22

,27t

La regió critica o de rebuig serRebuig de H0 si t Є (-∞,-t 27,α/2) o t Є (t27,α/2 ,∞)

Acceptació de H0 si t Є (-t27,α/2 ,t27,α/2 )

Si α=0.05 t27,α/2= t27,0.025=2’0518

2’2411 esta en la regió critica,

Rebutgem H0, les mitjanes del IMC en el grup A i el grup B no es poden considerar iguals

top related