alicia dickenstein
Post on 06-Feb-2016
38 Views
Preview:
DESCRIPTION
TRANSCRIPT
Alicia DickensteinAlicia Dickenstein
Probable menteSemana de la Semana de la Matemática 2005Matemática 2005
Por qué los casinos ganan siempre?
(sin hacer trampa)
Cómo tomar decisiones (favorables) sobre hechos que
suceden azarosamente?
Por qué los casinos ganan siempre? (sin hacer trampa)
Cómo tomar decisiones (favorables) sobre hechos que suceden azarosamente?
Teoría de probabilidades
Si tiramos una moneda no cargada
p(cara) = p(ceca) = 1/2
Si tiramos una moneda cargada:
p(cara) = 1 - p(ceca)
p(cara) p(ceca) % caras
1/2 1/2 50
1/4 3/4 25
1 0 100
p 1-p 100 p
Si tiramos dos monedas no cargadas:
p(2 caras) = p(2 cecas) = 1/4
p(1 cara y 1 ceca) =
Si tiramos dos monedas no cargadas:
p(2 caras) = p(2 cecas) = 1/4
p(1 cara y 1 ceca) = 1/2
…
Si hay 3 monedas no cargadas
…
…
p(3 caras) = 1/8
p(2 caras y 1 ceca)=
Si hay 3 monedas:
…
p(3 caras) = 1/8
p(2 caras y 1 ceca)= 3/8
Problema:
• Se tiene una moneda cargada,
con probabilidad p de salir cara y q = 1-
p de salir ceca
• p (y q) son desconocidas
• Cómo usar esta moneda cargada para hacer una apuesta justa
(pareja) entre dos personas?
(Una) respuesta:
• Se tira 2 veces la moneda sucesivamente, esto es considerado 1 tiro..
• Uno de los jugadores elige: primero cara y luego ceca, el otro elige primero ceca y luego cara.
• Se tira la moneda hasta que salgan 2 facetas distintas en un tiro (doble)
Por que es una apuesta justa?
p(cara-cara) = p. p = p2
p(ceca-ceca)= q. q = q2
p(cara-ceca)= p. q
P(ceca-cara)=q. p
• Ambos jugadores tienen probabilidad p.q = q.p de ganar
Notar que: p2 + q2 + 2 pq = (p+q)2 = 12 = 1
Pero…
• Cuál es el número esperado de tiros hasta que salgan dos facetas distintas??
Respuesta:
• En general, el número esperado E de tiradas para que se produzca un suceso con probabilidad u de suceder,
hasta que suceda es igual a 1/u• Porque:
• E = 1. u + (E+1)(1-u),
• y se despeja • E= 1/u.
• Ya que: o sucede en una tirada, o estamos en el punto de partida nuevamente, salvo que ya “pagamos una tirada”
En nuestro caso
• La probabilidad de que salgan dos facetas distintas en un tiro (doble) es:
• u = 2 p (1-p)
• Por lo tanto, el valor esperado del número de tiros hasta que salga cara-ceca o ceca-cara es:
• E = 1/ 2 p (1-p)
Por ejemplo:
p(cara) nro. esperado de tiros
1/2 2
¼ o 3/4 3
1/10 o 9/10 6
1/100 o 99/1000 51
1/1000 o 999/1000 501
1 o 0 (nunca sale ceca o nunca sale cara)
?
Los favoritos en los deportes
• Supongamos que el equipo argentino es tan bueno que tiene probabilidad de ganarle 7 de cada 10 veces a cualquier otro equipo del mundo, o sea la probabilidad p de que gane cualquier partido es
• p = 7/10
• Cuál es la probabilidad de ganar 4 partidos (octavos de final, cuartos de final, semifinal y
final)?
Respuesta:
(7/10)4 = 0, 2401
• O sea, la probabilidad de ganar cualquier partido individual es del 70% , pero la probabilidad de ganar los 4 es de menos del 25% (24,01%)
p1 es la probabilidad de ganar un partidop4 es la corresp. probabilidad de ganar los 4
p1 en % p4 en %
0,5 =1/2 50 0,0625 6,25
0,6 60 0,1296 ~ 13
0,7 70 0,2401 ~ 24
0,8 80 0,40 40
0,9 90 0,6561 ~ 65
~ 0,84 ~ 84 0,5 = 1/2 50
Para favorecer al favorito:
• Como en la NBA por ejemplo…
• Gana el equipo que gane el mayor numero de partidos entre 3, 5 o 7 partidos disputados entre los dos
equipos !
En porcentajes (aproximados):
Prob. de ganar 1 partidoX 100
Prob. de ganar al menos 2 de 3 x
100
Prob. de ganar al menos 3 de 5 x
100
Prob. de ganar al menos 4 de 7 x
100
60 65 68 71
70 78 84 87
50 50 50 50
40 35 32 29
La pregunta indiscreta
• Supongamos que se quiere conocer, por ejemplo, el porcentaje de adolescentes de
menos de 16 años que han probado alguna droga….
La pregunta indiscreta
• Supongamos que se quiere conocer, por ejemplo, el porcentaje de adolescentes de
menos de 16 años que han probado alguna droga….
• Puede estimarse este valor sin violar la privacidad de nadie?
• O sea, puede obtenerse informacion veraz de la población en general sin tener informacion
veraz de ningun individuo en particular?
Se entrega al entrevistado una moneda (no cargada) y el entrevistado se compromete a lanzar la moneda en privado
y de acuerdo al resultado:
• Si al tirar la moneda sale cara, responde
• SI,
• cualquiera sea la respuesta verdadera
• Si al tirar la moneda sale ceca, responde
• SI o NO,
• de acuerdo a la verdad.
Entonces, sin tener ninguna información sobre si un individuo que respondió SI, probó la droga o no, se puede
estimar
% de respuestas SI % de adolescentes que probaron la droga
60 20
65 30
50 0
80 60
La fórmula es:
• p(SI) = p(SI/ salio ceca) . ½ + p(SI/ salio cara). ½ = = p(SI/ salio ceca) ½ + 1. ½
• p(SI) se estima como
• p (SI) = nro. de respuestas SI/ nro total de entrevistados
• De donde:
• p(SI/ salio ceca) = 2. (p(SI) -1/2)• O bien:
• % de verdaderas respuestas SI = 2 (% de respuestas SI obtenidas – 50%).
Imaginemos un dado tetraedral...con caras A,T, C, G
TAGAGACGGGGGTTTCACAATGTTGGCCA
Al lanzarlo, se generan secuencias de ADN
>hg17_dna range=chr17:38464686-38473085 5'pad=0 3'pad=0 revComp=FALSE strand=? repeatMasking=noneATCCAGAAGTCTAGTATACATCTCAAAATTCATGCATCTGGCCGGGCACAGTGGCTCACACCTGCAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATTACCTGAGGTCAGGAGTTTAAGACCAGCCTGGCCAACATGGTAAAACCCCATCTCTACTAAAAATACAAGTATTAGCCAGGCATTGTGGCAGGTGCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAAAATCACTTGAACCGGGAGGCGGAGGTTGGAGTGAGCTGAGATCGTGCTACCGCACTCCATGCACTCTAGCCTGGGCAACAGAACGAGATGCTGTCACAACAACAACAACAACAACAACAACAACAACAACAACAACAACAAATTCTCACATCTAAAACAGAGTTCCTGGTTCCATTCCTGCTTCCTGCCTTTCCCACTCCCCCATATTCCCTACCATGCCTTCTTCATCTAATTTAATATTACTAACAAGATCTATTGTTCAAGCCAAAACCCAAGTGTCACTCCTTCAATTTCTCTTTACCTTATCCTCCAAATTTAATCCATTAGCAAGTCCTCTCTTCAAACCCATCCCAAACCAACCTTGTTTTTAACCATCTCCACACCACCAATTACCACAAGGATAAAATCTGAATTCCTTACCACCAAATACTATGTGATCTGGCCCTCATCTATGACCTTCTCCCATTCCTTGTGTAATCTCTGCCTCCACACATAATTTGCAAATTACTCCAGCTACACTGGCCTATTATTATTATTATTATTATTTTTGAGACGGAGTCTTGCTCTTTCGCCCAGCCTGGAGTGCAGTGGCGCAATCTCAGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCCCAGCCTCCCAAGTAGCTGTGATTACAGGCACATGCCACCATTCCCAGCTAATTTTTTTTTGTTTTTGAGATGGAGTTTCACTCTTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCTCAGCTCACCACAACCTCCACCTCCCGGGTTGATGAAGTGATTCTCTTGTCTCAGCCTCCCGTGTAGCTGGGATTAGAGGCACGCGCCACCACGCTGGGCAAATTTTTGTATTTTTAGTAGAGACAGGGTTTCTACCTCAGTGATCTGTCCGCCTTGACCTCCCAAAGTGCTGGGATTACAGGAATGAGCCACCACACCCAGCCGTGCCCAGCTAATTTTTGCATTTTTTAGTAGAGATGGGGTTTTGCCACGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGGGGATCTGCCTGCCTCGGCCTCCTAGAGTGCTGGAATTACAGGTGTGAGCCACTGTGCCCGAACCTTTTATCATTATTATTTCTTGAGACAGGAGTCTTGCTCTGTCGTTCAGGCTGGAGTGCAGTGATGCGATCTTGGCTCACTGTAACTCCTACCTTTCGGTTCAAGTGATTCTCCTGCCTCAGCCTCTGGAGTAGCTGGGATTACAGGCACTGGGATTACAGGCACACACCACCACACCATGCTAGTTTTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAAGTGATTTGCCTGCCTTGGCTTCCCAAAGTGCTGGGATTATAGGCACGAGCCACCACACACGACCAACATTGGCCTATCTTTTAAAAAATAAACCAAGCTCTGGCCGGGCACAGTGGCTCACACCTGTGATCCCAGCACTTTGGGAGGTTGAGGTGGTTGGATCACTTGAGTTCAGGAGTTTGAGACCAGCCTGACCAACGTGGTAAAACCCCATCTCTACTAAAAATAAAAACTAGTCGGGTGTGGTAGCACGCGTGCCTGTAATACCAGCTACTCAGGAGGCCAAGGCAGGAGAATTGCTTGAACCCAGGAGACAGAGTTTGCAGTGAGCCAAGATTGTGCCACTGCACTCCAGCCTGGGGGATAGAGGGAGACACCATCTCAAAAAAACCAAAATACAGAAATCAAAAAACCACACTCATTATTACCTCAAGACCTTTATGTTTGCTATTCCTCTGCCTATAAGATGCATTCCCTTCATTTTTCAAGGACAATTATTTCTTGTTATTTAGGTCTCAGCTCAATTTTTTCAGAAAGGCTTTCCCTGGCCTCCTTAAACGAAAGTAATCAACAACCTTTGACAGCTAATACTATTCCACTGTTCTGTATATTTCTCCATAGCATTTATTGTTATCTTAAATTCATCTTTATTGTGTATCTCCCCTCGACAGAACCTGAATCCTACCAGGGACTTAGTTAGTCTTATTTACTGTTGCATTCCTAGTGCCCAGAACACAGTAGGCTCCCAATAAATAGCCACTGAATAAAAGTTAAAACCAACAAAAATAATCATTTAATTAATTATGAATACATCGAATTGTGCACAATAGTTTATAAAATTACTTTTTTTTTTTTTTTAAGACAGGGTCTCATTCTGTCTCACAGGCTGGAGTGCAGTGGTGCAATCTAGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCCAGCAGCTAGGATTACAGGCACATGCCACCACGCTCGACTAATTTTTTTGTGTTTTTAGTAGAGACAAGGTTTCACCATGTTGACCAGGCTGGTCTCGAACTCCTGACCTCAAGTGATCCACCTGCCTTGGCCACTCAAAGTGCTGGGATTATAGGCATGAGCCACCACGCCTGGCCTATAAAATTACTTTCACATTTCATTTTGCCTGATCTGTTGTCACAGAAGTTCTCAGATGGCTGTTCTGAAATTATTCCTCCTCCTACACTCTATCTTATTTACTTCTCACTGTTCTCAGTATCATAAAGTGCAACATCTTTTTGAAGCAATCTGAATTATAAACAGATACATTTGCATGTATATATATGTATATATGCATATGCACACACACACTTTTTTTTTTTTAAGAGACAGGGTCTTGCTCTGTGCAAGTGCAAGAGTGCAATGGTATGATCATAGCTCACTGCAGCCTTGAACTCCTGGGCTCAAGTGATTCTTCTGGCTTAGCTTCCTCAGTAGCTAAGACTACAGAAGCACACTGCCATGCCCGGCTAATTAAAAAAAAATTTTGTGGAGACAGAGTCTCACTATGTTGCCCAGGCTGGTTTCAAACTCCTGGCCTCAAGTAATCTTCCTGTCTCAGCCTCCCAAAGGGCTGAGATTATAAGTGTGAGCCACTGCATCTGGACTGCATATTAATATGAAGAGCTTTTCTTCAACAACAGTGAACAGTTTTCTACAAAGGTATATGCAAGTGGGCCCACTTCTTGTTCTTATGAATCTTTTCTTTCCTTTTATAAAACTCCTTTTCCTTTCTCTTTTCCCCAAAGAAAGGACTGTTTCTTTTGAAATCTAGAACAAATGAGAACAGAGGATATCCTGGTTTGCGCTGCAAAATTTTTTTTTTTTTTAAGACGGAGTCTCGCTCTGTTGCCAGGTTGGAGTGCAGTGGCACGATCTTGGCTCATTGCAACCTCCACCTCCCGGGTTCAAGAGATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGAACTAAAGGCGCATGCCACCACGCTGAGTAATTTTTTGTATTTTAGTAGAGACAGGGTTTCACCATGTTGCCCAGGCTGATCTCGAACTCCTGAGCTCAGGCAATCTGCCTGTCTTGGCCTCCCACAGTGTTAGGATTACAGGCATGAGCCACTGCACCCGATTTTTTTTTTCTTTTGATGGAGTTTTGCTCTTGTTGCCCAGGTTAGAGTGCAATGATGCGATCTCAGCTCACTGCAACCCCCGCCTCCCAGGTTCAAGTGATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGAATTACAGGCAAGTGCCACCAAGCCCGGCTAATTTTGTATTTTTAGTAGAAACGGGGTTTCTCCATGTTGGTCAGGCTGGTCTTGAACTCCCGACATCAGGTGATCCAAGCGCCTCAGCCTCCCAAAGCGCTGGGATTATAGGTATGAGCCACAGTGCAGGCCTGCATAATTCTTGATGATCCTCATTATCATGGAAAATTTGTGCATTGTTAAGGAAAGTGGTGCATTGATGGAAGGAAGCAAATACATTTTTAACTATATGACTGAATGAATATCTCTGGTTAGTTTGTAACATCAAGTACTTACCTCATTCAGCATTTTTCTTTCTTTAATAGACTGGGTCACCCCTAAAGAGATCATAGAAAAGACAGGTTACATACAGCAGAAGAACGTGCTCTTTTCACGGAGATAGAGAGGTCAGCGATTCACAAAAGAGCACAGGAAGAATGACAGAGGAGAGGTCCTTCCCTCTAAAGCCACAGCCCTTTAATAAGGCTTGTAGCAGCAGTTTCCTTCTGGAGACAGAGTTGATGTTTAATTTAAACATTATAAGTTTGCCTGCTGCACATGGATTCCTGCCGACTATTAAATAAATCCCTAGCTCATATGCTAACATTGCTAGGAGCAGATTAGGTCCTATTAGTTATAAAAGAGACCCATTTTCCCAGCATCACCAGCTTATCTGAACAAAGTGATATTAAAGATAAAAGTAGTTTAGTATTACAATTAAAGACCTTTTGGTAACTCAGACTCAGCATCAGCAAAAACCTTAGGTGTTAAACGTTAGGTGTAAAAATGCAATTCTGAGGTGTTAAAGGGAGGAGGGGAGAAATAGTATTATACTTACAGAAATAGCTAACTACCCATTTTCCTCCCGCAATTCCTAGAAAATATTTCAGTGTCCGTTCACACACAAACTCAGCATCTGCAGAATGAAAAACACTCAAAGGATTAGAAGTTGAAAACAAAATCAGGAAGTGCTGTCCTAAGAAGCTAAAGAGCCTCAGTTTTTTACACTCCCAAGATCAATCTGGATTTATGATTCTAAAACCCCTGGTGACAGAATCAGAGGCTGAAAACACCACTAATTATAACCAGCAGGTATGGATATTTGGAAGTCTAGGGGAGGCTGATATGAAGTTAAGACCAGAGGAAATATCTGTCCACTCCCTCTTCTCAACACCCATCTTCTAGACGCCAAGGCTAGCTATAGATCTCCATTATAGTGTTCAAGGAATTAGGAATTATCCATGTCAATAGTTTTGATTAATGTGGACGGAGAACATCTATATTACTAGATGGCAATATGTGAAAGAAGAAAACAGTATTGTTGAAAACCTAAATCTGAAATGTCAATGTAATGACAAATTTTCACCCCTAGAATGTCTACCTGGGGAGTCCTAACCCTCTAATATTCCCCTGAGAGGGATGGGAGAATACAGTGCAGAGCTTTTATATAAGTATTTCAGAAAGCAGTAGCTAAAGAATCACTTGTTTATTTCCCAGTGTTTCAAAGGCCCTTCTGAAGAACTAAGCAAACTAAGGAAAGACCATTTAGTTTTAAACAGGAGAAATGTATTTAACTAAATCCTAAACACAGCAGGCTATCTGCAAGCAGCAGCAGCAGCAGCAGCCATGCTCCCTCACAGAATCCTTACAATTTTTGAAGTTTTTTGTTTAACTGCTACAAAAGCCGATTTAGTAACATTTATTACACTTAAAAACTTCAGTTCATTTGTAGTTCAAAGCAAATGTATTGGCTTTGAGTTTAAAGACTGAACTACTTTAGATTTGATTTGCATTTTTTTTTTTTTTTTTTTTTGAGATGCAGTCTTGCTCTGTCAGCCAGGCTGGAGTGCAGTGGCTGGATCTCAGCTCACGGCAAGCTCTGCCTCCTGGGTTCATGCCATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGATGCCCGCCACCATGCCCGGCTAATTTTTTGTATTTTTACTAGAGATGGGGTTTCACCGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCTGCCCGCCTTGGCCCCCCAAAGCGCTGGGATTACAGGCCTGAGCCACCACGCTTGGCATCTTTTTACCTTTCATTAACTTTGATGCAAACCTATAGCTTAAGGTATCTTAAACTTTAATGACATTTTTCTCTAAAATAGTAGTTTGTAATAACTTGTTCTGGCACCTGGCTCCAATGAACACTACCCTCTGACCCTGTGGTATAATTTTCATGAGTAAGTGGAAACCTAAGATCTTAGAAGTTCAACGGCAATGTGTCCAAGGGGTTTAGATCCTCTCCTTAAGTGCCTGTATCTCTGTGAAAAGAATCATCATAGGCTAGGCGCGATGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGTAGGTGGATCACCTGAGGTCGGGAGTCCAAGACCAGCCTGACTGACATGGAAAAACCCTGTCTCTACTAAAAATACAAAATTAGGTATGGTGGTGCATTCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGAGGGGGAGGTTGCAGCAAGCCAAGATCGTGCCATTGCACTCCAGCAGCCTGGGCAACAAGAGTGAAAAACTACACCTCAAAAACAAAAACAAAAACAAAAGAATCATCATCAAGTGAACTGGAACACATCCAGAGAACTAATTTTGTTAGAAAGATTTTAGAGTTGAGCCACACAATCTGCATCTTCTGCGTCCTCCATGCACTCGTCTGCTTTCTGGAGCCCCATGAGTGAGTCTTAATCCTGTTCCAGATAACAGTTCTCTTCCGGGTAACGGTTCTTCAGATACTTGAAGACAGTGTCTTATTTCCTTAAATCTTCTCATTTCTTCTTCAAAAGACAGTATTTCAAGTTACTTTTATGTATCTTTACCATCTACCTCTGGATAAACACTCTCCAATTTGTCAGTGACCATGTTAAAAACCAAGCACGGTGCTTAAAACTGACATCATCTTTCAGGCAATCACTCCATTGGAGAATACAGTGGGGCTCTGGATCTGTACTTCACTTGCTCCAGAGCCTCTGCTTGTGTTAATACGGCCCAGTTTCAAATAAGCATTTTTAGCAGCCCTGAAATGTGTACTCAGATTTAGTTTATAGTCAACTAAAAACACCCAGAGGTCTCCTGTATTACACAAGTTATAATTAAAACCTTAAAAGAGAAAGGTATAGGACAAATGATCTGTCTCCTCCCTTTTTTGCTTTTTCATATGTTAAGACTATCTCGGAGCTGTTATCAGACTTTTTTCCTGAAAAACTCTCAACAATACTCAAACTAGGTGTTACATGAAGCTGGGGTCTCCAGGTTTTGCCTCACTTGTTCTTTCTTTTGTTGTTGTTGAGACAGAGTCTCACTCTGTCGCCAGGCTGGAGTGCAGTGGCAGGATCTCAGCTGACTGCAACCTCAGCCTCCAGAGTTCAAGCAATTCTTCTGTGTCAGCCTCCCAAGTAGCTGGGATTACAGGTGCACACCACCACGCCCAGCCA
La secuencia de 42 bases
TTTAATTGAAAGAAGTTAATTGAATGAAAATGATC
AACTAAG
La secuencia de 42 bases
TTTAATTGAAAGAAGTTAATTGAATGAAAATGATC
AACTAAG
Está presente en el genoma de 10 vertebrados:Hombre, chimpancé, ratón, rata, perro, pollo, rana, pez, cebra, pez fugu, tetraodón
En: “The Mathematics of Phylogenomics”Lior Pachter and Bernd Sturmfels
http://arxiv.org/abs/math.ST/0409132
Ver también el libro: Algebraic Statistics for Computational BiologyCambridge University Press, 2005
• La probabilidad (de acuerdo al modelo de evolución de Jukes-Cantor) de que
esto haya ocurrido por azar es aproximadamente igual a:
10 -50 = 0, 0……..01
(50 cifras decimales)
Conjetura:
Esta secuencia de 42 bases estaba en un ancestro común a todos estos vertebrados
TAGAGACGGGGGTTTCACAATGTTGGCCA
Muchas gracias por venir!
Agradecemos a Agradecemos a Lior Pachter y Bernd SturmfelsLior Pachter y Bernd Sturmfelspor autorizarnos a reproducirpor autorizarnos a reproducir
la figura de su personajela figura de su personajeDiaNADiaNA
creado para su libro:creado para su libro:
Algebraic Statistics for Computational Biology
Cambridge University Press, 2005
top related