Title: Alicia Dickenstein
1Probable mente Semana de la Matemática 2005
2- Por qué los casinos ganan siempre?
- (sin hacer trampa)
3 Cómo tomar decisiones (favorables) sobre hechos
que suceden azarosamente?
4Por qué los casinos ganan siempre? (sin hacer
trampa) Cómo tomar decisiones (favorables)
sobre hechos que suceden azarosamente? Teoría
de probabilidades
5Si tiramos una moneda no cargada
p(cara) p(ceca) 1/2
6Si tiramos una moneda cargada
p(cara) 1 - p(ceca)
p(cara) p(ceca) caras
1/2 1/2 50
1/4 3/4 25
1 0 100
p 1-p 100 p
7Si tiramos dos monedas no cargadas
p(2 caras) p(2 cecas) 1/4
p(1 cara y 1 ceca)
8Si tiramos dos monedas no cargadas
p(2 caras) p(2 cecas) 1/4
p(1 cara y 1 ceca) 1/2
9Si hay 3 monedas no cargadas
10p(3 caras) 1/8
p(2 caras y 1 ceca)
11Si hay 3 monedas
p(3 caras) 1/8
p(2 caras y 1 ceca) 3/8
12Problema
- Se tiene una moneda cargada, con probabilidad p
de salir cara y q 1-p de salir ceca - p (y q) son desconocidas
- Cómo usar esta moneda cargada para hacer una
apuesta justa (pareja) entre dos personas?
13(Una) respuesta
- Se tira 2 veces la moneda sucesivamente, esto es
considerado 1 tiro.. - Uno de los jugadores elige primero cara y luego
ceca, el otro elige primero ceca y luego cara. - Se tira la moneda hasta que salgan 2 facetas
distintas en un tiro (doble)
14Por que es una apuesta justa?
- p(cara-cara) p. p p2
- p(ceca-ceca) q. q q2
- p(cara-ceca) p. q
- P(ceca-cara)q. p
- Ambos jugadores tienen probabilidad p.q q.p de
ganar
Notar que p2 q2 2 pq (pq)2 12 1
15Pero
- Cuál es el número esperado de tiros hasta que
salgan dos facetas distintas??
16Respuesta
- En general, el número esperado E de tiradas para
que se produzca un suceso con probabilidad u de
suceder, hasta que suceda es igual a 1/u - Porque
- E 1. u (E1)(1-u),
- y se despeja
- E 1/u.
- Ya que o sucede en una tirada, o estamos en el
punto de partida nuevamente, salvo que ya
pagamos una tirada
17En nuestro caso
- La probabilidad de que salgan dos facetas
distintas en un tiro (doble) es - u 2 p (1-p)
- Por lo tanto, el valor esperado del número de
tiros hasta que salga cara-ceca o ceca-cara es - E 1/ 2 p (1-p)
18Por ejemplo
p(cara) nro. esperado de tiros
1/2 2
¼ o 3/4 3
1/10 o 9/10 6
1/100 o 99/1000 51
1/1000 o 999/1000 501
1 o 0 (nunca sale ceca o nunca sale cara) ?
19Los favoritos en los deportes
- Supongamos que el equipo argentino es tan bueno
que tiene probabilidad de ganarle 7 de cada 10
veces a cualquier otro equipo del mundo, o sea la
probabilidad p de que gane cualquier partido es - p 7/10
- Cuál es la probabilidad de ganar 4 partidos
(octavos de final, cuartos de final, semifinal y
final)?
20Respuesta
- (7/10)4 0, 2401
- O sea, la probabilidad de ganar cualquier partido
individual es del 70 , pero la probabilidad de
ganar los 4 es de menos del 25 (24,01)
21p1 es la probabilidad de ganar un partidop4 es
la corresp. probabilidad de ganar los 4
p1 en p4 en
0,5 1/2 50 0,0625 6,25
0,6 60 0,1296 13
0,7 70 0,2401 24
0,8 80 0,40 40
0,9 90 0,6561 65
0,84 84 0,5 1/2 50
22Para favorecer al favorito
- Como en la NBA por ejemplo
- Gana el equipo que gane el mayor numero de
partidos entre 3, 5 o 7 partidos disputados entre
los dos equipos !
23En porcentajes (aproximados)
Prob. de ganar 1 partido X 100 Prob. de ganar al menos 2 de 3 x 100 Prob. de ganar al menos 3 de 5 x 100 Prob. de ganar al menos 4 de 7 x 100
60 65 68 71
70 78 84 87
50 50 50 50
40 35 32 29
24La pregunta indiscreta
- Supongamos que se quiere conocer, por ejemplo, el
porcentaje de adolescentes de menos de 16 años
que han probado alguna droga.
25La pregunta indiscreta
- Supongamos que se quiere conocer, por ejemplo, el
porcentaje de adolescentes de menos de 16 años
que han probado alguna droga. - Puede estimarse este valor sin violar la
privacidad de nadie? - O sea, puede obtenerse informacion veraz de la
población en general sin tener informacion veraz
de ningun individuo en particular?
26Se entrega al entrevistado una moneda (no
cargada) y el entrevistado se compromete a lanzar
la moneda en privado y de acuerdo al resultado
- Si al tirar la moneda sale cara, responde
- SI,
- cualquiera sea la respuesta verdadera
- Si al tirar la moneda sale ceca, responde
- SI o NO,
- de acuerdo a la verdad.
27Entonces, sin tener ninguna información sobre si
un individuo que respondió SI, probó la droga o
no, se puede estimar
de respuestas SI de adolescentes que probaron la droga
60 20
65 30
50 0
80 60
28La fórmula es
- p(SI) p(SI/ salio ceca) . ½ p(SI/ salio
cara). ½ - p(SI/ salio ceca) ½ 1. ½
- p(SI) se estima como
- p (SI) nro. de respuestas SI/ nro total de
entrevistados - De donde
- p(SI/ salio ceca) 2. (p(SI) -1/2)
- O bien
- de verdaderas respuestas SI 2 ( de
respuestas SI obtenidas 50).
29Imaginemos un dado tetraedral... con caras A,T,
C, G
30gthg17_dna rangechr1738464686-38473085 5'pad0
3'pad0 revCompFALSE strand? repeatMaskingnoneA
TCCAGAAGTCTAGTATACATCTCAAAATTCATGCATCTGGCCGGGCACAG
TGGCTCACACCTGCAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATT
ACCTGAGGTCAGGAGTTTAAGACCAGCCTGGCCAACATGGTAAAACCCCA
TCTCTACTAAAAATACAAGTATTAGCCAGGCATTGTGGCAGGTGCCTGTA
ATCCCAGCTACTCGGGAGGCTGAGGCAGGAAAATCACTTGAACCGGGAGG
CGGAGGTTGGAGTGAGCTGAGATCGTGCTACCGCACTCCATGCACTCTAG
CCTGGGCAACAGAACGAGATGCTGTCACAACAACAACAACAACAACAACA
ACAACAACAACAACAACAACAAATTCTCACATCTAAAACAGAGTTCCTGG
TTCCATTCCTGCTTCCTGCCTTTCCCACTCCCCCATATTCCCTACCATGC
CTTCTTCATCTAATTTAATATTACTAACAAGATCTATTGTTCAAGCCAAA
ACCCAAGTGTCACTCCTTCAATTTCTCTTTACCTTATCCTCCAAATTTAA
TCCATTAGCAAGTCCTCTCTTCAAACCCATCCCAAACCAACCTTGTTTTT
AACCATCTCCACACCACCAATTACCACAAGGATAAAATCTGAATTCCTTA
CCACCAAATACTATGTGATCTGGCCCTCATCTATGACCTTCTCCCATTCC
TTGTGTAATCTCTGCCTCCACACATAATTTGCAAATTACTCCAGCTACAC
TGGCCTATTATTATTATTATTATTATTTTTGAGACGGAGTCTTGCTCTTT
CGCCCAGCCTGGAGTGCAGTGGCGCAATCTCAGCTCACTGCAATCTCCGC
CTCCTGGGTTCAAGCGATTCTCCTGCCCCAGCCTCCCAAGTAGCTGTGAT
TACAGGCACATGCCACCATTCCCAGCTAATTTTTTTTTGTTTTTGAGATG
GAGTTTCACTCTTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCTCAGCT
CACCACAACCTCCACCTCCCGGGTTGATGAAGTGATTCTCTTGTCTCAGC
CTCCCGTGTAGCTGGGATTAGAGGCACGCGCCACCACGCTGGGCAAATTT
TTGTATTTTTAGTAGAGACAGGGTTTCTACCTCAGTGATCTGTCCGCCTT
GACCTCCCAAAGTGCTGGGATTACAGGAATGAGCCACCACACCCAGCCGT
GCCCAGCTAATTTTTGCATTTTTTAGTAGAGATGGGGTTTTGCCACGTTG
GCCAGGCTGGTCTCAAACTCCTGACCTCAGGGGATCTGCCTGCCTCGGCC
TCCTAGAGTGCTGGAATTACAGGTGTGAGCCACTGTGCCCGAACCTTTTA
TCATTATTATTTCTTGAGACAGGAGTCTTGCTCTGTCGTTCAGGCTGGAG
TGCAGTGATGCGATCTTGGCTCACTGTAACTCCTACCTTTCGGTTCAAGT
GATTCTCCTGCCTCAGCCTCTGGAGTAGCTGGGATTACAGGCACTGGGAT
TACAGGCACACACCACCACACCATGCTAGTTTTTTGTATTTTTAGTAGAG
ATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAAG
TGATTTGCCTGCCTTGGCTTCCCAAAGTGCTGGGATTATAGGCACGAGCC
ACCACACACGACCAACATTGGCCTATCTTTTAAAAAATAAACCAAGCTCT
GGCCGGGCACAGTGGCTCACACCTGTGATCCCAGCACTTTGGGAGGTTGA
GGTGGTTGGATCACTTGAGTTCAGGAGTTTGAGACCAGCCTGACCAACGT
GGTAAAACCCCATCTCTACTAAAAATAAAAACTAGTCGGGTGTGGTAGCA
CGCGTGCCTGTAATACCAGCTACTCAGGAGGCCAAGGCAGGAGAATTGCT
TGAACCCAGGAGACAGAGTTTGCAGTGAGCCAAGATTGTGCCACTGCACT
CCAGCCTGGGGGATAGAGGGAGACACCATCTCAAAAAAACCAAAATACAG
AAATCAAAAAACCACACTCATTATTACCTCAAGACCTTTATGTTTGCTAT
TCCTCTGCCTATAAGATGCATTCCCTTCATTTTTCAAGGACAATTATTTC
TTGTTATTTAGGTCTCAGCTCAATTTTTTCAGAAAGGCTTTCCCTGGCCT
CCTTAAACGAAAGTAATCAACAACCTTTGACAGCTAATACTATTCCACTG
TTCTGTATATTTCTCCATAGCATTTATTGTTATCTTAAATTCATCTTTAT
TGTGTATCTCCCCTCGACAGAACCTGAATCCTACCAGGGACTTAGTTAGT
CTTATTTACTGTTGCATTCCTAGTGCCCAGAACACAGTAGGCTCCCAATA
AATAGCCACTGAATAAAAGTTAAAACCAACAAAAATAATCATTTAATTAA
TTATGAATACATCGAATTGTGCACAATAGTTTATAAAATTACTTTTTTTT
TTTTTTTAAGACAGGGTCTCATTCTGTCTCACAGGCTGGAGTGCAGTGGT
GCAATCTAGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGTGATTCTCC
TGCCTCAGCCTCCCCAGCAGCTAGGATTACAGGCACATGCCACCACGCTC
GACTAATTTTTTTGTGTTTTTAGTAGAGACAAGGTTTCACCATGTTGACC
AGGCTGGTCTCGAACTCCTGACCTCAAGTGATCCACCTGCCTTGGCCACT
CAAAGTGCTGGGATTATAGGCATGAGCCACCACGCCTGGCCTATAAAATT
ACTTTCACATTTCATTTTGCCTGATCTGTTGTCACAGAAGTTCTCAGATG
GCTGTTCTGAAATTATTCCTCCTCCTACACTCTATCTTATTTACTTCTCA
CTGTTCTCAGTATCATAAAGTGCAACATCTTTTTGAAGCAATCTGAATTA
TAAACAGATACATTTGCATGTATATATATGTATATATGCATATGCACACA
CACACTTTTTTTTTTTTAAGAGACAGGGTCTTGCTCTGTGCAAGTGCAAG
AGTGCAATGGTATGATCATAGCTCACTGCAGCCTTGAACTCCTGGGCTCA
AGTGATTCTTCTGGCTTAGCTTCCTCAGTAGCTAAGACTACAGAAGCACA
CTGCCATGCCCGGCTAATTAAAAAAAAATTTTGTGGAGACAGAGTCTCAC
TATGTTGCCCAGGCTGGTTTCAAACTCCTGGCCTCAAGTAATCTTCCTGT
CTCAGCCTCCCAAAGGGCTGAGATTATAAGTGTGAGCCACTGCATCTGGA
CTGCATATTAATATGAAGAGCTTTTCTTCAACAACAGTGAACAGTTTTCT
ACAAAGGTATATGCAAGTGGGCCCACTTCTTGTTCTTATGAATCTTTTCT
TTCCTTTTATAAAACTCCTTTTCCTTTCTCTTTTCCCCAAAGAAAGGACT
GTTTCTTTTGAAATCTAGAACAAATGAGAACAGAGGATATCCTGGTTTGC
GCTGCAAAATTTTTTTTTTTTTTAAGACGGAGTCTCGCTCTGTTGCCAGG
TTGGAGTGCAGTGGCACGATCTTGGCTCATTGCAACCTCCACCTCCCGGG
TTCAAGAGATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGAACTAAAGGCG
CATGCCACCACGCTGAGTAATTTTTTGTATTTTAGTAGAGACAGGGTTTC
ACCATGTTGCCCAGGCTGATCTCGAACTCCTGAGCTCAGGCAATCTGCCT
GTCTTGGCCTCCCACAGTGTTAGGATTACAGGCATGAGCCACTGCACCCG
ATTTTTTTTTTCTTTTGATGGAGTTTTGCTCTTGTTGCCCAGGTTAGAGT
GCAATGATGCGATCTCAGCTCACTGCAACCCCCGCCTCCCAGGTTCAAGT
GATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGAATTACAGGCAAGTGCCA
CCAAGCCCGGCTAATTTTGTATTTTTAGTAGAAACGGGGTTTCTCCATGT
TGGTCAGGCTGGTCTTGAACTCCCGACATCAGGTGATCCAAGCGCCTCAG
CCTCCCAAAGCGCTGGGATTATAGGTATGAGCCACAGTGCAGGCCTGCAT
AATTCTTGATGATCCTCATTATCATGGAAAATTTGTGCATTGTTAAGGAA
AGTGGTGCATTGATGGAAGGAAGCAAATACATTTTTAACTATATGACTGA
ATGAATATCTCTGGTTAGTTTGTAACATCAAGTACTTACCTCATTCAGCA
TTTTTCTTTCTTTAATAGACTGGGTCACCCCTAAAGAGATCATAGAAAAG
ACAGGTTACATACAGCAGAAGAACGTGCTCTTTTCACGGAGATAGAGAGG
TCAGCGATTCACAAAAGAGCACAGGAAGAATGACAGAGGAGAGGTCCTTC
CCTCTAAAGCCACAGCCCTTTAATAAGGCTTGTAGCAGCAGTTTCCTTCT
GGAGACAGAGTTGATGTTTAATTTAAACATTATAAGTTTGCCTGCTGCAC
ATGGATTCCTGCCGACTATTAAATAAATCCCTAGCTCATATGCTAACATT
GCTAGGAGCAGATTAGGTCCTATTAGTTATAAAAGAGACCCATTTTCCCA
GCATCACCAGCTTATCTGAACAAAGTGATATTAAAGATAAAAGTAGTTTA
GTATTACAATTAAAGACCTTTTGGTAACTCAGACTCAGCATCAGCAAAAA
CCTTAGGTGTTAAACGTTAGGTGTAAAAATGCAATTCTGAGGTGTTAAAG
GGAGGAGGGGAGAAATAGTATTATACTTACAGAAATAGCTAACTACCCAT
TTTCCTCCCGCAATTCCTAGAAAATATTTCAGTGTCCGTTCACACACAAA
CTCAGCATCTGCAGAATGAAAAACACTCAAAGGATTAGAAGTTGAAAACA
AAATCAGGAAGTGCTGTCCTAAGAAGCTAAAGAGCCTCAGTTTTTTACAC
TCCCAAGATCAATCTGGATTTATGATTCTAAAACCCCTGGTGACAGAATC
AGAGGCTGAAAACACCACTAATTATAACCAGCAGGTATGGATATTTGGAA
GTCTAGGGGAGGCTGA TATGAAGTTAAGACCAGAGGAAATATCTGTCCA
CTCCCTCTTCTCAACACCCATCTTCTAGACGCCAAGGCTAGCTATAGATC
TCCATTATAGTGTTCAAGGAATTAGGAATTATCCATGTCAATAGTTTTGA
TTAATGTGGACGGAGAACATCTATATTACTAGATGGCAATATGTGAAAGA
AGAAAACAGTATTGTTGAAAACCTAAATCTGAAATGTCAATGTAATGACA
AATTTTCACCCCTAGAATGTCTACCTGGGGAGTCCTAACCCTCTAATATT
CCCCTGAGAGGGATGGGAGAATACAGTGCAGAGCTTTTATATAAGTATTT
CAGAAAGCAGTAGCTAAAGAATCACTTGTTTATTTCCCAGTGTTTCAAAG
GCCCTTCTGAAGAACTAAGCAAACTAAGGAAAGACCATTTAGTTTTAAAC
AGGAGAAATGTATTTAACTAAATCCTAAACACAGCAGGCTATCTGCAAGC
AGCAGCAGCAGCAGCAGCCATGCTCCCTCACAGAATCCTTACAATTTTTG
AAGTTTTTTGTTTAACTGCTACAAAAGCCGATTTAGTAACATTTATTACA
CTTAAAAACTTCAGTTCATTTGTAGTTCAAAGCAAATGTATTGGCTTTGA
GTTTAAAGACTGAACTACTTTAGATTTGATTTGCATTTTTTTTTTTTTTT
TTTTTTGAGATGCAGTCTTGCTCTGTCAGCCAGGCTGGAGTGCAGTGGCT
GGATCTCAGCTCACGGCAAGCTCTGCCTCCTGGGTTCATGCCATTCTCCT
GCCTCAGCCTCCTGAGTAGCTGGGACTACAGATGCCCGCCACCATGCCCG
GCTAATTTTTTGTATTTTTACTAGAGATGGGGTTTCACCGTGTTAGCCAG
GATGGTCTCGATCTCCTGACCTCGTGATCTGCCCGCCTTGGCCCCCCAAA
GCGCTGGGATTACAGGCCTGAGCCACCACGCTTGGCATCTTTTTACCTTT
CATTAACTTTGATGCAAACCTATAGCTTAAGGTATCTTAAACTTTAATGA
CATTTTTCTCTAAAATAGTAGTTTGTAATAACTTGTTCTGGCACCTGGCT
CCAATGAACACTACCCTCTGACCCTGTGGTATAATTTTCATGAGTAAGTG
GAAACCTAAGATCTTAGAAGTTCAACGGCAATGTGTCCAAGGGGTTTAGA
TCCTCTCCTTAAGTGCCTGTATCTCTGTGAAAAGAATCATCATAGGCTAG
GCGCGATGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGTAGG
TGGATCACCTGAGGTCGGGAGTCCAAGACCAGCCTGACTGACATGGAAAA
ACCCTGTCTCTACTAAAAATACAAAATTAGGTATGGTGGTGCATTCCTGT
AATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGA
GGGGGAGGTTGCAGCAAGCCAAGATCGTGCCATTGCACTCCAGCAGCCTG
GGCAACAAGAGTGAAAAACTACACCTCAAAAACAAAAACAAAAACAAAAG
AATCATCATCAAGTGAACTGGAACACATCCAGAGAACTAATTTTGTTAGA
AAGATTTTAGAGTTGAGCCACACAATCTGCATCTTCTGCGTCCTCCATGC
ACTCGTCTGCTTTCTGGAGCCCCATGAGTGAGTCTTAATCCTGTTCCAGA
TAACAGTTCTCTTCCGGGTAACGGTTCTTCAGATACTTGAAGACAGTGTC
TTATTTCCTTAAATCTTCTCATTTCTTCTTCAAAAGACAGTATTTCAAGT
TACTTTTATGTATCTTTACCATCTACCTCTGGATAAACACTCTCCAATTT
GTCAGTGACCATGTTAAAAACCAAGCACGGTGCTTAAAACTGACATCATC
TTTCAGGCAATCACTCCATTGGAGAATACAGTGGGGCTCTGGATCTGTAC
TTCACTTGCTCCAGAGCCTCTGCTTGTGTTAATACGGCCCAGTTTCAAAT
AAGCATTTTTAGCAGCCCTGAAATGTGTACTCAGATTTAGTTTATAGTCA
ACTAAAAACACCCAGAGGTCTCCTGTATTACACAAGTTATAATTAAAACC
TTAAAAGAGAAAGGTATAGGACAAATGATCTGTCTCCTCCCTTTTTTGCT
TTTTCATATGTTAAGACTATCTCGGAGCTGTTATCAGACTTTTTTCCTGA
AAAACTCTCAACAATACTCAAACTAGGTGTTACATGAAGCTGGGGTCTCC
AGGTTTTGCCTCACTTGTTCTTTCTTTTGTTGTTGTTGAGACAGAGTCTC
ACTCTGTCGCCAGGCTGGAGTGCAGTGGCAGGATCTCAGCTGACTGCAAC
CTCAGCCTCCAGAGTTCAAGCAATTCTTCTGTGTCAGCCTCCCAAGTAGC
TGGGATTACAGGTGCACACCACCACGCCCAGCCA
31La secuencia de 42 bases
TTTAATTGAAAGAAGTTAA TTGAATGAAAATGATC AACTAAG
32La secuencia de 42 bases
TTTAATTGAAAGAAGTTAA TTGAATGAAAATGATC AACTAAG
Está presente en el genoma de 10
vertebrados Hombre, chimpancé, ratón, rata,
perro, pollo, rana, pez, cebra, pez fugu,
tetraodón
33En The Mathematics of PhylogenomicsLior
Pachter and Bernd Sturmfelshttp//arxiv.org/abs/m
ath.ST/0409132Ver también el libro Algebraic
Statistics for Computational BiologyCambridge
University Press, 2005
- La probabilidad (de acuerdo al modelo de
evolución de Jukes-Cantor) de que esto haya
ocurrido por azar es aproximadamente igual a - 10 -50 0, 0..01
- (50 cifras decimales)
34Conjetura
- Esta secuencia de 42 bases estaba en un ancestro
común a todos estos vertebrados
35Muchas gracias por venir!
TAGAGACGGGGGTTTCACAATGTTGGCCA
36 Agradecemos a Lior Pachter y Bernd
Sturmfels por autorizarnos a reproducir la figura
de su personaje DiaNA creado para su
libro Algebraic Statistics for Computational
Biology Cambridge University Press, 2005