Title: Aucun titre de diapositive
1Stage au LIRMM (Montpellier)
Sous la direction dOlivier Gascuel et de Denis
Bertrand
juin/août 2004
Propriétés topologiques des arbres de duplication
http//philippe.gambette.free.fr/LIRMM
2Plan
? Le processus de duplication en tandem
? Sa modélisation larbre de duplication, un
arbre phylogénétique particulier
? Suppression dune feuille dans un arbre de
duplication
? Réarrangements topologiques dans un arbre de
duplication
? Conclusion sur les résultats trouvés
3La recombinaison inégale
Avant la méiose
ADN du père
ADN de la mère
4La recombinaison inégale
Prophase I
cytoplasme
chromosome venant du père
chromosome venant de la mère
5La recombinaison inégale
Prophase I
cytoplasme
chromosome venant du père
chromosome venant de la mère
6La recombinaison inégale
Prophase I
cytoplasme
chromosome venant du père
chromosome venant de la mère
7La recombinaison inégale
Prophase I
cytoplasme
chromosome venant du père
chromosome venant de la mère
8La recombinaison inégale
Prophase I, recombinaison inégale
cytoplasme
chromosome venant du père
chromosome venant de la mère
9Lhistoire de duplication (duplication simple)
CATTGAGCTATGATTGCATTGACCTATGATTC
10Lhistoire de duplication (duplication multiple)
On a la séquence finale, on veut retrouver
lhistoire des duplications.
11Retrouver lhistoire de duplication
On a la séquence finale, on veut retrouver
lhistoire des duplications
1- Détecter les motifs répétés.
2- Aligner tous les motifs pour en réaliser un
arbre phylogénétique afin den déduire un arbre
de duplication qui modélise lhistoire de
duplication.
CATTGAGTATGACCTATGAGCTATGACCTATTGATAC
travail du biologiste
alignement multiple de séquences
déduction de larbre de duplication
construction de phylogénie
12Quest-ce quun arbre phylogénétique ?
Il présente les relations de parenté entre être
vivants.
Labeille est génétiquementplus proche de la
moucheque du singe.
abeille
mouche
rat
singe
homme
On peut les construire grâce à des algorithmes
gloutons optimisant les paramètres suivants -
distance - maximum de vraisemblance - parcimonie
(minimiser le nombre de transformations
élémentaires)
13Reconstruire un arbre phylogénétique (distance)
On connaît la matrice des distances entre tout
couple de feuille (fi,fj). En partant dun arbre
en étoile, on regroupe progressivement en des
consensus les feuilles les plus proches pour
construire larbre.
Larbre obtenu nest pas enraciné
14Reconstruire un arbre phylogénétique
Larbre phylogénétique obtenu peut être amélioré
par des réarrangements locaux - NNI (Nearest
Neighbor Exchange, permettent dexplorer lespace
des phylogénies)
NNI
- SPR (Subtree Pruning and Regrafting)
SPR
Peut-on faire de même pour les arbres de
duplication ?
15Quest-ce quun arbre de duplication ?
Cest un arbre phylogénétique dont les feuilles
sont des gènes dupliqués en tandem.Les feuilles
sont donc ordonnées. Tout arbre phylogénétique
nest donc pas un arbre de duplication.On peut
les déduire dalignements multiples grâce à des
méthodes similaires à celles sur les
phylogénies. On obtient des arbres de duplication
enracinés ou non. Les arbres de duplication ne
permettent pas de modéliser les délétions.
16La recombinaison inégale duplication simple
arbre de duplicationenraciné (1-RDT)
17La recombinaison inégale duplication multiple
arbre de duplicationenraciné (RDT)
arbre de duplicationnon enraciné (DT)
18Définition dun arbre de duplication (RDT)
Soit T, un arbre, et O un ordre sur ses feuilles.
Si f1 et f2 sont deux feuilles de T, et n un nœud
de T, alors (f1,n,f2) est une cerise de T.
C(T) est lensemble des cerises de T.
Si f1 et f2 sont adjacentes, on note f1?f2.
19Définition dun arbre de duplication (RDT)
(T,O) est un arbre de duplication enraciné
(RDT) de racine r si - (T,O) contient
uniquement rou- il existe dans C(T) une série
de cerises (gi,ui,di), (gi1,ui1,di1), ... ,
(gk,uk,dk) avec k?i et gi?gi1?...?gk?di?di1?...?
dk dans O, telle que (T',O') soit un arbre de
duplication de racine r, où T' est obtenu Ã
partir de T en enlevant gi, gi1,...,gk,di,di1,..
.,dk, et O' est obtenu en remplaçant (gi,
gi1,..., gk,di,di1,...,dk) par (ui,ui1,...,uk)
dans O.
20Suppression dune feuille dans un 1-RDT
1-RDT On garde un arbre de duplication après
suppression
La feuille est dite supprimable.
suppression de la feuille 1
21Suppression dune feuille dans un 1-RDT
1-RDT On garde un arbre de duplication après
suppression
La feuille est dite supprimable.
Larbre obtenu est larbre de départ dans lequel
on a supprimé la feuille 1
22Suppression dune feuille f dans un RDT
6 cas se présentent
23Suppression dune feuille f dans un RDT
24Suppression dune feuille f dans un RDT
25Suppression dune feuille f dun RDT
pourcentage darbres qui perdent leur caractère
de duplication
30
26,6
20
15
10
5
0
4 10 20
30 40
50 60
nombre de feuilles
Proportion d'arbres qui perdent le caractère de
duplication, en fonction du nombre de feuilles ?,
ou de la feuille supprimée ?
pourcentage darbres qui perdent leur caractère
de duplication
45
40
35
30
26,6
20
15
0 50 100 150 200 250 300
feuille supprimée
26Suppression dune feuille f dun RDT
100 feuilles100 feuilles100 feuilles24
feuilles18 feuilles12 feuilles10 feuilles8
feuilles
Cas 1
Cas 2
Cas 5
Cas 3
Cas 4
Cas 6
Proportion des feuilles dans chaque cas
Le modèle est donc relativement robuste, avec 3/4
des arbres qui restent de duplication. On a
besoin de vérifier les conditions de délétions
sur le père pour seulement 8 des feuilles.
27Suppression dun sous-arbre dans un RDT
Soit (T,O), un arbre de duplication
enraciné.Soit r, la racine du sous-arbre Ã
supprimer dans cet arbre.L'arbre (T',O')
résultant de la suppression du sous-arbre de
racine r dans (T,O) est un arbre de duplication ?
une des trois conditions de délétion est vérifiée.
28Les réarrangements topologiques
SPR (Subtree Pruning and Regrafting)
y
(T,O)
x
x
SPR(r,(x,y),(T,O))
r
y
r
Le SPR est valide si larbre résultant du SPR est
un arbre de duplication. Les SPR valides
permettent dexplorer lespace des RDT.
29SPR sur un sous-arbre
Soit (T,O) un arbre de duplication. L'arbre
d'agglomération minimale pour r et (T,O) est
l'arbre obtenu après un minimum d'agglomérations
dans lequel r est feuille.
Soient r, x et y des sommets de T, et (Ti,Oi),
l'arbre d'agglomération minimale pour r et (T,O).
SPR(r,(x,y),(T,O)) est valide si et seulement si
SPR(r,(x,y),(Ti,Oi)) est valide.
Il suffit de donc détudier les SPR sur les
feuilles !
30Une déception
Un SPR peut être valide bien que la feuille
concernée ne soit pas supprimable...
SPR(2,(f,4),(T,O))
31Divers SPR
32Divers SPR
33Bilan quantitatif sur les SPR
SPR 1
SPR 2
SPR 3
SPR 4
SPR 5
SPR validesnon reconnus
SPR non valides
Proportion des SPR dans chaque cas
34Conclusion
Les résultats sur les feuilles sont intéressants
sur la proportion darbres corrects, mais doivent
être complétés par des analyses biologiques
darbres de duplication vérifiés, puisque les
arbres de duplications observés contiennent moins
de duplications multiples quen théorie. Les
conditions de suppression des feuilles sont plus
complexes quespérées, lobligation de vérifier
les conditions sur les ancêtres notamment. Les
SPR identifiés ne couvrent pas une grande portion
de lespace des SPR, et sont trop compliqués pour
être utiles.
35Annexe Montpellier
Le Peyrou et le Château dEau
36Annexe Montpellier
LArc de Triomphe à la sortie du Peyrou
37Annexe Montpellier
Immeuble habité par Guyslain Naves dans sa
jeunesse
Laqueduc
38Annexe Montpellier
La Faculté de Médecine
39Annexe Montpellier
La Préfecture, face à un magasin Gibert