Pr - PowerPoint PPT Presentation

1 / 48
About This Presentation
Title:

Pr

Description:

nature des copies (exact, approximatif) nombre de copies (r 2) aspect inattendu (taille minimale) aspect biologique (inter/intra esp ce chromosome) ... – PowerPoint PPT presentation

Number of Views:22
Avg rating:3.0/5.0
Slides: 49
Provided by: Alain49
Category:

less

Transcript and Presenter's Notes

Title: Pr


1
Séminaire Bioinfo-Ouest / Symbiose - 29 avril 2004
répétitions et duplications intra-chromosomiques
Alain.Viari_at_inrialpes.fr
2
Plan
  • 1- Introduction
  • -2- Définitions
  • -3 - Expérience 1 répétitions chez B. subtilis
  • 4 - Expérience 2 Levure et extensions
  • -5- Aspects algorithmiques

3
Introduction
-gt duplications à différents niveaux
4
niveaux de duplication dans les génomes (1)
5
niveaux de duplication dans les génomes (2)
6
niveaux de duplication dans les génomes (3)
mais encore...
Escherichia coli
  • 4,6 Mb
  • 4 288 gènes
  • Séquences répétées
  • - 22 IS
  • - 7 rDNA, 5 Rhs, 314 REP, etc.
  • - 1 345 gènes dupliqués.

7
Plan
  • 1- Introduction
  • -2- Définitions
  • -3 - Expérience 1 répétitions chez B. subtilis
  • 4 - Expérience 2 Levure et extensions
  • -5- Aspects algorithmiques

8
Repétitions dans les génomes
  • nature de lobjet répété (structural, lexical)
  • nature des copies (exact, approximatif)
  • nombre de copies (r 2)
  • aspect inattendu (taille minimale)
  • aspect biologique (inter/intra espèce
    chromosome)

9
Nature de lobjet répété répétitions
structurales
exemple 1 tRNA
pb recherche / inférence
10
Répétitions lexicales nombre de copies
11
Répétitions lexicales nature de la copie
répétition exacte ou approchée
12
Répétitions lexicales orientation de la copie
répétition directe /  inverse 
ATTTG
CAAAT
5
3
5
3
GTTTA
TAAAG
13
Répétitions lexicales aspect biologiques
14
Pourquoi chercher des répétitions ?
Aspect entomologique Trace de lévolution
outil pour lanalyse de la dynamique des génomes
15
Plan
  • 1- Introduction
  • -2- Définitions
  • -3 - Expérience 1 répétitions chez B. subtilis
  • 4 - Expérience 2 Levure et extensions
  • -5- Aspects algorithmiques

16
Montage expérimental
17
Densité de répétitions
Rocha et al. MBE 99
18
Distribution des répétitions
19
Distribution des répétitions chez B. subtilis
20
Transfert horizontal chez B. subtilis (hypothèse)
Horizontal transfert in B. subtilis (hypothesis)
21
Inserted Elements (IE) in B. subtilis
Transfert horizontal chez B. subtilis (hypothèse)
17 elements 5 of the total size of
genome mean spacer size is 10.6 kb (10 kb
expected) gt50 of genes in spacers does not
exhibit B. subtilis codon usage 2/3 of genes
in spacers are UFO mostly represented
identified functions are - production of
antibiotics - detoxification -
restriction/modification and DNA reparation
- motility and transport
22
Plan
  • 1- Introduction
  • -2- Définitions
  • -3 - Expérience 1 répétitions chez B. subtilis
  • 4 - Expérience 2 Levure et extensions
  • -5- Aspects algorithmiques

23
Objectif
Les répétitions comme outil détude de la
dynamique des génomes
  • Mouvements et évolution des génomes.
  • Observation directe impossible
  • rechercher des traces de son activité
    (répétitions).
  • Répétitions générateur dinstabilités
    chromosomiques (recombinaison).

Répétitions traces et moteur de la dynamique
des génomes.
24
Un modèle (trop) simple
duplication
répétition stricte
séquence unique
25
Montage expérimental (1)
-gt répétitions approchées sur lADN
heuristique
26
Montage expérimental (2)
Alignement local (prog. dyn)
27
Montage expérimental (résumé)
Détection Lmin 15 - 17 bp
Filtre entropique subtélomérique
dans les subtélomères
basse complexité
CACACACA
CACACACA
Extension
Longeur gt 30 Identité gt 50
Filtre Répétitions particulières
Ty, solos, ARNt, ARNr
28
Paramètres
note spacer gt 0
29
Résultats (1)
Génome de la levure
30
Spacer distributions
réel
aléatoire (x 10)
Répétitions inversées
Répétitions directes
total
total
1bp
3bp
100bp
1kb
10kb
100kb
3.2Mb
1bp
3bp
100bp
1kb
10kb
100kb
3.2Mb
spacer
spacer
CDR
Les Close Direct Repeats (CDR) sont
surreprésentés.
31
Spacer corrélation avec le identité entre les
copies
Les CDR présentent une corrélation négative avec
le identité
32
Spacer corrélation avec la longueur
Les CDR présentent une corrélation positive avec
la taille
33
Un modèle (moins) simple
La recombinaison est négativement corrélée à la
taille du spacer.
34
Données expérimentales (littérature)
recombinaison
35
identité et longueur distributions
réel
aléatoire
Répétitions directes
Répétitions inversées
36
Un modèle (un peu plus) complet
tectonique des répétitions
37
Extension à dautres eucaryotes
Saccharomyces cerevisiae 16 chromosomes 12.1
Mb(génome complet)
Homo sapiens 2 chromosomes 67.3 Mb
(Achaz et al., 2001)
38
Distribution du spacer
S. cerevisiae
A. thaliana
P. falciparum
directes
inversées
Nombre
C. elegans
H. sapiens
D. melanogaster
Nombre
39
Corrélations du spacer
Spacer vs. Longueur
Spacer vs. Identité
CDR
Espèces
p
t
p
t
De(/Mb)
N
lt10-4
0.45
lt10-3
-0.32
5.0
60
S. cerevisiae
gt0.05
0.06
gt0.05
-0.08
49.8
100
P. falciparum
lt10-4
0.39
lt10-4
-0.35
23.9
889
A. thaliana
lt10-4
0.24
lt10-4
-0.31
34.0
3,242
C. elegans
lt10-4
0.41
lt10-4
-0.36
4.7
546
D. melanogaster
lt10-4
0.33
lt10-4
-0.30
15.5
1,042
H. sapiens
40
Densité en bases
Répétitions inversées (du chromosome)
5
4
3
2
C. elegans

1
0
0
5
1
0
1
5
2
0
Répétitions directes ( du chromosome)
Les répétitions directes sont (un peu) plus
nombreuses que les inversées.
41
Densité en évènements
n/N
D
e
Répétitions inversées (/Mb)
5
0
4
0
3
0
2
0
C. elegans
1
0
0
0
2
0
4
0
6
0
8
0
1
0
0
Répétitions directes (/Mb)
Les chromosomes de la même espèce présentent une
De similaire -gt propriété nucléaire globale ?
42
Conclusion
eucaryotes idem procaryotes (50 génomes)
les répétitions comme outil détude de la
dynamique des génomes
43
Plan
  • 1- Introduction
  • -2- Définitions
  • -3 - Expérience 1 répétitions chez B. subtilis
  • 4 - Expérience 2 Levure et extensions
  • -5- Aspects algorithmiques

44
Un problème algorithmique (classique)
45
En pratique...
pb pratique trouver toutes les 2-répétions
maximales de tailles Lmin
note en utilisation pratique Lmin est tel que n2
ltlt N
46
Vers des très grandes séquences
47
Remerciements
Guillaume ACHAZ
Frédéric BOYER
Eric COISSAC
Eduardo ROCHA
Pierre NETTER
48
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com