Mesure des niveaux d'expression des g - PowerPoint PPT Presentation

1 / 32
About This Presentation
Title:

Mesure des niveaux d'expression des g

Description:

Mesure des niveaux d'expression des gnes chez les bactries par la technique des biopuces Analyse du – PowerPoint PPT presentation

Number of Views:84
Avg rating:3.0/5.0
Slides: 33
Provided by: hubertc
Category:

less

Transcript and Presenter's Notes

Title: Mesure des niveaux d'expression des g


1
Mesure des niveaux d'expression des gènes chez
les bactéries par la technique des
biopucesAnalyse du transcriptome de la bactérie
Buchnera aphidicola en condition de stress
trophique de son hôte, le puceron Acyrthosiphon
pisum
Hubert Charles Fédérica Calevro
  • Laboratoire BF2I, UMR INRA/INSA de Lyon 203
  • Bât. Louis Pasteur, 69 621 Villeurbanne, France.
  • BSMC, Biologie Cellulaire et Modélisation
    Cellulaire
  • DTAMB Université Claude Bernard Lyon 1

2
Inférer (ou valider) un modèle de réseau de
régulation à partir de données dexpressions de
puces à ADN
Temps (min)
3
Introduction la technique des puces à ADN
4
De limage de la puce aux résultats interprétés
  • 1. Nature des données dexpression
  • 2. Problématique biologique
  • 3. Mesure des données dexpression
  • 31. Acquisition de limage
  • 32. Acquisition des données issues de limage 
  • 33. Filtration des données
  • 34. Analyse qualité
  • 35. Normalisation
  • 36. Gestion des données de puces
  • 4. Plans expérimentaux
  • 41. Plan de la puce
  • 42. Analyses comparatives (statiques)
  • 43. Analyses dynamiques
  • 5. Conclusions

5
1. Nature des données dexpression
  • Grands volumes de données (pb logiciel, pb
    algorithmique)
  • Dissymétrie du tableau de données (gènes x
    conditions)
  • Les données sont relatives (pas de niveau 0, pas
    de mesure absolue)
  • Distribution non-normale des données
  • -gt Transformation log2
  • Non-indépendance des données
  • Des connaissances associées très hétérogènes
    (annotation par exemple)

6
2. Problématique biologique la symbiose chez le
puceron Acyrthosiphon pisum
  • Buchnera est une bactérie symbiotique
    intracellulaire associée à la majorité des
    pucerons dimportance économique. Lassociation
    est très ancienne (250 Ma). Les partenaires sont
    devenus dépendants.
  • Buchnera complémente lalimentation de son hôte
    (acides aminés et vitamines)
  • Buchnera possède un génome de taille très réduite
    (400 à 600 kb), très riche en bases A et T et
    incluant de nombreuses mutations délétères
    (adaptatives ?).
  • -gt Bon modèle détude à un niveau théorique
    (simple)
  • -gt très difficile à manipuler expérimentalement
    (incultivable)
  •  Le génome de Buchnera est  dégénéré 
  • -gt Comment Buchnera régule-t-elle lexpression
    des ces gènes ?
  • -gt Comment Buchnera sadapte-t-elle aux
    variations des besoins nutritionnels de lhôte ?

7
2. Problématique biologique  stress nutritionnel
chez le puceron
  • Expérience 1 (8 lames) 
  • Milieu complet Milieu Tyr0/Phe0
  • A B
  • 4 lames  A-Cy3 / B-Cy5
  • 4 lames  A-Cy5 / B-Cy3
  • Expérience en flip-flop

Analyse statistique test de t-modifié (SAM),
approche bayésienne
8
2. Problématique biologique  stress nutritionnel
chez le puceron
  • Expérience 2 (16 lames) 
  • aa équilibré aa déséquilibré
  • 0.5 M saccharose A B
  • 1 M saccharose C D
  • 2 répétitions indépendantes de 8 lames 
  • A/B, B/C, C/D, D/A, A/C, B/D, D/B, C/A

Analyse statistique modèles danalyse de la
variance
9
3. Mesure des niveaux dexpression
  • 31. Acquisition de limage
  • 32. Acquisition des données issues de limage 
  • 33. Filtration des données analyse qualité
  • 34. Normalisation
  • 35. Analyse statistique et interprétation des
    résultats
  • -gt Ces différentes phases ne sont pas distinctes

10
31. Limage brute
3ème oligo
bloc (12 x 16)
Oligo 3
Oligo 5
Doublets de spots
Superposition des 2 images (R et G)


Contrôles ( et -)
11
32. Acquisition des données issues de limage
  • Acquisition de limage réglage des PMT
  • limite de la saturation (216)
  • valeurs de PMT identiques (proches) pour toutes
    les lames dun même jeu de données
  • Quelle mesure du signal ?
  • Volume du spot (peu utilisé)
  • Moyenne (médiane) des pixels du spot
  • Faut-il retrancher un bruit de fond local ?
  • Estimation du bruit de fond sur les contours des
    spots (biais destimation)
  • Estimation sur la base de témoins négatifs
    répartis sur toute la surface de la puce

12
33. Filtration des données durant lacquisistion
(logiciel GenePix)
  • Filtration des données (ajout de  flags )
  • Flag  absent  des spots vides (- 50)
  • Flag  not found  des spots non détectés (- 75)
  • Flag  bad  des mauvais spots (- 100) 
  • Spots sous les taches et rayures (manuel),
    diamètres extrêmes, spots saturés (F635sat,
    script Genepix), spots éloignés du nuage (moyenne
    / médiane), spots à forts CVF et CVB
  • Flag  good  des bons spots ( 100)
  • B6351SD gt 55 et B5321SD gt 55 (script
    GenePix)
  • Flags (- 40) des valeurs corrigées négatives

13
34. Analyse qualité
  • Analyse de la variabilité (critères de qualité)
  • Variabilité inter sondes identiques
  • Variabilité intra-groupe de spottage
  • Variabilité intra-gène
  • Variabilité géographique
  • Variabilité inter lames
  • -gt Utilisation de CV
  • -gt Lanalyse de la variabilité permettra de
    décider de larrêt ou de la poursuite de la
    filtration puis du choix de la technique de
    normalisation

14
34. Analyse qualité représentations graphiques
Bruit de fond
Graphe RG
MA plot
Distribution de F532
15
35. Normalisation des données
  • Il nexiste pas de mesure absolue de fluorescence
  • Les fluorochromes ont des propriétés différentes
    (linéarité du signal, quenching, sensibilité,
    stabilité)
  • Les PMT fournissent des valeurs relatives
  • Les réactions de marquage ont des rendement
    différents
  • ...
  • -gt Il est nécessaire deffectuer une
    normalisation des données (la plus simple
    possible)

16
35. Normalisation différents modèles
  • Soit Ig lintensité du signal de fluorescence et
    xg labondance de l ARNm correspondant
  • Effet de bruit de fond 
  • Effet de saturation (non linéarité de la
    détection) 
  • Erreurs additives et multiplicatives

17
35. Normalisation différents modèles
Effet de saturation
Effet des erreurs additives (faibles intensités)
Mlog2(R/G)
Effet des erreurs multiplicatives (fortes
intensités)
Différence de bruit de fond entre vert et rouge
A(RG)1/2
Cui et al. 2002
18
35. Normalisation des données trois cas de
figures
  • (1) Le nombre de gènes est très grand. (H)  La
    plupart des gènes analysés ne varient pas, ou se
    répartissent équitablement du coté des sur- et
    des sous-exprimés.
  • -gt Normalisation sur tous les points
  • (2) Le nombre de gènes est moyen et H nest plus
    applicable. On dispose d un échantillons de
    gènes invariants (contrôles, gènes de ménage) ou
    on calcule cet échantillon (Tseng et al., 2001).
  • -gt Normalisation sur léchantillon de gènes
    invariants
  • (3) le nombre de gènes est faible. Il faut
    disposer dun jeu de contrôles répartis sur toute
    la gamme des intensités.
  • -gt Normalisation sur les contrôles

19
35. Normalisation globale
  • Normalisation  par la moyenne ou par la
    médiane 
  • On calcule le rapport des moyennes (ou des
    médianes) pour les deux couleurs et on le
    rapporte à 1.
  • La transformation 
  • Le modèle sous-jacent
  • -gt Applicable si  (1) pas de bruit de fond, (2)
    linéarité du graphe MA, (3) pas deffet aiguille,
    (4) pas deffet géographique

20
35. Normalisation globale
  • Normalisation  par régression linéaire 
  • Le modèle sous-jacent 
  • La transformation est la suivante 
  • -gt Applicable si  (1) pas de bruit de fond, (2)
    linéarité du graphe MA, (3) pas deffet aiguille,
    (4) pas deffet géographique

21
35. Normalisation globale
  • Normalisation  par régression linéaire locale
    (fonction loess)
  • Le modèle et la transformation sont les mêmes que
    précédemment, mais appliqués sur une classe
    dintensité.
  • -gt Applicable si  (1) pas de bruit de fond, (2)
    linéarité du graphe MA, (3) pas deffet aiguille,
    (4) pas deffet géographique

22
35. Normalisation locale (spatiale)
  • Toutes ces méthodes peuvent sappliquer de façon
    à normaliser par groupe daiguille ou par bloc
    (effet géographique)
  • -gt Applicable si  (1) pas de bruit de fond, (2)
    linéarité du graphe MA, (3) pas deffet aiguille,
    (4) pas deffet géographique
  • -gt coût sur H ou sur le nombre de témoins très
    importants

23
35. Normalisation des données Buchnera
  • La normalisation est basée sur un jeu de gènes
    invariants déterminé a posteriori
  • Normalisation  PrintTip loess 

24
36. Un système dinformations pour la gestion des
données de puces (SI-TRANS)
http//sitrans.insa-lyon.fr
25
4. Plans expérimentaux
  • 41. Plan de la puce
  • Les sondes doivent être spécifiques
  • Les sondes doivent montrer des rendements
    homogènes
  • Les sondes doivent être choisies dans des régions
    propices
  • Les sondes devraient être réparties aléatoirement
    sur la lame
  • Le nombre de répétitions doit être fixe pour
    toutes les sondes (calcul de moyennes)
  • La puce doit comporter des témoins négatifs
    répartis sur toute la surface
  • La puce doit comporter des témoins positifs
    répartis sur toute la gamme dintensité si
    lhypothèse de non variation de la majorité des
    gènes ne peut pas être faite.

26
4. Plans expérimentaux
http//pbil.univ-lyon1.fr/roso
27
4. Plans expérimentaux analyse statique
  • - Comparaison de 2 conditions
  • Tests de t modifiés (SAM) ou inférence
    bayesienne
  • - Comparaison de différentes conditions dans un
    plan factoriel 
  • Modèles dANOVA
  • - Comparaison de conditions multiples
  • Analyse discriminante, interclasse,
    non-supervisée

Plan en boucle
Plan en référence
28
4. Plans expérimentaux analyse dynamique
  • - Analyse à différents temps
  • Profil dexpression temporel classification
    supervisée ou non, corrélation de profils
  • Cycle cellulaire, Cycle circadien
    classification, transformée de fourrier, PLS

Plan en référence
- Peng X et al. (2005) Identification of cell
cycle-regulated genes in fission yeast. Mol Biol
Cell. 16(3)1026-42 - Remondini et al. (2005)
Targeting c-Myc-activated genes with a
correlation method Detection of global changes
in large gene expression network dynamics. Proc
Natl Acad Sci U S A. 10102(19)6902-6. - Luan Y
Li H (2004) Model-based methods for identifying
periodically expressed genes based on time course
microarray gene expression data. Bioinformatics.
1220(3)332-9.
29
4. Plans expérimentaux analyse dynamique
- Analyse à différents temps avec une covariable
qualitative  Effet dune drogue au cours du
temps analyse statique à chaque temps,
sélection des gènes significatif pour 50 des
temps, puis analyse des profils par classification
Plan en boucles répétées
- Lin et al. (2004) Discovery of estrogen
receptor alpha target genes and response elements
in breast tumor cells.Genome Biol. 20045(9)R6.
30
5. Conclusion
  • Le plan dexpérience est primordial pour réaliser
    les analyses statistiques et ou la modélisation
  • Toujours utiliser des plans en flip-flop
  • Le modélisateur doit être partie prenante dans la
    préparation des données (qualité, filtration,
    normalisation)

31
5. Conclusions
inhibited by sucrose stress at 50 aa
Activated by sucrose stress at 25 aa
atpH ftsY rpmG ytfN carB yba2
yjjT rplS rpsL rpsF
trpB flgB flgC yhbZ yleA
rpmB
fliJ cvpA aceE
murG grpE1 yfgB
phrB pnp infB
nth dnaJ guaC
ygbB yqhA
fabG fmt
murB dnaG
lipB yciL
mopA argH yibN lig fabB dcd
mesJ ydiC rplF yheM mutL iscU
fldA hscA
inhibited by sucrose stress at 25 aa
Activated by sucrose stress at 50 aa
Sucrose effect
32
5. Conclusions
  • Recherche des gènes impliqués dans la réponse à
    un stress trophique chez Buchnera
  • Recherche des voies métaboliques dans lesquelles
    ils sont impliqués
  • Analyse des séquences régulatrices des gènes
    coexprimés
  • Détection déléments régulateurs
  • Analyse génomique et analyse de la corrélation
    entre le niveau dexpression et lorganisation du
    génome de Buchnera
  • Détection de mécanismes de régulation
Write a Comment
User Comments (0)
About PowerShow.com