Title: Prsentation PowerPoint
1APPLICATIONS DES BIOPUCES EN BIOLOGIE ET EN
CLINIQUE
Bernard Mari
2- 1. Puces dexpression (transcriptome)
- - Gènes différentiellement exprimés
- - Diagnostic/ Pronostic
- - Etudes dépissages alternatifs
- 2. Analyse du génome
- - Hybridation génomique comparative (CGH)
- - Détection de mutations (gène BRCA1) ou de SNPs
- - Détection dorganismes pathogènes
- - Séquençage
- 3. chIP-chip (Immuno-précipitation de la
chromatine / caractérisation de promoteurs) - 4. MicroRNAs
3Les Puces dExpression
4Analyse des gènes différentiellement exprimés
classification par profil dexpression (exemple
du cycle cellulaire)
1- Mieux comprendre le phénomène étudié en
identifiant les gènes impliqués et les
régulations mises en jeu 2- Impliquer des gènes
de fonction inconnue dans des voies biologiques
connues
5Fish and Chips A Fast Track to Understanding
Blood Development
Combination of using gene transcript microarrays
to identify candidates and producing antisense
molecules in zebrafi sh for functional screening
of these candidates offers a way to
quickly identify genes with central roles
in vertebrate development
Eckfeldt CE, Mendenhall EM, Flynn CM, Wang TF,
Pickart MA, et al. (2005) Functional analysis of
human hematopoietic stem cell gene expression
using zebrafi sh. DOI 10.1371/journal.pbio.003025
4
6Transcriptome et Cancer
7(No Transcript)
8Objectifs de ces études à grande échelle 1)
Nouveaux facteurs pronostics 2) Nouveaux
facteurs prédictifs 3) Nouvelles cibles
thérapeutiques
9Le cancer du Poumon
La classification anatomo-pathologiste le
cancer du poumon est divisé en 4 grandes classes
le carcinome malpighien (25 à 40 des cancers
du poumon), ladénocarcinome (25 à 40 ), le
carcinome à petites cellules (20 à 25 ) et le
carcinome à grandes cellules (10 à 15) (15-17).
Dans certains cas, il s avère difficile de
classer les tumeurs. Ces analyses ont confirmé
l extrème degré de complexité concernant les
anomalies moléculaires dans ces cellules
(instabilité génétique très importante)
10Grandes Cellules
Petites Cellules
Malpighien
Adéno Gr1
Adéno Gr2
Adéno Gr3
Normal
Lutilisation des puces a permis détablir une
nouvelle classification moléculaire qui pourrait
permettre de trancher pour certains cas
difficiles.
11De plus, certaines signatures moléculaires
corrèlent avec un comportement métastatique et/ou
la survie des patients.
Bair E, Tibshirani R (2004) Semi-supervised
methods to predict patient survival from gene
expression data. DOI 10.1371/ journal.pbio.002010
8
12Problème Majeur en Cancérologie lextrème
hétérogénéité des tumeurs, ce qui complique
lanalyse
1) Nombreuses zones de nécrose 2) Infiltration
par de nombreuses cellules normales qui
composent le stroma Composition
fibroblastes, myofibroblastes, cellules
endothéliales, leukocytes, ...
13(No Transcript)
14Microdissection dun échantillon dAdénocarcinome
Avant
Après
Echantillon microdisséqué
Tumeur
Plèvre
(LCM Arcturus Pix Cell II)
15Traitement de léchantillon
Microdissected sample
RNA Isolation
RNA Amplification (2X)
In Vitro Transcription (aaUTP)
CyDye Coupling
Hybridization scanning
16Tumor
Normal
Ref
17Diagnostic Pronostic Applications Cliniques ?
Agendia (Amsterdam) MammaPrint (pronostic
métastases, 70 gènes) Ipsogen (Marseille)
cancer profiler Affymetrix (partenariat avec
Roche, bioMérieux, Veridex) AmpliChip CYP450
Puce dexpression pose néanmoins de sérieux
problèmes dinterprétation dans les applications
cliniques
18Epissage Alternatif ?
Alternative splicing events and probe location
for splice-array design
Fehlbaum, P. et al. Nucl. Acids Res. 2005 33e47
doi10.1093/nar/gni047 ExonHit (Paris), Splice
Arrays mais également Jivan (Trans Express
Arrays) et Affymetrix (exon-only array, 1 million
de sondes ...)
19Analyse du Génome
20Genetic Variation
21Array-based Comparative Genomic Hybridization
22Microarray (Resolution 1 Mb)
Traditional Resolution 5 Mb
Gains
Losses
Losses
Taken from Mehra, et al., 2002. Genes,
Chromosomes and Cancer. 33(2), 225-234
Gains
23De plus en plus précis ...
- NimbleGen 385.000 spots (résolution de 6000 pb)
avec la possibilité de zoomer sur une région
particulière. - - Agilent choix parmi 4 millions de sondes pour
designer sa lame à haute résolution (max 40.000
spots) - Tiling arrays Affymetrix 6.5 millions de
sondes, soit une résolution de 35 pb pour le
génome humain !
Nature, Technology feature, Vols 435 (p991) and
437 (p1195)
24Single-Nucleotide Polymorphism discovery (HapMap
Project)
25SNP Arrays
Et aussi Illumina (1 million de SNPs)
26Séquençage
Cycle1
Cycle2
The 1000 genome ?
Cycle3
Séquençage par synthèse (Solexa VisiGen)
27Gene Chip for Viral Discovery
Viral Discovery and Sequence Recovery Using DNA
Microarrays Know your enemy. Description of the
virus gene chip that helped to classify the
SARS virus as a novel coronavirus.
Wang et al., PLOS BIOL, 1, 2003
28Principe du ChIP on Chip
29(No Transcript)
30Etude des MicroRNAs
31Puce MIRs - IPMC
Version 2 1K plus de 1000 sondes
correspondant à lensemble des microRNAs isolés à
ce jour (release 7.0 miRNA registry, Sanger).
Protocole différent des puces dexpression
classiques par marquage direct au platine et
révélation par amplification enzymatique (Perkin
Elmer)
32(No Transcript)
33Lanalyse des Données
34(No Transcript)
35Normalisation Intra-Lame
Normalisation par les gènes de ménage / contrôles
exogènes Normalisation selon lintensité
totale Swap Lowess (Locally Weighted Scatter
plot Smoothing) est une méthode mathématique
basée sur le fait que la grande majorité des
gènes (plus de 90 ) n'est pas modulée lors dun
traitement quelconque (lissage robuste des ratios
par des régressions locales) Centrage
réduction les données brutes sont transformées
en logarithme. Afin de comparer plusieurs
expériences de puces à ADN, il est ensuite
nécessaire de réaliser une étape de centrage
réduction des données obtenues pour chacune des
expériences. Le centrage consiste à ramener la
valeur de la moyenne de la distribution de chaque
expérience à 0 pour les rendre comparables. La
réduction a pour effet de supprimer les effets de
variation entre les expériences en ramenant leurs
écart-types à la même valeur. Cette manipulation
prend comme hypothèse que la majorité des gènes
nont pas une expression modifiée au cours des
expériences. Shrunk Robust Splines, développée
par Gordon Smyth (Limma sous R). Cette fonction
est similaire à la normalisation par lowess mais
elle utilise une méthode de régression différente
des courbes de lowess (méthode Bayésienne).
36(No Transcript)
37(No Transcript)
38Normalisation (suite)
A
Intra-lame LOWESS
B
Inter-lame Quantile
39Analyse des Données
- Seuil fixe (Ratios gt 2)
- SAM (Significance Analysis of Microarrays)
développé à lUniversité de Stanford. Ce
programme détermine quels sont les gènes
significativement modulés à partir de données
répliquées. Le mode de sélection est basé sur
lexpression différentielle des gènes, et
également sur la reproductibilité des ratios au
niveau des réplicats expérimentaux. Ce programme
permet davoir une estimation du taux de faux
positifs (False Discovery Rate) en fonction du
nombre de gènes sortis de lanalyse
40- Analyse en Composante Principale
- (ACP)
- - ANOVA (test de student)
- - deux groupes cest le test T. Ce test
calcule la probabilité p que deux groupes dun
paramètre simple soient des membres dune même
population. - - plusieurs groupes cest lanalyse de la
variance (ANOVA). Ce test compare la distribution
de deux groupes ou plus pour déterminer si un ou
plusieurs des groupes est différent des autres.
Le test ANOVA permet davoir une estimation de la
contribution de chaque facteur intervenant dans
les données de puces à ADN, et aussi de
linteraction entre ces facteurs. Il permet
également de donner statistiquement la
significativité de ces contributions (p-values).
41- Analyse sous R test statistique laide
dun score statistique dérivé dun modèle
linéaire utilisant une approche empirique
bayésienne.
42 Consensus on a core set of statistical options
will likely emerge, as will agreement on data
quality standards. Applications will encompass
defining gene function inferring functional
networks and pathways understanding how
variation is distributed among individuals,
populations, and species and developing clinical
protocols relating to cancer prognosis and
detection of toxin exposure. Similar profi ling
methods for proteins and metabolites will attract
just as much attention as functional genomics,
building on the foundations laid by genome
sequencing