Title: Aide
1Aide à linterprétation des données
Virginie Defamie
2Comment utiliser sa liste de gènes modulés?
3Informations sur les gènes
OMIM (Online Mendelian Inheritance in Man)
http//www.ncbi.nlm.nih.gov.gate1.inist.fr/entrez/
query.fcgi?CMDsearchDBomim
DAVID (Database for Annotation, Visualisation and
Integarted Discovery) Permet dobtenir des infos
sur les gènes, les classer par fonction et les
inclure dans des voies de signalisation via un
lien vers KEGG.
http//apps1.niaid.nih.gov/david/
KEGG Kyoto Encyclopedia of Genes and
Genomes Schémas des voies de signalisation
impliquées dans divers processus cellulaires et
maladies humaines.
http//www.genome.jp/kegg/
4Informations sur les gènes
Entrez Gene sur NCBI Permet dobtenir des infos
sur les gènes, leur différents symboles, position
chromosomique, accès à la littérature, lien vers
KEGG
http//www.ncbi.nih.gov/entrez/query.fcgi?dbgene
5Le clustering
Définition
Organiser les gènes, dont les profils
dexpression sont identiques, en groupes
(clusters)
But
Révéler la fonction putative de certains gènes
encore non caractérisée gènes co-exprimés
peuvent être reliés fonctionnellement
Identifier les gènes co-régulés
Identifier rapidement un groupe de gènes régulés
selon une pathologie ou un traitement
6Le clustering
Clustering hiérarchique analyse non supervisée
1 détermination des distances entre les gènes
(méthode euclidienne)
2 liaison des gènes les plus proches (arbre
hiérarchique)
Techniques de clusterisation daprès la
Manchester Metropolitan University
http//149.170.199.144/multivar/ca_alg.htm
7Le clustering
Clustering hiérarchique analyse non supervisée
8Le clustering
Le k means clustering analyse supervisée
Permet le classement des gènes dans un nombre
fixe de classe (k) défini par lutilisateur. Les
gènes sont classés en clusters et dans chaque
cluster la distance moyenne entre les gènes est
la plus petite possible. Les gènes sont déplacés
de clusters en clusters jusquà que tout
changement naméliore plus le système. Le
logiciel minimise la variabilité au sein des
clusters et maximise la variabilité entre
clusters.
SOM (self organizing map) analyse
supervisée Principe similaire au k means mais
calculs par rapport au centroids. Le centroid de
chaque cluster est redéfini jusquà ce que les
clusters restent dans des localisations stables.
9Le clustering
Identification de gènes tissu ou cellule
spécifiques.
Set de 50 microarray homme.
Chaque ligne correspond au niveau dexpression
dun gène dans les différents types cellulaires.
Niveau dexpression
10Le clustering
Logiciels disponibles sur le web
MeV MultiExperiment Viewer
http//www.tm4.org/mev.html
http//www.tigr.org/software/microarray.shtml
Genesis http//genome.tugraz.at/ J-expr
ess http//www.ii.uib.no/bjarted/jexpr
ess/
11EASE (Expression Analysis Systematic Explorer)
EASE disponible sur le web
http//david.niaid.nih.gov/david/ease.htm
Permet de définir des familles fonctionnelles à
partir dune liste de gènes dintérêt. EASE
utilise les bases de données DAVID, KEGG, Entrez
Gene
12EASE (Expression Analysis Systematic Explorer)
Liste gène modulés sous format .txt
13EASE (Expression Analysis Systematic Explorer)
Liste gène présents sur la puce sous format .txt
14EASE (Expression Analysis Systematic Explorer)
15EASE (Expression Analysis Systematic Explorer)
Étude des gènes modulés lors de la régénération
hépatique chez la souris. Cinétique de
régénération 0, 2, 16 et 40 heures post
hépatectomie.
16EASE (Expression Analysis Systematic Explorer)
Identification des thèmes biologiques les plus
important grâce à EASE en donnant un score
statistique EASE ou FISHER.
Conclusion réorganisation du cytosquelette
surexpression des protéines impliquées dans la
synthèse dADN au profit des protéines de
fonctionnement hépatique
17PAM (Prediction Analysis of Microarrays)
Exemple biologique
Objectifs identifier un set de gènes modulés en
fonction des condition asthme vs témoin
diagnostic prédictif de nouveaux patients rhinite
ou asthme?
3 Exécution du programme sur Excel
18PAM (Prediction Analysis of Microarrays)
19PAM (Prediction Analysis of Microarrays)
20PAM (Prediction Analysis of Microarrays)
erreur dans la prédiction
Trouver le juste milieu entre un nombre de gènes
prédictifs satisfaisant et derreur le plus
petit possible
21PAM (Prediction Analysis of Microarrays)
Entrée des données dont le diagnostique des
patients est inconnu (Rhinite ou asthme?)
22PAM (Prediction Analysis of Microarrays)
23Genomatix
Logiciel payant disponible sur
http//www.genomatix.de/
24Genomatix
- Créer des liens entre les gènes de la liste de
gènes modulés - Voies de signalisation et voies métaboliques
- Étude des facteurs de transcription et de leurs
cibles
25Genomatix
- Analyse des promoteurs
- Identifier les gènes co-réguler
26Conclusion
Il existe plusieurs façons daborder ses données
selon la question biologique posée. Analyse
gène par gène Analyse globale (gènes
corégulés) Dégager un set de gènes prédictifs
dune pathologie