Title: Nouveaux services et projet d
1Nouveaux services et projet dévolution de la
plate-forme
- Esther KABORÉ
- Emmanuelle MORIN
- Anne-Sophie VALIN
2Services adaptés
-
- Blast contre banque personnelle
- génération de fichiers aux formats souhaités
-
- Antigenic
- recherche de motifs antigéniques dans les
protéines - possibilité damélioration du résultat
3Génération damorces
- Mise en évidence de marqueurs CAPS
- digestion virtuelle avec restrict
- alignement avec
- affichage des coupures uniques, validation avec
lalignement - Amorces microsatellites
- cartographie de génome
- enchaînement Sputnik et Primer3
- génération dun fichier résultat compatible avec
Excel
4Amorces dégénérées
- 1ère étape alignement séquence consensus
- séquence consensus avec menu déroulant
- 2ème étape sélection des blocs significatifs
- détermination des AA ambigus
- choix de la séquence de référence
5Étape de sélection
6Amorces dégénérées suite
- 3ème étape validation des blocs et de lespèce
de référence - 4ème étape dégénération des blocs
- à partir extrémité 3
- code génétique dégénéré jusquà 64x
- Ex GAY coût 2x
- table dusage des codons de lespèce de
référence pour la suite
7Affichage des amorces dégénérées
- ordre décroissant de dégénérescence
- maximum 64x
8Pouvez-vous maider ?
- FAQ sur genouest.org
- poser une question
- consulter les questions déjà posées
- Email
- Esther Esther.Kabore_at_irisa.fr
- Anne-Sophie Anne-Sophie.Valin_at_irisa.fr
- Emmanuelle Emmanuelle.Morin_at_irisa.fr
9Projet dévolution
-
- rénovation du site web
- accent sur lergonomie, la convivialité
- appel doffre courant octobre 2004
- mise en ligne 1er semestre 2005
10Esther KABORÉBase de donnéesBase de données
spécialiséesBASE
11- Laccès aux données génomiques dans
OUEST-genopole - Construction de bases de données spécialisées
- BASEUn serveur de données pour les données du
transcriptome
12De nombreuses banques publiques disponibles
localement
Nom Date dernière maj Fréq. Maj majeures
GenBank 144 10/2004 6/ année
EMBL 80 09/2004 3/ année
GenPept 144 11/2004 6 / année
PIR-Protein 79.05 11/2004 3/ année
NRL_3D 28.0 01/2001 Non définie
SWISS-PROT 45 10/2004 3/ année
SP-TREMBL 28 10/2004 3 / année
Pfam 16 11/2004 Non définie
Imgt 200445-6 11/2004 1 / semaine
13Les garanties de la plate-forme
- Le suivi des nouvelles sources de données
disponibles - Des banques à jour
- Des banques disponibles localement pour du
calcul intensif spécialisé et/ou sécurisé - Un environnement complet dutilisation.
14Banques de génomes complets
- Génomes Eucaryotes Homo sapiens, Mus musculus,
Ratus Norvegicus, Oryza sativa, Plasmodium
falciparum, Caenorhabditis elegans, Saccharomyces
serevisiae, Drosophila melagongaster,
Encephalitozoon cuniculi, - Génomes Bactériens Escherichia coli,
Prochloroccocus marinus, Salmonella typhi,
Staphylococcus aureus, vibrio cholerae, Neisseria
meningitidis Yersinia pestis,
15Quels services/besoins sur les banques de
génomes complets ?
- Services proposés actuellement
- Blast
- Recherche de motifs (STAN)
- Generic Genome Browser (http//idefix.univ-rennes
1.fr8080/cgi-bin/GGB/gbrowse) - Autres besoins ?
16Construction de bases de données spécialisées
- Définir les données spécifiques au sujet détude
dun labo - Regrouper des données non redondantes sur ce
sujet - Les consulter facilement via une base de données
- Vérifier et mettre à jour régulièrement ces
données - Rajouter des fonctionnalités dédiées à cet
ensemble de données
17Base de données spécialisée du chou fleur
- Base de données spécialisée des huitres
- 20 espèces
- Environ 7000 séquences
- Base de données spécialisée du xenope
- Xenopus laevis (433190 séquences)
- Xenopus tropicalis (383400 séquences)
BRETAGNE BIOTECHNOLOGIE VEGETALE (BBV)
St Pole
Brest
Rennes
Base de données spécialisée des algues
Nantes
Angers
Base de données spécialisée du rosier (5000
séquences dEST)
Base de données spécialisée des semences en phase
de germination (Pisum sativum, Arabidopsis
thaliana, Medicago truncatula)
18BASE un serveur de données pour le transcriptome
- Platform
- Linux Operating System
- MySQL Database
- Apache Webserver
- PHP, C
- Server computer(s)
- Interface
- Entirely Web-based
- Personal User Accounts Workspace
- User-level sharing of files, projects, and data
- Link to other databases (NCBI, UniGene, etc)
- Plug-in architecture for analysis modules
19BASE le serveur
BASE Server
BASE runs as a server Installed locally in a lab
or institute
Collaborators
20Workflow
Sample Annotation
Reporter Annotation
Annotation Type
Biomaterial
Well Annotation
Quantitated Data Matrix
Extracts
Array Design
Image(s)
Array
Labeled Extracts
Hybridization
Experiment Explorer
Plug-In Architecture
Experiment
Transformation
Filter
Plots,Histograms, and Tables
Data Export
Analysis
21Lanalyse de données dans BASE
- Plug-Ins
- Architecture for easy addition of your own
transformation - and analysis modules to BASE
- Proof-of-concept BASE 1.0 included 2
plug-ins - Normalization (LOWESS, mean/median intensity)
- Multi-Dimensional Scaling (MDS)
- Import/Export
- Import any data format using Import Wizard
- Export data in standard formats (ie Eisen
cluster, - MAGE-ML, J-Express, Expression Profiler, tab
delimited, etc)
22- http//idefix.univ-rennes1.fr8080/www-base
- (ekabore_at_irisa.fr)
- http//cardioserve.nantes.inserm.fr/BASE_test
- http//cardioserve.nantes.inserm.fr/BASE_transcrip
tome - (abihouee_at_nantes.inserm.fr)
23Anne-Sophie VALINRecherche de motifsDécouverte
de motifs
24Recherche et découverte de motifs
- Recherche de motifs
- on connaît le motif
- on cherche ses occurrences
- Découverte de motif
- on ne connaît pas le motif
- on cherche à mettre en évidence des motifs
intéressants
25Plate-forme de découverte de motif
http//idefix.univ-rennes1.fr8080/PatternDiscover
y/
26Plate-forme de recherche de motif
http//idefix.univ-rennes1.fr8080/PatternMatching
/
27Les outils de recherche de motif
- Grappe 3.0
- Projet Adage (LORIA)
- Gregory Kucherov, Paul Zimmermann, Eric
Queffelec, Sébastien Briais - STAN 1.0
- Projet Symbiose
- Jacques Nicolas, Patrick Durand, Grégory Ranchy,
Anne-Sophie Valin - WAPAM (disponible en décembre)
- Projet Symbiose
- Mathieu Giraud, Dominique Lavenier
28Grappe 3.0
http//www.loria.fr/kucherov/SOFTWARE/grappe-3.0/
grappe-3.0-en.html
29Exemple de recherche
ATTT?ACCACA
30Résultats
31Mise à profit des données disponibles en local
- STAN (Motif nucléique et protéique)
- Génomes
- (version 1.0 Athaliana, celegans,drosophile,enc
ephalitozoon) - WAPAM (Motif protéique)
- Génomes
- Banques de données
32STAN (Suffix Tree ANalyser)
- Format du motif
- Succession de bases ABCD avec A , B , C et D
différentes bases. - Disjonction de mots AC avec A et C deux
ensemble de bases - Disjonction de bases ABC avec A , B et C
différentes bases - GAP de taille fixe x(num) avec num la taille du
gap. - GAP de taille variable x(num1,num2) , avec la
taille du gap comprise entre num1 et num2 - Succession de bases avec erreur de substitution
patternnum - Élément SVG Xnum ou Xmin,max suivi de X
dans le motif ou de X pour le palindrome de X
33Exemple
CTAGATTTTAA2-X7-x(4)-X5-ACGATTT1
34Interface Graphique
35Mise à profit des données disponibles en local
- STAN (Motif nucléique et protéique)
- Génomes
- (version 1.0 Athaliana, celegans,drosophile,enc
ephalitozoon) - WAPAM (Motif protéique)
- Génomes
- Banques de données
36WAPAM
- Format du motif
- PROSITE
- Motifs avec erreurs
37WAPAM
38WAPAM
39Interface graphique
40Interface graphique
41Questions ?