Nouveaux services et projet d - PowerPoint PPT Presentation

1 / 41
About This Presentation
Title:

Nouveaux services et projet d

Description:

affichage des coupures uniques, validation avec l'alignement ... Affichage des amorces d g n r es. ordre d croissant de d g n rescence. maximum 64x. Pouvez ... – PowerPoint PPT presentation

Number of Views:32
Avg rating:3.0/5.0
Slides: 42
Provided by: emo95
Category:

less

Transcript and Presenter's Notes

Title: Nouveaux services et projet d


1
Nouveaux services et projet dévolution de la
plate-forme
  • Esther KABORÉ
  • Emmanuelle MORIN
  • Anne-Sophie VALIN

2
Services adaptés
  • Blast contre banque personnelle
  • génération de fichiers aux formats souhaités
  • Antigenic
  • recherche de motifs antigéniques dans les
    protéines
  • possibilité damélioration du résultat

3
Génération damorces
  • Mise en évidence de marqueurs CAPS
  • digestion virtuelle avec restrict
  • alignement avec
  • affichage des coupures uniques, validation avec
    lalignement
  • Amorces microsatellites
  • cartographie de génome
  • enchaînement Sputnik et Primer3
  • génération dun fichier résultat compatible avec
    Excel

4
Amorces dégénérées
  • 1ère étape alignement séquence consensus
  • séquence consensus avec menu déroulant
  • 2ème étape sélection des blocs significatifs
  • détermination des AA ambigus
  • choix de la séquence de référence

5
Étape de sélection
6
Amorces dégénérées suite
  • 3ème étape validation des blocs et de lespèce
    de référence
  • 4ème étape dégénération des blocs
  • à partir extrémité 3
  • code génétique dégénéré jusquà 64x
  • Ex GAY coût 2x
  • table dusage des codons de lespèce de
    référence pour la suite

7
Affichage des amorces dégénérées
  • ordre décroissant de dégénérescence
  • maximum 64x

8
Pouvez-vous maider ?
  • FAQ sur genouest.org
  • poser une question
  • consulter les questions déjà posées
  • Email
  • Esther Esther.Kabore_at_irisa.fr
  • Anne-Sophie Anne-Sophie.Valin_at_irisa.fr
  • Emmanuelle Emmanuelle.Morin_at_irisa.fr

9
Projet dévolution
  • rénovation du site web
  • accent sur lergonomie, la convivialité
  • appel doffre courant octobre 2004
  • mise en ligne 1er semestre 2005

10
Esther KABORÉBase de donnéesBase de données
spécialiséesBASE
11
  • Laccès aux données génomiques dans
    OUEST-genopole
  • Construction de bases de données spécialisées
  • BASEUn serveur de données pour les données du
    transcriptome

12
De nombreuses banques publiques disponibles
localement
Nom Date dernière maj Fréq. Maj majeures
GenBank 144 10/2004 6/ année
EMBL 80 09/2004 3/ année
GenPept 144 11/2004 6 / année
PIR-Protein 79.05 11/2004 3/ année
NRL_3D 28.0 01/2001 Non définie
SWISS-PROT 45 10/2004 3/ année
SP-TREMBL 28 10/2004 3 / année
Pfam 16 11/2004 Non définie
Imgt 200445-6 11/2004 1 / semaine
13
Les garanties de la plate-forme
  • Le suivi des nouvelles sources de données
    disponibles
  • Des banques à jour
  • Des banques disponibles localement pour du
    calcul intensif spécialisé et/ou sécurisé
  • Un environnement complet dutilisation.

14
Banques de génomes complets
  • Génomes Eucaryotes Homo sapiens, Mus musculus,
    Ratus Norvegicus, Oryza sativa, Plasmodium
    falciparum, Caenorhabditis elegans, Saccharomyces
    serevisiae, Drosophila melagongaster,
    Encephalitozoon cuniculi,
  • Génomes Bactériens Escherichia coli,
    Prochloroccocus marinus, Salmonella typhi,
    Staphylococcus aureus, vibrio cholerae, Neisseria
    meningitidis Yersinia pestis,

15
Quels services/besoins sur les banques de
génomes complets ?
  • Services proposés actuellement
  • Blast
  • Recherche de motifs (STAN)
  • Generic Genome Browser (http//idefix.univ-rennes
    1.fr8080/cgi-bin/GGB/gbrowse)
  • Autres besoins ?

16
Construction de bases de données spécialisées
  • Définir les données spécifiques au sujet détude
    dun labo
  • Regrouper des données non redondantes sur ce
    sujet
  • Les consulter facilement via une base de données
  • Vérifier et mettre à jour régulièrement ces
    données
  • Rajouter des fonctionnalités dédiées à cet
    ensemble de données

17
Base de données spécialisée du chou fleur
  • Base de données spécialisée des huitres
  • 20 espèces
  • Environ 7000 séquences
  • Base de données spécialisée du xenope
  • Xenopus laevis (433190 séquences)
  • Xenopus tropicalis (383400 séquences)

BRETAGNE BIOTECHNOLOGIE VEGETALE (BBV)
St Pole
Brest
Rennes
Base de données spécialisée des algues
Nantes
Angers
Base de données spécialisée du rosier (5000
séquences dEST)
Base de données spécialisée des semences en phase
de germination (Pisum sativum, Arabidopsis
thaliana, Medicago truncatula)
18
BASE un serveur de données pour le transcriptome
  • Platform
  • Linux Operating System
  • MySQL Database
  • Apache Webserver
  • PHP, C
  • Server computer(s)
  • Interface
  • Entirely Web-based
  • Personal User Accounts Workspace
  • User-level sharing of files, projects, and data
  • Link to other databases (NCBI, UniGene, etc)
  • Plug-in architecture for analysis modules

19
BASE le serveur
BASE Server
BASE runs as a server Installed locally in a lab
or institute
Collaborators
20
Workflow
Sample Annotation
Reporter Annotation
Annotation Type
Biomaterial
Well Annotation
Quantitated Data Matrix
Extracts
Array Design
Image(s)
Array
Labeled Extracts
Hybridization
Experiment Explorer
Plug-In Architecture
Experiment
Transformation
Filter
Plots,Histograms, and Tables
Data Export
Analysis
21
Lanalyse de données dans BASE
  • Plug-Ins
  • Architecture for easy addition of your own
    transformation
  • and analysis modules to BASE
  • Proof-of-concept BASE 1.0 included 2
    plug-ins
  • Normalization (LOWESS, mean/median intensity)
  • Multi-Dimensional Scaling (MDS)
  • Import/Export
  • Import any data format using Import Wizard
  • Export data in standard formats (ie Eisen
    cluster,
  • MAGE-ML, J-Express, Expression Profiler, tab
    delimited, etc)

22
  • http//idefix.univ-rennes1.fr8080/www-base
  • (ekabore_at_irisa.fr)
  • http//cardioserve.nantes.inserm.fr/BASE_test
  • http//cardioserve.nantes.inserm.fr/BASE_transcrip
    tome
  • (abihouee_at_nantes.inserm.fr)

23
Anne-Sophie VALINRecherche de motifsDécouverte
de motifs
24
Recherche et découverte de motifs
  • Recherche de motifs
  • on connaît le motif
  • on cherche ses occurrences
  • Découverte de motif
  • on ne connaît pas le motif
  • on cherche à mettre en évidence des motifs
    intéressants

25
Plate-forme de découverte de motif
http//idefix.univ-rennes1.fr8080/PatternDiscover
y/
26
Plate-forme de recherche de motif
http//idefix.univ-rennes1.fr8080/PatternMatching
/
27
Les outils de recherche de motif
  • Grappe 3.0
  • Projet Adage (LORIA)
  • Gregory Kucherov, Paul Zimmermann, Eric
    Queffelec, Sébastien Briais
  • STAN 1.0
  • Projet Symbiose
  • Jacques Nicolas, Patrick Durand, Grégory Ranchy,
    Anne-Sophie Valin
  • WAPAM (disponible en décembre)
  • Projet Symbiose
  • Mathieu Giraud, Dominique Lavenier

28
Grappe 3.0
http//www.loria.fr/kucherov/SOFTWARE/grappe-3.0/
grappe-3.0-en.html
29
Exemple de recherche
ATTT?ACCACA
30
Résultats
31
Mise à profit des données disponibles en local
  • STAN (Motif nucléique et protéique)
  • Génomes
  • (version 1.0 Athaliana, celegans,drosophile,enc
    ephalitozoon)
  • WAPAM (Motif protéique)
  • Génomes
  • Banques de données

32
STAN (Suffix Tree ANalyser)
  • Format du motif
  • Succession de bases ABCD avec A , B , C et D
    différentes bases.
  • Disjonction de mots AC avec A et C deux
    ensemble de bases
  • Disjonction de bases ABC avec A , B et C
    différentes bases
  • GAP de taille fixe x(num) avec num la taille du
    gap.
  • GAP de taille variable x(num1,num2) , avec la
    taille du gap comprise entre num1 et num2
  • Succession de bases avec erreur de substitution
    patternnum
  • Élément SVG Xnum ou Xmin,max suivi de X
    dans le motif ou de X pour le palindrome de X

33
Exemple
CTAGATTTTAA2-X7-x(4)-X5-ACGATTT1
34
Interface Graphique
35
Mise à profit des données disponibles en local
  • STAN (Motif nucléique et protéique)
  • Génomes
  • (version 1.0 Athaliana, celegans,drosophile,enc
    ephalitozoon)
  • WAPAM (Motif protéique)
  • Génomes
  • Banques de données

36
WAPAM
  • Format du motif
  • PROSITE
  • Motifs avec erreurs

37
WAPAM
38
WAPAM
39
Interface graphique
40
Interface graphique
41
Questions ?
Write a Comment
User Comments (0)
About PowerShow.com