Dfinition relle - PowerPoint PPT Presentation

1 / 39
About This Presentation
Title:

Dfinition relle

Description:

bioinformatique sont l'identification des g nes et la pr diction de leur ... Toutes les applications de l'informatique la biologie. - tude in silico de la ... – PowerPoint PPT presentation

Number of Views:137
Avg rating:3.0/5.0
Slides: 40
Provided by: info111
Category:

less

Transcript and Presenter's Notes

Title: Dfinition relle


1
Introduction
  • Définition réelle
  • La Bioinformatique est la discipline de l
  • Analyse de lInformation Biologique.
  • Malgré son nom, la "bioinformatique" ne doit pas
    être confondue avec
  • une simple application aux données biologiques
    des concepts et des
  • outils de l'informatique traditionnelle. Les
    défis principaux de la
  • bioinformatique sont l'identification des gènes
    et la prédiction de leur
  • fonction, deux problèmes au centre de la
    "génomique fonctionnelle".

2
Introduction
  • Définition de la réalité
  • De façon très générale
  • Toutes les applications de l'informatique à la
    biologie.
  • - étude in silico de la connectique des neurones,
  • - traitement quantitatif et qualitatif d'images
    microscopiques,
  • - la gestion des échantillons et des données
    expérimentales dans les grands laboratoires
    industriels,
  • - la modélisation de l'évolution de populations
    animales dans des conditions écologiques
    spécifiques,
  • - ...

3
Introduction
  • Applications majeurs
  • Partie émergeante de la bioinformatique
  •  méthodes en biologie capable de générer des
    quantités très importantes de données sans
    nécessairement les lier à des hypothèses de
    travail précises 
  • Les  Omiques 
  • génomique - transcriptomique protéomique
    glycomique

4
Génomique
5
Transcriptomique
6
Protéomique
7
Historique
  • 1951 Première séquence protéique (Insuline,
    Sanger)
  • 1960 Lien entre séquence structure (Globines,
    Perutz)
  • 1965 Premier Ordinateurs IBM/360
  • 1965 "Evolutionary divergence and convergence in
    Proteins" (Zuckerkandl Pauling)
  • 1967 "Construction of Phylogenetic Trees" Fitch
    Margoliash.
  • 1968 Atlas of Protein Sequences (M. Dayhoff,
    Georgetown)
  • 1968 mini-ordinateur DEC PDP-8
  • 1970 "A general method applicable to the search
    for similaries in sequences of two proteins"
    (Needleman Wunsch).
  • 1971 Premier travaux sur le repliement des ARNs
    (J. Ninio)
  • 1972 Premier microprocesseur Intel 8008
  • 1974 "Prediction of Protein Conformation" (Chou
    Fasman)
  • 1975 Intel 8080, kit Altair
  • 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
    (Apple, Commodore, Radioshack)-
  • Séquençage d'ADN (Sanger, Maxam, Gilbert)
  • 1977 Premier "package" Bioinformatique (Staden)
  • 1978 Bases de données ACNUC, PIR, EMBL, GenBank
  • 1980 Accès téléphonique à la base de données PIR
  • 1981 IBM-PC (8088), 16-32kb
  • 1981 Los Alamos-GenBank 270 séquences, 370.000
    nucléotides Programme d'alignement local
    (Smith-Waterman)

8
(No Transcript)
9
Historique
  • 1951 Première séquence protéique (Insuline,
    Sanger)
  • 1960 Lien entre séquence structure (Globines,
    Perutz)
  • 1965 Premier Ordinateurs IBM/360
  • 1965 "Evolutionary divergence and convergence in
    Proteins" (Zuckerkandl Pauling)
  • 1967 "Construction of Phylogenetic Trees" Fitch
    Margoliash.
  • 1968 Atlas of Protein Sequences (M. Dayhoff,
    Georgetown)
  • 1968 mini-ordinateur DEC PDP-8
  • 1970 "A general method applicable to the search
    for similaries in sequences of two proteins"
    (Needleman Wunsch).
  • 1971 Premier travaux sur le repliement des ARNs
    (J. Ninio)
  • 1972 Premier microprocesseur Intel 8008
  • 1974 "Prediction of Protein Conformation" (Chou
    Fasman)
  • 1975 Intel 8080, kit Altair
  • 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
    (Apple, Commodore, Radioshack)-
  • Séquençage d'ADN (Sanger, Maxam, Gilbert)
  • 1977 Premier "package" Bioinformatique (Staden)
  • 1978 Bases de données ACNUC, PIR, EMBL, GenBank
  • 1980 Accès téléphonique à la base de données PIR
  • 1981 IBM-PC (8088), 16-32kb
  • 1981 Los Alamos-GenBank 270 séquences, 370.000
    nucléotides Programme d'alignement local
    (Smith-Waterman)

10
(No Transcript)
11
Historique
  • 1951 Première séquence protéique (Insuline,
    Sanger)
  • 1960 Lien entre séquence structure (Globines,
    Perutz)
  • 1965 Premier Ordinateurs IBM/360
  • 1965 "Evolutionary divergence and convergence in
    Proteins" (Zuckerkandl Pauling)
  • 1967 "Construction of Phylogenetic Trees" Fitch
    Margoliash.
  • 1968 Atlas of Protein Sequences (M. Dayhoff,
    Georgetown)
  • 1968 mini-ordinateur DEC PDP-8
  • 1970 "A general method applicable to the search
    for similaries in sequences of two proteins"
    (Needleman Wunsch).
  • 1971 Premier travaux sur le repliement des ARNs
    (J. Ninio)
  • 1972 Premier microprocesseur Intel 8008
  • 1974 "Prediction of Protein Conformation" (Chou
    Fasman)
  • 1975 Intel 8080, kit Altair
  • 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
    (Apple, Commodore, Radioshack)-
  • Séquençage d'ADN (Sanger, Maxam, Gilbert)
  • 1977 Premier "package" Bioinformatique (Staden)
  • 1978 Bases de données ACNUC, PIR, EMBL, GenBank
  • 1980 Accès téléphonique à la base de données PIR
  • 1981 IBM-PC (8088), 16-32kb
  • 1981 Los Alamos-GenBank 270 séquences, 370.000
    nucléotides Programme d'alignement local
    (Smith-Waterman)

12
Historique
  • 1951 Première séquence protéique (Insuline,
    Sanger)
  • 1960 Lien entre séquence structure (Globines,
    Perutz)
  • 1965 Premier Ordinateurs IBM/360
  • 1965 "Evolutionary divergence and convergence in
    Proteins" (Zuckerkandl Pauling)
  • 1967 "Construction of Phylogenetic Trees" Fitch
    Margoliash.
  • 1968 Atlas of Protein Sequences (M. Dayhoff,
    Georgetown)
  • 1968 mini-ordinateur DEC PDP-8
  • 1970 "A general method applicable to the search
    for similaries in sequences of two proteins"
    (Needleman Wunsch).
  • 1971 Premier travaux sur le repliement des ARNs
    (J. Ninio)
  • 1972 Premier microprocesseur Intel 8008
  • 1974 "Prediction of Protein Conformation" (Chou
    Fasman)
  • 1975 Intel 8080, kit Altair
  • 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
    (Apple, Commodore, Radioshack)-
  • Séquençage d'ADN (Sanger, Maxam, Gilbert)
  • 1977 Premier "package" Bioinformatique (Staden)
  • 1978 Bases de données ACNUC, PIR, EMBL, GenBank
  • 1980 Accès téléphonique à la base de données PIR
  • 1981 IBM-PC (8088), 16-32kb
  • 1981 Los Alamos-GenBank 270 séquences, 370.000
    nucléotides Programme d'alignement local
    (Smith-Waterman)

13
LEvolution
14
(No Transcript)
15
 Les Bioinformatiques 
  • Lanalyse
  • Besoin propre réaliser au sein des
    entreprises/laboratoires,
  • Quelques petites entreprises basées sur un
    transfert de savoir,
  • Produit résultant à haute valeur ajoutée,
  • Puissance de calcul importante.
  • La mise à disposition de logiciel et services
  • Buisness de vente de logiciel  classique 
  • Package universitaire online, payant ou gratuit.
  • La mise à disposition de données
  • Production de données par technologies  haut
    débit  (séquençage ADN, screening protéique, etc
    ),
  • Majoritairement gratuit.

16
Marché
  • Marché des plateformes et logiciels
    bioinformatiques
  • 52 millions en 2000
  • 202 millions 2004
  • 634 million 2006
  • Marché des données
  • 225 millions en 2001
  • 445 millions en 2006
  • Marché Analyse Consulting ?
  • développement des médicaments
  • moins 33 en terme de coût
  • moins 2 ans pour AMM
  • 60 dexternalisation / achat
  • Prévision de marché 1,7 milliard pour 2006

17
Acteurs et chiffres
  • LionBioScience Biological information
    technology company providing integrated solutions
    for genomics. (2003 ventes 32.3 millions, 337
    employés)
  • Tripos Provider of discovery research software
    services. (2003 ventes 54.1 millions, 358
    employés)
  • Paracel Develops and markets high-performance
    text and genomic data analysis systems.
  • Celera Provides genomic data and analysis
    tools. (2003 ventes 88.3 millions, 750
    employés)
  • MDL Makers of Assay Explorer software to track
    and datamine imaging based experiments.
  • LabBook Provides XML-powered Internet solutions
    and bioinformatics applications.
  • Applied Biosciences (2003 ventes 1,682.9
    millions, 4,540 employés)
  • IBM
  • Accelrys Supplier of bioinformatics software
    for gene and protein sequence analysis.
  • (2002 ventes 95.1 millions, 540 employés)

18
Enjeux
- séquence - taux d'expression
- séquence - fonction - structure 3D
Contexte - Drug design - Diagnostic
19
Enjeux
Valeur ajoutée
Savoir Informations Données Biologie
Volume
20
BENthe Belgian EMBnet Node
  • Initiative commune U.LB. et V.U.B.
  • Financé par la Politique scientifique fédérale
  • Membre du réseau EMBnet
  • Opérationel depuis mars 1993
  • Staff de 3 personnes
  • Offre banques de données logiciels d'analyse
    pour la biologie moléculaire
  • Services en partie libres et accessible par WWW
    et en partie pour utilisateurs enregistrés et
    accessibles par WWW ou par session terminal
  • Support technique accessible par téléphone ou
    E-mail http//www.be.embnet.org
    ben_at_vub.ac.be

21
(No Transcript)
22
BeBIF Belgian Biodiversity Information
Facility Le nud national belge du réseau mondial
GBIF http//www.be.gbif.net http//www.bebif.be
23
Système mondial dinformation sur la biodiversité
(www.gbif.org)
  • Projet scientifique coopératif international
  • Mis en place par lOCDE
  • Protocole daccord multilatéral entre des pays,
    des économies et des organisations
    internationales
  • infrastructure distribuée dinformation consacrée
    aux données primaires en biodiversité
  • espèces et leur distribution (spécimens,
    observations)
  • liens au niveau moléculaire, génétique et des
    écosystèmes
  • Information scientifique sur la biodiversité
    mondiale disponible gratuitement et
    universellement
  • Application effective des accords de Rio relatifs
    à la Convention sur la Biodiversité (1992).

24
Pays et Economies (41)
Organisations (26)
ASEAN Regional Centre for Biodiversity
Conservation, ASEANET, All Species Foundation,
BIOSIS, BioNET-INTERNATIONAL, CABI Bioscience,
EASIANET, European Commission, Expert Center for
Taxonomic Identification, Finding Species,
Freshwater Biological Association
FreshwaterLife, IUCN, Integrated Taxonomic
Information System, Inter-American Biodiversity
Information Network, International Centre for
Insect Physiology and Ecology, NatureServe,
Nordic Gene Bank, Ocean Biogeographic Information
System, SAFRINET, Société de Bactériologie
Systématique et Vétérinaire, Species 2000,
Taxonomic Databases Working Group, United Nations
Educational Scientific and Cultural Organisation,
Man and the Biosphere Programme, United Nations
Environment Programme, Wildscreen Trust, World
Federation for Culture Collections
25
GBIF Data Node
  • Système distribué
  • Format déchange de données
  • Par voie dinterfaces déchange normalisées
  • Métadonnées sur les data node et leurs services
  • Libre accès aux données de biodiversité.
  • Permet aux institutions de partager les données
    quils souhaitent rendrent publiques en utilisant
    des formats déchanges structurés sans égard aux
    formats et aux systèmes quils utilisent.

26
Les standards déchange
  • Description des données en XML
  • Spécimen, observation
  • Nom, taxon
  • Institution, fournisseur, collection,
  • Personnes (fonctions variées)
  • Processus de normalisation
  • GBIF travaille avec TDWG
  • Discussion, documentation
  • Open source
  • digir.sourceforge.net

27
Formats déchange Darwin Core2 et ABCD
  • Darwin Core 2 http//digir.net/schema/conceptua
    l/darwin/2003/1.0/darwin2.xsd
  • 48 éléments
  • Spécimens et observation
  • Information de base quoi, quand, ou , par qui ?
  • Actuellement utilisé par le GBIF
  • Utile pour établir des catalogues despèces
  • ABCD (Access to Biological collection Data)
    http//www.bgbm.org/tdwg/CODATA/Schema/default.htm
  • Plus de 700 éléments
  • Subdivisé en disciplines
  • Accords entre groupes thématiques
  • Actuellement utilisé par le réseau européen
    BioCASE
  • En phase dimplémentation au GBIF
  • Permet léchange dinformation

28
(No Transcript)
29
(No Transcript)
30
Collaborations et Projets
Plan national
Programme d'Appui au Développement Durable
(PADD) Centralisation des données relatives à la
biodiversité collectées lors de la réalisation de
ces projets
Institut Royal des Sciences Naturelles de Belgique
Invertébrés Récents (Laboratoire de
Carcinologie) Bianzo (Benthos Antarctique)
Jardin Botanique National de Belgique
Projet de collaboration Prototype Image Server
to integrate the Martius Herbarium and the
Digital Flora brasiliensis (Etude de Faisabilité
ENBI)
Musée de lAfrique Centrale
Valorisation des collections du musée,The African
Biodiversity Information Centre (ABIC), (2 Etudes
de Faisabilité ENBI, Rift Albertien, Mouches
causant des dommages aux fruits)
31
Collaborations et Projets
Nud Belge de EMBnet (BEN) afin de fournir des
liens vers les données de séquences et les outils
informatiques en biologie moléculaire et génétique
Collaboration avec les Collections Coordonnées
Belges de Microorganismes (BCCM) afin d'exposer
une partie de leurs données aux standards GBIF
Fédération des Banques de données
biogéographiques (Université de Mons)
FBDB
Belgian Committee of the International Water
Association (BIWA)
Unité de Recherche en Biologie des Organismes
(URBO, Facultés Universitaires Notre-Dame de la
Paix à Namur) Fournisseur de données de BeBIF
(Sous-Contractant) spécialisé en écologie des
eaux douces
Collaboration avec les Provinces, Commaunautés et
les Regions en Belgique
32
  • Systèmes de gestion de bases de données
    PostgreSQL
  • Systèmes déchange de données DiGIR
    (DarwinCore), BioCASE (ABCD)
  • Interface web Apache, Tomcat, Java
  • Système dinformation géographique MapServer,
    OpenMap, Geotools, Degree, Utilisation de données
    libres couches géographiques, données
    géoréférencées (climatiques, géologiques, de
    pollutions), gazetteers
  • Système dexploitation Debian Linux

Compétences et Services
  • Expertises en Systèmes dInformation
    Géographiques (OpenSource)
  • Traitements des données
  • Analyse de base de données
  • Analyse des besoins et solutions pour nos
    utilisateurs dans le domaine de la biodiversité
  • Hosting de données, mise en ligne, interface de
    requêtes adaptées à la demande

33
L'Avenir
Dans le cadre de la mise sur pied dun Belgian
Biological Resource Centre (BRC) en Biodiversité
les rôles de la cellule informatique seront
  • Réseau d'information sur la Biodiversité
     Belge  utilisant les outils informatiques
    DIGIR et BioCASE et les standards DarwinCore et
    ABCD pour l'échange de données avec les
    organismes internationaux tels que le GBIF
  • Portail central combinant l'interrogation sur des
    bases de données distribuées et centrales.
  • Offres de différents services en fonction des
    besoins des utilisateurs serveur de
    cartographie, possibilité d'introduction et de
    mise à jour de données, outils de validation et
    de contrôle de la qualités des données, outils
    d'analyse et de modélisation des données

34
Personnel
Infrastructure
Serveurs ULB/VUB Quad-Xeon MP _at_ 1.50GHz 2GB
memory 500GB storage on a SCSI Hotswap RAID5
array Running Debian Linux BeBIF core
server University of Gent Bi-Xeon _at_ 2.40GHz 2GB
memory 200GB storage on a SCSI Hotswap RAID5
array Running Debian Linux Server shared with
BCCM-IT project University of Namur Xeon _at_
2.40GHz 1GB memory 300GB storage on a RAID5
array Running Debian Linux
Robert Herzog, BeBIF Promoteur, rherzog_at_ulb.ac.be
Patricia Mergen, BeBIF Chef de Projet,
pmergen_at_ulb.ac.be
Frédéric Wautelet, BeBIF Responsable
informatique fwautele_at_ben.vub.ac.be
Johan Duflost, BeBIF Analyste Programmeur, jduflo
st_at_ben.vub.ac.be
35
Contacts BeBIF
BeBIF http//www.be.gbif.net and
http//www.bebif.be GBIF http//www.gbif.org
Belgian Biodiversity Information Facility
(BeBIF) Université Libre de Bruxelles Campus de
la Plaine CP 257 Bâtiment NO, Bureau 4 O4 209
(Niveau 4) Boulevard du Triomphe, entrée ULB
2 B-1050 Bruxelles pmergen_at_ulb.ac.be Tél. 32
2 650 57 51 - Fax 32 2 650 51 24
36
(No Transcript)
37
Caractéristiques
  • Distribué
  • Basé sur des ontologies de donnée et de service
  • Modulable et extensible
  • Ajout dontologie de donnée
  • Ajout dobjet métier
  • Caractéristiques
  • Accès unifié vers les ressources
  • GUI basé sur type de donnée
  • Edition et partage de workflow
  • Notion de services

38
Equipe
39
Olivier DUGAS odugas_at_dbm.ulb.ac.be
BIGRE!
Write a Comment
User Comments (0)
About PowerShow.com