Title: Dfinition relle
1Introduction
- Définition réelle
- La Bioinformatique est la discipline de l
- Analyse de lInformation Biologique.
- Malgré son nom, la "bioinformatique" ne doit pas
être confondue avec - une simple application aux données biologiques
des concepts et des - outils de l'informatique traditionnelle. Les
défis principaux de la - bioinformatique sont l'identification des gènes
et la prédiction de leur - fonction, deux problèmes au centre de la
"génomique fonctionnelle".
2Introduction
- Définition de la réalité
- De façon très générale
- Toutes les applications de l'informatique à la
biologie. - - étude in silico de la connectique des neurones,
- - traitement quantitatif et qualitatif d'images
microscopiques, - - la gestion des échantillons et des données
expérimentales dans les grands laboratoires
industriels, - - la modélisation de l'évolution de populations
animales dans des conditions écologiques
spécifiques, - - ...
3Introduction
- Applications majeurs
- Partie émergeante de la bioinformatique
-  méthodes en biologie capable de générer des
quantités très importantes de données sans
nécessairement les lier à des hypothèses de
travail précises - Les  OmiquesÂ
- génomique - transcriptomique protéomique
glycomique
4Génomique
5Transcriptomique
6Protéomique
7Historique
- 1951 Première séquence protéique (Insuline,
Sanger) - 1960 Lien entre séquence structure (Globines,
Perutz) - 1965 Premier Ordinateurs IBM/360
- 1965 "Evolutionary divergence and convergence in
Proteins" (Zuckerkandl Pauling) - 1967 "Construction of Phylogenetic Trees" Fitch
Margoliash. - 1968 Atlas of Protein Sequences (M. Dayhoff,
Georgetown) - 1968 mini-ordinateur DEC PDP-8
- 1970 "A general method applicable to the search
for similaries in sequences of two proteins"
(Needleman Wunsch). - 1971 Premier travaux sur le repliement des ARNs
(J. Ninio) - 1972 Premier microprocesseur Intel 8008
- 1974 "Prediction of Protein Conformation" (Chou
Fasman) - 1975 Intel 8080, kit Altair
- 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
(Apple, Commodore, Radioshack)- - Séquençage d'ADN (Sanger, Maxam, Gilbert)
- 1977 Premier "package" Bioinformatique (Staden)
- 1978 Bases de données ACNUC, PIR, EMBL, GenBank
- 1980 Accès téléphonique à la base de données PIR
- 1981 IBM-PC (8088), 16-32kb
- 1981 Los Alamos-GenBank 270 séquences, 370.000
nucléotides Programme d'alignement local
(Smith-Waterman)
8(No Transcript)
9Historique
- 1951 Première séquence protéique (Insuline,
Sanger) - 1960 Lien entre séquence structure (Globines,
Perutz) - 1965 Premier Ordinateurs IBM/360
- 1965 "Evolutionary divergence and convergence in
Proteins" (Zuckerkandl Pauling) - 1967 "Construction of Phylogenetic Trees" Fitch
Margoliash. - 1968 Atlas of Protein Sequences (M. Dayhoff,
Georgetown) - 1968 mini-ordinateur DEC PDP-8
- 1970 "A general method applicable to the search
for similaries in sequences of two proteins"
(Needleman Wunsch). - 1971 Premier travaux sur le repliement des ARNs
(J. Ninio) - 1972 Premier microprocesseur Intel 8008
- 1974 "Prediction of Protein Conformation" (Chou
Fasman) - 1975 Intel 8080, kit Altair
- 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
(Apple, Commodore, Radioshack)- - Séquençage d'ADN (Sanger, Maxam, Gilbert)
- 1977 Premier "package" Bioinformatique (Staden)
- 1978 Bases de données ACNUC, PIR, EMBL, GenBank
- 1980 Accès téléphonique à la base de données PIR
- 1981 IBM-PC (8088), 16-32kb
- 1981 Los Alamos-GenBank 270 séquences, 370.000
nucléotides Programme d'alignement local
(Smith-Waterman)
10(No Transcript)
11Historique
- 1951 Première séquence protéique (Insuline,
Sanger) - 1960 Lien entre séquence structure (Globines,
Perutz) - 1965 Premier Ordinateurs IBM/360
- 1965 "Evolutionary divergence and convergence in
Proteins" (Zuckerkandl Pauling) - 1967 "Construction of Phylogenetic Trees" Fitch
Margoliash. - 1968 Atlas of Protein Sequences (M. Dayhoff,
Georgetown) - 1968 mini-ordinateur DEC PDP-8
- 1970 "A general method applicable to the search
for similaries in sequences of two proteins"
(Needleman Wunsch). - 1971 Premier travaux sur le repliement des ARNs
(J. Ninio) - 1972 Premier microprocesseur Intel 8008
- 1974 "Prediction of Protein Conformation" (Chou
Fasman) - 1975 Intel 8080, kit Altair
- 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
(Apple, Commodore, Radioshack)- - Séquençage d'ADN (Sanger, Maxam, Gilbert)
- 1977 Premier "package" Bioinformatique (Staden)
- 1978 Bases de données ACNUC, PIR, EMBL, GenBank
- 1980 Accès téléphonique à la base de données PIR
- 1981 IBM-PC (8088), 16-32kb
- 1981 Los Alamos-GenBank 270 séquences, 370.000
nucléotides Programme d'alignement local
(Smith-Waterman)
12Historique
- 1951 Première séquence protéique (Insuline,
Sanger) - 1960 Lien entre séquence structure (Globines,
Perutz) - 1965 Premier Ordinateurs IBM/360
- 1965 "Evolutionary divergence and convergence in
Proteins" (Zuckerkandl Pauling) - 1967 "Construction of Phylogenetic Trees" Fitch
Margoliash. - 1968 Atlas of Protein Sequences (M. Dayhoff,
Georgetown) - 1968 mini-ordinateur DEC PDP-8
- 1970 "A general method applicable to the search
for similaries in sequences of two proteins"
(Needleman Wunsch). - 1971 Premier travaux sur le repliement des ARNs
(J. Ninio) - 1972 Premier microprocesseur Intel 8008
- 1974 "Prediction of Protein Conformation" (Chou
Fasman) - 1975 Intel 8080, kit Altair
- 1977 mini-ordinateur DEC-VAX.-Micro-ordinateurs
(Apple, Commodore, Radioshack)- - Séquençage d'ADN (Sanger, Maxam, Gilbert)
- 1977 Premier "package" Bioinformatique (Staden)
- 1978 Bases de données ACNUC, PIR, EMBL, GenBank
- 1980 Accès téléphonique à la base de données PIR
- 1981 IBM-PC (8088), 16-32kb
- 1981 Los Alamos-GenBank 270 séquences, 370.000
nucléotides Programme d'alignement local
(Smith-Waterman)
13LEvolution
14(No Transcript)
15Â Les BioinformatiquesÂ
- Lanalyse
- Besoin propre réaliser au sein des
entreprises/laboratoires, - Quelques petites entreprises basées sur un
transfert de savoir, - Produit résultant à haute valeur ajoutée,
- Puissance de calcul importante.
- La mise à disposition de logiciel et services
- Buisness de vente de logiciel  classiqueÂ
- Package universitaire online, payant ou gratuit.
- La mise à disposition de données
- Production de données par technologies  haut
débit (séquençage ADN, screening protéique, etc
), - Majoritairement gratuit.
16Marché
- Marché des plateformes et logiciels
bioinformatiques - 52 millions en 2000
- 202 millions 2004
- 634 million 2006
- Marché des données
- 225 millions en 2001
- 445 millions en 2006
- Marché Analyse Consulting ?
- développement des médicaments
- moins 33 en terme de coût
- moins 2 ans pour AMM
- 60 dexternalisation / achat
- Prévision de marché 1,7 milliard pour 2006
17Acteurs et chiffres
- LionBioScience Biological information
technology company providing integrated solutions
for genomics. (2003 ventes 32.3 millions, 337
employés) - Tripos Provider of discovery research software
services. (2003 ventes 54.1 millions, 358
employés) - Paracel Develops and markets high-performance
text and genomic data analysis systems. - Celera Provides genomic data and analysis
tools. (2003 ventes 88.3 millions, 750
employés) - MDL Makers of Assay Explorer software to track
and datamine imaging based experiments. - LabBook Provides XML-powered Internet solutions
and bioinformatics applications. - Applied Biosciences (2003 ventes 1,682.9
millions, 4,540 employés) - IBM
- Accelrys Supplier of bioinformatics software
for gene and protein sequence analysis. - (2002 ventes 95.1 millions, 540 employés)
18Enjeux
- séquence - taux d'expression
- séquence - fonction - structure 3D
Contexte - Drug design - Diagnostic
19Enjeux
Valeur ajoutée
Savoir Informations Données Biologie
Volume
20BENthe Belgian EMBnet Node
- Initiative commune U.LB. et V.U.B.
- Financé par la Politique scientifique fédérale
- Membre du réseau EMBnet
- Opérationel depuis mars 1993
- Staff de 3 personnes
- Offre banques de données logiciels d'analyse
pour la biologie moléculaire - Services en partie libres et accessible par WWW
et en partie pour utilisateurs enregistrés et
accessibles par WWW ou par session terminal - Support technique accessible par téléphone ou
E-mail http//www.be.embnet.org
ben_at_vub.ac.be
21(No Transcript)
22BeBIF Belgian Biodiversity Information
Facility Le nud national belge du réseau mondial
GBIF http//www.be.gbif.net http//www.bebif.be
23Système mondial dinformation sur la biodiversité
(www.gbif.org)
- Projet scientifique coopératif international
- Mis en place par lOCDE
- Protocole daccord multilatéral entre des pays,
des économies et des organisations
internationales - infrastructure distribuée dinformation consacrée
aux données primaires en biodiversité - espèces et leur distribution (spécimens,
observations) - liens au niveau moléculaire, génétique et des
écosystèmes - Information scientifique sur la biodiversité
mondiale disponible gratuitement et
universellement - Application effective des accords de Rio relatifs
à la Convention sur la Biodiversité (1992).
24Pays et Economies (41)
Organisations (26)
ASEAN Regional Centre for Biodiversity
Conservation, ASEANET, All Species Foundation,
BIOSIS, BioNET-INTERNATIONAL, CABI Bioscience,
EASIANET, European Commission, Expert Center for
Taxonomic Identification, Finding Species,
Freshwater Biological Association
FreshwaterLife, IUCN, Integrated Taxonomic
Information System, Inter-American Biodiversity
Information Network, International Centre for
Insect Physiology and Ecology, NatureServe,
Nordic Gene Bank, Ocean Biogeographic Information
System, SAFRINET, Société de Bactériologie
Systématique et Vétérinaire, Species 2000,
Taxonomic Databases Working Group, United Nations
Educational Scientific and Cultural Organisation,
Man and the Biosphere Programme, United Nations
Environment Programme, Wildscreen Trust, World
Federation for Culture Collections
25 GBIF Data Node
- Système distribué
- Format déchange de données
- Par voie dinterfaces déchange normalisées
- Métadonnées sur les data node et leurs services
- Libre accès aux données de biodiversité.
- Permet aux institutions de partager les données
quils souhaitent rendrent publiques en utilisant
des formats déchanges structurés sans égard aux
formats et aux systèmes quils utilisent.
26Les standards déchange
- Description des données en XML
- Spécimen, observation
- Nom, taxon
- Institution, fournisseur, collection,
- Personnes (fonctions variées)
- Processus de normalisation
- GBIF travaille avec TDWG
- Discussion, documentation
- Open source
- digir.sourceforge.net
27Formats déchange Darwin Core2 et ABCD
- Darwin Core 2 http//digir.net/schema/conceptua
l/darwin/2003/1.0/darwin2.xsd - 48 éléments
- Spécimens et observation
- Information de base quoi, quand, ou , par qui ?
- Actuellement utilisé par le GBIF
- Utile pour établir des catalogues despèces
- ABCD (Access to Biological collection Data)
http//www.bgbm.org/tdwg/CODATA/Schema/default.htm
- Plus de 700 éléments
- Subdivisé en disciplines
- Accords entre groupes thématiques
- Actuellement utilisé par le réseau européen
BioCASE - En phase dimplémentation au GBIF
- Permet léchange dinformation
28(No Transcript)
29(No Transcript)
30Collaborations et Projets
Plan national
Programme d'Appui au Développement Durable
(PADD) Centralisation des données relatives à la
biodiversité collectées lors de la réalisation de
ces projets
Institut Royal des Sciences Naturelles de Belgique
Invertébrés Récents (Laboratoire de
Carcinologie) Bianzo (Benthos Antarctique)
Jardin Botanique National de Belgique
Projet de collaboration Prototype Image Server
to integrate the Martius Herbarium and the
Digital Flora brasiliensis (Etude de Faisabilité
ENBI)
Musée de lAfrique Centrale
Valorisation des collections du musée,The African
Biodiversity Information Centre (ABIC), (2 Etudes
de Faisabilité ENBI, Rift Albertien, Mouches
causant des dommages aux fruits)
31Collaborations et Projets
Nud Belge de EMBnet (BEN) afin de fournir des
liens vers les données de séquences et les outils
informatiques en biologie moléculaire et génétique
Collaboration avec les Collections Coordonnées
Belges de Microorganismes (BCCM) afin d'exposer
une partie de leurs données aux standards GBIF
Fédération des Banques de données
biogéographiques (Université de Mons)
FBDB
Belgian Committee of the International Water
Association (BIWA)
Unité de Recherche en Biologie des Organismes
(URBO, Facultés Universitaires Notre-Dame de la
Paix à Namur) Fournisseur de données de BeBIF
(Sous-Contractant) spécialisé en écologie des
eaux douces
Collaboration avec les Provinces, Commaunautés et
les Regions en Belgique
32- Systèmes de gestion de bases de données
PostgreSQL - Systèmes déchange de données DiGIR
(DarwinCore), BioCASE (ABCD) - Interface web Apache, Tomcat, Java
- Système dinformation géographique MapServer,
OpenMap, Geotools, Degree, Utilisation de données
libres couches géographiques, données
géoréférencées (climatiques, géologiques, de
pollutions), gazetteers - Système dexploitation Debian Linux
Compétences et Services
- Expertises en Systèmes dInformation
Géographiques (OpenSource) - Traitements des données
- Analyse de base de données
- Analyse des besoins et solutions pour nos
utilisateurs dans le domaine de la biodiversité - Hosting de données, mise en ligne, interface de
requêtes adaptées à la demande
33L'Avenir
Dans le cadre de la mise sur pied dun Belgian
Biological Resource Centre (BRC) en Biodiversité
les rôles de la cellule informatique seront
- Réseau d'information sur la Biodiversité
 Belge  utilisant les outils informatiques
DIGIR et BioCASE et les standards DarwinCore et
ABCD pour l'échange de données avec les
organismes internationaux tels que le GBIF - Portail central combinant l'interrogation sur des
bases de données distribuées et centrales. - Offres de différents services en fonction des
besoins des utilisateurs serveur de
cartographie, possibilité d'introduction et de
mise à jour de données, outils de validation et
de contrôle de la qualités des données, outils
d'analyse et de modélisation des données
34Personnel
Infrastructure
Serveurs ULB/VUB Quad-Xeon MP _at_ 1.50GHz 2GB
memory 500GB storage on a SCSI Hotswap RAID5
array Running Debian Linux BeBIF core
server University of Gent Bi-Xeon _at_ 2.40GHz 2GB
memory 200GB storage on a SCSI Hotswap RAID5
array Running Debian Linux Server shared with
BCCM-IT project University of Namur Xeon _at_
2.40GHz 1GB memory 300GB storage on a RAID5
array Running Debian Linux
Robert Herzog, BeBIF Promoteur, rherzog_at_ulb.ac.be
Patricia Mergen, BeBIF Chef de Projet,
pmergen_at_ulb.ac.be
Frédéric Wautelet, BeBIF Responsable
informatique fwautele_at_ben.vub.ac.be
Johan Duflost, BeBIF Analyste Programmeur, jduflo
st_at_ben.vub.ac.be
35Contacts BeBIF
BeBIF http//www.be.gbif.net and
http//www.bebif.be GBIF http//www.gbif.org
Belgian Biodiversity Information Facility
(BeBIF) Université Libre de Bruxelles Campus de
la Plaine CP 257 Bâtiment NO, Bureau 4 O4 209
(Niveau 4) Boulevard du Triomphe, entrée ULB
2 B-1050 Bruxelles pmergen_at_ulb.ac.be Tél. 32
2 650 57 51 - Fax 32 2 650 51 24
36(No Transcript)
37Caractéristiques
- Distribué
- Basé sur des ontologies de donnée et de service
- Modulable et extensible
- Ajout dontologie de donnée
- Ajout dobjet métier
- Caractéristiques
- Accès unifié vers les ressources
- GUI basé sur type de donnée
- Edition et partage de workflow
- Notion de services
38Equipe
39 Olivier DUGAS odugas_at_dbm.ulb.ac.be
BIGRE!