Title: Nicolas Jacq, jacqclermont'in2p3'fr
1Introduction aux grilles informatiques
- Nicolas Jacq, jacq_at_clermont.in2p3.fr
- Laboratoire de Physique Corpusculaire, CNRS/IN2P3
- IUT dAurillac, licence bioinformatique
- 23/11/2005
- Crédits le projet EGEE
2La vision de léquipe PCSV
EQUIPE PCSV
Médecine nucléaire Radio / curiethérapie
Sciences du vivant médecine
Imagerie médicale
Développements spécifiques
Bio / Healthgrid
GATE
GEANT4
Grilles informatiques
Instrumentation
Gestion et analyse des données
Simulation modélisation
Détecteurs
Recherche fondamentale en physique corpusculaire
3Introduction aux grilles informatiques
- Les grilles, pourquoi ?
- Le besoin des utilisateurs
- Évolution des architectures informatiques
- La grille, quest-ce que cest ?
- Analogie électrique
- Définition
- Impact dune grille
- Quels sont les utilisateurs des grilles ?
- Les organisations de recherche
- Les entreprises
- Quel sont les projets de grille ?
- EGEE
- Auvergrid
- RUGBI
- Quel apport pour la bio-informatique ?
4Problématique de la recherche
- Divers domaines dapplication
- Physique(s)
- Sciences de la vie
- Sciences de la terre
- Etc.
- Même besoin de traitement de linformation
- Ressources informatiques
- Développement dapplications dédiées
5Caractéristiques des applications
- Applications gourmandes
- En puissance de calcul
- En stockage de données
- Problème Dimensionnement des ressources
Zzz Zzz
MeteoSysgt La météo dhier sera Bonne
6Caractéristiques des applications
- Applications utilisées par une communauté
scientifique - Transversale aux organisations de tutelle
- Géographiquement distribuée
- Travail collaboratif
- Partage des applicatifs
- Partages des données
- Problème Accès partagé aux ressources
7Evolution de linfrastructure informatique
- Les machines diminuent en taille et se relient en
réseaux - Les réseaux augmentent en nombre et augmentent en
interconnexion
Optical Fibre(bits per second)
Doubling Time(months)
Gilders Law(32X in 4 yrs)
Data Storage(bits per sq. inch)
Storage Law (16X in 4yrs)
Performance per Dollar Spent
Chip capacity(numb. transistors)
Moores Law(5X in 4yrs)
0 1 2
3 4 5
Number of Years
Triumph of Light Scientific American. George
Stix, January 2001
8Calcul local
- Toutes les ressources sont sur un seul site, en
accès direct par lutilisateur - Problème de performance, mémoire
- Exemple sa station de travail
9 Calcul distant
- Ressources accessibles à distance
- Toutes les ressources importantes sont encore
centralisées - Exemple supercalculateur (CINES), centre de
calcul (CC, LPC)
OU
10Calcul parallèle
- Multiples ordinateurs ou processeurs travaillant
ensemble sur des tâches communes - Échange de données important au cours du calcul
entre les processeurs (supercalculateur ou ferme) - Exemple de technologie MPI (Message Passing
Interface)
11Calcul distribué
- Ressources géographiquement distribuées
- Accès spécialisé important transferts de
données logiciels de coordination,
dordonnancement - Exemple Napster, Seti_at_home, clusters
12Défintion dun ordonnanceur de tâche dune
plate-forme de calcul
- Plate-forme de calcul (ou ferme ou grappe ou
cluster) - Parc informatique de machines fonctionnant sous
divers systèmes dexploitation et reliées par un
réseau local. - Ordonnanceur de tâches (ou système de batch)
- Unique point dentrée commun à tous les
utilisateurs pour soumettre des tâches sur une
plate-forme de calcul. - Rôle de recevoir les tâches soumises par les
utilisateurs, de les ordonnancer et de les
soumettre pour exécution sur une machine de
calcul (worker) appropriée et disponible. - La mutualisation permet une utilisation optimale
de l'ensemble dune ferme. - Exemple BQS
13Introduction aux grilles informatiques
- Les grilles, pourquoi ?
- Le besoin des utilisateurs
- Évolution des architectures informatiques
- La grille, quest-ce que cest ?
- Analogie électrique
- Définition
- Impact dune grille
- Quels sont les utilisateurs de la grille ?
- Les organisations de recherche
- Les entreprises
- Quel sont les projets de grille ?
- EGEE
- Auvergrid
- RUGBI
- Quel apport pour la bio-informatique ?
14Le concept de grille analogie
Le réseau électrique Réseau haute tension
Centrales de production délectricité
15Le concept de grille informatique (GRID)
Internet Mise à disposition statique de
linformation Grilles Internet Ressources
informatiques Services de gestion dynamique
de linformation (collecte, transfert, tri,
analyse)
16Définition
- GRID, Globalisation des Resources Informatiques
et des Données - Chaque noeud est constitué dune ressource de
calculs et/ou de stockage - Par exemple une ferme de PCs ou un espace de
sauvegarde - Chaque noeud est propriétaire de sa ressource et
définit les modalités de partage - Cette ressource est interfacée à la grille par
linstallation dun intergiciel permettant - De lire et décrire sur des espaces disques
partagés par des communautés virtuelles - De soumettre des tâches de calcul à distance et
de rapatrier des résultats - Intergiciel (middleware) Classe de logiciels
qui assurent l'intermédiaire entre les
applications et le transport des données par les
réseaux.
17Un aperçu de la grille
18Les utilisateurs
- La technologie de grille permet
- aux scientifiques
- Daccéder à des ressources de façon transparente
- Dinteragir avec des collègues
- Danalyser des données volumineuses
- De partager les résultats
19Les ressources
- La grille intègre des ressources
- traditionnelles
- Puissance de calcul
- Stockage (disque, bande, ...)
- réseau
- Les ressources sont
- hétérogènes
- dynamiques
20Les outils de production de données
- Les détecteurs produisent
- dénormes quantités de
- données à analyser.
- Fournisseurs
- Instruments scientifiques (séquenceurs)
- Technologies pour les conférences
- Video, audio, chat
21Les données et les logiciels
- Accès aux données
- Fichiers et ensembles de données
- Bases de données
- Méta-données des données
- Méta-données des logiciels
- Gestion des données
- Transfert et copie des données
- Localiser les données pertinentes
22Les services
- Services
- Services de haut-niveau pour faciliter
lutilisation de la grille - Ex Gestion des jobs
- Services spécifiques aux applications
- Ex Portails
23Quest-ce que la grille ?
- Intergiciel
- Service dinteropérabilité entre les ressources
- Services de haut-niveau pour faciliter
lutilisation de la grille - Resources
- Fournies par les participants à la grille
- Partagées pour une utilisation efficace
24Représentation en couches
Réseaux
- Grille distribuée sur des sites distants
interconnectés par des réseaux à haut débit - Des ressources importantes de calcul et de
stockage - Gérées par un système dexploitation commun
- Offrant un ensemble de services permettant de
déployer des applications à grande échelle - Pour servir des communautés dutilisateurs
Ressources de calcul et de stockage
Services de grille Système dexploitation
Applications à grande échelle
Communautés dutilisateurs
25Status des grilles
- Calcul sur grille
- Ressources et services géographiquement
distribués - Accès transparent
- Transferts des calculs et de données
- Organisation et fonctionnalités pour un calcul
facile, modulable, extensible - Source
- Ian Foster et Carl Kesselman, Universités
américaines (globus) - Repris et en cours de diffusion à grande échelle
par lEurope - Exploitation ?
- Il existe de multiple projets en dév. dans le
monde, quelques uns sont en production
26Impact potentiel dune grille sur la santé
publique
- Été 2003, une vague de chaleur en Europe tue 10
000 personnes en France - Le pourcentage de mortalité était en excès de 10
à 50 dans les maisons de retraite et les
hôpitaux. Mais linformation a été ignorée
pendant 2 semaines. - Un système de monitoring aurait pu donner
lalarme plus tôt - Besoin de collecter linformation des hôpitaux et
des services funéraires en fonction du nombre de
cas - Dinternet à la grille
- Internet nécessite de la main-duvre pour
fournir une information fiable sur un portail web
centralisé - Avantage dune grille fédération de bases de
données localisées dans les hôpitaux et les
services funéraires des services pour calculer
le pourcentage de mortalité et signaler un excès - La technologie rend possible ce système
aujourdhui
27Développement pharmaceutique
Molecular Docking Predict how small molecules,
such as substrates or drug candidates, bind to a
receptor of known 3D structure
Target discovery
Lead discovery
Lead Optimization
Target Identification
Clinical Phases (I-III)
Target Validation
Lead Identification
Duration 12 15 years, Costs 500 - 800 million
US
28Impact potentiel dune grille sur le criblage
virtuel de molécules
Millions of chemical compounds available in
laboratories
wisdom.eu-egee.fr
High Throughput Screening 1-10/compound, nearly
impossible
- - 1,000,000 Chemical
- compounds
Molecular docking (FlexX, Autodock) 80 CPU
years, 1 TB data
Computational data challenge 6 weeks on 1600
computers
5 structures, 8 scenarios
Hits screening using assays performed on living
cells
Leads
Clinical testing
X-crystallographic data of disease targets
available in laboratories
Drug
29En résumé
- Une grille de calcul est un ensemble formé de
plusieurs éléments - Une capacité de calcul de plusieurs milliers de
calculateurs - Une capacité de stockage -gt des données en masse
(petaoctets) - Un réseau à très haut débit interconnectant les
sites - Un ensemble logiciel permettre le fonctionnement
en grille - Des outils et applications tirant partie de la
grille - Bénéfices
- Puissance de calcul illimitée
- Exécution de grandes applications mettant en
oeuvre des milliers de calculateurs - Accès transparent à des ressources de haut niveau
depuis un poste de travail - Une même manière de présenter et d'utiliser une
large gamme de ressources - Une localisation des ressources de calcul et de
stockage répartie et indépendante - Sécurité assurée à travers l'authentification,
des autorisations, et la confidentialité
30- http//gridcafe.web.cern.ch/gridcafe/
- http//gridcafe.web.cern.ch/gridcafe/demos/Grid-be
ginners.ppt
31Introduction aux grilles informatiques
- Les grilles, pourquoi ?
- Le besoin des utilisateurs
- Évolution des architectures informatiques
- La grille, quest-ce que cest ?
- Analogie électrique
- Définition
- Impact dune grille
- Quels sont les utilisateurs de la grille ?
- Les organisations de recherche
- Les entreprises
- Quel sont les projets de grille ?
- EGEE
- Auvergrid
- RUGBI
- Quel apport pour la bio-informatique ?
32Une grille pour la santé
In this context "Health" does not involve only
clinical practice but covers the whole range of
information from molecular level (genetic and
proteomic information) over cells and tissues, to
the individual and finally the population level
(social healthcare).
S. Nørager Y. Paindaveine European
Commission DG-INFSO
33Potential grid services for virtual screening
Grid service customers
Biology teams
Chemist/biologist teams
Grid infrastructure
hits
Selected hits
target
Virtual Docking services
Annotation services
MD service
Grid service providers
Chimioinformatics teams
Bioinformatics teams
34Les acteurs dune grille
- Utilisateurs
- Scientifiques avec un projet
- Scientifiques fournisseurs dapplications et de
bases de données - Organisations virtuelles
- Personnes membres dune institution avec des buts
communs - Partager les ressources pour atteindre les buts
- Administrateurs de sites
- Personnes responsables pour maintenir les
ressources des institutions - Contrôler lefficacité et lutilisation correcte
des ressources disponibles - Organisations réelles
- Instituts, agences financées, gouvernements
35La grille, outil de mutualisation
- La grille est un moyen de structuration des
organisations - Mutualisation
- Transfert de technologies
- Modifier les comportements
- Besoins de
- standards
- veille technologique
- Support développeur, utilisateur
- Groupes de discussion
- Interne aux organisations, aux projets
- Entre organisations, projets, pays, continents
- Groupe de travail, conférence, production de
documents de référence - Global Grid Forum (GGF), Healthgrid
36Un exemple de motivation économique
- Lutilisation des ressources informatiques varie
au cours du temps - Analyses financières de fin de trimestre
- Période de vacances de juillet et aout
-
- Solutions habituelles
- Acheter la capacité maximale nécessaire gt
tourner au ralenti en période basse - Acheter la capacité moyenne gt retarder les
résultats - Solution dune grille
- Partager les ressources pour varier la
disponibilité - Acheter la capacité moyenne nécessaire mais
obtenir les résultats au bon moment - Améliorer la fiabilité
37Intérèt pour tous
- Investissements
- Plus de 100 millions de dollars investis par les
instituts publiques dans le monde dans des
projets de grille (NSF, NASA, Europe, CNRS) - IBM a investit plusieurs milliards de dollars sur
le calcul à la demande . Sun, Microsoft, HP
développent leurs technologies de grille. Oracle,
Communication Système participent aux projets. - Des solutions grilles sont proposées aujourdhui
Novartis utilise la technologie de United
Devices - Espoirs
- Permettre aux chercheurs de résoudre de nouveaux
problèmes - Fabriquer de nouvelles applications de e-commerce
communiquant entre elles
38Introduction aux grilles informatiques
- Les grilles, pourquoi ?
- Le besoin des utilisateurs
- Évolution des architectures informatiques
- La grille, quest-ce que cest ?
- Analogie électrique
- Définition
- Impact dune grille
- Quels sont les utilisateurs de la grille ?
- Les organisations de recherche
- Les entreprises
- Quel sont les projets de grille ?
- EGEE
- Auvergrid
- RUGBI
- Quel apport pour la bio-informatique ?
39- UK e-Science Grid
- Netherlands VLAM, PolderGrid
- Germany UNICORE, Grid proposal
- France Grid funding approved
- Italy INFN Grid
- Eire Grid proposals
- Switzerland - Network/Grid proposal
- Hungary DemoGrid, Grid proposal
- Norway, Sweden - NorduGrid
- NASA Information Power Grid
- DOE Science Grid
- NSF National Virtual Observatory
- NSF GriPhyN
- DOE Particle Physics Data Grid
- NSF TeraGrid
- DOE ASCI Grid
- DOE Earth Systems Grid
- DARPA CoABS Grid
- NEESGrid
- DOH BIRN
- NSF iVDGL
- DataGrid (CERN, ...)
- EuroGrid (Unicore)
- DataTag (CERN,)
- Astrophysical Virtual Observatory
- GRIP (Globus/Unicore)
- GRIA (Industrial applications)
- GridLab (Cactus Toolkit)
- CrossGrid (Infrastructure Components)
- EGSO (Solar Physics)
40Services de grille clefs
- Authentification et autorisation
- Login individuel, sécurisé (SSL) et encrypté
- Basé sur un certificat, et un proxy expédié à
chaque tâche - Recherche de ressource et publication
dinformation - Recherche dynamique de létat des ressources de
la grille, réseau, tâches, etc - Contrôle constant de ce qui fonctionne/ne
fonctionne pas/ est disponible - Gestion de données
- Accès aux fichiers et transferts
- Gestion de collection de données
- Gestion de ressource
- Programmation de job/process
- Execution de commande
41Services de grille additionnels
- Flux de jobs
- Spécifier les séquences de jobs/processes et les
transferts de données - Dessiner les flux des tâches et les transferts de
données avec les conditions, déterminé par un
moteur de flux de jobs -
- Gestion de lutilisation
- Gestion des comptes
- Gestion des crédits
- Gestion des allocations
- Enregistrement de la session
42Le projet EGEE www.eu-egee.org
- Enabling Grids for E-sciencE
- 71 institutions dans 27 pays, fédérés par des
grilles régionales - 32 M Euros de lUE (2004-5), 100 M de budget
total - But de combiner les capacités de plus de 20000
CPUs - 300 personnes dédiées
43Objectifs du projet EGEE
- Services de Grille en production continue et
fiable - En partant des prototypes et infrastructures de
tests existants vers une qualité industrielle - Pour de nombreux domaines scientifiques
- Procédure viable pour intégrer dautres groupes
scientifiques - Processus largement distribué dingénierie
logicielle, tout en restant efficace et rapide - Harmoniser les activités dEGEE avec celles
nationales et internationales
44- CC-IN2P3 (France)
- LDAP Server
- RLS
CC-IN2P3 1CE 1000 CPU SCAI 1CE 32 CPU
(MPICH) IPP 1CE 2 CPU (MPICH)
LAL 1CE 20 CPU CGG 1CE 8 CPU
LPC 2CE 142 CPU UPV 1CE 20 CPU CNB 1CE
16 CPU
- CNAF (Italy)
- RB (production)
SINICA 1CE 100 CPU TAU 1CE 30 CPU
CNAF 2CE (MPICH)
- IFAE (Spain)
- RB (production)
Cyprus
- Biomedical Resources
- 50 utilisateurs, 7 pays,
- 18 labos de recherche,
- 12 Applications
- 60 CE (3 000 CPUs ),
- 60 SE (21 TB ),
- 20 RB, 1 RLS/RMC
45Applications EGEE
- Biomedicales
- Imagerie médicale, diagnostique, traitement
- Etudes des génomes et des protéines
- Physique des Hautes Energies
- Simulation des interactions des particules
- Analyse des données des détecteurs
- Science de la terre
- Observer les conditions terrestres
- Ressources naturelles
- Chimie
- Simulation de propriétés chimiques
46Infrastructure EGEE / VO, Aspect opérationnel
- Configuration nécessaire pour une VO
- 1 nom de VO unique pour la grille 1 VO manager
- 1 Serveur de gestion des membres et de leurs
rôles - 1 (au moins) Resource Broker (RB)
- 1 Service de Replica Catalog (RLS/RMC)
- 1 User Interface (UI)
- 1 (au moins) Centre de Ressource (RC)
- 1 Système dinformation indexant les ressources
(BDII)
SE
CE
47Infrastructure EGEE / VO, Aspect opérationnel
- Centre de linfrastructure
- Administration globale
- Serveurs de gestion de VO
- Services de Replica Catalog
- Resource Brokers
- Système dinformation de la grille
- Monitoring
- User Support / Astreinte
- Accounting
VO
Resource Broker
France
Italie
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
Replica Catalog
Stockage
48Infrastructure EGEE / VO, Aspect opérationnel
- Centre de ressource
- Fournit à la grille
- Des ressources de calcul
- Des ressources de stokage
VO
Resource Broker
France
Italie
Computing Element
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
Replica Catalog
Storage Element
Stockage
49Infrastructure EGEE / VO, Aspect opérationnel
- Gestion des membres dune VO
- Authentification
- Certificat Electronique émis par une autorité de
certification (CA) - Equivalent à une carte didentité, un passeport
- Autorisations
- Droits en fonction du rôle
- Gérés par
- Groupe (LDAP, actuel)
- Regular user, Software manager,
- Individu, par association dune liste de droits
(VOMS, à venir)
VO manager
VO
50Infrastructure EGEE / VO, Aspect opérationnel
- Gestion des membres dune VO
- Login dun membre depuis une UI
- Avec un certificat proxy généré à partir du
certificat de lutilisateur - Une durée limitée (12 heures)
- Intègre les informations du certificat nécessaire
au mapping
51Infrastructure EGEE / VO, Aspect opérationnel
- Publication dinformation sur la grille
- Chaque site publie
- Une description des ressources/services quil
fournit par VO - Létat actuel de ses resources (CPUs libres,
Espace de stockage, etc.) - Sur les RCs, ce quune VO a installé (Tags des
Software Managers)
VO1
Système dinformation (BDII)
VO2
RC1
RB1
RLS/RMC
RB2
RLS/RMC
VO3
RC3
RC2
Site CC-IN2P3
52Infrastructure EGEE / VO, Aspect opérationnel
- Gestion de jobs (1)
- La soumission dun job
- Lexécution de lapplication souhaitée sur lun
des WNs de la grille - Laccès aux données qui lui sont nécessaires
- Le job doit fournir à la grille une description
suffisante de ses besoins pour permettre la
sélection de lenvironnement dexécution adéquat. - Désignation de la VO (nom unique sur la grille)
- Description de ses besoins via un formalisme de
description de job (JDL) - Le programme à exécuter
- TAG de lapplication cible (pré-installée par les
VO software managers) - Temps max. estimé dexécution
- Désignation des fichiers dont il a besoin
- Etc.
53Infrastructure EGEE / VO, Aspect opérationnel
VO3
VO3
TAG VO3_APP1.0.2
TAG VO3_APP1.0.2
Input datafile1
Input datafile1
BDII
TAG VO3_APP1.0.2
RC1
RB1
RLS/RMC
RB2
RLS/RMC
RC3
RC2
54AUVERGRID - www.auvergrid.fr
- Un partage de COMPETENCES (8 établissements, 18
laboratoires) - Aide dans les choix technologiques
- Transfert de compétence systèmes et réseaux
- Un partage de ressources
- Puissance de calcul (de lordre de 800 CPUs)
- Espace de stockage (de lordre de 50Toctets)
- Sauvegarde
- Un environnement pour collaborer
- Entre établissements partageant des thèmes de
recherche - Sur des projets pluridisciplinaires
- Budget de 5 Millions deuros sur trois ans
55Déploiement dauvergrid
Centrale Paris
IBCP
LPC Noeud EGEE - Auvergrid Eté 2004
CS Grenoble
AUVERGNE
Grille Rugbi Bioinformatique
Biopôle
Technologie, expertise
Biopôle, CIRI Noeuds en 2005
LPC
CERN
CC-IN2P3
Marseille
Orsay
Grille INSTRUIRE
LCG
CIRI
Grille EGEE Projet européen
IUT Le Puy Aurillac
Pôle Modélisation / ISIMA / LIMOS
3 sites en 2006 3 sites en 2007
CEMAGREF
Pôle chimie
LLAIC1
OPGC
Grille GLOP
Pôle santé ERIM
IFMA/LaMI
LASMEA
56RUGBI rugbi.in2p3.fr
- Réalisation et Utilisation dune Grille pour la
Bio-Informatique - 2003 gt 2005, 3 ans
- Projet industriel et académique
- Un ensemble de services bioinformatiques sur
grille pour lanalyse à grande échelle des
protéines - Support pour les besoins des PMEs et des
laboratoires en science de la vie - Déploiement dune grille inter-régionale
- Création dune communauté de biologistes
utilisant la grille - Sur des technologies existantes
57Utilisation transparente de services
bioinformatiques
- Mise à jour automatique de bases de données
- EMBL, Swissprot, Trembl, PDB, KEGG,
- Utilisation de programmes de protéomique
- Blast, Outils de prédiction de structure
secondaire des protéines, Analyses des voies
métaboliques, docking - Outils de gestion dexpérience in silico
- Stockage privé
- Sécurité (confidentialité et intégrité)
- Accès anonyme et limité par le portail SecProt
58Introduction aux grilles informatiques
- Les grilles, pourquoi ?
- Le besoin des utilisateurs
- Évolution des architectures informatiques
- La grille, quest-ce que cest ?
- Analogie électrique
- Définition
- Impact dune grille
- Quels sont les utilisateurs de la grille ?
- Les organisations de recherche
- Les entreprises
- Quel sont les projets de grille ?
- EGEE
- Auvergrid
- RUGBI
- Quel apport pour la bio-informatique ?
59La bioinformatique à léchelle des génomes
- Juillet 2004 1131 projets de génomes complets
- Publiés 207
- En cours 506 procaryotes, 418 eucaryotes
- Taille des données génomiques
- H. sapiens 3000 Mb
- S. cerevisae 120 Mb
- A. thaliana 116 Mb
- Bioinformatique à grande échelle
- Rapport de 1000 entre données brutes et données
annotées - Automatisation et récurrence de lanalyse
60La bioinformatique à léchelle des génomes
- Analyse à grande échelle et à haute performance
- Croissance exponentielle des données
- Diversité des analyses annotation des
séquences, modélisation moléculaire, etc. - Automatique et récurrence des analyses
- Apport potentiel des grilles
- Grande puissance de calcul et de stockage
- Distribution et intégration des données
biologiques - Service intégrés doutils danalyse
bioinformatique
61Un modèle dapplication bioinformatique
62Les données en bioinformatique
- Complexité
- Séquences, motifs protéiques, structures 3D,
bibliographie - Taille des banques
- Mo (PROSITE), plusieurs Mo (Swissprot), Go (EMBL)
- Croissance exponentielle doublement tous les
10-12 mois - Différentes localisations
- Expasy, EBI-EMBL, NCBI
- Différents stockages
- Fichiers textes à plat , SGBD, XML
- Différents formats
- Complet genbank, EMBL, PDB, PROSITE
- Optimisé pour lanalyse séquentielle
Pearson-Fasta - Cycle de vie
- Création, correction, mise à jour
- élevé
- Sécurité et intégrité
- Académiques, médicales et industrielles
63Les algorithmes en bioinformatique
- Complexité
- Alignements, recherche de motifs, prédictions
- Vitesse de calcul
- Seconde (Gor), minute (clustal W), heure (NAMD)
- Dépend de la taille des données
- Différentes localisations
- EBI-EMBL, NCBI, IBCP
- Différentes programmations
- Perl, python, java, c, c
- Environnement
- Différents fonctionnements
- Mode de paramétrage
- Formats des données entrées et sorties
- Cycle de vie
- Création, mise à jour
- faible
- Sécurité et intégrité
- Académiques, industriels
- licences
64Objectifs
- Être capable de comprendre ces génomes
- Annoter les données nouvelles
- Puissance de calcul
- Puissance de méthodes
- Expertise dans lanalyse
- Accéder ces données annotées
- Capacité de stockage et de distribution
- Croiser les références
- Intelligence du stockage intégration
sémantique, ontologie - Maintenir à jour ces connaissances
- Automatiser les analyses
- Répercuter les mises à jour
- Prendre en compte les spécificités bio
- Données personnelles/médicales, industrielles,
scientifiques
65Apport de la grille pour la bioinformatique
- Capacités de calcul
- Mutualisation de grandes puissances de calculs
- Intégration des algorithmes
- Pour des portails ou des centres bioinformatiques
- Intégrer et distribuer les données
- Fichiers modifiables
- SGBD distribué stockage des résultats, des
banques - Sécurité
- Authentification, gestion des accès
- Chiffrement des données, des algorithmes,
intégrité - Suivi des données logs des transferts et accès
66GridBlast, un exemple de gridification
Computing elements
Input file
UI
67Introduction aux grilles informatiques
- Les grilles, pourquoi ?
- Le besoin des utilisateurs
- Évolution des architectures informatiques
- La grille, quest-ce que cest ?
- Analogie électrique
- Définition
- Impact dune grille
- Quels sont les utilisateurs de la grille ?
- Les organisations de recherche
- Les entreprises
- Quel sont les projets de grille ?
- EGEE
- Auvergrid
- RUGBI
- Quel apport pour la bio-informatique ?
68Radiotherapy is widely used to treat cancer
69Better treatment requires better planning
- Today analytic calculation to compute dose
distributions in the tumor - For new Intensity Modulated Radiotherapy
treatments, analytic calculations off by 10 to
20 near heterogeneities - Better alternative Monte Carlo (MC) simulations
- unacceptable time consuming
- The GRID impact reduce MC computing time to a
level acceptable by the physician
Gridification of GATE MC simulation platform on
Grid testbeds
70Computation of a radiotherapy treatment on the
Grid A physician has to treat a patient with a
brain tumor
71Les applications GATE sur grille de calcul
72Introduction aux grilles informatiques
- Les grilles, pourquoi ?
- Le besoin des utilisateurs
- Évolution des architectures informatiques
- La grille, quest-ce que cest ?
- Analogie électrique
- Définition
- Impact dune grille
- Quels sont les utilisateurs de la grille ?
- Les organisations de recherche
- Les entreprises
- Quel sont les projets de grille ?
- EGEE
- Auvergrid
- RUGBI
- Quel apport pour la bio-informatique ?
73Conclusion
- Technologie prometteuse, mais qui reste un outil
pour lutilisateur. Ne fera pas le travail à sa
place ! - Apprendre à lutiliser
- Intégration des outils et données
- Encore en développement
- En particulier manque de standards
- Mais deviendra petit à petit indispensable
- A intégrer dans la recherche de solutions
informatiques pour votre futur employeur - Dépend de ses besoins réels gt les estimer
- Un laboratoire de recherche peut intégrer
aujourdhui une grille - Une PME peut chercher une entrée auprès dun
institut - Une grande entreprise peut faire appel aux
fournisseurs privés