Nicolas Jacq, jacqclermont'in2p3'fr - PowerPoint PPT Presentation

1 / 73
About This Presentation
Title:

Nicolas Jacq, jacqclermont'in2p3'fr

Description:

ADMET. QSAR. Molecular Docking: Predict how small molecules, such as substrates or drug candidates, bind to a receptor of known 3D structure ... – PowerPoint PPT presentation

Number of Views:76
Avg rating:3.0/5.0
Slides: 74
Provided by: auver
Category:

less

Transcript and Presenter's Notes

Title: Nicolas Jacq, jacqclermont'in2p3'fr


1
Introduction aux grilles informatiques
  • Nicolas Jacq, jacq_at_clermont.in2p3.fr
  • Laboratoire de Physique Corpusculaire, CNRS/IN2P3
  • IUT dAurillac, licence bioinformatique
  • 23/11/2005
  • Crédits le projet EGEE

2
La vision de léquipe PCSV
EQUIPE PCSV
Médecine nucléaire Radio / curiethérapie
Sciences du vivant médecine
Imagerie médicale
Développements spécifiques
Bio / Healthgrid
GATE
GEANT4
Grilles informatiques
Instrumentation
Gestion et analyse des données
Simulation modélisation
Détecteurs
Recherche fondamentale en physique corpusculaire
3
Introduction aux grilles informatiques
  • Les grilles, pourquoi ?
  • Le besoin des utilisateurs
  • Évolution des architectures informatiques
  • La grille, quest-ce que cest ?
  • Analogie électrique
  • Définition
  • Impact dune grille
  • Quels sont les utilisateurs des grilles ?
  • Les organisations de recherche
  • Les entreprises
  • Quel sont les projets de grille ?
  • EGEE
  • Auvergrid
  • RUGBI
  • Quel apport pour la bio-informatique ?

4
Problématique de la recherche
  • Divers domaines dapplication
  • Physique(s)
  • Sciences de la vie
  • Sciences de la terre
  • Etc.
  • Même besoin de traitement de linformation
  • Ressources informatiques
  • Développement dapplications dédiées

5
Caractéristiques des applications
  • Applications gourmandes
  • En puissance de calcul
  • En stockage de données
  • Problème Dimensionnement des ressources

Zzz Zzz
MeteoSysgt La météo dhier sera Bonne
6
Caractéristiques des applications
  • Applications utilisées par une communauté
    scientifique
  • Transversale aux organisations de tutelle
  • Géographiquement distribuée
  • Travail collaboratif
  • Partage des applicatifs
  • Partages des données
  • Problème Accès partagé aux ressources

7
Evolution de linfrastructure informatique
  • Les machines diminuent en taille et se relient en
    réseaux
  • Les réseaux augmentent en nombre et augmentent en
    interconnexion

Optical Fibre(bits per second)
Doubling Time(months)
Gilders Law(32X in 4 yrs)
Data Storage(bits per sq. inch)
Storage Law (16X in 4yrs)
Performance per Dollar Spent
Chip capacity(numb. transistors)
Moores Law(5X in 4yrs)
0 1 2
3 4 5
Number of Years
Triumph of Light Scientific American. George
Stix, January 2001
8
Calcul local
  • Toutes les ressources sont sur un seul site, en
    accès direct par lutilisateur
  • Problème de performance, mémoire
  • Exemple sa station de travail

9
Calcul distant
  • Ressources accessibles à distance
  • Toutes les ressources importantes sont encore
    centralisées
  • Exemple supercalculateur (CINES), centre de
    calcul (CC, LPC)

OU
10
Calcul parallèle
  • Multiples ordinateurs ou processeurs travaillant
    ensemble sur des tâches communes
  • Échange de données important au cours du calcul
    entre les processeurs (supercalculateur ou ferme)
  • Exemple de technologie MPI (Message Passing
    Interface)

11
Calcul distribué
  • Ressources géographiquement distribuées
  • Accès spécialisé important transferts de
    données logiciels de coordination,
    dordonnancement
  • Exemple Napster, Seti_at_home, clusters

12
Défintion dun ordonnanceur de tâche dune
plate-forme de calcul
  • Plate-forme de calcul (ou ferme ou grappe ou
    cluster)
  • Parc informatique de machines fonctionnant sous
    divers systèmes dexploitation et reliées par un
    réseau local.
  • Ordonnanceur de tâches (ou système de batch)
  • Unique point dentrée commun à tous les
    utilisateurs pour soumettre des tâches sur une
    plate-forme de calcul.
  • Rôle de recevoir les tâches soumises par les
    utilisateurs, de les ordonnancer et de les
    soumettre pour exécution sur une machine de
    calcul (worker) appropriée et disponible.
  • La mutualisation permet une utilisation optimale
    de l'ensemble dune ferme.
  • Exemple BQS

13
Introduction aux grilles informatiques
  • Les grilles, pourquoi ?
  • Le besoin des utilisateurs
  • Évolution des architectures informatiques
  • La grille, quest-ce que cest ?
  • Analogie électrique
  • Définition
  • Impact dune grille
  • Quels sont les utilisateurs de la grille ?
  • Les organisations de recherche
  • Les entreprises
  • Quel sont les projets de grille ?
  • EGEE
  • Auvergrid
  • RUGBI
  • Quel apport pour la bio-informatique ?

14
Le concept de grille analogie
Le réseau électrique Réseau haute tension
Centrales de production délectricité
15
Le concept de grille informatique (GRID)
Internet Mise à disposition statique de
linformation Grilles Internet Ressources
informatiques Services de gestion dynamique
de linformation (collecte, transfert, tri,
analyse)
16
Définition
  • GRID, Globalisation des Resources Informatiques
    et des Données
  • Chaque noeud est constitué dune ressource de
    calculs et/ou de stockage
  • Par exemple une ferme de PCs ou un espace de
    sauvegarde
  • Chaque noeud est propriétaire de sa ressource et
    définit les modalités de partage
  • Cette ressource est interfacée à la grille par
    linstallation dun intergiciel permettant
  • De lire et décrire sur des espaces disques
    partagés par des communautés virtuelles
  • De soumettre des tâches de calcul à distance et
    de rapatrier des résultats
  • Intergiciel (middleware) Classe de logiciels
    qui assurent l'intermédiaire entre les
    applications et le transport des données par les
    réseaux.

17
Un aperçu de la grille
18
Les utilisateurs
  • La technologie de grille permet
  • aux scientifiques
  • Daccéder à des ressources de façon transparente
  • Dinteragir avec des collègues
  • Danalyser des données volumineuses
  • De partager les résultats

19
Les ressources
  • La grille intègre des ressources
  • traditionnelles
  • Puissance de calcul
  • Stockage (disque, bande, ...)
  • réseau
  • Les ressources sont
  • hétérogènes
  • dynamiques

20
Les outils de production de données
  • Les détecteurs produisent
  • dénormes quantités de
  • données à analyser.
  • Fournisseurs
  • Instruments scientifiques (séquenceurs)
  • Technologies pour les conférences
  • Video, audio, chat

21
Les données et les logiciels
  • Accès aux données
  • Fichiers et ensembles de données
  • Bases de données
  • Méta-données des données
  • Méta-données des logiciels
  • Gestion des données
  • Transfert et copie des données
  • Localiser les données pertinentes

22
Les services
  • Services
  • Services de haut-niveau pour faciliter
    lutilisation de la grille
  • Ex Gestion des jobs
  • Services spécifiques aux applications
  • Ex Portails

23
Quest-ce que la grille ?
  • Intergiciel
  • Service dinteropérabilité entre les ressources
  • Services de haut-niveau pour faciliter
    lutilisation de la grille
  • Resources
  • Fournies par les participants à la grille
  • Partagées pour une utilisation efficace

24
Représentation en couches
Réseaux
  • Grille distribuée sur des sites distants
    interconnectés par des réseaux à haut débit
  • Des ressources importantes de calcul et de
    stockage
  • Gérées par un système dexploitation commun
  • Offrant un ensemble de services permettant de
    déployer des applications à grande échelle
  • Pour servir des communautés dutilisateurs

Ressources de calcul et de stockage
Services de grille Système dexploitation
Applications à grande échelle
Communautés dutilisateurs
25
Status des grilles
  • Calcul sur grille
  • Ressources et services géographiquement
    distribués
  • Accès transparent
  • Transferts des calculs et de données
  • Organisation et fonctionnalités pour un calcul
    facile, modulable, extensible
  • Source
  • Ian Foster et Carl Kesselman, Universités
    américaines (globus)
  • Repris et en cours de diffusion à grande échelle
    par lEurope
  • Exploitation ?
  • Il existe de multiple projets en dév. dans le
    monde, quelques uns sont en production

26
Impact potentiel dune grille sur la santé
publique
  • Été 2003, une vague de chaleur en Europe tue 10
    000 personnes en France
  • Le pourcentage de mortalité était en excès de 10
    à 50 dans les maisons de retraite et les
    hôpitaux. Mais linformation a été ignorée
    pendant 2 semaines.
  • Un système de monitoring aurait pu donner
    lalarme plus tôt
  • Besoin de collecter linformation des hôpitaux et
    des services funéraires en fonction du nombre de
    cas
  • Dinternet à la grille
  • Internet nécessite de la main-duvre pour
    fournir une information fiable sur un portail web
    centralisé
  • Avantage dune grille fédération de bases de
    données localisées dans les hôpitaux et les
    services funéraires des services pour calculer
    le pourcentage de mortalité et signaler un excès
  • La technologie rend possible ce système
    aujourdhui

27
Développement pharmaceutique
Molecular Docking Predict how small molecules,
such as substrates or drug candidates, bind to a
receptor of known 3D structure
Target discovery
Lead discovery
Lead Optimization
Target Identification
Clinical Phases (I-III)
Target Validation
Lead Identification
Duration 12 15 years, Costs 500 - 800 million
US
28
Impact potentiel dune grille sur le criblage
virtuel de molécules
Millions of chemical compounds available in
laboratories
wisdom.eu-egee.fr
High Throughput Screening 1-10/compound, nearly
impossible
  • - 1,000,000 Chemical
  • compounds

Molecular docking (FlexX, Autodock) 80 CPU
years, 1 TB data
Computational data challenge 6 weeks on 1600
computers
5 structures, 8 scenarios
Hits screening using assays performed on living
cells
Leads
Clinical testing
X-crystallographic data of disease targets
available in laboratories
Drug
29
En résumé
  • Une grille de calcul est un ensemble formé de
    plusieurs éléments
  • Une capacité de calcul de plusieurs milliers de
    calculateurs
  • Une capacité de stockage -gt des données en masse
    (petaoctets)
  • Un réseau à très haut débit interconnectant les
    sites
  • Un ensemble logiciel permettre le fonctionnement
    en grille
  • Des outils et applications tirant partie de la
    grille
  • Bénéfices
  • Puissance de calcul illimitée
  • Exécution de grandes applications mettant en
    oeuvre des milliers de calculateurs
  • Accès transparent à des ressources de haut niveau
    depuis un poste de travail
  • Une même manière de présenter et d'utiliser une
    large gamme de ressources
  • Une localisation des ressources de calcul et de
    stockage répartie et indépendante
  • Sécurité assurée à travers l'authentification,
    des autorisations, et la confidentialité

30
  • http//gridcafe.web.cern.ch/gridcafe/
  • http//gridcafe.web.cern.ch/gridcafe/demos/Grid-be
    ginners.ppt

31
Introduction aux grilles informatiques
  • Les grilles, pourquoi ?
  • Le besoin des utilisateurs
  • Évolution des architectures informatiques
  • La grille, quest-ce que cest ?
  • Analogie électrique
  • Définition
  • Impact dune grille
  • Quels sont les utilisateurs de la grille ?
  • Les organisations de recherche
  • Les entreprises
  • Quel sont les projets de grille ?
  • EGEE
  • Auvergrid
  • RUGBI
  • Quel apport pour la bio-informatique ?

32
Une grille pour la santé
In this context "Health" does not involve only
clinical practice but covers the whole range of
information from molecular level (genetic and
proteomic information) over cells and tissues, to
the individual and finally the population level
(social healthcare).
S. Nørager Y. Paindaveine European
Commission DG-INFSO
33
Potential grid services for virtual screening
Grid service customers
Biology teams
Chemist/biologist teams
Grid infrastructure
hits
Selected hits
target
Virtual Docking services
Annotation services
MD service
Grid service providers
Chimioinformatics teams
Bioinformatics teams
34
Les acteurs dune grille
  • Utilisateurs
  • Scientifiques avec un projet
  • Scientifiques fournisseurs dapplications et de
    bases de données
  • Organisations virtuelles
  • Personnes membres dune institution avec des buts
    communs
  • Partager les ressources pour atteindre les buts
  • Administrateurs de sites
  • Personnes responsables pour maintenir les
    ressources des institutions
  • Contrôler lefficacité et lutilisation correcte
    des ressources disponibles
  • Organisations réelles
  • Instituts, agences financées, gouvernements

35
La grille, outil de mutualisation
  • La grille est un moyen de structuration des
    organisations
  • Mutualisation
  • Transfert de technologies
  • Modifier les comportements
  • Besoins de
  • standards
  • veille technologique
  • Support développeur, utilisateur
  • Groupes de discussion
  • Interne aux organisations, aux projets
  • Entre organisations, projets, pays, continents
  • Groupe de travail, conférence, production de
    documents de référence
  • Global Grid Forum (GGF), Healthgrid

36
Un exemple de motivation économique
  • Lutilisation des ressources informatiques varie
    au cours du temps
  • Analyses financières de fin de trimestre
  • Période de vacances de juillet et aout
  • Solutions habituelles
  • Acheter la capacité maximale nécessaire gt
    tourner au ralenti en période basse
  • Acheter la capacité moyenne gt retarder les
    résultats
  • Solution dune grille
  • Partager les ressources pour varier la
    disponibilité
  • Acheter la capacité moyenne nécessaire mais
    obtenir les résultats au bon moment
  • Améliorer la fiabilité

37
Intérèt pour tous
  • Investissements
  • Plus de 100 millions de dollars investis par les
    instituts publiques dans le monde dans des
    projets de grille (NSF, NASA, Europe, CNRS)
  • IBM a investit plusieurs milliards de dollars sur
    le  calcul à la demande . Sun, Microsoft, HP
    développent leurs technologies de grille. Oracle,
    Communication Système participent aux projets.
  • Des solutions grilles sont proposées aujourdhui
    Novartis utilise la technologie de United
    Devices
  • Espoirs
  • Permettre aux chercheurs de résoudre de nouveaux
    problèmes
  • Fabriquer de nouvelles applications de e-commerce
    communiquant entre elles

38
Introduction aux grilles informatiques
  • Les grilles, pourquoi ?
  • Le besoin des utilisateurs
  • Évolution des architectures informatiques
  • La grille, quest-ce que cest ?
  • Analogie électrique
  • Définition
  • Impact dune grille
  • Quels sont les utilisateurs de la grille ?
  • Les organisations de recherche
  • Les entreprises
  • Quel sont les projets de grille ?
  • EGEE
  • Auvergrid
  • RUGBI
  • Quel apport pour la bio-informatique ?

39
  • UK e-Science Grid
  • Netherlands VLAM, PolderGrid
  • Germany UNICORE, Grid proposal
  • France Grid funding approved
  • Italy INFN Grid
  • Eire Grid proposals
  • Switzerland - Network/Grid proposal
  • Hungary DemoGrid, Grid proposal
  • Norway, Sweden - NorduGrid
  • NASA Information Power Grid
  • DOE Science Grid
  • NSF National Virtual Observatory
  • NSF GriPhyN
  • DOE Particle Physics Data Grid
  • NSF TeraGrid
  • DOE ASCI Grid
  • DOE Earth Systems Grid
  • DARPA CoABS Grid
  • NEESGrid
  • DOH BIRN
  • NSF iVDGL
  • DataGrid (CERN, ...)
  • EuroGrid (Unicore)
  • DataTag (CERN,)
  • Astrophysical Virtual Observatory
  • GRIP (Globus/Unicore)
  • GRIA (Industrial applications)
  • GridLab (Cactus Toolkit)
  • CrossGrid (Infrastructure Components)
  • EGSO (Solar Physics)

40
Services de grille clefs
  • Authentification et autorisation
  • Login individuel, sécurisé (SSL) et encrypté
  • Basé sur un certificat, et un proxy expédié à
    chaque tâche
  • Recherche de ressource et publication
    dinformation
  • Recherche dynamique de létat des ressources de
    la grille, réseau, tâches, etc
  • Contrôle constant de ce qui fonctionne/ne
    fonctionne pas/ est disponible
  • Gestion de données
  • Accès aux fichiers et transferts
  • Gestion de collection de données
  • Gestion de ressource
  • Programmation de job/process
  • Execution de commande

41
Services de grille additionnels
  • Flux de jobs
  • Spécifier les séquences de jobs/processes et les
    transferts de données
  • Dessiner les flux des tâches et les transferts de
    données avec les conditions, déterminé par un
    moteur de flux de jobs
  • Gestion de lutilisation
  • Gestion des comptes
  • Gestion des crédits
  • Gestion des allocations
  • Enregistrement de la session

42
Le projet EGEE www.eu-egee.org
  • Enabling Grids for E-sciencE
  • 71 institutions dans 27 pays, fédérés par des
    grilles régionales
  • 32 M Euros de lUE (2004-5), 100 M de budget
    total
  • But de combiner les capacités de plus de 20000
    CPUs
  • 300 personnes dédiées

43
Objectifs du projet EGEE
  • Services de Grille en production continue et
    fiable
  • En partant des prototypes et infrastructures de
    tests existants vers une qualité industrielle
  • Pour de nombreux domaines scientifiques
  • Procédure viable pour intégrer dautres groupes
    scientifiques
  • Processus largement distribué dingénierie
    logicielle, tout en restant efficace et rapide
  • Harmoniser les activités dEGEE avec celles
    nationales et internationales

44
  • CC-IN2P3 (France)
  • LDAP Server
  • RLS

CC-IN2P3 1CE 1000 CPU SCAI 1CE 32 CPU
(MPICH) IPP 1CE 2 CPU (MPICH)
LAL 1CE 20 CPU CGG 1CE 8 CPU
LPC 2CE 142 CPU UPV 1CE 20 CPU CNB 1CE
16 CPU
  • CNAF (Italy)
  • RB (production)

SINICA 1CE 100 CPU TAU 1CE 30 CPU
CNAF 2CE (MPICH)
  • IFAE (Spain)
  • RB (production)

Cyprus
  • UPV (Spain)
  • RB (test)
  • Biomedical Resources
  • 50 utilisateurs, 7 pays,
  • 18 labos de recherche,
  • 12 Applications
  • 60 CE (3 000 CPUs ),
  • 60 SE (21 TB ),
  • 20 RB, 1 RLS/RMC

45
Applications EGEE
  • Biomedicales
  • Imagerie médicale, diagnostique, traitement
  • Etudes des génomes et des protéines
  • Physique des Hautes Energies
  • Simulation des interactions des particules
  • Analyse des données des détecteurs
  • Science de la terre
  • Observer les conditions terrestres
  • Ressources naturelles
  • Chimie
  • Simulation de propriétés chimiques

46
Infrastructure EGEE / VO, Aspect opérationnel
  • Configuration nécessaire pour une VO
  • 1 nom de VO unique pour la grille 1 VO manager
  • 1 Serveur de gestion des membres et de leurs
    rôles
  • 1 (au moins) Resource Broker (RB)
  • 1 Service de Replica Catalog (RLS/RMC)
  • 1 User Interface (UI)
  • 1 (au moins) Centre de Ressource (RC)
  • 1 Système dinformation indexant les ressources
    (BDII)

SE
CE
47
Infrastructure EGEE / VO, Aspect opérationnel
  • Centre de linfrastructure
  • Administration globale
  • Serveurs de gestion de VO
  • Services de Replica Catalog
  • Resource Brokers
  • Système dinformation de la grille
  • Monitoring
  • User Support / Astreinte
  • Accounting

VO
Resource Broker
France

Italie
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
Replica Catalog
Stockage
48
Infrastructure EGEE / VO, Aspect opérationnel
  • Centre de ressource
  • Fournit à la grille
  • Des ressources de calcul
  • Des ressources de stokage

VO
Resource Broker
France

Italie
Computing Element
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
RC
Replica Catalog
Storage Element
Stockage
49
Infrastructure EGEE / VO, Aspect opérationnel
  • Gestion des membres dune VO
  • Authentification
  • Certificat Electronique émis par une autorité de
    certification (CA)
  • Equivalent à une carte didentité, un passeport
  • Autorisations
  • Droits en fonction du rôle
  • Gérés par
  • Groupe (LDAP, actuel)
  • Regular user, Software manager,
  • Individu, par association dune liste de droits
    (VOMS, à venir)

VO manager

VO
50
Infrastructure EGEE / VO, Aspect opérationnel
  • Gestion des membres dune VO
  • Login dun membre depuis une UI
  • Avec un certificat proxy généré à partir du
    certificat de lutilisateur
  • Une durée limitée (12 heures)
  • Intègre les informations du certificat nécessaire
    au mapping

51
Infrastructure EGEE / VO, Aspect opérationnel
  • Publication dinformation sur la grille
  • Chaque site publie
  • Une description des ressources/services quil
    fournit par VO
  • Létat actuel de ses resources (CPUs libres,
    Espace de stockage, etc.)
  • Sur les RCs, ce quune VO a installé (Tags des
    Software Managers)

VO1
Système dinformation (BDII)
VO2
RC1
RB1
RLS/RMC
RB2
RLS/RMC
VO3
RC3
RC2
Site CC-IN2P3
52
Infrastructure EGEE / VO, Aspect opérationnel
  • Gestion de jobs (1)
  • La soumission dun job
  • Lexécution de lapplication souhaitée sur lun
    des WNs de la grille
  • Laccès aux données qui lui sont nécessaires
  • Le job doit fournir à la grille une description
    suffisante de ses besoins pour permettre la
    sélection de lenvironnement dexécution adéquat.
  • Désignation de la VO (nom unique sur la grille)
  • Description de ses besoins via un formalisme de
    description de job (JDL)
  • Le programme à exécuter
  • TAG de lapplication cible (pré-installée par les
    VO software managers)
  • Temps max. estimé dexécution
  • Désignation des fichiers dont il a besoin
  • Etc.

53
Infrastructure EGEE / VO, Aspect opérationnel
  • Gestion de jobs (2)

VO3
VO3
TAG VO3_APP1.0.2
TAG VO3_APP1.0.2
Input datafile1
Input datafile1
BDII
TAG VO3_APP1.0.2
RC1
RB1
RLS/RMC
RB2
RLS/RMC
RC3
RC2
54
AUVERGRID - www.auvergrid.fr
  • Un partage de COMPETENCES (8 établissements, 18
    laboratoires)
  • Aide dans les choix technologiques
  • Transfert de compétence systèmes et réseaux
  • Un partage de ressources
  • Puissance de calcul (de lordre de 800 CPUs)
  • Espace de stockage (de lordre de 50Toctets)
  • Sauvegarde
  • Un environnement pour collaborer
  • Entre établissements partageant des thèmes de
    recherche
  • Sur des projets pluridisciplinaires
  • Budget de 5 Millions deuros sur trois ans

55
Déploiement dauvergrid
Centrale Paris
IBCP
LPC Noeud EGEE - Auvergrid Eté 2004
CS Grenoble
AUVERGNE
Grille Rugbi Bioinformatique
Biopôle
Technologie, expertise
Biopôle, CIRI Noeuds en 2005
LPC
CERN
CC-IN2P3
Marseille
Orsay
Grille INSTRUIRE
LCG
CIRI
Grille EGEE Projet européen
IUT Le Puy Aurillac
Pôle Modélisation / ISIMA / LIMOS
3 sites en 2006 3 sites en 2007
CEMAGREF
Pôle chimie
LLAIC1
OPGC
Grille GLOP
Pôle santé ERIM
IFMA/LaMI
LASMEA
56
RUGBI rugbi.in2p3.fr
  • Réalisation et Utilisation dune Grille pour la
    Bio-Informatique
  • 2003 gt 2005, 3 ans
  • Projet industriel et académique
  • Un ensemble de services bioinformatiques sur
    grille pour lanalyse à grande échelle des
    protéines
  • Support pour les besoins des PMEs et des
    laboratoires en science de la vie
  • Déploiement dune grille inter-régionale
  • Création dune communauté de biologistes
    utilisant la grille
  • Sur des technologies existantes

57
Utilisation transparente de services
bioinformatiques
  • Mise à jour automatique de bases de données
  • EMBL, Swissprot, Trembl, PDB, KEGG,
  • Utilisation de programmes de protéomique
  • Blast, Outils de prédiction de structure
    secondaire des protéines, Analyses des voies
    métaboliques, docking
  • Outils de gestion dexpérience in silico
  • Stockage privé
  • Sécurité (confidentialité et intégrité)
  • Accès anonyme et limité par le portail SecProt

58
Introduction aux grilles informatiques
  • Les grilles, pourquoi ?
  • Le besoin des utilisateurs
  • Évolution des architectures informatiques
  • La grille, quest-ce que cest ?
  • Analogie électrique
  • Définition
  • Impact dune grille
  • Quels sont les utilisateurs de la grille ?
  • Les organisations de recherche
  • Les entreprises
  • Quel sont les projets de grille ?
  • EGEE
  • Auvergrid
  • RUGBI
  • Quel apport pour la bio-informatique ?

59
La bioinformatique à léchelle des génomes
  • Juillet 2004 1131 projets de génomes complets
  • Publiés 207
  • En cours 506 procaryotes, 418 eucaryotes
  • Taille des données génomiques
  • H. sapiens 3000 Mb
  • S. cerevisae 120 Mb
  • A. thaliana 116 Mb
  • Bioinformatique à grande échelle
  • Rapport de 1000 entre données brutes et données
    annotées
  • Automatisation et récurrence de lanalyse

60
La bioinformatique à léchelle des génomes
  • Analyse à grande échelle et à haute performance
  • Croissance exponentielle des données
  • Diversité des analyses annotation des
    séquences, modélisation moléculaire, etc.
  • Automatique et récurrence des analyses
  • Apport potentiel des grilles
  • Grande puissance de calcul et de stockage
  • Distribution et intégration des données
    biologiques
  • Service intégrés doutils danalyse
    bioinformatique

61
Un modèle dapplication bioinformatique
62
Les données en bioinformatique
  • Complexité
  • Séquences, motifs protéiques, structures 3D,
    bibliographie
  • Taille des banques
  • Mo (PROSITE), plusieurs Mo (Swissprot), Go (EMBL)
  • Croissance exponentielle doublement tous les
    10-12 mois
  • Différentes localisations
  • Expasy, EBI-EMBL, NCBI
  • Différents stockages
  • Fichiers textes  à plat , SGBD, XML
  • Différents formats
  • Complet genbank, EMBL, PDB, PROSITE
  • Optimisé pour lanalyse séquentielle
    Pearson-Fasta
  • Cycle de vie
  • Création, correction, mise à jour
  • élevé
  • Sécurité et intégrité
  • Académiques, médicales et industrielles

63
Les algorithmes en bioinformatique
  • Complexité
  • Alignements, recherche de motifs, prédictions
  • Vitesse de calcul
  • Seconde (Gor), minute (clustal W), heure (NAMD)
  • Dépend de la taille des données
  • Différentes localisations
  • EBI-EMBL, NCBI, IBCP
  • Différentes programmations
  • Perl, python, java, c, c
  • Environnement
  • Différents fonctionnements
  • Mode de paramétrage
  • Formats des données entrées et sorties
  • Cycle de vie
  • Création, mise à jour
  • faible
  • Sécurité et intégrité
  • Académiques, industriels
  • licences

64
Objectifs
  • Être capable de comprendre ces génomes
  • Annoter les données nouvelles
  • Puissance de calcul
  • Puissance de méthodes
  • Expertise dans lanalyse
  • Accéder ces données annotées
  • Capacité de stockage et de distribution
  • Croiser les références
  • Intelligence du stockage intégration
    sémantique, ontologie
  • Maintenir à jour ces connaissances
  • Automatiser les analyses
  • Répercuter les mises à jour
  • Prendre en compte les spécificités bio
  • Données personnelles/médicales, industrielles,
    scientifiques

65
Apport de la grille pour la bioinformatique
  • Capacités de calcul
  • Mutualisation de grandes puissances de calculs
  • Intégration des algorithmes
  • Pour des portails ou des centres bioinformatiques
  • Intégrer et distribuer les données
  • Fichiers modifiables
  • SGBD distribué stockage des résultats, des
    banques
  • Sécurité
  • Authentification, gestion des accès
  • Chiffrement des données, des algorithmes,
    intégrité
  • Suivi des données logs des transferts et accès

66
GridBlast, un exemple de gridification
Computing elements
Input file
UI
67
Introduction aux grilles informatiques
  • Les grilles, pourquoi ?
  • Le besoin des utilisateurs
  • Évolution des architectures informatiques
  • La grille, quest-ce que cest ?
  • Analogie électrique
  • Définition
  • Impact dune grille
  • Quels sont les utilisateurs de la grille ?
  • Les organisations de recherche
  • Les entreprises
  • Quel sont les projets de grille ?
  • EGEE
  • Auvergrid
  • RUGBI
  • Quel apport pour la bio-informatique ?

68
Radiotherapy is widely used to treat cancer
69
Better treatment requires better planning
  • Today analytic calculation to compute dose
    distributions in the tumor
  • For new Intensity Modulated Radiotherapy
    treatments, analytic calculations off by 10 to
    20 near heterogeneities
  • Better alternative Monte Carlo (MC) simulations
  • unacceptable time consuming
  • The GRID impact reduce MC computing time to a
    level acceptable by the physician

Gridification of GATE MC simulation platform on
Grid testbeds
70
Computation of a radiotherapy treatment on the
Grid A physician has to treat a patient with a
brain tumor
71
Les applications GATE sur grille de calcul
72
Introduction aux grilles informatiques
  • Les grilles, pourquoi ?
  • Le besoin des utilisateurs
  • Évolution des architectures informatiques
  • La grille, quest-ce que cest ?
  • Analogie électrique
  • Définition
  • Impact dune grille
  • Quels sont les utilisateurs de la grille ?
  • Les organisations de recherche
  • Les entreprises
  • Quel sont les projets de grille ?
  • EGEE
  • Auvergrid
  • RUGBI
  • Quel apport pour la bio-informatique ?

73
Conclusion
  • Technologie prometteuse, mais qui reste un outil
    pour lutilisateur. Ne fera pas le travail à sa
    place !
  • Apprendre à lutiliser
  • Intégration des outils et données
  • Encore en développement
  • En particulier manque de standards
  • Mais deviendra petit à petit indispensable
  • A intégrer dans la recherche de solutions
    informatiques pour votre futur employeur
  • Dépend de ses besoins réels gt les estimer
  • Un laboratoire de recherche peut intégrer
    aujourdhui une grille
  • Une PME peut chercher une entrée auprès dun
    institut
  • Une grande entreprise peut faire appel aux
    fournisseurs privés
Write a Comment
User Comments (0)
About PowerShow.com