CPER MISN : Projet MBI Modlisation des Biomolcules et de leurs Interactions

1 / 23
About This Presentation
Title:

CPER MISN : Projet MBI Modlisation des Biomolcules et de leurs Interactions

Description:

Les d fis de la bioinformatique aujourd'hui. Mod liser, simuler, interagir, pour ma triser ... mode de fonctionnement (personnel affect au CCT, activit de service, ... –

Number of Views:53
Avg rating:3.0/5.0
Slides: 24
Provided by: mddev
Category:

less

Transcript and Presenter's Notes

Title: CPER MISN : Projet MBI Modlisation des Biomolcules et de leurs Interactions


1
CPER MISN Projet MBIModélisation des
Biomolécules et de leurs Interactions
Conseil Scientifique lundi 26 novembre 2007
  • Marie-Dominique Devignes
  • Coordinatrice du projet MBI
  • LORIA, Orpailleur

2
Plan de lexposé
  • Contexte du projet
  • Objectifs
  • Partenaires et Opérations
  • Bilan de la 1ère année
  • Perspectives
  • Conclusion

3
Contexte (1/2) Les défis de la bioinformatique
aujourdhui
  • Modéliser, simuler, interagir, pour maîtriser des
    flots de données
  • Problématiques de masses de données
  • Données biologiques complexes
  • Multiplicité des concepts sous-jacents ?
    nécessité des approches à base de connaissances
    pour intégrer, abstraire
  • Données 3D et/ou bruitées ? problématiques de
    visualisation, de modélisation des interactions
  • Retombées majeures en santé publique,
    biotechnologies, environnement

4
Contexte (2/2) Une expérience
interdisciplinaire en Lorraine
  • Fruits du précédent CPER PRST Intelligence
    Logicielle
  • Tissu de collaborations partenaires
    informaticiens et biologistes
  • Quelques faits
  • Journée Bioinfo du 28 septembre 2007
  • Thèses soutenues en 2007 (Saliha Yilmaz, Fabrice
    Touzain)
  • Thèses en cours (Adrien Coulet, Catherine Eng,
    Mathieu Chavent, Laurent Provot, Alex Beautrait,
    Leo Ghemtio, Mehdi Kaytoue)

5
Objectifs du projet MBI
  • Introduire des approches à base de connaissances
    dans les méthodes de modélisation des
    biomolécules et de leurs interactions
  • Aborder sous cet angle la modélisation des
    systèmes biologiques
  • Créer un Centre de Compétences et de Transfert en
    Génomique et Bio-Modélisation G-BioModeL


  • http//bioinfo.loria.fr

6
Concept de Centre de Compétences et de Transfert
pour la Génomique et la Bio-Modélisation
  • Interface avec des laboratoires de biologie et
    des entreprises pharmaceutiques ou de
    biotechnologies
  • Conseil typer le (les) besoin(s) du client
  • Faciliter laccès aux ressources (bases de
    données, logiciels)
  • Services (criblage virtuel, analyse
    bioinformatique, développements)
  • Lien avec les projets de recherche
  • CCT en amont lorsque cela est pertinent, aider
    les clients à établir des collaborations de
    recherche
  • CCT en aval valorisation des prototypes et des
    algorithmes développés en recherche
  • Projets apparentés BioScope IT (Belgique),
    Softberry (USA)

7
Partenaires et opérations du projet MBI
  • Au Loria et associés au Loria (environ 20
    personnes)
  • Extérieurs au Loria (environ 15 personnes)

INPL ENSAIA
G-BioModeL
Orpailleur
UHP-INRA IaM
MAPP
STREPTO-TH
UHP-INRA LGM
Adagio
VSM-G
UHP-CNRS MAEM
ABC
Algorille
Alice
Fac de Médecine Laboratoire de Génétique
IECN
8
Plan de lexposé
  • Contexte du projet
  • Objectifs et paradigmes
  • Partenaires et Opérations
  • Bilan de la 1ère année
  • Perspectives
  • Conclusion

9
Bilan 2007 (1/4) CCT G-BioModeL
  • 2007-2009 3 projets pilotes pour explorer les
    modalités de fonctionnement
  • P1 Docking en solvant non aqueux (ENSAIA-LBB)
  • P2 Annotation des génomes de champignons
    (UHP-INRA IaM)
  • P3 Criblage virtuel de ligands de la protéine
    Met par le logiciel VSM-G (UHP-IBDML)
  • 2007 Constitution dune équipe de pilotage
  • Aspects Scientifiques MD Devignes, B Maigret, M
    Smaïl-Tabbone
  • Aspects Techniques L Pierron
  • Chef de Projet M Souchet
  • 2007 Equipement (OIP 2007 du CPER)
  • Serveur de données 15 disques de 500 Go 7,5
    To
  • Serveur de calcul 16 unités bi Quad 128
    processeurs
  • Serveur dapplications

10
Bilan 2007 (2/4) Opération STREPTO-TH
  • Objectifs de lopération
  • Mettre en évidence par des méthodes sans a priori
    (HMM) des hétérogénéités dans les séquences des
    génomes entièrement séquencés de Streptocoques.
  • Caractériser les régions atypiques (contenu en
    gènes, origines possibles, etc.).
  • Valider la méthode didentification sans apriori
    des régions atypiques dans les génomes
    bactériens.
  • Résultats 2007 Analyse de régions atypiques
  • Thèse Catherine Eng (2ème année) co-encadrée
    Pierre Leblond (LGM) et Jean-François Mari
    (Orpailleur)
  • Posters JOBIM 2005, Rencontre des
    microbiologistes de lINRA 2006, ISMB ECCB 2007
  • Article en cours de soumission concernant
    lapplication des HMM2 dans la modélisation de
    sites de fixation des facteurs de transcription
    chez Streptomyces coelicolor A3(2) (cf précédent
    CPER)
  • Mise en place dune collaboration avec
    lentreprise danoise Chr. Hansen (données de
    puces à ADN).

11
Opération Strepto-TH illustration
Alignement de deux génomes de Streptococcus
thermophilus
Les rectangles verts localisent les 49 régions
atypiques déterminées par le HMM2, le long du
génome de S. thermophilus CNR1066. Les bandes
rouges et bleues relient entre elles des
séquences ayant une homologie dans le même sens
et dans le sens inverse respectivement, entre ces
deux souches.
gt 12 régions atypiques parmi les 49 régions
atypiques extraites par le HMM2 sont aussi
identifiées comme des régions spécifiques de la
souche CNRZ1066 par rapport à la souche LMD-9.
Homologue
Région
Processus de caractérisation automatique des
régions atypiques
Le processus permet de caractériser les régions
atypiques comportant des gènes spécifiques de
souche et/ou despèce. - de la création dune
base de données stockant les données génomiques
du phylum des firmicutes (91 espèces) et les
caractéristiques des régions atypiques, - dune
exécution automatique de blast (recherche
dhomologie) sur les bases de données
(firmicutes, nr), - de requêtes dextraction des
régions atypiques comportant des gènes
spécifiques.
Organisme
Souche
  • 10 régions atypiques supplémentaires validées
    comme ayant une origine exogène

12
Bilan 2007 (3/4) Opération MAPP
  • Objectifs
  • Identifier rapidement les modes dassemblage les
    plus pertinents entre plusieurs unités protéiques
  • Manipuler interactivement et analyser les
    interfaces protéine-protéine ainsi créés.
  • Thèses en cours Laurent Provot, Mathieu Chavent
  • Résultats
  • Propositions pour améliorer avec les méthodes de
    la géométrie discrète les méthodes de recherche
    dinformation géométriques sur les surfaces des
    protéines.
  • Geometric Feature Estimators for Noisy Discrete
    Surfaces, article soumis à la conférence
    internationale DGCI 2008.

13
Opération MAPP Illustrations
  • Calculs de  patchs  à la surface de lobjet
    utilisation dun paramètre dépaisseur pour une
    prise en compte du bruit
  • 2) Extraction de caractéristiques géométriques à
    partir des patchs (estimateur daire, vecteur
    normal, discrimination des zones plates,
    convexes, concaves).
  • Visualisation haute-performance des surfaces (M.
    Chavent en interaction avec Bruno Lévy,
    opération MoVIs, thème MIS) utilisation du CPU
    et du GPU pour le calcul de la surface
    moléculaire.

14
Bilan 2007 (4/4) Opération VSM-G
  • Objectifs
  • Améliorer les techniques de criblage virtuel, en
    particulier par le développement de chimiothèques
    spécialisées et par lutilisation des grilles de
    calcul (Orpailleur)
  • Améliorer les techniques de docking spécialisées
    dans le domaines des complexes protéine-protéine
    et protéine - acide nucléique (Orpailleur-MAEM)
  • Thèses en cours
  • Alexandre Beautrait soutenance prévue 15 janvier
    2008
  • Léo Ghemtio (1ère année)
  • Résultats
  • Modèle structural de ligand inhibiteurs pour le
    récepteur c-Met
  • Modélisation 3D dun ARN (CUG)17 et recherche de
    petites molécules capables de sy fixer.

15
Opération VSM-G Illustrations
1. Ligands du récepteur c-Met Sélection de
ligands potentiels à partir dune chimiothèque
maison (600 000 molécules, 90 millions de
conformations) et sur la base dun ligand connu
(K252A inhibiteur de référence). R1, R2 et R3
groupements de substitution -gt synthèse chimique
et tests.
  • 2. Maladies à triplets dARN
  • Modélisation 3D de lARN (CUG)17 sur la base
    dun modèle expérimental de duplex (CUG)6(CUG)6
  • Dynamique moléculaire pour obtenir les
    conformations en solution de lARN (CUG)17
  • Sélection de 10 conformations représentatives
    par classement hiérarchique.

C U G
Recherche de petite molécules se fixant sur des
sites pré-définis lARN (CUG)17 (en cours)
16
Plan de lexposé
  • Contexte du projet
  • Objectifs et paradigmes
  • Partenaires et Opérations
  • Bilan de la 1ère année
  • Perspectives
  • Conclusion

17
Perspectives 2008 et au-delà (1/4) Résultats du
2ème appel à opérations octobre 2007
  • Opération BioCoron (Orpailleur IaM)
  • Extraction de profils dexpression à partir de
    résultats de puces transcriptomiques approches
    symboliques, adaptation de la plateforme Coron
    dOrpailleur aux données biologiques.
  • Expertise externe favorable au vu de la qualité
    des équipes impliquées
  • Opération IP3L-RDM (Orpailleur)
  • Application des méthodes de Fouille de Données
    Relationnelle (Relational Data Mining) et
    Programmation Logique Inductive (PLI) à la
    caractérisation des interactions
    protéines-ligands et protéines-protéines
  • En attente dun retour dexpertise externe

18
Perspectives 2008 et au-delà (2/4) Ouverture du
CCT G-BioModeL
  • Trois composantes
  • Plateforme académique (en lien avec le Génopole
    Strasbourg-Alsace-Lorraine et la palteforme BIPS)
  • Structure privée ou semi-privée permettant de
    fournir dans nos domaines de composante des
    services en Bioinformatique
  • Projet en émergence pour lexploitation du
    logiciel VSM-G
  • Poursuite de lOIP pour léquipement du CCT
  • Extension du serveur de données et du serveur de
    calcul
  • But répondre à de nouveaux besoins en fouille de
    données biologiques
  • Question du financement et du rattachement
    administratif des emplois générés par lactivité
    du CCT

19
Perspectives 2008 et au-delà (3/4) Autres
opérations en cours
  • Opération STREPTO-TH
  • Regroupement et caractérisation des régions
    atypiques afin de déterminer des signatures de
    groupe
  • Comparaison avec les modèles de Markov dordre 1
    (M1-Mk), Nicolas P. et al., 2002.
  • Validation expérimentale grâce à une
    collaboration avec une entreprise industrielle
    alimentaire Chr. Hansen ( données de puces à
    ADN).
  • Opération MAPP
  • Association par complémentarité de forme
  • Approche multi-échelle
  • Application au docking Protéine-Protéine. Prise
    en compte des interactions électrostatiques dans
    la définition dune fonction de score
  • Opération VSM-G
  • Validation du logiciel sur le système récepteur
    c-Met ligand
  • Adaptation au criblage des interactions ARN
    (CUG)17 - ligands

20
Perspectives 2008 et au-delà (4/4) Animation
scientifique et formation
  • Séminaire Bioinfo Journée bioinfo
  • Travail sur les filières universitaires proposant
    un enseignement en Bioinfo
  • INPL cursus bioinformatique commun
    Mines-ENSIC-ENSAIA
  • UFR STB (biologie) fermeture en 2008 du M2P
    Génomique Informatique
  • UFR IAEM (informatique) Licence Informatique
    projet doption Santé-Biologie
  • Faculté de Médecine plus de Bioinformatique en
    UE de génétique (4ème année)
  • Favoriser de nouvelles collaborations
  • Avec le CPER Santé
  • Dans le Grand-Est
  • Au niveau transfrontalier (MPI Sarrebruck et
    Université de la Sarre)

21
Conclusion
  • Projet structuré autour du CCT G-BioModeL
  • Nombreuses sollicitations de la part des
    biologistes
  • Beaucoup de questions par rapport au mode de
    fonctionnement (personnel affecté au CCT,
    activité de service, pérennité, etc.)
  • Problème récurrent dans dautres thèmes du CPER
    MISN (TALC, SSS) réflexion générale ?
  • Bioinformatique et Sciences du Vivant
  • Thème transversal au sein du Loria dans le
    prochain quadriennal
  • Plus large que le projet MBI étendu aux
    recherches sur les systèmes bio-inspirés et la
    modélisation du comportement humain et du cerveau
  • Nouvelles collaborations au sein du thème et avec
    dautres thèmes TALC, MIS

22
Paradigmes (1/2)
  • Prédire des interactions protéine-protéine

Interface?
Protéine 1
Protéine 2
Représentation des Connaissances
Atomes exposés
Autres interfaces bien décrites
Enveloppes globales des complexes (SAXS)
Résultats de mutagenèse
23
Paradigmes (2/2)
  • La protéine FAK commutateur cellulaire entre
    différentes voies de signalisation

P0
P2
Complexe dadhesion
P1
P0
P0
FAK
P8
P7
P5
FAK
FAK
P3
P4
P6
P9
P10
Signalisation intracellulaire
  • La modélisation de ce système biologique doit
    inclure des connaissances sur les interactions
    protéine-protéine
  • Challenges importants en Santé et Sciences du
    Vivant comprendre et combattre les métastases,
    concevoir de nouveaux médicaments
Write a Comment
User Comments (0)
About PowerShow.com