Title: CPER MISN : Projet MBI Modlisation des Biomolcules et de leurs Interactions
1CPER MISN Projet MBIModélisation des
Biomolécules et de leurs Interactions
Conseil Scientifique lundi 26 novembre 2007
- Marie-Dominique Devignes
- Coordinatrice du projet MBI
- LORIA, Orpailleur
2Plan de lexposé
- Contexte du projet
- Objectifs
- Partenaires et Opérations
- Bilan de la 1ère année
- Perspectives
- Conclusion
3Contexte (1/2) Les défis de la bioinformatique
aujourdhui
- Modéliser, simuler, interagir, pour maîtriser des
flots de données - Problématiques de masses de données
- Données biologiques complexes
- Multiplicité des concepts sous-jacents ?
nécessité des approches à base de connaissances
pour intégrer, abstraire - Données 3D et/ou bruitées ? problématiques de
visualisation, de modélisation des interactions - Retombées majeures en santé publique,
biotechnologies, environnement
4Contexte (2/2) Une expérience
interdisciplinaire en Lorraine
- Fruits du précédent CPER PRST Intelligence
Logicielle - Tissu de collaborations partenaires
informaticiens et biologistes - Quelques faits
- Journée Bioinfo du 28 septembre 2007
- Thèses soutenues en 2007 (Saliha Yilmaz, Fabrice
Touzain) - Thèses en cours (Adrien Coulet, Catherine Eng,
Mathieu Chavent, Laurent Provot, Alex Beautrait,
Leo Ghemtio, Mehdi Kaytoue)
5Objectifs du projet MBI
- Introduire des approches à base de connaissances
dans les méthodes de modélisation des
biomolécules et de leurs interactions - Aborder sous cet angle la modélisation des
systèmes biologiques - Créer un Centre de Compétences et de Transfert en
Génomique et Bio-Modélisation G-BioModeL -
http//bioinfo.loria.fr
6Concept de Centre de Compétences et de Transfert
pour la Génomique et la Bio-Modélisation
- Interface avec des laboratoires de biologie et
des entreprises pharmaceutiques ou de
biotechnologies - Conseil typer le (les) besoin(s) du client
- Faciliter laccès aux ressources (bases de
données, logiciels) - Services (criblage virtuel, analyse
bioinformatique, développements) - Lien avec les projets de recherche
- CCT en amont lorsque cela est pertinent, aider
les clients à établir des collaborations de
recherche - CCT en aval valorisation des prototypes et des
algorithmes développés en recherche - Projets apparentés BioScope IT (Belgique),
Softberry (USA)
7Partenaires et opérations du projet MBI
- Au Loria et associés au Loria (environ 20
personnes)
- Extérieurs au Loria (environ 15 personnes)
INPL ENSAIA
G-BioModeL
Orpailleur
UHP-INRA IaM
MAPP
STREPTO-TH
UHP-INRA LGM
Adagio
VSM-G
UHP-CNRS MAEM
ABC
Algorille
Alice
Fac de Médecine Laboratoire de Génétique
IECN
8Plan de lexposé
- Contexte du projet
- Objectifs et paradigmes
- Partenaires et Opérations
- Bilan de la 1ère année
- Perspectives
- Conclusion
9Bilan 2007 (1/4) CCT G-BioModeL
- 2007-2009 3 projets pilotes pour explorer les
modalités de fonctionnement - P1 Docking en solvant non aqueux (ENSAIA-LBB)
- P2 Annotation des génomes de champignons
(UHP-INRA IaM) - P3 Criblage virtuel de ligands de la protéine
Met par le logiciel VSM-G (UHP-IBDML) - 2007 Constitution dune équipe de pilotage
- Aspects Scientifiques MD Devignes, B Maigret, M
Smaïl-Tabbone - Aspects Techniques L Pierron
- Chef de Projet M Souchet
- 2007 Equipement (OIP 2007 du CPER)
- Serveur de données 15 disques de 500 Go 7,5
To - Serveur de calcul 16 unités bi Quad 128
processeurs - Serveur dapplications
10Bilan 2007 (2/4) Opération STREPTO-TH
- Objectifs de lopération
- Mettre en évidence par des méthodes sans a priori
(HMM) des hétérogénéités dans les séquences des
génomes entièrement séquencés de Streptocoques. - Caractériser les régions atypiques (contenu en
gènes, origines possibles, etc.). - Valider la méthode didentification sans apriori
des régions atypiques dans les génomes
bactériens. - Résultats 2007 Analyse de régions atypiques
- Thèse Catherine Eng (2ème année) co-encadrée
Pierre Leblond (LGM) et Jean-François Mari
(Orpailleur) - Posters JOBIM 2005, Rencontre des
microbiologistes de lINRA 2006, ISMB ECCB 2007 - Article en cours de soumission concernant
lapplication des HMM2 dans la modélisation de
sites de fixation des facteurs de transcription
chez Streptomyces coelicolor A3(2) (cf précédent
CPER) - Mise en place dune collaboration avec
lentreprise danoise Chr. Hansen (données de
puces à ADN).
11Opération Strepto-TH illustration
Alignement de deux génomes de Streptococcus
thermophilus
Les rectangles verts localisent les 49 régions
atypiques déterminées par le HMM2, le long du
génome de S. thermophilus CNR1066. Les bandes
rouges et bleues relient entre elles des
séquences ayant une homologie dans le même sens
et dans le sens inverse respectivement, entre ces
deux souches.
gt 12 régions atypiques parmi les 49 régions
atypiques extraites par le HMM2 sont aussi
identifiées comme des régions spécifiques de la
souche CNRZ1066 par rapport à la souche LMD-9.
Homologue
Région
Processus de caractérisation automatique des
régions atypiques
Le processus permet de caractériser les régions
atypiques comportant des gènes spécifiques de
souche et/ou despèce. - de la création dune
base de données stockant les données génomiques
du phylum des firmicutes (91 espèces) et les
caractéristiques des régions atypiques, - dune
exécution automatique de blast (recherche
dhomologie) sur les bases de données
(firmicutes, nr), - de requêtes dextraction des
régions atypiques comportant des gènes
spécifiques.
Organisme
Souche
- 10 régions atypiques supplémentaires validées
comme ayant une origine exogène
12Bilan 2007 (3/4) Opération MAPP
- Objectifs
- Identifier rapidement les modes dassemblage les
plus pertinents entre plusieurs unités protéiques
- Manipuler interactivement et analyser les
interfaces protéine-protéine ainsi créés. - Thèses en cours Laurent Provot, Mathieu Chavent
- Résultats
- Propositions pour améliorer avec les méthodes de
la géométrie discrète les méthodes de recherche
dinformation géométriques sur les surfaces des
protéines. - Geometric Feature Estimators for Noisy Discrete
Surfaces, article soumis à la conférence
internationale DGCI 2008.
13Opération MAPP Illustrations
- Calculs de patchs à la surface de lobjet
utilisation dun paramètre dépaisseur pour une
prise en compte du bruit
- 2) Extraction de caractéristiques géométriques à
partir des patchs (estimateur daire, vecteur
normal, discrimination des zones plates,
convexes, concaves). -
- Visualisation haute-performance des surfaces (M.
Chavent en interaction avec Bruno Lévy,
opération MoVIs, thème MIS) utilisation du CPU
et du GPU pour le calcul de la surface
moléculaire.
14Bilan 2007 (4/4) Opération VSM-G
- Objectifs
- Améliorer les techniques de criblage virtuel, en
particulier par le développement de chimiothèques
spécialisées et par lutilisation des grilles de
calcul (Orpailleur) - Améliorer les techniques de docking spécialisées
dans le domaines des complexes protéine-protéine
et protéine - acide nucléique (Orpailleur-MAEM) - Thèses en cours
- Alexandre Beautrait soutenance prévue 15 janvier
2008 - Léo Ghemtio (1ère année)
- Résultats
- Modèle structural de ligand inhibiteurs pour le
récepteur c-Met - Modélisation 3D dun ARN (CUG)17 et recherche de
petites molécules capables de sy fixer.
15Opération VSM-G Illustrations
1. Ligands du récepteur c-Met Sélection de
ligands potentiels à partir dune chimiothèque
maison (600 000 molécules, 90 millions de
conformations) et sur la base dun ligand connu
(K252A inhibiteur de référence). R1, R2 et R3
groupements de substitution -gt synthèse chimique
et tests.
- 2. Maladies à triplets dARN
- Modélisation 3D de lARN (CUG)17 sur la base
dun modèle expérimental de duplex (CUG)6(CUG)6
- Dynamique moléculaire pour obtenir les
conformations en solution de lARN (CUG)17 - Sélection de 10 conformations représentatives
par classement hiérarchique.
C U G
Recherche de petite molécules se fixant sur des
sites pré-définis lARN (CUG)17 (en cours)
16Plan de lexposé
- Contexte du projet
- Objectifs et paradigmes
- Partenaires et Opérations
- Bilan de la 1ère année
- Perspectives
- Conclusion
17Perspectives 2008 et au-delà (1/4) Résultats du
2ème appel à opérations octobre 2007
- Opération BioCoron (Orpailleur IaM)
- Extraction de profils dexpression à partir de
résultats de puces transcriptomiques approches
symboliques, adaptation de la plateforme Coron
dOrpailleur aux données biologiques. - Expertise externe favorable au vu de la qualité
des équipes impliquées - Opération IP3L-RDM (Orpailleur)
- Application des méthodes de Fouille de Données
Relationnelle (Relational Data Mining) et
Programmation Logique Inductive (PLI) à la
caractérisation des interactions
protéines-ligands et protéines-protéines - En attente dun retour dexpertise externe
18Perspectives 2008 et au-delà (2/4) Ouverture du
CCT G-BioModeL
- Trois composantes
- Plateforme académique (en lien avec le Génopole
Strasbourg-Alsace-Lorraine et la palteforme BIPS) - Structure privée ou semi-privée permettant de
fournir dans nos domaines de composante des
services en Bioinformatique - Projet en émergence pour lexploitation du
logiciel VSM-G - Poursuite de lOIP pour léquipement du CCT
- Extension du serveur de données et du serveur de
calcul - But répondre à de nouveaux besoins en fouille de
données biologiques - Question du financement et du rattachement
administratif des emplois générés par lactivité
du CCT
19Perspectives 2008 et au-delà (3/4) Autres
opérations en cours
- Opération STREPTO-TH
- Regroupement et caractérisation des régions
atypiques afin de déterminer des signatures de
groupe - Comparaison avec les modèles de Markov dordre 1
(M1-Mk), Nicolas P. et al., 2002. - Validation expérimentale grâce à une
collaboration avec une entreprise industrielle
alimentaire Chr. Hansen ( données de puces à
ADN). - Opération MAPP
- Association par complémentarité de forme
- Approche multi-échelle
- Application au docking Protéine-Protéine. Prise
en compte des interactions électrostatiques dans
la définition dune fonction de score - Opération VSM-G
- Validation du logiciel sur le système récepteur
c-Met ligand - Adaptation au criblage des interactions ARN
(CUG)17 - ligands
20Perspectives 2008 et au-delà (4/4) Animation
scientifique et formation
- Séminaire Bioinfo Journée bioinfo
- Travail sur les filières universitaires proposant
un enseignement en Bioinfo - INPL cursus bioinformatique commun
Mines-ENSIC-ENSAIA - UFR STB (biologie) fermeture en 2008 du M2P
Génomique Informatique - UFR IAEM (informatique) Licence Informatique
projet doption Santé-Biologie - Faculté de Médecine plus de Bioinformatique en
UE de génétique (4ème année) - Favoriser de nouvelles collaborations
- Avec le CPER Santé
- Dans le Grand-Est
- Au niveau transfrontalier (MPI Sarrebruck et
Université de la Sarre)
21Conclusion
- Projet structuré autour du CCT G-BioModeL
- Nombreuses sollicitations de la part des
biologistes - Beaucoup de questions par rapport au mode de
fonctionnement (personnel affecté au CCT,
activité de service, pérennité, etc.) - Problème récurrent dans dautres thèmes du CPER
MISN (TALC, SSS) réflexion générale ? - Bioinformatique et Sciences du Vivant
- Thème transversal au sein du Loria dans le
prochain quadriennal - Plus large que le projet MBI étendu aux
recherches sur les systèmes bio-inspirés et la
modélisation du comportement humain et du cerveau - Nouvelles collaborations au sein du thème et avec
dautres thèmes TALC, MIS
22Paradigmes (1/2)
- Prédire des interactions protéine-protéine
Interface?
Protéine 1
Protéine 2
Représentation des Connaissances
Atomes exposés
Autres interfaces bien décrites
Enveloppes globales des complexes (SAXS)
Résultats de mutagenèse
23Paradigmes (2/2)
- La protéine FAK commutateur cellulaire entre
différentes voies de signalisation
P0
P2
Complexe dadhesion
P1
P0
P0
FAK
P8
P7
P5
FAK
FAK
P3
P4
P6
P9
P10
Signalisation intracellulaire
- La modélisation de ce système biologique doit
inclure des connaissances sur les interactions
protéine-protéine - Challenges importants en Santé et Sciences du
Vivant comprendre et combattre les métastases,
concevoir de nouveaux médicaments