Title: Diapositive 1
1Plan
Présentation des descripteurs moléculaires
Samia ACI - CEA/DSV/DRDC/BIM
- Descripteurs moléculaires
- Descripteurs 1D
- Descripteurs 2D
- Descripteurs 3D
- Logiciels
- Domaine privé
- Domaine public
- Problèmes généraux
- Application au projet
- III) Mise en forme préalable
- a) Au niveau de la 2D
- b) Génération 3D?
2Descripteurs
- Descripteurs moléculaires
- Descripteurs 1D
Accessibles via la formule brute de la molécule
(ex. C2H5NO2) Propriétés très générales
- poids moléculaire
- nombre et composition des atomes
-
Calculés à partir de la structure 2D de la
molécule. Ex Plusieurs
types
- constitutionnels révélateurs de la nature des
différents composants de la molécule - ex. nombre de liaisons (simples/doubles,
etc..), de cycles, - topologiques caractérisent la taille, la
ramification et la forme globale de la molécule - ex. indices de Balaban, de Wiener, de Kier, de
Petitjean, de Randic - propriétés décrivent certaines propriétés
physico-chimiques de la molécule - ex. somme des aires des surfaces de Van der
Waals, logP par la méthode des fragments,
3Descripteurs
- Les descripteurs basés sur la décomposition en
fragments
2 classes principales - clé structurale composée
dun ensemble de fragments prédéfinis (mêmes
fragments quelque soit la molécule) ex. MACCS
key, Unity fingerprints, etc - empreinte
moléculaire composée de fragments générés
spécifiquement pour la molécule ex. Daylight
fingerprints, Hologram QSAR, topological torsion,
atomic pair
Daylight fingerprint
Unity fingerprint
Représentation Utilisation de bit
strings binaires spécifie labsence ou la
présence dun fragments continues quantifie le
nombre doccurrences dun fragment
binaire
continue
4Descripteurs
- Les descripteurs basés sur les propriétés
physico-chimiques
relient les propriétés pharmacophores des atomes
avec la topologie de la molécule. Propriétés
pharmacophores couramment utilisées - donneur de
liaison H - accepteur de liaison H - cation (ou
acide) - anion (ou base) - centre hydrophobe -
cycle aromatique Ex. BCUT, ToPD fingerprints,
FTrees, pharmacophores 2-, 3-, 4-points,
etc Représentations
A
H
D, A
empreinte pharmacophorique (binaire ou continue)
polarisabilité charge a/d LH
indices
atome i
liaison i-j 0.01 si non-liés 0.1valeur
liaison si liés
5Descripteurs
Descripteurs calculés à partir de la structure 3D
de la molécule. Ex Plusieurs types de
descripteurs 3D.
- géométriques mêmes indices quen 2D mais
appliqués aux distances géométriques ex.
Balaban, Wiener, Kier, Petitjean, Randic, ... - propriétés renseignent sur lagencement spatial
des atomes - ex. moment principal dinertie, surface
accessible au solvant,
- Les descripteurs basés sur les propriétés
physico-chimiques
Idem 2D mais relient les propriétés
pharmacophores avec la géométrie de la
molécule. Ex. descripteurs BCUT
2D
3D
distance i, j
liaison i-j 0.01 si non-liés 0.1valeur
liaison si liés
6Descripteurs
- Les descripteurs basés sur le champs
dinteraction moléculaire
relient lactivité biologique avec les propriétés
dinteraction et la forme tridimensionnelle de la
molécule. ? nécessitent le calcul du champs
dinteraction de la molécule dans lespace. Ex.
GRIND, CoMFA, CoMSIA, etc..
- Descripteurs basés sur les méthodes
spectroscopiques
Représente les molécules par des mesures
spectroscopiques Ex. EVA (Eigen VAlues) MoRSE
(Molecule Representation of Structures based on
Electron diffraction) RDF (Radial Distribution
Function)
- Autres descripteurs spécifiquement 3D
- WHIM saffranchit du problème de lalignement
des molécules car basé sur des indices
statistiques calculés sur les projections des
atomes le long des trois axes principaux - GETAWAY utilise une matrice dinfluence
moléculaire pondérée par des propriétés atomiques
7Logiciels
Calcul de pharmacophores (propriétés
physico-chimiques
Molinspiration
Calcul dindices et de propriétés globales (1D,
2D, 3D)
Misearch
Mitool
Optive Research
EA-Inventor
Discovery Enginel
MDL-Isis (?)
MDL-QSAR
Elsevier MDL
Tsar, Catalyst
Cerius², DS Accord
Accelrys
QSAR/QSPR predictive model
QuaSAR-MOE
FTrees (BioSolveIT)
TOPIX (SDL)
Chemical Commputing Group Dragon
(Talete) Tripos
Prochemist (CADCOM)
JChem (ChemAxon)
Chem3D (CambridgeSoft)
THINK (Treweren Consultant)
Molconn-Z
DISCO, DiverseSolution
QSAR/QSPR predictive model
VolSurf, Almond (Molecular Discovery Ltd)
HQSAR, Unity
ROCS, Shape tk (OpenEye)
DayCart (Daylight)
Calcul par décomposition en fragments
Calcul de descripteurs spécifiquement 3D
Almond QSAR with CoMFA (hint!Zap), CoMSIA,
VolSurf
FILTER (OpenEye)
8Logiciels
Calcul de pharmacophores (propriétés
physico-chimiques
Calcul dindices et de propriétés globales (1D,
2D, 3D)
PETRA (labo TORVS)
CAVEAT (PAB Group, Univ. Californie) (?)
PreADME (BMDRC, Corée)
Molgen-QSPR (Dept Math, Univ. Bayreuth)
DOCK (UCSF, Univ. Californie) (?)
CODESSA PRO (Univ. Floride)
Calcul par décomposition en fragments
Calcul de descripteurs spécifiquement 3D
9Logiciels
Peu de logiciels freeware (même chez les
académiques)
Librairie CDK (Chemistry Development Kit)
librairie java libre de droit
10Logiciels
d) Application au projet
- Diversité des chimiothèques
- Evaluation logiciels Tripos
- DiverseSolution, Selector (logiciel dévaluation
de la diversité des chimiothèques) - HQSAR, Distill, Unity2D, Molconn-Z (génèrent
différents descripteurs) - Jchem (ChemAxon)
- module compr compare la diversité/dissimilarité
entre deux chimiothèques
- Recherche faux-négatifs/faux-positifs
descripteurs expérimentaux (issus des données de
criblage)
- descripteurs chimiques actuels
- indices de forme Kier, Petitjean (calculés avec
librairie CDK) - indices de flexibilité Kier, rotatable
bonds (calculés avec CDK ChemAxon) - Indices de propriétés PSA, logP, points
pharmacophores (calculés avec ChemAxon)
combinaison
- descripteurs chimiques à intégrer
- Triangles de Dragos
11Logiciels
- Recherche explicative de bio-activité
- Logiciel FTree (Feature Tree)
- descripteur développé chez BioSolveIT
- conserve la topologie de la molécule en relation
avec - les propriétés physico-chimique.
- capable de rechercher des similarité floues
- ? Version dévaluation pour 6 semaines
- Logiciel THINK
- calcul de descripteur pharmacophores 2-, 3- et
4-points géométriques - ? licence académique
- Logiciels de ChemAxon
- calcul de descripteur pharmacophores 2-points
topologiques - ? licence académique
12Mise en forme
- Mise en forme des molécules
- Au niveau de la 2D
Traitement des molécules avant calcul des
descripteurs
- SMILES/numérotation numérotation canonique (
Weininger et al,1989) - ? molconvert de chez ChemAxon
- En général, traités comme suit
- reconnaissance des différentes formes
- choix dune forme de représentation (conservant
le mieux les propriétés) - ? Standardizer de chez ChemAxon
13Mise en forme
2 formes toujours en équilibre
- 2 méthodes
- standardiser dans lune des formes
- (ex. toujours forme cétone de léquilibre
céto/énol) - ? problème forme majoritaire difficile à
déterminer - tous les cas ne peuvent pas être listés
- générer toutes les formes tautomères
- attention
- ? ne tient pas compte de la forme prédominante
- ? alourdit les calculs
- Standardizer de ChemAxon
- actuellement, solution 1) car fichiers de
configuration modifiables - demandé au UGM ChemAxon module de génération
des différentes formes - ? solution 2) possible
14Mise en forme
Forme dune molécule f(pH ) ? propriétés
attachées aux atomes dépendent également du
pH. Or, molécules entrées dans la base sans tenir
compte du pH Exemple acide acétique
Outil Major Microspecies de ChemAxon donne
lespèce majoritaire au pH demandé
15Mise en forme
- Problèmes des chimiothèques révélés par cette
étape
- composés additifs
- inhomogénéité contres ions
- ex. ion Cl- noté par Cl, Cl-, ClH
- présence parfois de molécules deau
- présence de diacides
- ? plusieurs diacides
- ? stoechiométries???
16Mise en forme
- composés multiples
- mélanges?
- erreurs de saisie?
17Mise en forme
- Mise en forme des molécules
- G énération 3D?
Démarche de plus en plus adoptée générer un
ensemble de conformations 3D énergétiquement
acceptables pour chaque molécule de la base
- prendre en compte la flexibilité de la molécule
- la stéréochimie de la molécule
- les effets stériques
- Programmes les plus couramment utilisés
- CONCORD (Tripos) génère des structures 3D
optimisées - Confort outil danalyse conformationnel
- StereoPlex, Protoplex génération de
stéréoisomères, tautomères, etc - CORINA (TORVS Research Team) 1 des plus utilisé
actuellement, génère un conformère de plus faible
énergie - ROTATE génération dautres conformations
- ...
18- disponible dans lAcademic Package de ChemAxon
- Thème abordé au UGM ChemAxon
- Utilise des espaces de Minkowski
- construction itérative par optimisation
- de fragments de la molécule et des
- distances inter-atomiques
- minimisation finale dénergie
- permet de conserver le nombre de
- conformations souhaité
19Mise en forme
- dans un premier temps, utiliser la base 2D
standardisée - possibilité de générer une base 3D
- ? Clean3D (transformation 2D -gt 3D possible)
- ? projet WISDOM grilles de calcul (permet de
disposer des ressources nécessaires - comparaison possible résultats 2D/3D.