Title: Presentazione di PowerPoint
1BIOinformatica
MASTER in
Applicazioni BioMediche e Farmaceutiche.
Università degli Studi La Sapienza ROMA Anno
2002/2003
Analisi in silico per la ricerca di domini
conservati di NRPSs batteriche in genomi
eucariotici
Direttore Master Prof.ssa Anna
Tramontano Relatore Prof. Stefano Pascarella
Pietro Buffa
2Generalità sulle Non Ribosomal Peptide
Syntetases, NRPSs
Le NRPSs provvedono ad una sintesi peptidica
differente da quella svolta dai ribosomi, essi si
presentano generalmente come grossi enzimi
multifunzionali con unorganizzazione molecolare
di tipo modulare.
Il modulo più semplice è composto da tre domini
indispensabili per il corretto funzionamento
dellenzima
Catalizza lallungamento del peptide nascente.
Lega laminoacido al gruppo prostetico di
fosfopanteteina (PP), formando un
aminoacil-tioestere.
Catalizza lattivazione dellaminoacido
(aminoacil-adenilato).
3- Diversi studi condotti sul dominio di
Adenilazione di questa famiglia di enzimi hanno
dimostrato che - La natura del substrato che sarà inserito nel
peptide sintetizzato dalle NRPSs è controllata
principalmente da questo dominio. - La presenza di un aminoacil-adenilato è la
necessaria premessa alla formazione
dellaminoacil-tioestere nel dominio di
Tiolazione e quindi alla sintesi del peptide. - Studi condotti su oltre 150 domini di
Adenilazione provenienti da organismi diversi,
hanno rivelato la presenza di importanti residui
conservati coinvolti nel legame e nellidrolisi
dellATP. Sulla base di queste osservazioni è
oggi possibile prevedere la specificità di un
dominio di adenilazione a partire dalla struttura
primaria con una accuratezza di circa l86
(Stachelhaus et al, 1999). - Nel 1997 Mohamed Marahiel della Philipps
university of Marburg ha ottenuto la struttura
cristallografica del dominio di Adenilazione
della Gramicidina sintetasi di Bacillus brevis.
La struttura cristallografica, lunica fino ad
oggi risolta, è stata ottenuta con i substrati
complessati, rispettivamente la L-Phe e AMP ad
una risoluzione di 1,9Å. In giallo il dominio
maggiore, in rosso il dominio minore. AMP e Phe
sono mostrati come modelli a spazio pieno.
4SCOPO DEL LAVORO
Punto di partenza di questa ricerca è stata la
recente identificazione da parte di due
ricercatori Giapponesi (T. Kasahara e T. Kato,
Nature 2003) di una importante molecola
la Pirrolo Quinolina Quinone (PQQ), cruciale per
la degradazione dellaminoacido Lisina da parte
di particolari deidrogenasi PQQ-dipendenti nel
topo (acido 2-aminoadipico 6-semialdeide
deidrogenasi AAS) . Queste deidrogenasi,
presentano una organizzazione dei domini che è
tipica degli enzimi NRPS di origine
batterica Dominio di Adenilazione legante
AMP Dominio di Tiolazione legante PP Ed un
Dominio legante il PQQ
Scopo della ricerca è quello di verificare se
proteine contenenti i domini AMP e PP compaiono
anche in altri organismi (oltre che in Topo e
Drosophila dove sono stati recentemente
riscontrati) e se si, associati a quale altro
dominio.
5RISULTATI DELLA RICERCA
Ricerca di nuove sequenze proteiche correlate
alle NRPSs batteriche in diversi genomi
eucariotici
Una preliminare ricerca sulle banche dati
proteiche, ha permesso di individuare 15 proteine
correlate alle NRPSs batteriche (contenenti cioè
i domini fondamentali), non ancora annotate nella
loro funzione in banca dati.
Sono state utilizzate come sonda le proteine AAS
(Acido 2-aminoadipico 6-semialdeide deidrogenasi)
di topo Accession number, 30348962 U26 di
Drosophila Accession number, AAF52679 EBONY di
Drosophila Accession number, CAA11962
6Le sequenze precedentemente elencate sono state
utilizzate come sonda per ricerche di similarità
sulle Banche Dati Genomiche utilizzando il modulo
tblastn del programma BLAST implementato sia su
NCBI che su ENSEMBL.
R. Norvegicus (Rat) M. Musculus H. Sapiens D.
Melanogaster C. Elegans C. Briggsae A.Thaliana D.
Rerio (Zebrafish) A.Gambiae S. Scrofa G.
Gallus B. Taurus C. Intestinalis F. Rubripes O.
sativa
Per alcuni genomi non si sono avuti risultati
positivi.
Per altri si è trovata una notevole similarità e
la presenza di residui chiave veniva mantenuta.
Per queste sequenze si è proceduto
allesportazione delle rispettive sequenze
genomiche in formato FASTA.
7Costruzione di geni in silico per le sequenze
ritrovate in seguito alle ricerche genomiche
Le sequenze genomiche precedentemente esportate e
salvate vengono utilizzate in questa seconda fase
del lavoro, per cercare di ottenere, attraverso
luso di programmi quali GenScan e genomeScan,
una corretta costruzione del gene specifico per
ogni sequenza ed arrivare alla fine, alla
predizione della relativa sequenza proteica
completa.
Rattus norvegicus
Homo Sapiens
8Realizzazione di un allineamento multiplo completo
- Abbiamo utilizzato 35 sequenze
DFFxxLGG(HD)S(LI) Residui fondamentali del
dominio di tiolazione. La serina lega il gruppo
prostetico di fosfopanteteina.
- Da tutte le 35 seq. È stata manualmente
eliminata la regione contenente il dominio
C-terminale
- E stato utilizzato il programma HMMERalign
Parte dellallineamento multiplo di 35
sequenze proteiche appartenenti alla famiglia
della NRPSs,. Lallineamento è stato formattato
utilizzando il programma ESPRIT 2.1.
- Sono state eliminate dallallineamento multiplo
le regioni iniziali e terminali poichè non avendo
corrispondenze ben definite, potevano creare un
fastidioso rumore di fondo che andrebbe a
disturbare la successiva fase di generazione
dellalbero evolutivo
9Realizzazione dellalbero filogenetico
Linea filetica dei Batteri
Sono stati utilizzati i programmi PROTDIST KITSCH
e DRAWTREE
Linea filetica dei Funghi
Linea filetica dei Vegetali
Linea filetica degli organismi eucariotici
superiori animali
Albero filogenetico.
10DISCUSSIONE
Il completamento in corso di vari progetti
gnomici ha permesso di individuare numerose
proteine correlate alle NRPSs batteriche in
organismi eucariotici superiori non ancora
annotate in banca dati. La conoscenza del
sistema sintetico delle NRPSs e la comprensione
più approfondita dellevoluzione che queste
proteine enzimatiche , conosciute fino a poco
tempo fa soltanto a livello batterico, potrebbero
avere avuto, potrebbe risultare utile per cercare
di far luce su determinate vie metaboliche non
ancora molto chiare in diversi organismi
superiori.
11RINGRAZIAMENTI