Title: Bereich 3: V10 - Integrative Biologie
1Bereich 3 V10 - Integrative Biologie
1 Protein-Netzwerke topologische
Graphen-Netzwerke 2 Analyse von
Stoffwechselwegen (metabolic pathways)
Konzentration auf Metabolite, enzym.
Reaktionen 3 Zell-Simulationen dynamische
Simulation auf Sekunden-Zeitskala, ?t 0.01 s
(V10 und V11) Systembiologie Integration von
genomischen und proteomischen Analysen
Komplexität, Level an Verständnis
www.systemsbiology.org
2Analyse von Stoffwechselwegen Beispiel E. coli
verwende Daten aus Datenbank EcoCyc (siehe auch
MetaCyc Stoffwechsel von gt 150
Organismen) EcoCyc enthält 905 Reaktionen für
E.coli davon gehören 161 nicht zum Stoffwechsel
kleiner Moleküle, z.B. DNA Replikation, von den
verbleibenden 744 wurden 569 mindestens einem
Pfad zugeordnet Dagegen gibt es 607 Enzyme. Es
gibt also keine 11 Zuordnung zwischen Enzymen
und Reaktionen, denn (1) Manche Enzyme
katalyiseren mehrere Reaktionen, und manche
Reaktionen werden von mehreren Enzymen
katalysiert (2) nicht zu allen Reaktionen sind
die Enzyme bekannt, die sie katalysieren.
Ouzonis, Karp, Genome Research 10, 568 (2000)
3Beispiel Stoffwechsel von E. coli
Die 744 Reaktionen enthalten 791 verschiedene
Substrate.
Im Mittel enthält jede Reaktion 4 Substrate.
Ouzonis, Karp, Genome Research 10, 568 (2000)
4Beispiel Stoffwechsel von E. coli
EcoCyc enthält 131 Stoffwechsel- Pfade. Die Länge
der Pfade variiert von 1 bis 16. Im Mittel
5.4. Von den 607 Enzymen sind 100
multifunktional. Purin-Nukleosid-Phosphorylase und
Nukleosid-Diphosphatkinase katalysieren 7 bzw. 9
Reaktionen. 483 Reaktionen gehören zu
einem Pfad, 99 Reaktionen gehören zu mehreren
Pfaden.
Ouzonis, Karp, Genome Research 10, 568 (2000)
5Fazit
Stoffwechsel-Netzwerke von einfachen Organismen
sind mittlerweile fast vollständig bekannt. Ist
die Beschreibung mit einzelnen Stoffwechsel-Wegen
adäquat? - Reaktionen, Enzyme und Substrate
gehören oft zu mehreren Pfaden. - Die Einteilung
in einzelne Stoffwechsel-Pfade ist nicht immer
eindeutig.
6Protein-Netzwerke Cytoscape
Main window of Cytoscape 2.0, displaying a
network of protein-protein and protein-DNA
interactions among 332 yeast genes.
http//www.cytoscape.org/
7Protein-Wechselwirkungsnetzwerke Cytoscape
You can flip through different visual styles by
making a selection from the Visual Style pull
down menu. "Sample2" will give gene expression
values for each node will be colored along a
color gradient between red and green.
http//www.cytoscape.org/
8Protein-Wechselwirkungsnetzwerke Cytoscape
With the Cytoscape Visual Style feature, you can
easily customize the visual appearance of your
graph. Cytoscape can also map values such as
probabilities, confidence levels, and expression
values to the visualization of networks.
http//www.cytoscape.org/
9Protein-Wechselwirkungsnetzwerke Cytoscape
Cytoscape implements an algorithm for finding
"active pathways", i.e., subnetworks of genes
that jointly show significant differential
expression over a set of experimental conditions
observed by microarray experiment. The image
right show the results of a run of this
algorithm. Several active paths have been found
the highest scoring one has 22 genes identified
as being active in three of the 20 experimental
conditions. From here, one can view a graph with
only these genes, display the expression data for
any of the conditions, and examine Gene Ontology
(GO) information available to assess the
biological significance of this network.
http//www.cytoscape.org/
10Features of Cytoscape v2.0 (July 2004)
Input Input and construct molecular interaction
networks from raw interaction files (SIF format)
containing lists of protein-protein and/or
protein-DNA interaction pairs. For yeast and
other model organisms, large sources of pairwise
interactions are available through the BIND and
TRANSFAC databases. User-defined interaction
types are also supported. Load and save
previously-constructed interaction networks in
GML format (Graph Markup Language). Input mRNA
expression profiles from tab- or space-delimited
text files. Load and save arbitrary attributes
on nodes and edges. For example, input a set of
custom annotation terms for your proteins, create
a set of confidence values for your
protein-protein interactions. Import gene
functional annotations from the Gene Ontology
(GO) and KEGG databases.
http//www.cytoscape.org/
11Features of Cytoscape v2.0 (July 2004)
Visualization Customize network data display
using powerful visual styles. View a
superposition of gene expression ratios and
p-values on the network. Expression data can be
mapped to node color, label, border thickness, or
border color, etc. according to user-configurable
colors and visualization schemes. Layout
networks in two dimensions. A variety of layout
algorithms are available, including cyclic and
spring-embedded layouts. Zoom in/out and pan for
browsing the network. Use the network manager to
easily organize multiple networks. Use the
birds eye view to easily navigate large
networks.
http//www.cytoscape.org/
12Features of Cytoscape v2.0 (July 2004)
Analysis Java plug-ins available for network and
molecular profile analysis. E.g. Filter the
network to select subsets of nodes and/or
interactions based on the current data. E.g.,
users may select nodes involved in a threshold
number of interactions, nodes that share a
particular GO annotation, or nodes whose gene
expression levels change significantly in one or
more conditions according to p-values loaded with
the gene expression data. - Find active
subnetworks / pathway modules. The network is
screened against gene expression data to identify
connected sets of interactions, i.e. interaction
subnetworks, whose genes show particularly high
levels of differential expression. The
interactions contained in each subnetwork provide
hypotheses for the regulatory and signaling
interactions in control of the observed
expression changes. - Find clusters (highly
interconnected regions) in any network loaded
into Cytoscape. Depending on the type of network,
clusters may mean different things. For instance,
clusters in a protein-protein interaction network
have been shown to be protein complexes and parts
of pathways. Clusters in a protein similarity
network represent protein families.
http//www.cytoscape.org/
13Metabolische Pfade in der post-genomischen Ära
(a) klassische Biochemie bestimmt
Stöchiometrien einzelner Reaktionen (b)
Katalogisierung vieler Reaktionen, Gruppierung
nach gemeinsamen Metaboliten führt zu
traditionellen Pfaden wie Glykolyse,
Pentose-Phosphat- Pfad (c) Durch komplette
Information können nun die kompletten metabolisch
en Pfade zugeordnet werden.
14Metabolische Pfade in der post-genomischen Ära
Traditionelle metabolische Pfade dienen als
konzeptioneller Rahmen für Forschung und
Lehre. Man kann dadurch Metabolismen
verschiedener Organismen vergleichen. Jedoch
sind sie nicht für quantitative, systemische
Bewertungen biologischer Reaktionsnetzwerke
geeignet, da sie nur Teile der Netzwerke
darstellen. Sie wurden oft in Zelltypen
entdeckt, in denen sie wichtige
metabolische Funktionen übernehmen (z.G.
Glykolyse in Hefe). Man kann diese Pfade jedoch
nicht einfach auf andere Zelltypen mit
anderen Enzymleveln und metabolischen Profilen
übertragen.
153 Vorgehensweisen
1 konstruiere alle Transformationswege, die von
einem gegebenen Substrat zu einem gegebenen
Produkt führen 2 verwende Satz von linear
(systemisch) unabhängigen Basisvektoren im Raum
der Reaktionsflüsse, durch Linearkombination
sollen sich alle möglichen Flußverteilungen
darstellen lassen. Allerdings ist die Wahl
dieser Basisvektoren nicht eindeutig. 3 Konzept
der elementaren (Fluss-) Moden Eine
Elementarmode ist ein minimaler Satz von Enzymen,
die im Gleichgewicht operieren können. Minimal
heisst falls nur die Enzyme dieser Mode
operieren, führt Inhibition jedes einzelnen
seiner Enzyms zum Stop aller Gleichgewichtsflüsse
im System
16Beschreibung vernetzter metabolischer Pfade
Papin et al. TIBS 28, 250 (2003)
(a) aus genomischen, biochemischen,
physiologischen Daten wird ein Reaktionsnetzwerk
aufgestellt. Es gibt interne Flüsse innerhalb der
Systemgrenzen und externe Flüsse mit der
Umgebung. (b) Dieses Netzwerk wird durch eine
stöchiometrische Matrix dargestellt, in der
Metaboliten durch Reaktionen miteinander
verbunden werden. (c) Mögliche Zustände der Zelle
aufgrund dieser Matrix werden mit Techniken wie
elementary modes oder extreme pathways
identifiziert. Die möglichen Zustände liegen
innerhalb eines Konus im durch die verschiedenen
Flüsse aufgespannten Koordinatensystem.
17Analyse der stöchiometrischen Matrix
stöchiometrische Koeffizienten der
einzelnen Reaktionen.
Darstellung des Reaktions- netzwerks mit
stöchiometrischer Matrix S.
Metabolite
Analyse der Matrix S ? Pathway-Darstellung
P. Deren Zeilen enthalten den Reaktionen
entsprechende Flüsse und die Spalten die
sich ergebenden Pfade.
Darstellung der Pfade ist möglich für einfache
Netzwerke.
Papin et al. TIBS 28, 250 (2003)
18Netzwerk-Analyse
(a) welche Substrate (A-E) sind zur Produktion
der Biomasse erforderlich (B,E), welche nicht?
(b) Aufspüren von nicht genutzten Reaktionen (F ?
E), Refinement der Annotation von Genomen.
Papin et al. TIBS 28, 250 (2003)
(c) quantitative Beschreibung von Pathway-Redundan
z bzw. Robustheit des Netzwerks P1 und P2 führen
beide von A nach D.
(d) Reaktionen RA, RB und RC werden stets
gemeinsam benutzt. Ihre Gene werden daher
vermutlich koordiniert reguliert.
19Welche Rolle spielt Pathway-Analyse?
Papin et al. TIBS 28, 250 (2003)
Die auf Netzwerken basierende Analyse von Pfaden
stellt eine gute Basis dar um die heutige Flut an
experimentellen Daten ohne vorgefasste
Meinungen in biologische Modelle zu übersetzen.
20konkretes BeispielGlykolyse
Stoffwechselpfad in Lehrbuch.
http//biotech.icmb.utexas.edu/ glycolysis/pathway
.html
21Glykolyse
Pyr
Pyk
PEP
Schematische Darstellung. Metabolite sind
blau, Enzyme rot dargestellt.
Eno
2PG
Gpm
3PG
Pgk
Gap
Glucose
G6P
F6P
FP2
GAP
1,3BPG
Fba
Hexokinase
Pgi
Pfk
TpiA
DHAP
22Pentose-Phosphat-Stoffwechsel
Xyl5P
Sed7P
Ery4P
Rpe
TktI
Tal
Ru5P
Gnd
R5P
GAP
F6P
TktII
6PG
Pgl
GO6P
Zwf
G6P
G6P
F6P
Analoge Darstellung für PPP. G6P und F6P tauchen
je zweimal auf!
23Konkretes Beispiel Monosaccharid-Stoffwechsel
Benötigter Input Deklaration interner und
externer Substanzen, Enzymreaktionen und ihre
Richtung
Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
24Reaktionsschema für Monosaccharid-Stoffwechsel
Kopplung von Glykolyse und Pentose-Phosphat-Pfad
15 Metabolite, 19 Reaktionen Daher besitzt
die stöchiometrische Matrix die Dimension 15 ?
19. Welche Reaktionen müssen notwendigerweise ge
meinsam ablaufen? Offensichtlich Gap, Pgk, Gpm,
Eno, Pyk und Zwf, Pgl, Gnd. Weiterhin auch
Fba, TpiA und 2 Rpe, TktI, Tal, TktII.
Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
25Reduktion(I) Reduziertes Schema
Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
Schema wurde aus vorherigem Schema erhalten indem
all Enzyme kombiniert wurden, die immer gemeinsam
operieren.
26Reduktion (II) Elementarmoden
Eine Elementarmode ist ein minimaler Satz von
Enzymen, die im Gleichgewicht operieren können.
Minimal heisst wenn nur die Enzyme einer Mode
aktiv sind, führt Inhibition jedes einzelnen
Enzyms zum Stop aller Gleichgewichtsflüsse.
Identifizierung der Moden (1) ursprünglicher
Glykolyse-Stoffwechsel. Die Moden (3)-(6) stimmen
mit den 4 Moden des Pentose-Phosphat-Stoffwechsel
s aus Stryer überein.
Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
27Elementarmoden
Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
Graphische Darstellung von 7 Elementarmoden. Die
Moden beinhalten unterschiedliche Anzahl an
Enzymen und überlappen teilweise miteinander. Die
Zahlen entsprechen den relativen Flüssen. Jeder
Systemzustand im Gleichgewicht lässt sich als
Linearkombination dieser Elementarmoden
darstellen.
28Software FluxAnalyzer, setzt auf Matlab auf
Steffen Klamt.
Klamt et al. Bioinformatics 19, 261 (2003)
29Software FluxAnalyzer, setzt auf Matlab auf
Links Network composer of the FluxAnalyzer
facilitating the definition of the network
structure. Mitte Input mask for defining a new
network element of type reaction Rechts
Pull-down menu of the FluxAnalyzer providing an
interactive use of the various functions of the
toolbox.
http//pinguin.biologie.uni-jena.de/bioinformatik/
30Fazit
Stoffwechselpfade sind nicht isoliert
voneinander, besitzen in verschiedenen Organismen
verschiedene Komponenten bzw. Bedeutung. Oft
sind mehrere alternative Reaktionspfade
möglich. Das Program BIOMINER (Prof. Lenhof)
wählt z.B. den Pfad/Graphen der geringsten
Länge. Komplexe metabolische Netzwerke sind
daher für uns schwer zu durchschauen. Man
benötigt intelligente und robuste Algorithmen um
daraus biologische Modelle abzuleiten. Diese
biologischen Modelle sehen jedoch vermutlich
nicht so einfach aus wie in heutigen Lehrbüchern.
31E-cell Software Umgebung zur Simulation ganzer
Zellen
- Institute for Advanced Biosciences der Keio
University (existiert seit 1996) - Dr. Masaru Tomita, Team enthält gt 50 Mitglieder!
- weitere Programme für integrative
Zellsimulationen - GEPASI (1993, 1997) Simulation von
Stoffwechselpfaden - KINSIM (1983, 1997)
- METAMODEL (1991)
- SCAMP (1993)
- DBSolve (1997)
- V-Cell (1999)
- es gibt auch separate Programme, mit denen man
Genregulation und expression, - sowie Signaltransduktion und Zellteilung
untersuchen kann. - Das allgemeine Problem sind fehlende
experimentelle Daten.
32Implementation des E-cell Systems
- E-CELL wurde in C geschrieben, existiert nun in
der Version 3. - Das Modell besteht aus 3 Listen, die bei
Programmstart geladen werden - substance list definiert alle Objekte, die die
Zelle und das Kulturmedium enthalten - rule list definiert alle Reaktionen, die in der
Zelle stattfinden - system list definiert die räumliche und/oder
funktionelle Struktur der Zelle und ihrer
Umgebung - Der Zustand der Zelle zu jedem Zeitpunkt wird als
Liste von Konzentrationen und globalen Parametern
wie Zellvolumen, pH und Temperatur angegeben. - Das Programm (simulation engine) erzeugt neue
Zustände der Zelle nach Iterationsschritten von
jeweils z.B. ?t 1 ms.
33Erstes Modellsystem Mycoplasma genitalium
- 1996 Veröffentlichung des Genoms von Mycoplasma
genitalium - Dies ist eines der kleinsten bisher bekannten
Genome (580 kb). - Es enthält die kleinste bisher bekannte Anzahl
von Genen (ca. 480) von allen bisher bekannten
lebenden Organismen. - Genom ist 10 ? kleiner als E.coli
- ca. 80 der Gene sind homolog zu Proteinen mit
bekannter Funktion. - Intensive Gene-Knockout Untersuchungen zeigten,
dass viele der 480 Gene für das Überleben von M.
genitalium nicht notwendig sind. - Es wurde ein minimaler Satz von 127 Genen als
notwendig und hinreichend für das Überleben und
einen stabilen Zustand der Zelle ausgewählt.
34Large-scale Organisation von metabolischen
Netzwerken
- Modell einer Zelle, die aus eigener Kraft lebt.
Diese minimale Zelle besitzt 127 Gene, gerade
ausreichend um Proteingehalt und Membranstruktur
aufrecht zu erhalten. - Glukose wird aus der Umgebung als Energiequelle
aufgenommen ATP wird durch den Glykolyse-Pfad
produziert und wird hauptsächlich zur
Proteinsynthese verbraucht. - Proteine und Phospholipide werden mit der Zeit
spontan abgebaut.
35127 Gene der überlebensfähigen Zelle
- Anzahl der Gene in wichtigen Pfaden der
hypothetischen Zelle. - Other sind solche Gene, die in der Genliste von
M. genitalium nicht gefunden wurden und daher von
anderen Organismen übernommen wurden, wie z.B.
E.coli.
36Für Proteine kodierende Gene in der
hypothetischen Zelle
37Enzyme in der hypothetischen Zelle
- Die Information über Pfade wurde aus 2
Datenbanken übernommen - KEGG (Kanehisa, 1996)
- enthält eine grosse Sammlung von diagrammatischen
Stoffwechselpfaden, die nicht für bestimmte
Spezien spezifisch sind - EcoCyc (Karp et al. 1996)
- Datenbank mit Pfaden mit vielen Links auf
Literaturstellen ? sehr nützlich um kinetische
Daten für Reaktionen zu finden.
38KEGG Stoffwechsel-Datenbank
- enthält metabolische Pfade für viele
- sequenzierte Organismen
39Substanzen
- Kleine Moleküle in der hypothetischen Zelle
- Metabolite
- Aminosäuren
- Nukleotide
- Kationen
- andere Substanzen
- Proteine, DNA, RNA,
- Multi-Protein-Komplexe
- Protein-DNA Komplexe
- Protein-RNA Komplexe
40Reaktionsregeln
- 495 Reaktionsregeln
- enzymatische Reaktionen
- erhöhen und verringern die Mengen von Substraten
und Produkten - (2) Komplexbildungen, bei denen mehrere Substrate
Komplexe bilden - (3) Transportvorgänge, bei denen Substanzen
zwischen verschiedenen Kompartments ausgetauscht
werden (keine Diffusion innerhalb der
Kompartments) - (4) stochastische Prozesse wie die Bindung eines
Transkriptionsfaktors - Die Reaktionen (1) (3) werden als einfache
Ratengleichungen formuliert. - Alle Reaktionen werden parallel simuliert.
41Reaktionsregeln
- Chemische Reaktionen können verallgemeinert
werden als - Sn ist die Konzentration der n ten Substanz, und
?n deren stöchiometrischer Koeffizient. Die
Geschwindigkeit jeder Reaktion kann als Funktion
von Sn und ?n dargestellt werden. - Die meisten nicht-enzymatischen Reaktionen sind
erster Ordnung. D.h. ihre Geschwindigkeiten v
hängen direkt von den Konzentrationen der
Substrate ab - Enzymatische Reaktionen mit einem Substrat und
einem Produkt können durch die
Michaelis-Menten-Gleichung dargestellt werden
42graphische Kontrolle
- Mit Hilfe von verschiedenen graphischen
Oberflächen kann der - Benutzer dynamische Änderungen der Substanzmengen
und Reaktionsflüsse überwachen. - Die Mengen jeder Substanz können während der
Simulation ausserdem jederzeit von aussen
verändert werden.
43Ontologische Structur des E-CELL Systems
- Es gibt drei fundamentale Klassen Substanzen,
Reaktor und System. - Reaktoren und Zellkomponenten sind die vom
Benutzer zu definierenden Klassen.
44Transcriptions-Stoffwechsel in der Modellzelle
- Komplexe Reaktion wie Transkription und
Translation werden als detaillierte Abfolge von
Reaktionen modelliert.
45Modell des menschlichen Erythrozyten
- Enthält drei grosse Stoffwechselwege (1)
Glykolyse (2) Pentose-Phosphat-Stoffwechsel and
(3) Nukleotid-Stoffwechsel. - Abbreviations ADA adenosine deaminase
- ADE, adenine ADPRT, adenine phosphoribosyl
transferase - AK, adenosine kinase ALD, aldolase
- AMP adenosine monophosphate
- AMPDA, adenosine monophosphate deaminase
- APK, adenylate kinase CAH, carbonic anhydrase
- DHAP, dihydroxy acetone phosphate
- DPG, diphosphogrycerate
- DPGase, diphosphogrycerate phosphatase
- DPGM, diphosphogrycerate mutase EN, enolase
- E4P, erythrose 4-phosphate FDP, fructose
1,6-diphosphate - F6P, fructose 6-phosphate G6P glucose
6-phosphate - GA3P, glyceraldehyde 3-phosphate
- GAPDH, glyceraldehyde phosphate dehydrogenase
- GLC, glucose GLCtr, glucose transport process
- GO6P, gluconate 6-phosphate GSH, glutathione
- GSHox, glutathione turnover
46menschlicher Erythrozt mit Aldolase-Mangel
- Sowie mit jedem Simulationspaket kann man auch
E-CELL benutzen um durch Änderung von
Enzymparametern virtuelle Experimente
durchzuführen. - Aldolase wandelt Fruktose-1,6-
- bis-phosphat (X12) in
- Glyceraldehyd-3-Phosphat (X14)
- und Dihydroxy-Aceton-Phosphat
- (X13) um.
- Durch einen Mangel an Aldolase
- steigt der Level des Reaktanden X12
- deutlich an und die
- Reaktionsprodukte X14 and X13
- deutlich abgesenkt.
47Ausblick
- Zusätzlich zu der virtuellen, überlebensfähigen
Zelle und zum Modell des menschlichen
Erythrozyten werden in Keio andere Modelle
konstruiert - - ein Modell eines Mitochondriums
- - ein Signaltransduktionsmodell für Chemotaxis in
E.coli - Ein allgemeines Problem von umfangreichen
Zellmodellen ist derzeit der - Mangel an quantitativen experimentellen Daten
- Konzentrationen von Metaboliten und Enzymen
- Flussraten
- kinetische Parameter und Dissoziationskonstanten
- Das Institute of Advanced Biosciences in Keio
besteht aus 3 Zentren - Metabolom-Forschung, Bioinformatik,
Genom-Engineering. - Ziel Entwicklung von custom-made Bakterien.
48Zusätzliche Folien (nicht benutzt)
49Beispiel Stoffwechsel von E. coli
Von den 3399 Reaktionen der Enzym-Nomenklatur
(ENZYME Datenbank, Bairoch 1999) wurden in E.coli
604 gefunden. Dies bedeutet, dass 301 Reaktionen
in E.coli keine E.C. Nummer besitzen. ? Problem
bei auf E.C. Nummern basierender Bioinformatik ...
Ouzonis, Karp, Genome Research 10, 568 (2000)