Bereich 3: V10 - Integrative Biologie - PowerPoint PPT Presentation

1 / 49
About This Presentation
Title:

Bereich 3: V10 - Integrative Biologie

Description:

Title: Computational Biology - Bioinformatik Author: Volkhard Helms Last modified by: Volkhard Helms Created Date: 1/8/2002 4:03:31 PM Document presentation format – PowerPoint PPT presentation

Number of Views:93
Avg rating:3.0/5.0
Slides: 50
Provided by: Volk75
Category:

less

Transcript and Presenter's Notes

Title: Bereich 3: V10 - Integrative Biologie


1
Bereich 3 V10 - Integrative Biologie
1 Protein-Netzwerke topologische
Graphen-Netzwerke 2 Analyse von
Stoffwechselwegen (metabolic pathways)
Konzentration auf Metabolite, enzym.
Reaktionen 3 Zell-Simulationen dynamische
Simulation auf Sekunden-Zeitskala, ?t 0.01 s
(V10 und V11) Systembiologie Integration von
genomischen und proteomischen Analysen
Komplexität, Level an Verständnis
www.systemsbiology.org
2
Analyse von Stoffwechselwegen Beispiel E. coli
verwende Daten aus Datenbank EcoCyc (siehe auch
MetaCyc Stoffwechsel von gt 150
Organismen) EcoCyc enthält 905 Reaktionen für
E.coli davon gehören 161 nicht zum Stoffwechsel
kleiner Moleküle, z.B. DNA Replikation, von den
verbleibenden 744 wurden 569 mindestens einem
Pfad zugeordnet Dagegen gibt es 607 Enzyme. Es
gibt also keine 11 Zuordnung zwischen Enzymen
und Reaktionen, denn (1) Manche Enzyme
katalyiseren mehrere Reaktionen, und manche
Reaktionen werden von mehreren Enzymen
katalysiert (2) nicht zu allen Reaktionen sind
die Enzyme bekannt, die sie katalysieren.

Ouzonis, Karp, Genome Research 10, 568 (2000)
3
Beispiel Stoffwechsel von E. coli
Die 744 Reaktionen enthalten 791 verschiedene
Substrate.
Im Mittel enthält jede Reaktion 4 Substrate.

Ouzonis, Karp, Genome Research 10, 568 (2000)
4
Beispiel Stoffwechsel von E. coli
EcoCyc enthält 131 Stoffwechsel- Pfade. Die Länge
der Pfade variiert von 1 bis 16. Im Mittel
5.4. Von den 607 Enzymen sind 100
multifunktional. Purin-Nukleosid-Phosphorylase und
Nukleosid-Diphosphatkinase katalysieren 7 bzw. 9
Reaktionen. 483 Reaktionen gehören zu
einem Pfad, 99 Reaktionen gehören zu mehreren
Pfaden.

Ouzonis, Karp, Genome Research 10, 568 (2000)
5
Fazit
Stoffwechsel-Netzwerke von einfachen Organismen
sind mittlerweile fast vollständig bekannt. Ist
die Beschreibung mit einzelnen Stoffwechsel-Wegen
adäquat? - Reaktionen, Enzyme und Substrate
gehören oft zu mehreren Pfaden. - Die Einteilung
in einzelne Stoffwechsel-Pfade ist nicht immer
eindeutig.

6
Protein-Netzwerke Cytoscape
Main window of Cytoscape 2.0, displaying a
network of protein-protein and protein-DNA
interactions among 332 yeast genes.

http//www.cytoscape.org/
7
Protein-Wechselwirkungsnetzwerke Cytoscape
You can flip through different visual styles by
making a selection from the Visual Style pull
down menu. "Sample2" will give gene expression
values for each node will be colored along a
color gradient between red and green.

http//www.cytoscape.org/
8
Protein-Wechselwirkungsnetzwerke Cytoscape
With the Cytoscape Visual Style feature, you can
easily customize the visual appearance of your
graph. Cytoscape can also map values such as
probabilities, confidence levels, and expression
values to the visualization of networks.

http//www.cytoscape.org/
9
Protein-Wechselwirkungsnetzwerke Cytoscape
Cytoscape implements an algorithm for finding
"active pathways", i.e., subnetworks of genes
that jointly show significant differential
expression over a set of experimental conditions
observed by microarray experiment. The image
right show the results of a run of this
algorithm. Several active paths have been found
the highest scoring one has 22 genes identified
as being active in three of the 20 experimental
conditions. From here, one can view a graph with
only these genes, display the expression data for
any of the conditions, and examine Gene Ontology
(GO) information available to assess the
biological significance of this network.

http//www.cytoscape.org/
10
Features of Cytoscape v2.0 (July 2004)
Input Input and construct molecular interaction
networks from raw interaction files (SIF format)
containing lists of protein-protein and/or
protein-DNA interaction pairs.  For yeast and
other model organisms, large sources of pairwise
interactions are available through the BIND and
TRANSFAC databases. User-defined interaction
types are also supported. Load and save
previously-constructed interaction networks in
GML format (Graph Markup Language). Input mRNA
expression profiles from tab- or space-delimited
text files. Load and save arbitrary attributes
on nodes and edges. For example, input a set of
custom annotation terms for your proteins, create
a set of confidence values for your
protein-protein interactions. Import gene
functional annotations from the Gene Ontology
(GO) and KEGG databases.

http//www.cytoscape.org/
11
Features of Cytoscape v2.0 (July 2004)
Visualization Customize network data display
using powerful visual styles. View a
superposition of gene expression ratios and
p-values on the network.  Expression data can be
mapped to node color, label, border thickness, or
border color, etc. according to user-configurable
colors and visualization schemes. Layout
networks in two dimensions.  A variety of layout
algorithms are available, including cyclic and
spring-embedded layouts. Zoom in/out and pan for
browsing the network. Use the network manager to
easily organize multiple networks. Use the
birds eye view to easily navigate large
networks.

http//www.cytoscape.org/
12
Features of Cytoscape v2.0 (July 2004)
Analysis Java plug-ins available for network and
molecular profile analysis. E.g. Filter the
network to select subsets of nodes and/or
interactions based on the current data.  E.g.,
users may select nodes involved in a threshold
number of interactions, nodes that share a
particular GO annotation, or nodes whose gene
expression levels change significantly in one or
more conditions according to p-values loaded with
the gene expression data. - Find active
subnetworks / pathway modules. The network is
screened against gene expression data to identify
connected sets of interactions, i.e. interaction
subnetworks, whose genes show particularly high
levels of differential expression.  The
interactions contained in each subnetwork provide
hypotheses for the regulatory and signaling
interactions in control of the observed
expression changes. - Find clusters (highly
interconnected regions) in any network loaded
into Cytoscape. Depending on the type of network,
clusters may mean different things. For instance,
clusters in a protein-protein interaction network
have been shown to be protein complexes and parts
of pathways. Clusters in a protein similarity
network represent protein families.

http//www.cytoscape.org/
13
Metabolische Pfade in der post-genomischen Ära
(a) klassische Biochemie bestimmt
Stöchiometrien einzelner Reaktionen (b)
Katalogisierung vieler Reaktionen, Gruppierung
nach gemeinsamen Metaboliten führt zu
traditionellen Pfaden wie Glykolyse,
Pentose-Phosphat- Pfad (c) Durch komplette
Information können nun die kompletten metabolisch
en Pfade zugeordnet werden.

14
Metabolische Pfade in der post-genomischen Ära
Traditionelle metabolische Pfade dienen als
konzeptioneller Rahmen für Forschung und
Lehre. Man kann dadurch Metabolismen
verschiedener Organismen vergleichen. Jedoch
sind sie nicht für quantitative, systemische
Bewertungen biologischer Reaktionsnetzwerke
geeignet, da sie nur Teile der Netzwerke
darstellen. Sie wurden oft in Zelltypen
entdeckt, in denen sie wichtige
metabolische Funktionen übernehmen (z.G.
Glykolyse in Hefe). Man kann diese Pfade jedoch
nicht einfach auf andere Zelltypen mit
anderen Enzymleveln und metabolischen Profilen
übertragen.

15
3 Vorgehensweisen
1 konstruiere alle Transformationswege, die von
einem gegebenen Substrat zu einem gegebenen
Produkt führen 2 verwende Satz von linear
(systemisch) unabhängigen Basisvektoren im Raum
der Reaktionsflüsse, durch Linearkombination
sollen sich alle möglichen Flußverteilungen
darstellen lassen. Allerdings ist die Wahl
dieser Basisvektoren nicht eindeutig. 3 Konzept
der elementaren (Fluss-) Moden Eine
Elementarmode ist ein minimaler Satz von Enzymen,
die im Gleichgewicht operieren können. Minimal
heisst falls nur die Enzyme dieser Mode
operieren, führt Inhibition jedes einzelnen
seiner Enzyms zum Stop aller Gleichgewichtsflüsse
im System

16
Beschreibung vernetzter metabolischer Pfade

Papin et al. TIBS 28, 250 (2003)
(a) aus genomischen, biochemischen,
physiologischen Daten wird ein Reaktionsnetzwerk
aufgestellt. Es gibt interne Flüsse innerhalb der
Systemgrenzen und externe Flüsse mit der
Umgebung. (b) Dieses Netzwerk wird durch eine
stöchiometrische Matrix dargestellt, in der
Metaboliten durch Reaktionen miteinander
verbunden werden. (c) Mögliche Zustände der Zelle
aufgrund dieser Matrix werden mit Techniken wie
elementary modes oder extreme pathways
identifiziert. Die möglichen Zustände liegen
innerhalb eines Konus im durch die verschiedenen
Flüsse aufgespannten Koordinatensystem.
17
Analyse der stöchiometrischen Matrix
stöchiometrische Koeffizienten der
einzelnen Reaktionen.
Darstellung des Reaktions- netzwerks mit
stöchiometrischer Matrix S.

Metabolite
Analyse der Matrix S ? Pathway-Darstellung
P. Deren Zeilen enthalten den Reaktionen
entsprechende Flüsse und die Spalten die
sich ergebenden Pfade.
Darstellung der Pfade ist möglich für einfache
Netzwerke.
Papin et al. TIBS 28, 250 (2003)
18
Netzwerk-Analyse
(a) welche Substrate (A-E) sind zur Produktion
der Biomasse erforderlich (B,E), welche nicht?
(b) Aufspüren von nicht genutzten Reaktionen (F ?
E), Refinement der Annotation von Genomen.

Papin et al. TIBS 28, 250 (2003)
(c) quantitative Beschreibung von Pathway-Redundan
z bzw. Robustheit des Netzwerks P1 und P2 führen
beide von A nach D.
(d) Reaktionen RA, RB und RC werden stets
gemeinsam benutzt. Ihre Gene werden daher
vermutlich koordiniert reguliert.
19
Welche Rolle spielt Pathway-Analyse?

Papin et al. TIBS 28, 250 (2003)
Die auf Netzwerken basierende Analyse von Pfaden
stellt eine gute Basis dar um die heutige Flut an
experimentellen Daten ohne vorgefasste
Meinungen in biologische Modelle zu übersetzen.
20
konkretes BeispielGlykolyse
Stoffwechselpfad in Lehrbuch.
http//biotech.icmb.utexas.edu/ glycolysis/pathway
.html
21
Glykolyse
Pyr
Pyk
PEP
Schematische Darstellung. Metabolite sind
blau, Enzyme rot dargestellt.
Eno
2PG
Gpm
3PG
Pgk
Gap
Glucose
G6P
F6P
FP2
GAP
1,3BPG
Fba
Hexokinase
Pgi
Pfk
TpiA
DHAP
22
Pentose-Phosphat-Stoffwechsel
Xyl5P
Sed7P
Ery4P
Rpe
TktI
Tal
Ru5P
Gnd
R5P
GAP
F6P
TktII
6PG
Pgl
GO6P
Zwf
G6P
G6P
F6P
Analoge Darstellung für PPP. G6P und F6P tauchen
je zweimal auf!
23
Konkretes Beispiel Monosaccharid-Stoffwechsel

Benötigter Input Deklaration interner und
externer Substanzen, Enzymreaktionen und ihre
Richtung
Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
24
Reaktionsschema für Monosaccharid-Stoffwechsel
Kopplung von Glykolyse und Pentose-Phosphat-Pfad
15 Metabolite, 19 Reaktionen Daher besitzt
die stöchiometrische Matrix die Dimension 15 ?
19. Welche Reaktionen müssen notwendigerweise ge
meinsam ablaufen? Offensichtlich Gap, Pgk, Gpm,
Eno, Pyk und Zwf, Pgl, Gnd. Weiterhin auch
Fba, TpiA und 2 Rpe, TktI, Tal, TktII.

Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
25
Reduktion(I) Reduziertes Schema

Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
Schema wurde aus vorherigem Schema erhalten indem
all Enzyme kombiniert wurden, die immer gemeinsam
operieren.
26
Reduktion (II) Elementarmoden
Eine Elementarmode ist ein minimaler Satz von
Enzymen, die im Gleichgewicht operieren können.
Minimal heisst wenn nur die Enzyme einer Mode
aktiv sind, führt Inhibition jedes einzelnen
Enzyms zum Stop aller Gleichgewichtsflüsse.

Identifizierung der Moden (1) ursprünglicher
Glykolyse-Stoffwechsel. Die Moden (3)-(6) stimmen
mit den 4 Moden des Pentose-Phosphat-Stoffwechsel
s aus Stryer überein.
Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
27
Elementarmoden

Schuster, Fell, Dandekar, Nature Biotech 18, 326
(2000)
Graphische Darstellung von 7 Elementarmoden. Die
Moden beinhalten unterschiedliche Anzahl an
Enzymen und überlappen teilweise miteinander. Die
Zahlen entsprechen den relativen Flüssen. Jeder
Systemzustand im Gleichgewicht lässt sich als
Linearkombination dieser Elementarmoden
darstellen.
28
Software FluxAnalyzer, setzt auf Matlab auf

Steffen Klamt.
Klamt et al. Bioinformatics 19, 261 (2003)
29
Software FluxAnalyzer, setzt auf Matlab auf

Links Network composer of the FluxAnalyzer
facilitating the definition of the network
structure. Mitte Input mask for defining a new
network element of type reaction Rechts
Pull-down menu of the FluxAnalyzer providing an
interactive use of the various functions of the
toolbox.
http//pinguin.biologie.uni-jena.de/bioinformatik/
30
Fazit
Stoffwechselpfade sind nicht isoliert
voneinander, besitzen in verschiedenen Organismen
verschiedene Komponenten bzw. Bedeutung. Oft
sind mehrere alternative Reaktionspfade
möglich. Das Program BIOMINER (Prof. Lenhof)
wählt z.B. den Pfad/Graphen der geringsten
Länge. Komplexe metabolische Netzwerke sind
daher für uns schwer zu durchschauen. Man
benötigt intelligente und robuste Algorithmen um
daraus biologische Modelle abzuleiten. Diese
biologischen Modelle sehen jedoch vermutlich
nicht so einfach aus wie in heutigen Lehrbüchern.

31
E-cell Software Umgebung zur Simulation ganzer
Zellen
  • Institute for Advanced Biosciences der Keio
    University (existiert seit 1996)
  • Dr. Masaru Tomita, Team enthält gt 50 Mitglieder!
  • weitere Programme für integrative
    Zellsimulationen
  • GEPASI (1993, 1997) Simulation von
    Stoffwechselpfaden
  • KINSIM (1983, 1997)
  • METAMODEL (1991)
  • SCAMP (1993)
  • DBSolve (1997)
  • V-Cell (1999)
  • es gibt auch separate Programme, mit denen man
    Genregulation und expression,
  • sowie Signaltransduktion und Zellteilung
    untersuchen kann.
  • Das allgemeine Problem sind fehlende
    experimentelle Daten.

32
Implementation des E-cell Systems
  • E-CELL wurde in C geschrieben, existiert nun in
    der Version 3.
  • Das Modell besteht aus 3 Listen, die bei
    Programmstart geladen werden
  • substance list definiert alle Objekte, die die
    Zelle und das Kulturmedium enthalten
  • rule list definiert alle Reaktionen, die in der
    Zelle stattfinden
  • system list definiert die räumliche und/oder
    funktionelle Struktur der Zelle und ihrer
    Umgebung
  • Der Zustand der Zelle zu jedem Zeitpunkt wird als
    Liste von Konzentrationen und globalen Parametern
    wie Zellvolumen, pH und Temperatur angegeben.
  • Das Programm (simulation engine) erzeugt neue
    Zustände der Zelle nach Iterationsschritten von
    jeweils z.B. ?t 1 ms.

33
Erstes Modellsystem Mycoplasma genitalium
  • 1996 Veröffentlichung des Genoms von Mycoplasma
    genitalium
  • Dies ist eines der kleinsten bisher bekannten
    Genome (580 kb).
  • Es enthält die kleinste bisher bekannte Anzahl
    von Genen (ca. 480) von allen bisher bekannten
    lebenden Organismen.
  • Genom ist 10 ? kleiner als E.coli
  • ca. 80 der Gene sind homolog zu Proteinen mit
    bekannter Funktion.
  • Intensive Gene-Knockout Untersuchungen zeigten,
    dass viele der 480 Gene für das Überleben von M.
    genitalium nicht notwendig sind.
  • Es wurde ein minimaler Satz von 127 Genen als
    notwendig und hinreichend für das Überleben und
    einen stabilen Zustand der Zelle ausgewählt.

34
Large-scale Organisation von metabolischen
Netzwerken
  • Modell einer Zelle, die aus eigener Kraft lebt.
    Diese minimale Zelle besitzt 127 Gene, gerade
    ausreichend um Proteingehalt und Membranstruktur
    aufrecht zu erhalten.
  • Glukose wird aus der Umgebung als Energiequelle
    aufgenommen ATP wird durch den Glykolyse-Pfad
    produziert und wird hauptsächlich zur
    Proteinsynthese verbraucht.
  • Proteine und Phospholipide werden mit der Zeit
    spontan abgebaut.

35
127 Gene der überlebensfähigen Zelle
  • Anzahl der Gene in wichtigen Pfaden der
    hypothetischen Zelle.
  • Other sind solche Gene, die in der Genliste von
    M. genitalium nicht gefunden wurden und daher von
    anderen Organismen übernommen wurden, wie z.B.
    E.coli.

36
Für Proteine kodierende Gene in der
hypothetischen Zelle
37
Enzyme in der hypothetischen Zelle
  • Die Information über Pfade wurde aus 2
    Datenbanken übernommen
  • KEGG (Kanehisa, 1996)
  • enthält eine grosse Sammlung von diagrammatischen
    Stoffwechselpfaden, die nicht für bestimmte
    Spezien spezifisch sind
  • EcoCyc (Karp et al. 1996)
  • Datenbank mit Pfaden mit vielen Links auf
    Literaturstellen ? sehr nützlich um kinetische
    Daten für Reaktionen zu finden.

38
KEGG Stoffwechsel-Datenbank
  • enthält metabolische Pfade für viele
  • sequenzierte Organismen

39
Substanzen
  • Kleine Moleküle in der hypothetischen Zelle
  • Metabolite
  • Aminosäuren
  • Nukleotide
  • Kationen
  • andere Substanzen
  • Proteine, DNA, RNA,
  • Multi-Protein-Komplexe
  • Protein-DNA Komplexe
  • Protein-RNA Komplexe

40
Reaktionsregeln
  • 495 Reaktionsregeln
  • enzymatische Reaktionen
  • erhöhen und verringern die Mengen von Substraten
    und Produkten
  • (2) Komplexbildungen, bei denen mehrere Substrate
    Komplexe bilden
  • (3) Transportvorgänge, bei denen Substanzen
    zwischen verschiedenen Kompartments ausgetauscht
    werden (keine Diffusion innerhalb der
    Kompartments)
  • (4) stochastische Prozesse wie die Bindung eines
    Transkriptionsfaktors
  • Die Reaktionen (1) (3) werden als einfache
    Ratengleichungen formuliert.
  • Alle Reaktionen werden parallel simuliert.

41
Reaktionsregeln
  • Chemische Reaktionen können verallgemeinert
    werden als
  • Sn ist die Konzentration der n ten Substanz, und
    ?n deren stöchiometrischer Koeffizient. Die
    Geschwindigkeit jeder Reaktion kann als Funktion
    von Sn und ?n dargestellt werden.
  • Die meisten nicht-enzymatischen Reaktionen sind
    erster Ordnung. D.h. ihre Geschwindigkeiten v
    hängen direkt von den Konzentrationen der
    Substrate ab
  • Enzymatische Reaktionen mit einem Substrat und
    einem Produkt können durch die
    Michaelis-Menten-Gleichung dargestellt werden

42
graphische Kontrolle
  • Mit Hilfe von verschiedenen graphischen
    Oberflächen kann der
  • Benutzer dynamische Änderungen der Substanzmengen
    und Reaktionsflüsse überwachen.
  • Die Mengen jeder Substanz können während der
    Simulation ausserdem jederzeit von aussen
    verändert werden.

43
Ontologische Structur des E-CELL Systems
  • Es gibt drei fundamentale Klassen Substanzen,
    Reaktor und System.
  • Reaktoren und Zellkomponenten sind die vom
    Benutzer zu definierenden Klassen.

44
Transcriptions-Stoffwechsel in der Modellzelle
  • Komplexe Reaktion wie Transkription und
    Translation werden als detaillierte Abfolge von
    Reaktionen modelliert.

45
Modell des menschlichen Erythrozyten
  • Enthält drei grosse Stoffwechselwege (1)
    Glykolyse (2) Pentose-Phosphat-Stoffwechsel and
    (3) Nukleotid-Stoffwechsel.
  • Abbreviations ADA adenosine deaminase
  • ADE, adenine ADPRT, adenine phosphoribosyl
    transferase
  • AK, adenosine kinase ALD, aldolase
  • AMP adenosine monophosphate
  • AMPDA, adenosine monophosphate deaminase
  • APK, adenylate kinase CAH, carbonic anhydrase
  • DHAP, dihydroxy acetone phosphate
  • DPG, diphosphogrycerate
  • DPGase, diphosphogrycerate phosphatase
  • DPGM, diphosphogrycerate mutase EN, enolase
  • E4P, erythrose 4-phosphate FDP, fructose
    1,6-diphosphate
  • F6P, fructose 6-phosphate G6P glucose
    6-phosphate
  • GA3P, glyceraldehyde 3-phosphate
  • GAPDH, glyceraldehyde phosphate dehydrogenase
  • GLC, glucose GLCtr, glucose transport process
  • GO6P, gluconate 6-phosphate GSH, glutathione
  • GSHox, glutathione turnover

46
menschlicher Erythrozt mit Aldolase-Mangel
  • Sowie mit jedem Simulationspaket kann man auch
    E-CELL benutzen um durch Änderung von
    Enzymparametern virtuelle Experimente
    durchzuführen.
  • Aldolase wandelt Fruktose-1,6-
  • bis-phosphat (X12) in
  • Glyceraldehyd-3-Phosphat (X14)
  • und Dihydroxy-Aceton-Phosphat
  • (X13) um.
  • Durch einen Mangel an Aldolase
  • steigt der Level des Reaktanden X12
  • deutlich an und die
  • Reaktionsprodukte X14 and X13
  • deutlich abgesenkt.

47
Ausblick
  • Zusätzlich zu der virtuellen, überlebensfähigen
    Zelle und zum Modell des menschlichen
    Erythrozyten werden in Keio andere Modelle
    konstruiert
  • - ein Modell eines Mitochondriums
  • - ein Signaltransduktionsmodell für Chemotaxis in
    E.coli
  • Ein allgemeines Problem von umfangreichen
    Zellmodellen ist derzeit der
  • Mangel an quantitativen experimentellen Daten
  • Konzentrationen von Metaboliten und Enzymen
  • Flussraten
  • kinetische Parameter und Dissoziationskonstanten
  • Das Institute of Advanced Biosciences in Keio
    besteht aus 3 Zentren
  • Metabolom-Forschung, Bioinformatik,
    Genom-Engineering.
  • Ziel Entwicklung von custom-made Bakterien.

48
Zusätzliche Folien (nicht benutzt)
49
Beispiel Stoffwechsel von E. coli
Von den 3399 Reaktionen der Enzym-Nomenklatur
(ENZYME Datenbank, Bairoch 1999) wurden in E.coli
604 gefunden. Dies bedeutet, dass 301 Reaktionen
in E.coli keine E.C. Nummer besitzen. ? Problem
bei auf E.C. Nummern basierender Bioinformatik ...

Ouzonis, Karp, Genome Research 10, 568 (2000)
Write a Comment
User Comments (0)
About PowerShow.com