Seminar Service Aspects in ad-hoc and P2P networks - PowerPoint PPT Presentation

About This Presentation

Title:

Seminar Service Aspects in ad-hoc and P2P networks

Description:

Seminar Service Aspects in ad-hoc and P2P networks Database functionality in P2P-networks von Thorsten Weiberg – PowerPoint PPT presentation

Number of Views:56

Avg rating:3.0/5.0

Slides: 20

Provided by: Pon69

Category:

more less

Transcript and Presenter's Notes

Title: Seminar Service Aspects in ad-hoc and P2P networks

1
Seminar Service Aspects in ad-hoc and P2P
networks

Database functionality
in
P2P-networks
von
Thorsten Weiberg

2
Überblick

Motivation und Einleitung
DHT-Systeme
Query Vorgänge in P2P Netzen(PIER)
Mögliche allgemeine Architektur
und Architektur von PIER
Operatoren bei Suchanfragen (Bsp. Join)
Performance von PIER
Robustheit von PIER
Zusammenfassung und Ausblick

3
1. Einleitung und Motivation

Peer-to-Peer(P2P) v.a. bekannt durch Filesharing
Programme
Verteilte Datenbanken sind bisher in ihrer
Verteilung beschränkt.
Traditionelle Datenbanken werden bisher zentral
verwaltet.
Versuch Prinzip von P2P auf Datenbanken
anzusetzen (Bsp. PIER)

4
Einleitung und Motivation(2)

Näherung von der Datenbankseite durch Lockerung
der
Designprinzipien
Konsistenz
Anpassende Skalierung
Natürliche Umgebung von Daten
Standardisierte Schemas über eine populäre
Software

5
2. DHT-Systeme

Aufbau
Eine(!) Hashtable, deren Daten sich auf allen
Knoten verteilt befinden.
Jeder Knoten kann Daten speichern.
Jedes Datum hat einen eindeutigen Schlüssel.
Herzstück overlay-Routing

Ein DHT-System ist skalierbar und braucht für
einen Lookup O(log n) Hops bei n Knoten. Nur
exaktes Matching! Bsp. für ein DHT-System CAN
6
3. Query Vorgänge in P2P(Bsp. PIER)

Query Engine
- weit verbreitet, praktisch nutzbar
- API der dazu verwendet DHT dünn, portabel und
allgemein
PIER (P2P Information Exchange and Retrieval) ist
eine Query Engine, die Anzahl der teilnehmenden
Knoten vergrößert, ohne dass die Skalierbarkeit
darunter leidet.

7
4. Eine allgemeine Architektur

Drei-Schichten Modell

8
5. Architektur von PIER
9
6. Operatoren bei Suchanfragen

Operatoren für Selektion, Projektion, Join,
Grouping, Aggregation und Sortieren
Zur Vereinfachung wird nur das JOIN betrachtet

Symmertric hash join
Fetch Matches
Symmetric semi join
Bloom Filter

10
6.1 Symmetric Hash Join

Join (Equi-Join) über Relationen S und R
Nutzt DHT-Struktur zum Routen und Speichern von
Tupeln
Rehashing von R und S
jeder Knoten lokalen scan in seinem Namesspace NR
und NS ein, um alle R und S Tupel zu
lokalisieren.
jedes Tupel, das alle lokalen Selektionsprädikate
erfüllt, wird in den eindeutigen Namespace NQ
kopiert.
Die Werte für die Join-Attribute werden
konkateniert und bilden so die resourceID der
Kopie.

11
6.1 Symmetric Hash Join(2)

Das Prüfen der Hashtable ist eine lokale
Operation in NQ, die parallel beim Bilden
geschieht.
Jeder Knoten registriert sich in der DHT, um ein
newData Callback zu bekommen.
Wenn nun ein Tupel eingefügt wird, dann wird in
NQ geprüft, ob sich eine Übereinstimmung mit der
anderen Tabelle ergibt.
Übereinstimmungen werden an das Prüftupel
angehängt, um Ergebnistupel zu generieren.
Sie werden dann in zur nächsten Station der
Anfrage (ein anderer DHT Namespace) oder falls
sie schon Ergebnistupel sind, zum Ausgangspunkt
der Anfrage geschickt.

12
6.2 Fetch Matches

Variation eines traditionellen Join-Algorithmus
Eine Tabelle ist schon gehashed(hier S)!
auf NR ein lscan durchgeführt
Für jedes Tupel von R wird nun in S auf
Übereinstimmungen durchsucht.
Bei Übereinstimmung wird nun wie beim symmetric
hash join verfahren.

13
6.3 Symmetrisches Semi Join

beide Tabellen (R und S) neu gehashed
Braucht dafür große Bandbreite
Deshalb Projektion von R und S auf ihre
resourceID und Join Schlüssel
Auf diese Projektion wird ein normales
symmetrisches Join ausgeführt.

14
6.4 Bloom Join

Generieren von Bloom Filtern für alle Knoten für
jedes S und R Fragment
Diese Filter werden in einer temporären DHT mit
den Namespaces für jede Tabelle gespeichert.
Filter werden nun alle verodert
Multicast zu allen Knoten, die die entgegensetzte
Tabelle speichern
Ein Knoten scannt nun sein korrespondierendes
Fragment und rehashed nur Tupel, die mit den
Bloom Filter übereinstimmen.

15
7. Performance von PIER

Traditionellen Datenbanken Skalierbarkeit in der
Netzwerkgröße gemessen
Beim Internet Anzahl der Knoten und
Netzwerkcharakteristik
Erhöhung Knoten ?Erhöhung der Ressourcen
? Latenz steigt
Flaschenhälse Latenz und Bandbreite

16
7.1 unendliche Bandbreite

Unendliche Bandbreite (Messergebnisse bis zum
Erhalt des letzten Tupel), Vergleich der
Join-Algorithmen

Symmetrischer Hash Fetch Matches Sym. Semi-Join Bloom Filter
3,73 s 3,78 s 4,47 s 6,85 s

durchschnittliche Latenz von 0,57 s
Latenz zwischen zwei Knoten beträgt 0,1 s
ein Multicast braucht hier etwa 3 s
n 1024 Knoten

17
7.2 begrenzte Bandbreite

Sinkt die Selektivität von den Prädikaten unter
40 dann ist die
Kapazität der Berechnungsknoten der Flaschenhals.
Steigt sie
über 40, dann ist die inbound Kapazität auf
der Anfrageseite
der Flaschenhals.

18
8. Robustheit

Bemerken von Knotenausfällen mit Hilfe von
Lebenszeichen
Bemerken eines Knotenausfalls dauert gewisse Zeit
Knoten müssen also refreshed werden
Je höher die Refreshrate desto schneller wird ein
Ausfall bemerkt,
doch desto höher ist die Netzlast.

19
Zusammenfassung/Ausblick

PIER schlägt den richtigen Weg ein
Allerdings noch nicht fürs Internet geeignet,
aber schon eher für verteilte Datenbanken.
Aufteilung der Schichten lassen möglichst
allgemeine DHTs zu
Selektion alle Tupel von R durchsucht
(DHT-Schicht), Query Processor von PIER nicht die
Möglichkeit diese Tupel von S zu filtern.
Rationalisierungsbedarf für die Zukunft
Es können keine Selektionen von nicht-DHT
Attributen in der DHT gespeichert werden.
Anwendungsgebiete z.B. Netzwerkmonitorapplikation
en und weit verteilte Systeme (Datenbanken)