Analyse von Performanceproblemen beim UNIX-Backup Server - PowerPoint PPT Presentation

1 / 19
About This Presentation
Title:

Analyse von Performanceproblemen beim UNIX-Backup Server

Description:

Analyse von Performanceproblemen beim UNIX-Backup Server – PowerPoint PPT presentation

Number of Views:84
Avg rating:3.0/5.0
Slides: 20
Provided by: Hans275
Category:

less

Transcript and Presenter's Notes

Title: Analyse von Performanceproblemen beim UNIX-Backup Server


1
Analyse von Performanceproblemen beim UNIX-Backup
Server
2
Gliederung
  1. Backup- und Archiv- Service
  2. Wer nutzt netbackup?
  3. Funktion der netbackup
  4. Problem nach dem Aufrüsten
  5. Mögliche Ursachen und Lösungen
  6. Quellen / Kontakt

3
Backup- und Archiv- Service
  • Bei einem Festplattencrash oder Datenverlust
    durch den Benutzer können Daten wieder geholt
    werden.
  • Backup für kurze Zeit
  • mindestens 2 Monate
  • mehrere Versionen des Backups
  • Archivierung über mehrere Jahre
  • beliebig lange Zeit, bis zu 15 Jahre
  • nur eine Version der Daten

4
Wer nutzt netbackup?
  • Das Backup -gt Roboter
  • Unix netbackup
  • Novell rznwsave
  • einfaches und schnelles Wiederherstellen eines
    Datenbestandes
  • verursacht durch Benutzerfehler oder Systemcrash

5
Funktion der netbackup
  • Zwischen-speicherung der Daten die von der
    Servern geliefert werden.
  • Speicherung der Daten auf 100 GB AIT 3 Bändern
  • Steuerung des Roboters

6
Gründe für die Speicheraufrüstung
  • Der Speicherbedarf reichte aufgrund steigender
    Anzahl von Servern bei den Backups nicht mehr
    aus.
  • Da die netbackup die Server in einer Nacht nicht
    mehr sichern konnte, wurde eine
    Speichererweiterung vorgenommen.

7
Problem nach dem Aufrüsten
  • Speicher wurde erkannt aber
  • Bei geringem Speicherbedarf
  • hohe Performance
  • Sobald Speicher gebraucht wird
  • geringe Performance
  • Mit dem alten Speicher wurde eine höhere Leistung
    erzielt als mit dem neuen Speicher.

8
Speicherproblem?
  • Vermutete Ursache
  • Speicher ist defekt oder hat das falsche Timing.
  • Maßnahme
  • Ausbau des Speichers und Test des Speichers auf
    Funktion und Korrektheit des Timings.
  • Ergebnis
  • Messung hat ergeben, dass das Timing im
    Toleranzbereich liegt und ein Speicherbaustein
    defekt ist.

9
Speicherproblem?
  • Vermutete Ursache
  • Die Maschine kommt mit dem großem Speicher nicht
    zurecht.
  • Maßnahme
  • Schrittweiser Einbau des neuen Speichers und
    anschließender Test.
  • Ergebnis
  • Die Leistung der Maschine ist noch immer nicht
    zufrieden stellend.

10
Leistungsvergleich
  • Benchmark um das Problem des stehen bleiben von
    Skripts zu reproduzieren.
  • Bei Jobs die weniger als 2/3 des Speichers
    brauchen, gute Performance.
  • Über 2/3 Speicherbedarf bleibt der Job und damit
    das Programm oder Skript hängen.

11
Leistungsvergleich (HPC Benchmark)
Benchmark mit verschiedenen Jobgrößen mit
unterschiedlicher Speichermenge und CPU-Zeit im
Vergleich.
MB GB 95 905 1400
2 GB CPU-Zeit 30 334 32 375 28 475
3 GB CPU Zeit 31 328 34 362 32 394
12
Netzproblem?
  • Vermutete Ursache
  • Die Maschine hat ein Problem mit der Gigabit
    Netzwerkkarte.
  • Maßnahme
  • Neues Gigabit Interface sendet weniger IRQ
    anfragen, und hat keine Packetverluste.
  • Ergebnis
  • Durch das Tauschen des Gigabit Interfaces wurden
    die Paketverluste drastisch reduziert, das
    Problem mit dem Arbeitsspeicher aber nicht
    beseitigt.

13
Hardwareproblem?
  • Vermutete Ursache
  • Es gib ein verstecktes Hardwareproblem.
  • Maßnahme
  • Tausch von Netzteil, Speicher, Bios und Platten
    der netbackup mit der rznews.
  • Ergebnis
  • Es gab bei der netbackup keine Verbesserung dafür
    aber bei der rznews leichte Defekte als Folge des
    Umbaus.

14
Busproblem?
  • Vermutete Ursache
  • Der interne Bus ist überlastet.
  • Maßnahme
  • Aufstellen eines Bus-Plans und Analyse der
    Struktur der Maschine.
  • Ergebnis
  • Die Kapazitäten der internen Busse sind
    ausreichend und gleichmäßig belastet.

15
Bus-Plan
16
Bus-Plan
17
Plattenproblem?
  • Vermutete Ursache
  • Einzelne Platten überlastet, da nur lokal
    geschrieben wird.
  • Maßnahme
  • Durch das Stripen kann die Geschwindigkeit
    gesteigert werden, indem die Daten gleichmäßig
    verteilt werden, so dass von allen Platten
    gleichzeitig gelesen werden kann.
  • Ergebnis
  • Das reorganisieren der Daten brachte eine
    ausreichende Performancesteigerung.

18
Quellen
  • HPC-Gruppe
  • Helmut Krausenberger
  • Rainer Woitok
  • Stefan Turowski

Kontakt
Thomas.Kaiser_at_rrze.uni-erlangen.de
19
  • Vielen Dank für ihre Aufmerksamkeit !
Write a Comment
User Comments (0)
About PowerShow.com