Title: PowerPoint-Pr
1PentiumPro Vs. Pentium MMX
Namik P. Ley André El-Ama
2Die Probanden
System A PentiumPro 200MHz 64MB RAM System B
PentiumMMX 233MHz 64MB RAM
Verglichen werden soll nur die Prozessorperformanc
e! Andere Leistungsunterschiede wie etwa
unterschiede der Grafikkarte werden von uns
weitest gehend ausgeglichen.
Das Ziel
Der Ansatz zum Vergleich der beiden Prozessoren
liegt in Ihrer Architektur. Es sollen hier also
die Besonderheiten des Designs heraus gestellt
werden, so daß etwa die um 33MHz geringere
Taktfrequenz des PentiumPro nur sekundäre
Relevanz hat. Insbesondere liegt unser Augenmerk
auf den zwei primären Unterschieden. Der
PentiumMMX hat durch die MMX-Erweiterung die
Möglichkeit, Daten im SIMD Verfahren zu
bearbeiten, während der PentiumPro einen im
Prozessortakt arbeitenden L2 Cache besitzt.
3Der PentiumPro
? dynamische Befehlsausführung ? drei
zwölfstufige Pipelines ? On-Chip-FPU ? getrennte
L1-Befehls- und Daten-Caches mit
Write-Back-Strategie ? Out of order Abschluß
der Befehle ? Register-Rennaming mit 40
Registern ? Data Forwarding ? dynamische
Verzweigungsvorhersage ? spekulative Ausführung
von Befehlen ? Multiprozessing mit bis zu vier
PPro ohne zusätzliche Logik ? auf 36-Bit
erweiterter Adressbus für einen physikalischen
Adressraum von 64 GByte. ? neue Funktionen
CMOVcc für bedingte MOV-Operationen ? im selben
Gehäuse intergrierter L2-Cache, der über einen
dedizierten Bus mit vollem CPU-Takt angesprochen
wird
4(No Transcript)
5(No Transcript)
6(No Transcript)
7(No Transcript)
8(No Transcript)
9(No Transcript)
10Die Besonderheiten der MMX-Technologie
- SIMD Technologie
- 24 entsprechend neue Befehle (mit allen Variation
sind es 57) - 8 getarnte 64-Bit MMX Register
- 4 neue Datentypen
- 100 Abwärtskompatibel
- Doppelte 1st Level Größe (16KB/16KB)
- Wurde um eine Pipline-Stufe um höhere
Taktfrequenzen zu erzielen - Wurde um 1,2 Mio. Transistoren ergänzt
11SIMD Technologoe
12Mappen der MMX-Register auf die FP-Register
13Neue Datentypen
14FP und MMX in einer Applikation
FP_code ..... ..... / FP-Stack
leeren MMX_code ..... EMMS FP_code2
..... ..... / FP-Stack leeren
15Bug im Pentium-MMX und PII
- Umschaltung von MMX nach FP per EMMS
- MMX ca. 1458 Taktzyklen
- PII ca. 5287 Taktzyklen
- Normalerweise war vorgesehen, daß diese
- Umschaltung drei Taktzyklen verbraucht
16Pipeline der MMX CPU
17Block-Diagramm des Pentium MMX Prozessors
18Beispiel einer SIMD-Addition
19Beispiel einer Vektor-Multiplikation
20Addition ohne Überlaufschutz (Wrap-Arround)
21Addition mit Überlaufschutz (saturation)
22iComp Index 2.0
- CPUmark32
- Norton SI-32
- SPECint_base95
- SPECfp_base95
- Intel Media Benchmark
23iComp Index 2.0
PPro-200 (256 KB) 220
P-MMX-233 203
P-MMX-200 182
Pentium 200 142
24MPEG Benchmark
- Quelle
- AVI Video
- Länge 40sek (ca. 200MB)
- Auflösung 352288
- Ziel
- MPEG Video (ca. 4MB)
- Benutzte Software
- Xing-Encoder 2.2 (MMX-optimiert)
- Konvertierungzeit
- MMX-233 155 Sek
- MMX-200 180 Sek (umgerechnet)
- PPro-200 271 Sek
25MP3 Benchmark
- Quelle
- WAV-Sounddatei
- Länge 16Min 12Sek (ca. 170MB)
- Auflösung 16-Bit Stereo 44kHz
- Ziel
- MP3-Datei (ca. 15MB)
- Benutzte Software
- Audio Catalyst 2.0 (nicht MMX optimiert)
- Konvertierungzeit
- MMX-233 5Min 49Sek
- MMX-200 6Min 46Sek(umgerechnet)
- PPro-200 4Min 30Sek
26Spiele Benchmark
- Spiel
- Hexen II (ohne 3D-Karten Unterstützung)
- Nicht MMX optimiert
PPro-200 MMX-233
320200 29,8 32,1
640480 12,9 13,1
27MMX-Befehle Datentransfer
Befehl Typ Kommentar
MOV D,Q Laden oder Speichern der MMX-Register
28MMX-Befehle Packen
Befehl Typ Kommentar
PACKUS WB Words zu Bytes, mit unsigned Saturation
PACKSS WB,DW Words zu Bytes, Words zu Dwords,Dwords zu Qwords, mit signed Saturation
29MMX-Befehle Entpacken
Befehl Typ Kommentar
PUNPCKH BW, WD, DQ Byte zu Words, Words zu DWords, DWords zu QWords, High Order
PUNPCKL BW, WD, DQ Byte zu Words, Words zu DWords, DWords zu QWords, Low Order
30MMX-Befehle Arithmetik
Befehl Typ Kommentar
PADD B,W,D Addieren mit Wrap-Around
PADDS B,W Addieren mit signed Saturation
PADDUS B,W Addieren mit unsigned Saturation
PSUB B,W,D Subtrahieren mit Wrap Around
PSUBS B,W Subtrahieren mit signed Saturation
PSUBUS B,W Subtrahieren mit unsigned Saturation
PMULH W Multiplizieren, Ergebnis HighWord
PMULL W Multiplizieren, Ergebnis LowWord
PMADD WD Multiplizieren und Addieren, Ergebnis Dword
31MMX-Befehle Schieben
Befehl Typ Kommentar
PSLL W,D,Q Logisch nach links schieben
PSRL W,D,Q Logisch nach rechts schieben
PSRA W,D Arithmetisch nach rechts schieben
32MMX-Befehle Vergleichen
Befehl Typ Kommentar
PCMPEQ B,W,D Ergibt FF bei gleich, sonst 0
PCMPGT B,W,D Ergibt FF bei größer, sonst 0
33MMX-Befehle Logik
Befehl Typ Kommentar
PAND Bitweise logisches AND
PANDN Bitweise logisches NAND
POR Bitweise logisches OR
PXOR Bitweise logisches XOR
34MMX-Befehle Sonstiges
Befehl Typ Kommentar
EMMS Löscht den MMX-Zustand
35(No Transcript)
36(No Transcript)
37(No Transcript)
38(No Transcript)
39(No Transcript)
40(No Transcript)
41(No Transcript)
42(No Transcript)
43(No Transcript)
44(No Transcript)