Cours 2 Architectures - PowerPoint PPT Presentation

1 / 27
About This Presentation
Title:

Cours 2 Architectures

Description:

Petit nombre de processeurs super-puissants vs. grand nombre de processeurs ' ... d'ordinateurs mieux adapt s aux besoins actuels se sont d velopp s depuis les ... – PowerPoint PPT presentation

Number of Views:147
Avg rating:3.0/5.0
Slides: 28
Provided by: wwwen4
Category:

less

Transcript and Presenter's Notes

Title: Cours 2 Architectures


1
Cours 2Architectures
  • Pierre Delisle
  • Université du Québec à Chicoutimi
  • Département dinformatique et de mathématique

2
Plan de la présentation
  • Introduction
  • Réseaux dinterconnexion
  • Tableaux de processeurs
  • Multiprocesseurs
  • Multi-ordinateurs
  • Taxonomie de Flynn
  • Présentation du devoir

3
Vue densemble simplifiée du calcul parallèle des
années 2000
4
Introduction
  • 1960-1990 beaucoup de développement dans les
    architectures, mais trop de variété
  • Processeurs fabrication propriétaire vs.
    générique
  • Petit nombre de processeurs super-puissants vs.
    grand nombre de processeurs  ordinaires 
  • Aujourdhui
  • Utilisation de CPU génériques, croissance plus
    rapide que les technologies propriétaires
  • Questions
  • Comment relier ces processeurs les uns aux
    autres?
  • Comment relier ces processeurs à la mémoire ?

5
Réseau dinterconnexion
  • Sert à
  • Relier les processeurs à une mémoire partagée
  • Relier les processeurs les uns aux autres
  • Le médium du réseau peut être
  • Partagé
  • Commuté
  • Problématiques
  • Vitesse de communication vs. vitesse des
    processeurs

6
Médium partagé
  • Les messages sont envoyés à tous, un à la fois
  • Tous les processeurs reçoivent le message mais
    seuls ceux identifiés comme destinataires le
    conservent
  • Exemple Ethernet
  • Beaucoup de communications collisions

P
P
P
P
7
Médium commuté
  • Permet des communications point-à-point entre
    paires de processeurs
  • Chaque processeur a un lien avec le médium
  • Principaux avantages sur le médium partagé
  • Permet des communications simultanées
  • Plus extensible à de grand nombre de processeurs
  • Principaux inconvénients
  • Complexité
  • Coût

Médium commuté
P
P
P
P
8
Topologie du réseau dinterconnexion
  • Directe 1 processeur 1 commutateur
  • Indirecte Nb. processeurs lt Nb. Commutateurs
  • Critères de performance du réseau
  • Diamètre Distance maximum entre 2 nuds
  • Largeur bissectionnelle Nombre min. de liens
    devant être enlevés pour sectionner le réseau en
    deux moitiés
  • Degré Nb de liens directs dun nud vers
    dautres nuds
  • Longueur des liens entre les noeuds
  • Grille, Arbre binaire, Arbre hyperbolique,
    Papillon, Hypercube, Multi-étage
  • Aucune topologie nest supérieure sur tous les
    critères

9
Tableaux de processeurs (Arrays)
  • Ordinateur vectoriel ordinateur contenant des
    instructions sur des vecteurs (tableau de
    valeurs)
  • Tableau (réseau) de processeurs ordinateur
    vectoriel comprenant un ensemble déléments de
    calcul identiques et synchrones (p.38)
  • Les éléments de calcul sont des processeurs
    primitifs contrôlés par un processeur standard
  • Les processeurs effectuent simultanément la même
    opération sur des données différentes
  • Parallélisme de données
  • Vecteur lt Tableau Perte de performance
  • Vecteur gt Tableau Mapping (manuel ou système)

10
Le besoin darchitectures flexibles
  • Problèmes associés aux ordinateurs vectoriels
  • Peu flexibles (limité principalement au
    parallélisme de données)
  • Difficiles à programmer
  • Technologie progressant trop lentement par
    rapport aux processeurs génériques
  • Etc
  • 2 types dordinateurs mieux adaptés aux besoins
    actuels se sont développés depuis les années 90
  • Multiprocesseurs
  • Multi-ordinateurs

11
Multiprocesseur
  • Ordinateur comprenant plusieurs processeurs
    pouvant être génériques
  • Mémoire partagée
  • Supporte plusieurs utilisateurs
  • 2 types
  • Centralisé
  • Distribué

12
Multiprocesseur centralisé
  • Extension de larchitecture séquentielle typique
  • Un bus relie les processeurs à la mémoire et aux
    E/S
  • La mémoire cache permet daccélérer les calculs
    sur chaque processeur en réduisant les accès à la
    mémoire
  • 2 autres appellations, liées au temps daccès à
    la mémoire par tous les processeurs
  • Uniform Memory Access (UMA) Multiprocessor
  • Symmetric Multiprocessor (SMP)
  • Les processeurs communiquent par des
    lectures/écritures sur des variables en mémoire
    partagée

13
Multiprocesseur centralisé
  • Les caches réduisent la charge sur bus/mémoire
  • Exemples
  • High-Range IBM p5 595 jusquà 64 procs à 1.9
    Ghz
  • Mid IBM p5 570, 16 procs 1.9 Ghz, 32 Go RAM
    378,000
  • 2 Problèmes
  • Cohérence de cache
  • Synchronisation

CPU
CPU
CPU
Cache
Cache
Cache
Bus
Mémoire principale
Entrées /Sorties
14
Cohérence de cache
  • La duplication de certaines données dans les
    caches permet de minimiser les accès mémoire
  • Que fait-on lorsquune écriture est effectuée?
  • Exemple p. 45
  • Protocole de cohérence de cache ensemble de
    règles assurant que les processeurs possèdent la
    même valeur dun emplacement mémoire
  • Espionnage (Snooping) / write invalidate

15
Synchronisation
  • Dans certains cas dexécution parallèle, des
    règles de précédence doivent être respectées
  • Dans un contexte de mémoire partagée, des
    mécanismes permettent dassurer un certain ordre
    dans les opérations
  • Exclusion mutuelle seulement un processeur doit
    effectuer une partie de programme
  • Section critique partie de programme ne pouvant
    être effectuée que par un processeur à la fois
  • Barrière de synchronisation les processeurs
    sont arrêtés à un certain point du programme
    jusquà ce que tous les processeurs aient atteint
    ce point
  • Ces mécanismes peuvent être implémentés de façon
    matérielle ou logicielle

16
Multiprocesseur distribué
  • La mémoire principale est distribuée entre les
    processeurs
  • Les accès à la mémoire locale sont plus rapides
    que ceux à la mémoire distante
  • Permet un plus grand nombre de processeurs

CPU
CPU
CPU
Cache
Cache
Cache
Mémoire
E/S
Mémoire
Mémoire
E/S
E/S
Réseau dinterconnexion
17
Multiprocesseur distribué
  • Même si elle est physiquement distribuée, la
    mémoire est vue logiquement comme unique
  • Non Uniform Memory Access (NUMA) les temps
    daccès à la mémoire peuvent varier
    considérablement selon la localité
  • Réseau dinterconnexion problème de cohérence
    de cache trop complexe pour le protocole
    despionnage
  • Solution protocole basé sur un répertoire

18
Multi-ordinateur
  • La mémoire est physiquement organisée comme celle
    du multiprocesseur distribué
  • Logiquement, espaces dadressage disjoints
  • Chaque processeur na accès quà sa propre
    mémoire locale
  • Interactions entre processeurs effectuées par
    passage de messages
  • Peut être
  • Asymétrique
  • Symétrique

19
Multi-ordinateur asymétrique
  • Composé dun ordinateur principal complet et de
    plusieurs ordinateurs dédiés au calcul
  • Ordinateur principal
  • Point dentrée du système
  • Fonctionnalités standard dun ordinateur (OS,
    E/S, etc.)
  • Contient le programme qui contrôle les autres
    procs

Ordinateur
Ordinateur principal
Réseau dinterconnexion
Ordinateur
Utilisateur
Ordinateur
Multi-ordinateur
20
Multi-ordinateur asymétrique
  • Ordinateurs dédiés au calcul
  • Système dexploitation minimal
  • Pas dentrées/sorties
  • Problèmes
  • Une panne sur lordinateur principal, plus de
    machine !
  • Beaucoup dutilisateurs goulot détranglement
    sur la machine principale !
  • Programmes difficiles à débugger, pas dE/S sur
    les procs
  • Nécessite lécriture de 2 programmes
    (maître-esclave)

21
Multi-ordinateur symmétrique
  • Ordinateurs identiques, même fonctionnalités
  • Plusieurs points dentrée pour les utilisateurs
  • Avantages
  • Charge répartie sur le système plutôt que
    concentrée
  • Un ordinateur peut se permettre de tomber en
    panne
  • Un seul programme pour tous les ordinateurs

Utilisateur
Ordinateur
Ordinateur
Réseau dinterconnexion
Ordinateur
Ordinateur
Utilisateur
Ordinateur
Ordinateur
Multi-ordinateur
22
Multi-ordinateur symmétrique
  • Désavantages
  • Chaque nud pouvant servir dentrée et ayant sa
    propre identité, lillusion dun seul système est
    difficile à maintenir
  • Difficulté de répartition de la charge de calcul
    générale, de tous les utilisateurs, sur les
    processeurs
  • Compétition entre les programmes pour le temps
    CPU limite la performance

23
Clusters vs. Réseaux de stations
  • Réseau de stations (NOW)
  • Ensemble hétérogène dordinateurs
  • Souvent réparti géographiquement
  • Les nuds sont souvent déjà utilisés localement
  • Calcul parallèle Utilisation secondaire des
    machines
  • Connectés par un réseau générique, souvent
    Ethernet
  • Cluster
  • Ensemble homogène dordinateurs
  • Réunis géographiquement
  • Nuds dédiés au calcul parallèle
  • Ressource unifiée de calcul parallèle
  • Réseau haut débit (Fast/Gigabit Ethernet, Myrinet)

24
Clusters vs. Réseaux de stations
  • Comparaison des réseaux
  • Principal avantage des NOW Peu coûteux et
    facile à construire avec des composantes
    génériques

25
Taxonomie de Flynn
  • SISD Single Instruction Single Data
  • Ordinateurs séquentiels
  • SIMD Single Instruction Multiple Data
  • Tableaux de processeurs (arrays)
  • Ordinateurs vectoriels en pipelilne
  • MISD Multiple Instruction Multiple Data
  • Tableaux systoliques (systolic array)
  • MIMD Multiple Instruction Multiple Data
  • Multiprocesseurs et Multi-Ordinateurs
  • La plupart des machines parallèles daujourdhui
  • Modèle trop générique pour illustrer la diversité
    des architectures actuelles

26
Sommaire
  • Lintérêt pour les tableaux de processeurs a
    diminué avec
  • Diminution du coût des microprocesseurs
  • Rigidité du parallélisme de données
  •  Petits  ordinateurs parallèles
  • 2 lt Nombre de processeurs lt 64
  • Typiquement de type Multiprocesseur (SMP)
  • Vue globale de la mémoire, cohérence de cache
  •  Grands  ordinateurs parallèles
  • 64 lt Nombre de processeurs lt Quelques centaines
  • Typiquement de type Multi-Ordinateur
  • Souvent des clusters de SMP

27
Conclusion
  • Les différents types dordinateurs ne se
    programment pas tous de la même façon
  • Prochain cours Conception dalgorithmes en
    général
  • 3 cours suivants Algorithmique et programmation
    sur Multiprocesseurs/Multi-ordinateurs
  • Questions ?
  • Devoir 1
Write a Comment
User Comments (0)
About PowerShow.com