Title: Objectif
1Détection du meilleur format de compression pour
une matrice creuse dans un environnement
parallèle hétérogène
Olfa HAMDI-LARBI
2Objectif
- Améliorer les performances de lexécution en
parallèle des méthodes itératives de résolution
de systèmes linéaires et/ou de calcul de valeurs
propres où la matrice est creuse et
lenvironnement parallèle est hétérogène
3Quelques définitions
- Matrice creuse
- Matrice de très grande taille contenant
beaucoup déléments nuls et peu déléments non
nuls - Applications mécanique des fluides,
traitement dimage satellite, télé médecine,
4Quelques définitions
- Compression de la matrice gain en espace
mémoire en temps de traitement - Plusieurs formats de compression pour matrice
creuse CSR, COO, BND,
5Quelques définitions
Exemple Format COO
A IA JA
1. 2. 4. 5. 8. 27. 3. 6. 25. 21. 16. 15. 13. 7. 9. 10. 11. 12. 14. 22. 23.
1 2 4 5 4 3 3 6 5 1 1 2 5 3 2 5 6 4 6 4 3
1 2 4 5 2 5 3 6 6 2 3 4 3 1 1 10 5 2 4 5 2
Rmq A une matrice donnée on peut associer un
ensemble de formats de compression
6Environnement parallèle hétérogène
- Réseau de machines ayant des caractéristiques
matérielles et logicielles différentes et reliées
par des liens hétérogènes.
7Méthode itérative de résolution de système
linéaire
- Déf
- A x b
- Exple Méthode de Jacobi, Gauss-Jordan, Gradient
Conjugué, - ?des itérations de Produit Matrice-Vecteur
8Problématique
- Étude des performances du PMVC dans un milieu
hétérogène
Lexécution en séquentiel du PMVC sur chaque
bloc
La distribution de la matrice en blocs
Cas séquentiel
Cas parallèle
9Étude du PMVC Cas séquentiel
- Performances dun Algorithme Séquentiel Creux
Machine(caractéristiques matérielles
logicielles)
Matrice(densité, structure,)
Format de compression
? Détecter le meilleur format de compression
pour une matrice creuse et une machine données
10Étude du PMVC Cas séquentiel
- Tester le PMVC pour
- Un ensemble de formats CSR, COO, DNS, BND
- Une structure particulière de matrice Bande
- Un ensemble de machines PC Intel, un processeur
dune machine SP2, une station HP9000,
11Étude du PMVC Cas séquentiel
- Générer aléatoirement des matrices creuses bande
- Stocker une matrice donnée dans chacun des
formats de compression (COO, CSR, ) - différentes versions du PMVC
- Exécuter le PMVC pour chaque format
- Comparer les performances pour les différents
formats - ? déterminer le format qui a donné les
- meilleures performances
12Étude du PMVC Cas séquentiel
- Optimisation du PMVC séquentiel pour chaque
format de compression
Optimisations manuelles (par le programmeur)
Optimisations automatiques (par le compilateur)
Options de compilation funroll, O1, O2, ,
Remplacement scalaire, Sortir les invariants
dune boucle, Technique de unrolling,
13Optimisation du PMVC CSR
- Sur le PC et le mainframe HP9000
- Toutes les options du compilateur fournissent les
mêmes performances - Les optimisations du compilateur donnent des
performances meilleures que celles données par
les optimisations manuelles - Sur un processeur de la machine SP2
- Pour certaines matrices (ayant un nombre de NNZ
inférieur à un certain seuil), il faut combiner
les optimisations manuelles et automatiques pour
avoir les meilleurs performances - ? Poursuivre les tests pour les formats COO, BND
et DNS
14Étude du PMVC Cas parallèle
- Étude des performances du calcul du polynôme de
degré 2 - A(Axx)x
- pour différents formats de compression dans un
système pair-à-pair - Réseau dans lequel toutes les stations de travail
possèdent des capacités ainsi que des
responsabilités équivalentes
15Étude du PMVC Cas parallèle
16Fragmentation des données
Fragments contenant le même nbre de NNZ (FMNENN)
Fragments contenant le même nbre de lignes
(FMNL)
lignes contiguës
lignes non contiguës
17Fragmentation des données
- FMNL
- Approche facile
- peut engendrer un déséquilibre des charges
prohibitif pour les pairs - FMNENN
- Problème daffectation de N tâches indépendantes
de coûts c1, c2, , cN à p processeurs
homogènes, avec une contrainte sur la charge
maximale par processeur - ?Expérimentations sur le système ExtremWeb
18Conclusion et Perspectives
- Cas séquentiel
- Optimisation du PMVC pour les formats CSR, COO,
DNS et BND - Comparaison des formats du PMVC pour chaque
format - Cas parallèle
- Étude de la parallélisation du PMVC pour chaque
format de compression - Pour un format donné, proposer plusieurs version
parallèles à comparer - Déterminer le format qui donne la meilleure
version parallèle du PMVC