Titulo - PowerPoint PPT Presentation

About This Presentation
Title:

Titulo

Description:

Titulo Introducci n a MPI Clase 5 Marcelo Rozenberg (agradecimiento: Ruben Weht ruweht_at_cnea.gov.ar) – PowerPoint PPT presentation

Number of Views:79
Avg rating:3.0/5.0
Slides: 30
Provided by: Ruben62
Category:
Tags: titulo

less

Transcript and Presenter's Notes

Title: Titulo


1
Titulo
Introducción a MPI Clase 5
Marcelo Rozenberg (agradecimiento Ruben Weht
ruweht_at_cnea.gov.ar)
2
Tipos de datos derivados
  • Tipo contiguo (bloques simples)
  • Tipo vector (bloques equiespaceados)
  • Tipo indexado (bloques y espaceados variables)

MPI_Type_contiguous() MPI_Type_vector() MPI_Type
_indexed(cuantos, vec-largobloque,
vec-desplazamiento, oldtype, newtype, ierr)
3
Definir y manipular comunicadores
  1. Obtener un conjunto de IDs de un comunicador
    existente
  2. Crear un grupo como un subconjunto de un dado
    grupo
  3. Definir un nuevo comunicador para el grupo.

1. MPI_Comm_group ( comm, group, ierr)
2.1 MPI_Group_incl ( oldgrp, count, ranks,
newgrp, ierr)2.2 MPI_Group_excl ( oldgrp,
count, ranks, newgrp, ierr)
3. MPI_Comm_create ( comm, newgrp, newcomm,
ierr)
4
Una rutina útil MPI_Comm_split
  • Permite crear de una vez varios comunicadores
  • Ej una llamada crea q nuevos comunicadores
    (todos con el mismo nombre mi_fila_comm)
  • MPI_Comm mi_fila_comm
  • int mi_fila
  • C mi_rank es rank en MPI_Comm_world
  • C qq p
  • mi_fila mi_rank/q
  • MPI_Comm_split(MPI_COMM_WORLD, mi_fila , mi_rank
    , mi_fila_comm)

P0 P1 P2
P3 P4 P5
P6 P7 P8
q 3 p 9
out
Para el P5 los procs del comunicador mi_fila_comm
son el 3,4,5
5
Topologías virtuales
  • Topologías virtuales
  • MPI tiene rutinas que permiten definir una grilla
    de procesos que se adaptan bien a la geometría
    particular del cálculo.
  • El concepto de topología virtual es una
    característica de MPI que permite manejar una
    grilla de procesos.
  • El objetivo es obtener códigos mas concisos y
    simples, permitiendo también optimizar la
    comunicación entre los nodos.
  • Una topología virtual se asocia con un
    comunicador.

6
Ejemplos típicos








7
Ejemplos típicos








8
Definir una matriz de procesos!
1,1 1,2 1,3
2,1 2,2 2,3
3,1 3,2 3,3
4,1 4,2 4,3
P0
Grilla 2-d
P1
P2
P3
y definir comunicadores fila y comunicadores
columna
9
Cart_create
Hay dos tipos de topologías ? Cartesianas
? Graph (generales)
  • Las topologías cartesianas son grillas
    cartesianas uni o bi-dimensionales
  • Son un caso particular de las generales, pero
    como son muy utilizadas,
  • hay subrutinas dedicadas
  • Para asociar un punto de la grilla virtual a cada
    procesador es preciso
  • especificar la siguiente información
  • Numero de dimensiones de la grilla (1 o 2)
  • Largo de cada dimension ( de procs por fila y/o
    columna)
  • Periodicidad de la dimensión (condiciones de
    contorno anillos, toros)
  • Opción de optimización (reordenar los
    procesadores físicos)

10
Cart_create
Topología cartesiana
MPI_CART_CREATE(old_comm, ndims, dims,
periods, reorder, comm_cart, ierr)
ndims dimensión de la grilladims vector
con la dimensión de cada eje de
coordenadasperiods vector lógico que indica si
existe periodicidad o no en cada ejereorder
.false. Si los datos ya fueron distribuidos. Usa
los ranks del comunicador original
.true. Si los datos todavia no fueron
distribuidos. Reordena los procesos para
optimizar la comunicación
11
Ejemplo
Crear una topología cartesiana bidimensional de q
x q, con condiciones de contorno periodicas
(toro) y permitiendo al sistema reordenar
procesadores
  • MPI_Comm grid_comm
  • int dim_sizes(2), wrap_around(2), reorder
  • reorder 1
  • dim_sizes(1) q
  • dim_sizes(2) q
  • wrap_around(1) 1
  • wrap_around(2) 1
  • MPI_Cart_create( MPI_COMM_WORLD , 2 , dim_sizes
    , wrap_around , reorder , grid_comm )

12
Ejemplo (cont)
Cómo obtener las coordenadas?
  • MPI_Comm grid_comm
  • int dim_sizes(2), wrap_around(2), reorder,
    coord(2), mi_grid_rank
  • reorder 1
  • dim_sizes(1) q
  • dim_sizes(2) q
  • wrap_around(1) 1
  • wrap_around(2) 1
  • MPI_Cart_create( MPI_COMM_WORLD , 2 , dim_sizes
    , wrap_around , reorder , grid_comm )
  • MPI_Comm_rank( grid_comm , mi_grid_rank )
  • MPI_Cart_coord( grid_comm , mi_grid_rank , 2 ,
    coord )

13
Otras rutinas de la clase MPI_Cart
  • MPI_Cart_rank( grid_comm , coord , grid_rank )
  • Es el inverso de MPI_Cart_coord
  • MPI_Cart_sub( grid_comm , var_coords , fila_comm
    )
  • Crea subgrillas (nuevos comunicadores de filas)
  • Ej
  • MPI_comm fila_comm
  • int var_coords(2)
  • var_coords(1) 0 ( 0 porque la coord x no
    varia en cada fila)
  • var_coords(2) 1 ( 1 porque la coord y varia
    en cada fila)
  • MPI_Cart_sub( grid_comm , var_coords ,
    fila_comm)

14
Otras rutinas de la clase MPI_Cart
  • MPI_Cart_get( grid_comm , 2 , dim_sizes ,
    wrap_around , coord )
  • Obtiene las coordenadas del proceso ademas de
    los tamaños de las dimensiones y la periodicidad
    de un dado comunicador cartsiano.
  • vectores de salida dim_sizes(2) ,
    wrap_around(2) , coord(2)
  • MPI_Cart_shift( grid_comm , dir, disp ,
    rank_source, rank_dest )
  • Obtine el rank del proceso de origen y el de
    destino (para usar en un send/recv) entre
    procesos separados por disp procesos en la
    dirección dir. Averigua quiénes son los vecinos

15
Un código de ejemplo (típico)
  • Método de Jacobi para la solución del Problema de
    Poisson (ecuación en derivadas parciales PDE)

16
Problema de Poisson
D u f(x,y) en el interior u(x,y) g(x,y)
en el borde
ui,j ¼ (ui-1,j ui,j1 ui,j-1 ui1,j
h2 fi,j)
17
1/3
  • c
  • c oned.f - a solution to the Poisson problem
    using Jacobi
  • c interation on a 1-d decomposition
  • c
  • c The size of the domain is read by processor 0
    and broadcast to
  • c all other processors. The Jacobi iteration
    is run until the
  • c change in successive elements is small or a
    maximum number of
  • c iterations is reached. The difference is
    printed out at each
  • c step.
  • c
  • program main
  • C
  • include "mpif.h"
  • integer maxn
  • parameter (maxn 128)
  • double precision a(maxn,maxn),
    b(maxn,maxn), f(maxn,maxn)
  • integer nx, ny
  • integer myid, numprocs, ierr
  • integer comm1d, nbrbottom, nbrtop, s, e, it

18
2/3
  • c
  • if (myid .eq. 0) then
  • c
  • c Get the size of the problem
  • c
  • c print , 'Enter nx'
  • c read , nx
  • nx 110
  • endif
  • call MPI_BCAST(nx,1,MPI_INTEGER,0,MPI_COMM_W
    ORLD,ierr)
  • ny nx
  • c
  • c Get a new communicator for a decomposition of
    the domain
  • c
  • call MPI_CART_CREATE( MPI_COMM_WORLD, 1,
    numprocs, .false.,
  • .true., comm1d, ierr )
  • c
  • c Get my position in this communicator, and my
    neighbors
  • c

crea la topología una dimensión con
reordenamiento
cada procs obtiene su rank y averigua quienes son
sus vecinos
asigna bloques de puntos (x,y) a los procesos
19
Topología virtual 1-d para el Problema de Poisson
i,j1
rank2
i,j
i1,j
i-1,j
i,j-1
rank1
rank0
1-d
Debo definir bloques double precision u(0n1,
se) se indica los valores de j de cada bloque.
Cómo obtengo s y e?
Problema con los bordes!
20
Topología virtual 1-d para el Problema de Poisson
(cont)
i,j1
rank2
Agrando los bloques
i,j
i1,j
i-1,j
puntos fantasmas
i,j-1
rank1
rank0
double precision u(0n1, se) se indica los
valores de j de cada bloque Esto se hace con la
rutina MPE_DECOMP1D( ny, numprocs, myid, s, e
) Es una extension de MPI, freeware no forma
parte del standard MPI
21
Detalles sobre MPE_DECOMP1D
  • MPE_DECOMP1D( ny, numprocs, myid, s, e )
  • ny es el tamaño del sistema en el eje vertical
  • numprocs es el numero de procesos
  • myid es el rank de la coordenada cartesiana
  • Si ny y nprocs son divisibles es fácil
  • s 1 myid (ny /nprocs)
  • e s (ny/nprocs) 1
  • Si no lo son la elección obvia es
  • s 1 myid piso(ny /nprocs)
  • if (myid .eq. nprocs 1) then
  • e ny
  • else
  • e s piso(ny/nprocs) 1
  • endif
  • Donde piso(x) da el mayor entero que no es mayor
    que x.

MPE_DECOMP1D Es más inteligente !
22
2/3
  • c
  • if (myid .eq. 0) then
  • c
  • c Get the size of the problem
  • c
  • c print , 'Enter nx'
  • c read , nx
  • nx 110
  • endif
  • call MPI_BCAST(nx,1,MPI_INTEGER,0,MPI_COMM_W
    ORLD,ierr)
  • ny nx
  • c
  • c Get a new communicator for a decomposition of
    the domain
  • c
  • call MPI_CART_CREATE( MPI_COMM_WORLD, 1,
    numprocs, .false.,
  • .true., comm1d, ierr )
  • c
  • c Get my position in this communicator, and my
    neighbors
  • c

crea la topología una dimensión con
reordenamiento
cada procs obtiene su rank y averigua quiénes son
sus vecinos
asigna bloques de puntos (x,y) a los procesos
inicializa
23
Subrutina onedinit
  • subroutine onedinit( a, b, f, nx, s, e )
  • integer nx, s, e, i, j
  • double precision a(0nx1, s-1e1),
    b(0nx1, s-1e1),f(0nx1, s-1e1)
  • c
  • do 10 js-1,e1
  • do 10 i0,nx1
  • a(i,j) 0.0d0
  • b(i,j) 0.0d0
  • f(i,j) 0.0d0
  • 10 continue
  • c
  • c Handle boundary conditions
  • c
  • do 20 js,e
  • a(0,j) 1.0d0
  • b(0,j) 1.0d0
  • a(nx1,j) 0.0d0
  • b(nx1,j) 0.0d0
  • 20 continuec if (s .eq. 1) then

limpia las matrices
fija las condiciones de contorno
u(0,y) 1
u(x,0) 1 u(x,1) 0
u(1,y) 0
24
3/3
  • c
  • c Actually do the computation. Note the use of a
    collective operation to
  • c check for convergence, and a do-loop to bound
    the number of iterations.
  • c
  • call MPI_BARRIER( MPI_COMM_WORLD, ierr )
  • t1 MPI_WTIME()
  • do 10 it1, 100
  • c do 10 it1, 2
  • call exchng1( a, nx, s, e, comm1d, nbrbottom,
    nbrtop )
  • call sweep1d( a, f, nx, s, e, b )
  • call exchng1( b, nx, s, e, comm1d, nbrbottom,
    nbrtop )
  • call sweep1d( b, f, nx, s, e, a )
  • dwork diff( a, b, nx, s, e )
  • call MPI_Allreduce( dwork, diffnorm, 1,
    MPI_DOUBLE_PRECISION,
  • MPI_SUM, comm1d, ierr
    )
  • if (diffnorm .lt. 1.0e-5) goto 20
  • c if (myid .eq. 0) print , 2it, '
    Difference is ', diffnorm
  • 10 continue
  • if (myid .eq. 0) print , 'Failed to
    converge'

sincroniza y mide el tiempo
pasa los puntos fantasma
25
Subrutina exchng1
  • subroutine exchng1( a, nx, s, e, comm1d,
    nbrbottom, nbrtop )
  • include 'mpif.h'
  • integer nx, s, e
  • double precision a(0nx1,s-1e1)
  • integer comm1d, nbrbottom, nbrtop
  • integer status(MPI_STATUS_SIZE), ierr
  • c
  • call MPI_SENDRECV(
  • a(1,e), nx, MPI_DOUBLE_PRECISION
    , nbrtop, 0,
  • a(1,s-1), nx,
    MPI_DOUBLE_PRECISION, nbrbottom, 0,
  • comm1d, status, ierr )
  • call MPI_SENDRECV(
  • a(1,s), nx, MPI_DOUBLE_PRECISION
    , nbrbottom, 1,
  • a(1,e1), nx,
    MPI_DOUBLE_PRECISION, nbrtop, 1,
  • comm1d, status, ierr )
  • return
  • end

26
3/3
  • c
  • c Actually do the computation. Note the use of a
    collective operation to
  • c check for convergence, and a do-loop to bound
    the number of iterations.
  • c
  • call MPI_BARRIER( MPI_COMM_WORLD, ierr )
  • t1 MPI_WTIME()
  • do 10 it1, 100
  • c do 10 it1, 2
  • call exchng1( a, nx, s, e, comm1d, nbrbottom,
    nbrtop )
  • call sweep1d( a, f, nx, s, e, b )
  • call exchng1( b, nx, s, e, comm1d, nbrbottom,
    nbrtop )
  • call sweep1d( b, f, nx, s, e, a )
  • dwork diff( a, b, nx, s, e )
  • call MPI_Allreduce( dwork, diffnorm, 1,
    MPI_DOUBLE_PRECISION,
  • MPI_SUM, comm1d, ierr
    )
  • if (diffnorm .lt. 1.0e-5) goto 20
  • c if (myid .eq. 0) print , 2it, '
    Difference is ', diffnorm
  • 10 continue
  • if (myid .eq. 0) print , 'Failed to
    converge'

sincroniza y mide el tiempo
pasa los puntos fantasma
barrida por toda la red
27
Subrutina sweep
  • c
  • c Perform a Jacobi sweep for a 1-d decomposition.
  • c Sweep from a into b
  • c
  • subroutine sweep1d( a, f, nx, s, e, b )
  • integer nx, s, e
  • double precision a(0nx1,s-1e1),
    f(0nx1,s-1e1),
  • b(0nx1,s-1e1)
  • c
  • integer i, j
  • double precision h
  • c
  • h 1.0d0 / dble(nx1)
  • do 10 js, e
  • do 10 i1, nx
  • b(i,j) 0.25 (a(i-1,j)a(i,j1)a(i
    ,j-1)a(i1,j)) -
  • h h f(i,j)
  • 10 continue

28
3/3
  • c
  • c Actually do the computation. Note the use of a
    collective operation to
  • c check for convergence, and a do-loop to bound
    the number of iterations.
  • c
  • call MPI_BARRIER( MPI_COMM_WORLD, ierr )
  • t1 MPI_WTIME()
  • do 10 it1, 100
  • c do 10 it1, 2
  • call exchng1( a, nx, s, e, comm1d, nbrbottom,
    nbrtop )
  • call sweep1d( a, f, nx, s, e, b )
  • call exchng1( b, nx, s, e, comm1d, nbrbottom,
    nbrtop )
  • call sweep1d( b, f, nx, s, e, a )
  • dwork diff( a, b, nx, s, e )
  • call MPI_Allreduce( dwork, diffnorm, 1,
    MPI_DOUBLE_PRECISION,
  • MPI_SUM, comm1d, ierr
    )
  • if (diffnorm .lt. 1.0e-5) goto 20
  • c if (myid .eq. 0) print , 2it, '
    Difference is ', diffnorm
  • 10 continue
  • if (myid .eq. 0) print , 'Failed to
    converge'

sincroniza y mide el tiempo
pasa los puntos fantasma
barrida por toda la red
check de convergencia
29
Notas finalesqué quedó afuera?
  • Bibliotecas (2 buenas y documentadas)
  • ScaLAPACK (Scalable LAPACK)
    - originada en F77
  • PBLAS (Parallel BLAS)
  • PETSc (Portable Extensible Toolkit for Sci.
    Comp.) - diseñada para C
  • Profiling (medición de performance)
  • No hay un standard. La medición afecta el tiempo
    de cálculo!
  • Problemas de buffering
  • Balanceo de carga
  • Debugging (www.lam-mpi.org/software/xmpi/)
  • Bibliografia y links
  • Using MPI (W. Gropp, E. Lusk y A. Skjellum)
  • Parallel Programming with MPI
  • www.mpi-forum.org/ www.mcs.anl.gov/mpi
    www.erc.msstate.edu/mpi
Write a Comment
User Comments (0)
About PowerShow.com