Sistemas Distribuidos - PowerPoint PPT Presentation

About This Presentation
Title:

Sistemas Distribuidos

Description:

Sistemas Distribuidos Tiempo y coordinaci n Tiempo y coordinaci n Introducci n Sincronizaci n de relojes f sicos UTC Compensaci n de la deriva en los relojes ... – PowerPoint PPT presentation

Number of Views:107
Avg rating:3.0/5.0
Slides: 44
Provided by: Maq67
Category:

less

Transcript and Presenter's Notes

Title: Sistemas Distribuidos


1
Sistemas Distribuidos
Tiempo y coordinación
2
Tiempo y coordinación
  • Sincronización de relojes físicos
  • ? Tiempo universal coordinado (UTC)
  • ? Compensación de derivas
  • ? Sincronización de relojes en SD
  • Tiempo lógico y relojes lógicos
  • ? Diagramas de tiempo
  • Coordinación distribuida
  • ? Exclusión mutua distribuida
  • ? Elección

3
Introducción
  • El tiempo es un tema interesante e importante en
  • los sistemas distribuidos (SD) y es deseable
    poder medirlo con exactitud. Para ello se
    necesita sincronizar los relojes de los
    componentes del sistema.
  • La sincronización es necesaria para
  • ? mantener la consistencia de los datos
  • ? chequear la autenticidad de requerimientos a
    los servers
  • ? eliminar updates duplicados
  • Puede ser
  • ? sincronización interna por conocer con
    cierto grado de precisión la diferencia de tiempo
    entre los relojes de dos computadoras
  • ? sincronización externa mediante una
    fuente autorizada de tiempo
  • La noción de tiempo físico es también un problema
    en SD

4
Sincronización de relojes físicos
  • Los relojes físicos de las computadoras están
  • limitados por su resolución
  • Normalmente estos relojes sufren de deriva
    (drift)
  • Para compensar estas divergencias las
  • computadoras se puede sincronizar con un
    servicio de tiempo, por ej. UTC - Coordinated
    Universal Time
  • Existen distintos algoritmos para sincronizar

Red
5
UTC
  • Relojes atómicos
  • ? Un segundo es el tiempo durante el cual un
  • átomo de Cesio 133 hace 9.192.631.770
  • transiciones
  • ? Sin embargo fue definido originalmente en
  • términos de la rotación de la tierra
  • UTC
  • ? Estándar internacional basado en el tiempo
  • atómico pero donde se añaden o sacan
    segundos
  • bisiesto (leap)
  • ? Se transmiten por señales de radio con
    una
  • exactitud de 0.1-10 ms.

6
Compensación de la deriva en los relojes
  • Si el reloj de la computadora atrasa con
    respecto
  • al servicio de tiempo
  • ? se adelanta
  • ? se pierden algunos ticks pero
  • no hay problema
  • Al revés, es decir, si adelanta
  • ? no se puede atrasarlo. La solución es
    lentificar el reloj hasta normalizarlo
  • ? no en hardware sino en software

7
Método de Cristian para sincronizar relojes (1989)
mr
mt
p
Servidor de tiempo, S
  • Si el tiempo retornado por S en el mensaje mt
    es t,
  • p pondría su reloj en t Tround/2
  • El tiempo del reloj S cuando el mensaje mt
    arriba es
  • t min, t Tround - min, el ancho del
    rango es
  • Tround - 2 min y la exactitud es (Tround/2 -
    min)

8
Discusión del algoritmo de Cristian
  • El servidor de tiempo puede fallar
  • Un grupo de servidores de tiempo sincronizados
  • ? cada uno con un receptor para las señales
    de
  • tiempo del UTC
  • ? un cliente puede multicast sus
    requerimientos
  • a todos los servidores y usar la primera
    respuesta
  • que reciba
  • ? puede haber un servidor de tiempo que
    funcione mal o que sea un impostor

9
Algoritmo de Berkeley (1989)
  • Una computadora coordinadora actua como master
  • y periódicamente encuesta a sus slaves cuyos
  • relojes están siendo sincronizados
  • El master estima sus tiempos locales observando
  • el tiempo de round-trip (similar a la técnica
    de
  • Cristian) y promediando los valores obtenidos
  • El master considera un promedio tolerante a
    fallos
  • Si el master llegase a fallar se elige otro para
    que
  • ocupe su puesto de coordinador

10
Network time protocol (NTP)
  • NTP distribuye información del tiempo para
    proveer
  • ? un servicio para sincronizar clientes en
    Internet
  • ? un servicio seguro que sobreviva a caidas
  • ? una resincronización frecuente para
    disminuir la
  • deriva de los relojes de los clientes
  • ? protección contra interferencias
  • El servicio NTP es provisto por varios
    servidores y está basado en UDP
  • ? servidores primarios, secundarios y
    servidores de otros niveles (estratos)

11
Subred de sincronización en NTP
1
2
2
3
3
3
Nota Las flechas indican control de la
sincronización, los números indican estratos.
12
Sincronización en NTP
  • Los servidores NTP se sincronizan entre sí de
    tres
  • modos
  • ? multicast
  • ? usado en LANs de alta velocidad
  • ? los servidores transmiten
    periódicamente sus
  • tiempos
  • ? bajas exactitudes, aunque eficiente
  • ? procedure-call
  • ? similar a la operación del algoritmo de
    Cristian
  • ? simétrico
  • ? usado por master servers (el más
    seguro)
  • ? pares de servers intercambian
    información

13
Intercambio de mensajes
Ti - 2
Ti - 1
Mensajes intercambiados entre dos pares NTP
14
Intercambio de mensajes
  • Estimación del retardo y offset en el protocolo
    NTP
  • ? a Ti-2 - Ti-3
  • ? b Ti Ti-1
  • ? di a b (retardo, medida de la exactitud de
  • la estima del offset)
  • ? oi (a-b)/2 (estima del offset)
  • ? oi- di/2?o? oi di/2 (o, offset verdadero)
  • Pares ltoi, digt se le aplica un filtro de
    dispersión
  • Dispersión altadatos relativamente inseguros

15
Tiempo y relojes lógicos
  • El orden de los eventos
  • ? si 2 eventos ocurren en el mismo proceso,
  • ocurren en el orden en que se los observa
  • ? el evento de enviar un mensaje entre
    procesos
  • ocurre antes que el evento de recibirlo
  • La relación sucedió antes (Lamport), indicada
    por ?
  • ? HB1 Si ? proceso p x ?p y, luego x ? y.
  • ? HB2 P/cualquier mensaje m,
  • send(m) ? rcv(m),
  • ? HB3 Si x, y y z son eventos tales que x
    ? y y
  • y ? z, luego x ? z.

16
Marcas temporales lógicas
  • Reloj lógico (LC) Un contador por software
  • monotónicamente creciente
  • Cp un reloj lógico para el proceso p, Cp(a)
    marca
  • lógica de un evento a en p, Cp(b) marca lógica
  • de un evento b
  • LC1 evento ocurrido en proceso p, Cp Cp 1
  • LC2 a) p envía un mensaje m a q con valor
  • t Cp
  • b) Cq max(Cq,t) y aplica LC1 a
    rcv(m)
  • Si a ? b entonces C(a) lt C(b), no a la inversa!
  • Relojes totalmente ordenados

17
Marcas temporales lógicas - Ejemplo
p
1
a
b
m
1
Tiempo físico
p
2
c
d
m
2
p
3
e
f
Eventos ocurridos en tres procesos
18
Marcas temporales lógicas - Ejemplo
2
1
p
1
a
b
m
1
3
4
Tiempo físico
p
2
c
d
m
2
5
1
p
3
e
f
Marcas temporales de Lamport para los 3 eventos
19
Relojes totalmente ordenados
  • Los relojes lógicos sólo imponen un orden
    parcial
  • Para un orden total uso (Ca, pa)
  • (Ca, pa)lt (Cb, pb)
  • si y sólo si Calt Cb o (Ca Cb y palt pb)

20
Coordinación distribuida
  • Los procesos distribuidos necesitan coordinar
    sus
  • actividades
  • Algunos servidores no tienen mecanismos de
  • sincronización incorporado
  • En ciertos casos se utilizan mecanismos de
  • excusión mutua distribuida para obtener
  • seguridad, propiedades de ordenamiento y
  • vivacidad (problema de la sección crítica,
    CS)
  • Algoritmos de elección Métodos para elegir un
  • proceso único para un determinado rol

21
Exclusión mutua distribuida
  • Los requerimientos básicos para este mecanismo
  • ? ME1 (seguridad) Como máximo se puede
  • ejecutar un proceso a la vez en la CS
  • ? ME2 (vivacidad) Un proceso que requiera
    entrar
  • a la CS eventualmente puede ser admitido
  • (ME2 implica que la implementación es libre
    de
  • deadlock)
  • ? ME3 (ordenamiento) La entrada a la CS
    sería
  • admitida en un orden sucedió-antes

22
Soluciones
  • Algoritmo del servidor central (un único
    servidor
  • otorga acceso a la CS)
  • Algoritmo distribuido usando relojes lógicos
  • (algoritmo de Ricart y Agrawal, multicast a
    todos los
  • otros procesos)
  • Algoritmo basado en anillo (los procesos se
  • disponen en un anillo lógico)
  • ? el token circulante permite entrar a la CS

23
Algoritmo del server central
24
Algoritmo del server central
  • El protocolo para ejecutar una CS
  • ? enter() (entrar al bloque de CS si es
    necesario)
  • ? . (acceder a recursos compartidos en
    CS)
  • ? exit() (dejar CS -ahora pueden entrar
    otros
  • procesos)
  • Conceptualmente, la respuesta del server es un
  • token para entrar en la CS
  • ? si ningún proceso tiene el token el
    servidor lo
  • otorga
  • ? si el token lo tiene otro proceso, el
    requerimiento
  • es satisfecho
  • ? al salir de la CS el token es devuelto al
    servidor

25
Algoritmo del server central
  • Se alcanzan las condiciones de seguridad y
  • vivacidad
  • Ordenamiento
  • ? se alcanza en casos normales
  • ? cuando el servidor falla debe elegirse uno
    nuevo,
  • en este caso, el ordenamiento de
    requerimientos
  • de ingresos será distinto a menos que se
    tomen
  • precauciones
  • Problemas
  • ? El server es un cuello de botella de la
  • performance
  • ? y también un punto crítico de falla

26
Algoritmo de Ricart-Agrawala (1981)
  • Un algoritmo distribuído que usa relojes lógicos
  • Basado en un acuerdo distribuído en lugar de un
  • servidor central
  • Los procesos que quieren entrar a la CS
    multicast un
  • mensaje de requerimiento y pueden entrar sólo
    cuando
  • todos los otros procesos han respondido al
    mismo
  • Cada proceso tiene un reloj lógico
  • Forma de los mensajes para pedir el token ltT,
    pigt
  • Cada proceso tiene un estado
  • ? LIBERADO deja el token
  • ? PIDIENDO desea el token
  • ? OBTENIDO posee el token

27
  • Algoritmo de Ricart-Agrawala
  • Al iniciar
  • estado LIBERADO
  • Para obtener el testigo
  • estado PIDIENDO
  • T timestamp de la petición
  • Difundir petición al resto de procesos
  • Esperar hasta (num. de respuestas n - 1)
  • estado OBTENIDO
  • Al recibir una petición ltTi, pigt en el proceso
    pj (i ? j)
  • Si (estado OBTENIDO) o (estado PIDIENDO y (T,
    pj) lt (Ti, pi))
  • Encolar la petición de pi sin contestar
  • Si no
  • Contestar inmediatamente a pi
  • Al liberar el testigo

28
Sincronización multicast
lt41, p1gt
respuesta
P1
P3
respuesta
respuesta
lt34, p2gt
lt34, p2gt
lt41, p1gt
P2
29
Sincronización multicast
  • Obtener el token toma 2(n-1) mensajes
  • ? (n-1) para multicast el requerimiento
    seguido
  • de (n-1) respuestas
  • ? refinado tal que se requieren n
    mensajes
  • ? más costoso que el algoritmo del server
    central
  • Una falla en un proceso hace el progreso
    imposible
  • No hay mejora en el cuello de botella en la
  • performance con respecto al algoritmo del
    servidor
  • central

30
Algoritmo basado en anillo
  • La exclusión mutua es conferida obteniendo un
    token
  • pasado de un proceso a otro forma de anillo y
    en una
  • sola dirección
  • ? la topología en anillo no tiene nada que
    ver con
  • conexiones físicas
  • Si un proceso que no requiere entrar a la CS
    recibe el
  • token lo pasa hacia delante a su vecino
  • Si un proceso requiere el token espera hasta que
    lo
  • recibe y entonces lo retiene
  • Al salir de la CS envía el token a su vecino
  • Toma de 1 a (n-1) mensajes obtener el token

31
Algoritmo basado en anillo
32
Algoritmo basado en anillo
  • Si un proceso falla
  • ? no se progresa más allá de él, hasta que se
  • aplica una reconfiguración
  • ? los mensajes son enviados a lo largo del
    anillo
  • aún cuando ningún proceso requiera el token
  • Si el proceso que mantiene el token falla
  • ? se requiere una elección para elegir otro
    entre
  • los sobrevivientes, regenerar el token y
  • retransmitirlo
  • ? asegurarse que el proceso falló realmente
  • (puede llegar a haber dos token)

33
Discusión
  • Ninguno de los tres algoritmos parece un ejemplo
  • práctico muy prometedor para los SD
  • ? ninguno soluciona el tema de fallas en los
  • procesos o las máquinas
  • El del server central requiere el menor número
    de
  • mensajes aunque el server puede ser un cuello
    de
  • botella
  • En general, es preferible que el server maneje
  • recursos para proveer exclusión mutua a los
  • clientes que accedan al mismo

34
Elecciones
  • Una elección es un procedimiento realizado para
  • elegir un proceso cuando el coordinador falla
  • Objetivo Elección única

35
Algoritmo del matón (bully) - Silberschatz (1993)
  • Se supone comunicación fiable, pero los procesos
  • pueden fallar
  • Se intenta seleccionar al miembro sobreviviente
    con
  • mayor identificador
  • Un proceso comienza la elección cuando nota que
    el
  • que el supervisor falla
  • Todos los miembros del grupo conocen la
    identidad y
  • dirección del resto
  • Hay 3 tipos de mensajes
  • ? elección se envía para anunciar elección
  • ? respuesta enviado en respuesta al
    anterior
  • ? coordinador con identidad del nuevo
    coordinador

36
Algoritmo del matón
  • La elección comienza cuando un proceso envía un
    mensaje de elección a
  • los miembros con mayor identificador que él
  • ? El proceso espera un mensaje de respuesta
  • ? Si no llega ninguno, el proceso se considera
    elegido y envía un
  • mensaje de coordinador a los que tienen
    identificador menor
  • ? Si llega al menos un mensaje de respuesta el
    proceso espera un
  • mensaje de coordinador
  • ? Si no llega ninguno, comienza una nueva
    elección
  • Si un proceso recibe un mensaje de coordinador
    toma al proceso que lo
  • envía como coordinador electo
  • Si un proceso recibe un mensaje de elección
    devuelve un mensaje de
  • respuesta y comienza una nueva elección (si no
    lo había hecho ya)
  • Cuando un proceso es restaurado después de una
    caída
  • ? Si tiene el identificador mayor se considera el
    coordinador electo y
  • envía un mensaje de coordinación al resto
  • ? Si no, comienza una elección

37
Algoritmo del matón
38
Algoritmo del matón
  • Cuando un proceso falla recomienza la elección
  • ? este proceso comienza la elección
  • ? si tiene el identificador más alto decide
    ser el
  • coordinador y lo anuncia a los otros
    procesos
  • ? esto ocurre aún cuando el coordinador
    funcione
  • (el matón)
  • En el mejor caso (n-2) mensajes
  • ? el proceso con el 2º id más alto notifica
    la falla, se
  • elije él mismo coordinador y envía (n-2)
    mensajes
  • Peor caso O(n2) mensajes
  • ? el proceso con más bajo id notifica la
    falla

39
Algoritmo basado en anillo -Chang y Roberts
(1979)
  • Apropiado para una colección de procesos
    dispuestos
  • en un anillo lógico
  • Objetivo elegir como coordinador el proceso con
    el
  • id más alto
  • Se supone que
  • ? los procesos no conocen, a priori, la
    identidad de
  • los otros y sólo saben comunicarse con el
    vecino
  • ? Todos los procesos están funcionales y
  • alcanzables durante la elección
  • ? Tanenbaum (1992) da una variante en la cual
    los
  • procesos pueden fallar

40
Algoritmo basado en anillo
  • Inicialmente todos los procesos están marcados
    como
  • no-participantes
  • El proceso que inicia la elección envía un
    mensaje de elección
  • con su identificador a su vecino
  • Cuando un proceso recibe un mensaje de elección
  • ? Compara el identificador del mensaje con el
    suyo
  • ? Si el suyo es menor
  • ? Lo retransmite a su vecino
  • ? Si el suyo es mayor
  • ? Sustituye su identificador en el mensaje y lo
    retransmite
  • ? Si son iguales
  • ? Se considera coordinador electo y envía un
    mensaje de
  • coordinador

41
Algoritmo basado en anillo
  • Cuando un proceso que no es el coordinador
    recibe un
  • mensaje de elegido se marca el mismo como no-
  • participante y pasa el mensaje a su vecino
  • La razón para el marcado de un proceso como
  • participante o no-participante
  • ? los mensajes que se emiten cuando otro
    proceso
  • comienza una elección al mismo tiempo, son
  • extinguidos, siempre antes que el ganador
    de la
  • elección sea anunciado
  • Peor caso (3n-1) mensajes
  • ? el vecino anti-horario tiene el id más alto

42
Algoritmo basado en anillo
El mensaje de elección contiene 24 pero el
proceso 28 lo reemplazará con su id cuando el
mensaje lo alcance
43
Discusión
  • Problemática de los algoritmos anteriores
  • ? se basan en timeouts Retrasos de transmisión
  • pueden causar la elección de múltiples lideres
  • ? la perdida de conexión entre dos grupos de
  • procesadores puede aislar permanentemente los
  • procesadores
Write a Comment
User Comments (0)
About PowerShow.com