Systmes dinformation distribue - PowerPoint PPT Presentation

1 / 22
About This Presentation
Title:

Systmes dinformation distribue

Description:

Acc s des sources de donn es existantes typiquement sans perturber ... Fort niveau d'int gration: transaction, triggers, r plication, etc. F d ration de bases ... – PowerPoint PPT presentation

Number of Views:82
Avg rating:3.0/5.0
Slides: 23
Provided by: wwwroc
Category:

less

Transcript and Presenter's Notes

Title: Systmes dinformation distribue


1
Systèmes dinformation distribuée
2
Introduction
  • Gestion de données provenant de sources de
    données
  • distribuées entre plusieurs machines
  • distribuées géographiquement
  • sur des systèmes hétérogènes
  • avec des protocoles hétérogènes
  • dans des formats hétérogènes
  • structurées de manières indépendantes
  • sur des machines autonomes
  • Ressources et performance
  • Temps daccès réseau
  • Temps daccès disque
  • Temps daccès a la mémoire et calculs

3
Pourquoi?
  • Accès à des sources de données existantes
    typiquement sans perturber leurs utilisations
  • OLAP, Fouille de données, portails
  • Utilisation de la distribution
  • Pour améliorer les performances
  • Pour améliorer la disponibilité
  • Grappes (clusters), grilles (grid), network IS

4
Architectures
5
Exemples peu dautonomie
  • Systèmes de gestion de bases de données
    distribuées
  • Peu de machines
  • Peu dautonomie entre les machines
  • Fort niveau dintégration transaction, triggers,
    réplication, etc.
  • Fédération de bases de données
  • Un poil plus dautonomie

6
Exemples plus dautonomie
  • Entrepôt de données
  • Outils de LTE (load-transform-extract)
  • Chargement de données de sources opérationnelles
    indépendantes (copies)
  • Stockage, enrichissement, exploitation
  • Très efficace (fouille de données)
  • Pb propager les maj. des sources
  • Médiation de données
  • Les données ne sont pas copiées vues donc pas
    de problème de maj.
  • Réécriture de requêtes
  • Pb évaluation de requêtes

7
Exemples encore plus dautonomie
  • Portails dentreprise
  • Nombreux publieurs
  • Parfois nombreux sites physiques
  • Problèmes de cohérence
  • P2P ou network information system
  • Interface publish(clé,donnée) get(donnée)
    join(pair) leave(pair)
  • Exemple musique en ligne (Kazaa) Chord
  • Problèmes de cohérence
  • Web
  • Publication, navigation, recherche
  • Problèmes de cohérence

8
Médiation
Réécriture de requête Transformation et
intégration de résultats
Adaptateur Wrapper
Adaptateur Wrapper
requête
résultat
Adaptateur Wrapper
9
Entrepôt
Requête
Adaptateur Wrapper
Entrepôt
Adaptateur Wrapper
propagation maj.
chargement
Adaptateur Wrapper
10
Adapteurs et LTE tools
  • Restructuration et changement de format
  • Etre capable de charger des données du plus grand
    nombre possible de sources
  • Documents, emails, bases de données, agendas
  • Transformations dun format à un autre
  • Exemple HTML to XML
  • Plus difficile doc ou pdf vers XML
  • Travail souvent manuel
  • Techniques dapprentissage
  • Difficulté faire que la transformation résiste
    aux maj. et en particulier aux changements de
    structures

11
Architectures
intergiciel
Client
Client
Niveau présentation
Niveau présentation
Niveau application
Niveau application
Middleware
Niveau ressource
Niveau ressource
Server
Server
2-tier archi
3-tier archi
1-tier archi
12
Architecture 3 tier en moins simpliste
Client
client
Niveau présentation
Intégration
Niveau application
client
client
client
Middleware
adaptateur
adaptateur
adaptateur
Niveau ressource
Server
13
Middleware
14
Middlewares classiques
  • RPC Remote procedure call
  • TP monitors RPC gestion de transaction
  • Object brokers RPC orienté objet
  • Middleware Orienté Message
  • Object monitors TP monitors Object brokers

15
Quelques repères
  • TP monitors 60s
  • MOM aussi très anciens
  • Queues persistantes dans les années 90s
  • RPC 80s
  • Object brokers 90s
  • CORBA (Object Management Group)
  • DCOM (Microsoft)
  • 99 XML-RPC début des Web services
  • Messages en XML
  • Messages via HTTP-POST

16
Remote procedure call
  • Une abstraction qui permet déchanger de
    linformation, denvoyer des messages à partir
    dun programme en ignorant tous les détails de ce
    travail
  • Sockets, TCP, IP
  • RPC est à la base dune grande partie du
    middleware
  • par exemple SOAP quon va voir

17
TP monitors
  • RPC transaction processing
  • IBM CICS (customer information and control
    system), BEA Tuxedo
  • Support de la distribution transactions
    distribuées, logging, reprise sur panne,
    persistance, sécurité, communication

18
Object Broker
  • RPC Orienté Objet (utilise RPC de C ou Java)
  • CORBA (Common object request broker architecture)
    une spécification standardisée
  • DCOM et COM for Microsoft
  • Le monde Corba
  • LORB procure linteropérabilité
  • Les services Corba services communs comme
    la persistance
  • Les facilities Corba services de haut
    niveau utilisés par des applications
    particulières comme la gestion de documents

19
Comment ça marche
Vertical Corba facilities
finance
Supply chain
Horizontal Corba facilities
Objet utilisateur
Documents distribues
Gestion de système
ORB
Corba Services
nomage
events
query
security
collection
persistance
time
transaction
20
Middleware orienté message (MOM)
  • Appels asynchrones
  • Système de file dattente
  • Exemple WebSphere (IBM), série MQ (Microsoft)
    aussi dans Corba

CPeer
SPeer
Client
CPeer
MOM
Time!
Time?
Time?
Server
SPeer
cur
MOM
21
Synchrone et asynchrone
  • Synchrone efficace mais peut être bloquant
  • Exemple récent
  • Utilisation dun service Web qui fait de la
    classification de documents
  • Calcul prend quelques heures
  • Time out sur lappel de service
  • Il fallait faire un appel asynchrone
  • Classification très grossière
  • Une personne attend la réponse synchrone (Web
    search)
  • Une personne voudra un jour voir la réponse
    asynchrone (email)

22
Juste avant de passer aux services Web
  • On sait distribuer des données
  • On sait les accéder de nimporte où
  • On a un format de données standard
  • Avec le Web et XML
  • On sait distribuer des calculs
  • On na pas de protocole de distribution standard
  • HTTP est trop faible
  • Corba nest pas suffisamment standard
  • Avec les services Web
  • Standard pour du calcul distribué nimporte où
    sur le net.
Write a Comment
User Comments (0)
About PowerShow.com