Title: Modlisation et Optimisation du Web
1Modélisation et Optimisation du Web
- César JALPA VILLANUEVA
- Directeur Zhen LIU
- Projet MISTRAL
2Plan d exposé
- 1. Motivation
- 2. WAGON Web trAffic GeneratOr and beNchmark
- 3. Expérimentations
- 4. Analyse Statistique
- 5. Conclusions et Perspectives
31. Motivation
WWW World Wide Web ou World Wide Wait?
Popularité
Croissance
16 de nouvelles pages chaque mois
1 nouveau serveur toutes les 2 secondes
Saturation de serveurs et réseaux
70 de trafic de l Internet
WWW World Wide Wait?
4Qui, Quoi, Comment?
- Qui Quoi Comment
- serveur distribution sous-dimensionnement,
- mauvaise configuration, etc.
- réseaux support de sous-dimensionnement
- transmission
- protocoles transfert mauvaise conception,
- mauvais paramétrage, etc.
- navigateur récupération mauvaise conception,
- mauvais paramétrage, etc.
- cache ...
5Outils dEvaluation de Performance et de
Dimensionnement pour le Web
- Objectifs
- évaluation et prédiction de performances
- dimensionnement
- optimisation des architectures et des paramètres
- Approches
- modèles analytiques
- simulation
- benchmarks
6Benchmarks pour serveurs Web
- Un mécanisme pour générer un flux contrôlé de
requêtes HTTP avec des métriques pour rapporter
les résultats - Scénario de base clients qui émettent un flux de
requêtes et mesurent la réponse du système - processus de génération de trafic
- jeu d essai (workload)
- mesures de performance
7Benchmarks existants
- WebSTONE
- SPECweb96
- S-Client
- httperf
- hbenchWeb
- SURGE
82. WAGON Web trAffic GeneratOr and beNchmark
- Nouveau modèle de trafic plus réaliste, facile à
paramétrer. - Approche objets et java
- Emulation réseaux et transport
- Analyse Statistique
- Monitoring
- Interface Graphique
- extensibilité (HTTP-NG).
- Facilité de déploiement Internet 2 (VTHD)
- Probabilité Solaris, FreeBSD, Linux, Windows
9WAGON Historique
- V.0 (1997) F. Ah-Yave et V. Marquion
- V.1 (1998) en collaboration avec N. Niclausse
(thèse) - test, déboguage
- ajout de fonctionnalités fichier de traces,
approche objets, monitoring, émulation réseau. - V.2 (2000) avec concours de N. Niclausse
- amélioration de l architecture
- extension du modèle de trafic
- multiple classes de clients (profiles)
- émulation du réseau
- module danalyse statistique
- algorithme EM
- tests d ajustement
10WAGON Vue globale
Expérimentation
Synthèse du workload
Génération du trafic
11WAGON Générateur de trafic
- Modèle de trafic
- le processus d'arrivées des sessions
- la distribution du nombre de clics
- la distribution du temps de réflexion
clicA1
clicA2
clicA3
clicA4
Session A
Session B
12WAGON Générateur de trafic (suite)
- Modèle de navigation
- popularité
- routage
133. Expérimentation
- Comparaison des protocoles (HTTP1.0 et 1.1)
- Comparaison de serveurs (Apache, Jigsaw)
- Paramétrage de serveurs
- Auto-similarité du trafic généré par WAGON
- VTHD (Internet 2)
- Analyse Statistique
14Conditions de réalisation
- Réseau expérimental
- 7 Pentium II,128Moctets
- 2PentiumPro, 64Moctets
- FreeBSD3.2
- deux switchs, 100Mbps
- DUMMYNET
15Conditions de réalisation (suite)
- Serveur Web
- Apache, configuration par défaut (MaxClients 150,
KeepAliveTimeout 15s) - sous-ensemble du serveur INRIA (www.inria.fr)
- Paramètres du modèle de trafic
- analyse des fichiers de traces du serveur INRIA
- arrivée de sessions processus de Poisson, 0.002
? 0.008 - nombre de clics Gaussienne Inverse (µ 5, ?
3) (5, 1.28) - temps inter-clics LogNormal(m 3, s 1.1)
(36.8s, 56.40s)
16Conditions de réalisation (suite)
- Classes de clients
- type daccès délai (msec.) bande passante
- modem1 250 56 kps
- modem2 250 33 kps
- T1, DLS 20 1.5 Mbps
- WAN 80 150 kps
- satellite 500 2 Mbps
- Ethernet 0.1 100 Mbps
- Protocole
- HTTP1.0, 4 connexions
- HTTP1.1, 1 connexion, persistance Clasique,
(HTTP1.1-D) - HTTP1.1, 1 connexion, persistance Early Close,
(HTTP1.1-EC)
17Comparaison des protocoles HTTP1.0 et 1.1
Accès par modem
Accès lien T1
18Comparaison des protocoles HTTP1.0 et 1.1 (suite)
- À faible charge
- HTTP1.1-D meilleur que HTTP1.0 et HTTP1.1-EC
- HTTP1.1-EC comparable à HTTP1.1-D
- À forte charge
- HTTP1.0 meilleur que HTTP1.1-D
- HTTP1.1-EC meilleur HTTP1.0
- HTTP1.1-EC significativement meilleur que
HTTP1.1-D
19Performance subjective Latence HTML
Accès par modem
Accès par WAN
20Combien de connexions persistantes?
Netscape 6, IE 2
Temps de réponse (modem)
Latence HTML (modem)
214. Analyse Statistique
- Travaux de caracterisation
- moyenne, ecart type
- distributions simples Pareto, Weibull,
LogNormal, - Combinaison de Distributions corps queue
- Invariances?
- Mixage de distributions
- Algorithme EM
22Algorithme EM
L algorithme converge vers un maximum global à
partir de presque nimporte quel point de départ
23Statistiques et Identification de Paramètres
- fichiers de traces de trois serveurs WWW et un
Proxy (Clarknet, Inria, Boeing, Worldcup98) - Variables analysées
- tailles des fichiers (réponses)
- nombre de clics par session
- temps inter-clic
- temps d inter-arrivée des sessions
24Analyse des variables
Taille des fichiers
25Analyse des variables(suite)
- Traces Clarknet Arlitt and Williamson, 1996a
26Analyse des variables (suite)
Nombre de clics
27Analyse des variables (suite)
Temps inter-clic
28Analyse des variables ... (suite)
inter-arrivée de sessions
295. Conclusions et Perspectives
- Conclusions
- Développement d un outil de génération de trafic
- Expérimentations
- Nouvelle approche pour la caractérisation du Web
- Découverte d invariances
305. Conclusions et Perspectives
- Perspectives
- Evolution de WAGON
- mélanges de distributions pour la génération de
trafic - HTTPn.m
- Autres protocoles que HTTP
- Autres applications
- benchmark pour serveurs proxy-cache
- Caractérisation
- raffinement de la méthodologie
- autres variables
- autres fichiers de traces