Title: Graphes sans chelle : un modle pour la gnration d'arborescence de fichiers
1Graphes sans échelle un modèle pour la
générationd'arborescence de fichiers
2Sommaire
- Les graphes sans échelle
- Le système de fichiers utilisateurs du LaBRI un
graphe sans échelle - Modèles de générateur
3Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1959 Erdös-Rényi réseaux aléatoires
- Modèles Gn,m et Gn,p
4Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1959 Erdös-Rényi réseaux aléatoires
- Modèles Gn,m et Gn,p
5Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1959 Erdös-Rényi réseaux aléatoires
- Modèles Gn,m et Gn,p
6Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1989 Viennot
- Modélisation d'arbres en 3D, analyse de la
ramification
7Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1989 Viennot
- Modélisation d'arbres 3D, analyse de la
ramification
8Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1989 Viennot
- Modélisation d'arbres 3D, analyse de la
ramification
9Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1999 Barabasi Albert
- Etude du graphe du Web
10Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1999 Barabasi Albert
- Etude du graphe du Web
- La distribution des degrés suit une loi en
puissance
11Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1999 Barabasi Albert
- Etude du graphe du Web
- La distribution des degrés suit une loi en
puissance
12Graphes sans échelle
- Etude et génération de réseaux d'interactions
- 1999 Barabasi Albert
- Etude du graphe du Web
- La distribution des degrés suit une loi en
puissance
13Graphes sans échelle
- Etude et génération de réseaux d'interactions
- Pourquoi Gn,m et Gn,p ne reproduit pas cette
propriété ? - Inventaire des sommets est fixé
- Arêtes ajoutées aléatoirement entre ces sommets
14Graphes sans échelle
- Etude et génération de réseaux d'interactions
- Pourquoi Gn,m et Gn,p ne reproduit pas cette
propriété ? - Inventaire des sommets est fixé
- Arêtes ajoutées aléatoirement entre ces sommets
- Dans la réalité
- Les réseaux s'étendent caractère évolutif
- Les nouveaux sommets ne sont pas reliés au hasard
dans le réseau attachement préférentiel
15Graphes sans échelle
- Modèle de génération aléatoire de graphes sans
échelle - Croissance ajout d'un sommet n à chaque
itération - Attachement préférentiel la probabilité ? que
le sommet entrant n soit connecté au sommet
existant i - Les riches sont de plus en plus riches
16Graphes sans échelle
- Modèle de génération aléatoire de graphes sans
échelle - Croissance ajout d'un sommet n à chaque
itération - Attachement préférentiel la probabilité ? que
le sommet entrant n soit connecté au sommet
existant i
17Graphes sans échelle
- Variantes
- Modèle étendu de Barabasi-Albert
- Edition d'arêtes
- p ajoute m arêtes entre 1 sommet existant
(choisi aléatoirement - uniformément)
- et un sommet j existant (stratégie
d'attachement préférentiel) - q on redirige m arêtes
- 1-p-q on ajoute un nouveau sommet avec m arêtes
- stratégie d'attachement préférentiel
18Graphes sans échelle
- Variantes
- Modèles mixtes
- Cooper et Frieze
- Mori
- Combinaison de l'attachement préférentiel
(probabilité p) et la sélection uniforme
(probabilité 1-p) pour chaque nouveau sommet
19Etude du système de fichiers du LaBRI
- Données
- 1 partition utilisateurs
- Captures à 2 mois d'intervalle
- 83 utilisateurs (dont 2 création de comptes)
- 164 arbres
- 16 à 170 000 éléments
20- Un exemple à 94 785 sommets
21- Un exemple à 94 785 sommets
22 23- Distribution des éléments dans l'arbre
24 25 26 27Etude du système de fichiers du LaBRI
- Données
- Distribution des degrés
- Distribution des éléments dans les niveaux
- Type d'éléments dans les niveaux
- Hauteur
- Largeur
28Modèle de générateur
- Modèle évolutif
- Ajout de fichiers
- L'ajout engendre-t'il la création d'un répertoire
?
29Modèle de générateur
- Algorithme pour un utilisateur
- Ajout d'un fichier
- Choix du niveau n d'insertion
- du fichier
30Modèle de générateur
- Algorithme pour un utilisateur
- Ajout d'un fichier
- Choix du niveau n d'insertion
- du fichier
- Choix du parent dans le
- niveau n-1
31Modèle de générateur
- L'ajout engendre-t-il la création d'un dossier ?
- Niveau ne contient
- pas assez de répertoires
- On n'autorise l'allongement
- de l'arbre (hauteur) que si le
- nombre d'éléments le permet
32Résultats
- Tests sur la tranche d'arbres de taille
10000-15000 - Barabasi-Albert
- Mori
- Barabasi-Albert étendu
- Mori étendu
- Modèle proposé
33Résultats distribution des degrés
34Résultats distribution des degrés
35Résultats distribution des degrés
36Résultats Allure de l'arbre (hauteur)
37Résultats Allure de l'arbre (largeur)
38Résultats Répartition des éléments
39Résultats Composition des niveaux
40Observations sur une collection de graphes
- Et sur un système complet de plusieurs
utilisateurs ?
41Observations sur une collection de graphes
- Les modèles classiques engendrent des arbres qui
ont tous les mêmes propriétés standard - Dans la réalité, des familles se déssinent
- Utilisateur ordonné
- Utilisateur normal
- Utilisateur peu ordonné
42Adaptation du modèle
- La ramification de l'arbre peut être évaluée avec
le nombre de Strahler - Mais un sommet de très fort degré (répertoire
de test) - perturbe cette analyse
- Alors on élague les arbres jusqu'à ce qu'on ait
supprimé toutes - les étoiles
43Adaptation du modèle
- Distribution du Strahler à la racine sur les
arbres générés
44Adaptation du modèle
- Création d'un utilisateur
- Choix de sa famille d'appartenance (choix du
Strahler) - Calculer le nombre d'éléments
- Génération de l'arbre élagué
- Ajout de repertoires étoiles
45Adaptation du modèle
- Distribution du Strahler à la racine sur les
arbres générés après amélioration