TER analyse et classement de fichiers XML - PowerPoint PPT Presentation

1 / 15
About This Presentation
Title:

TER analyse et classement de fichiers XML

Description:

Utilisation du parseur SAX. Matrice de distances. Le clustering. Constitution des bases ... Pour chaque fichier i de la base. Pour chaque fichier j de la base ... – PowerPoint PPT presentation

Number of Views:41
Avg rating:3.0/5.0
Slides: 16
Provided by: mathieuDe8
Category:

less

Transcript and Presenter's Notes

Title: TER analyse et classement de fichiers XML


1
TERanalyse et classement de fichiers XML
2
Plan
  • Introduction
  • Fonctionnement
  • Utilisation du parseur SAX.
  • Matrice de distances.
  • Le clustering.
  • Constitution des bases
  • Préliminaires pour les tests.
  • Résultats

3
Objet
4
Fonctionnement
5
Utilisation du Parser SAX
  • Fichier1.xml
  • Dir\Fichier2.xml

PARSING
  • Fichier1.path
  • Dir\Fichier2.path

//result //result/rTag //result/rTag/f //result/rT
ag/f/Nom //result/rTag/f/ProfilUtilisateur
6
Matrice de distances
Début Pour chaque fichier i de la base
Pour chaque fichier j de la base
Matriceij 1- nc2/ninj Fin pour
Fin pour Fin
Dist 1 - nc2/n1n2
5 fichiers 0 1 2 3 4 0 0 0.91 0.99 0.96 0.96
1 0.91 0 0.84 0.91 0.96 2 0.99 0.84 0
0.91 0.99 3 0.96 0.91 0.91 0
0.84 4 0.96 0.96 0.99 0.84 0
7
Le clustering
1,2,3,2,3,2,1,3,3,3,2
12,7,9,7,9,7,12,9,9,9,7
8
Préliminaires pour les tests
Constitution des bases
9
Préliminaires pour les tests.
10
Préliminaires pour les tests.
0 1 2 3 4 0 0 0.91 0.99 0.96 0.96 1 0.91 0
0.84 0.91 0.96 2 0.99 0.84 0
0.91 0.99 3 0.96 0.91 0.91 0
0.84 4 0.96 0.96 0.99 0.84 0
Modèle 1
n clones
n clones
Modèle 2
n clones
Modèle 3
11
Distance intra-cluster
12
Résultats (1)
Temps de parsing
13
Résultats (2)
14
Résultats(3)
2 clusters de 5 fichiers chacun Distance
intra-cluster lt 0,05
15
Conclusion
  • Évolution de XMLBench
  • Les XPath fréquents
Write a Comment
User Comments (0)
About PowerShow.com