Alignement dontologies pour OWLLite : lapport dun classifieur smantique - PowerPoint PPT Presentation

1 / 20
About This Presentation
Title:

Alignement dontologies pour OWLLite : lapport dun classifieur smantique

Description:

Ontologies : un moyen pour permettre leur interop rabilit ... Ajouter d'autres classifieurs ce cadre. utilisant des ressources terminologiques ... – PowerPoint PPT presentation

Number of Views:69
Avg rating:3.0/5.0
Slides: 21
Provided by: anamal
Category:

less

Transcript and Presenter's Notes

Title: Alignement dontologies pour OWLLite : lapport dun classifieur smantique


1
Alignement dontologies pour OWL-Lite
lapport dun classifieur sémantique
Raphaël Troncy1,Umberto Straccia1 Henrik
Nottelmann2
  • Mercredi 01 juin 2005

IC'2005 Ingénierie des Connaissances
2
Motivations
  • Hétérogénéité des systèmes d'information
  • Ontologies un moyen pour permettre leur
    interopérabilité
  • Ontologies une source d'hétérogénéité
  • langage de représentation, degré de
    formalisation,
  • Web Sémantique W3C
  • Ontologies OWL / RDF sur le web
  • Comparer / fusionner des ontologies
  • couvrant des domaines qui se recoupent
  • différentes versions d'une même ontologie

? fournir un cadre formel et opérationnel pour
aligner automatiquement des ontologies OWL
oPLMAP
3
Aligner des ontologies
  • Un opérateur de mise en correspondance Euzenat,
    2004 KnowledgeWeb, 2005
  • Entrées un ensemble d'entités définies
    formellement
  • Sorties
  • une relation caractérisant les mises en
    correspondance (ou appariements) entre entités
    (subsomption, équivalence, )
  • une valeur de confiance
  • Méthode automatique / manuelle
  • Inspiration provenant de nombreux travaux issus
    de communautés variées
  • Schema matching, machine learning, data
    integration

4
Exemple
Équivalence Subsomption Incompatibilité
Euzenat "Schema and Ontology Matching" - ESWC
Tutorial 2005
5
Plan
  • Introduction du cadre formel
  • Aligner automatiquement 2 ontologies
  • Les classifieurs utilisés
  • Les classifieurs classiques et probabilistes
  • Le classifieur structurel et sémantique
  • Évaluation
  • Conclusion et perspectives

6
Introduction du cadre formel
  • Inspirations
  • Travaux formels en échange d'information Fagin
    et al., 2003
  • GLUE combiner plusieurs composants spécialisés
    pour obtenir le meilleur résultat Doan et al.,
    2003
  • Notations
  • Un alignement M (T, S, ?)
  • S et T sont les ontologies source et cible
  • ? est un ensemble de règles aij Tj ? Si
  • Soit I et J, les modèles (interprétations) de S
    et T
  • T(I, ?) est le résultat de l'application des
    règles de ? sur S
  • Pr(?, J, I) estime la probabilité que T(I, ?)
    soit une valeur plausible pour T

7
Introduction du cadre formel
  • Approche
  • Générer des ensembles ? contenant des règles de
    mise en correspondance
  • Estimer la qualité de ces ensembles
  • Estimer la probabilité d'une règle
  • Combinaison des estimations de différents
    classifieurs

8
Alignement automatique de 2 ontologies
  • Évaluer la probabilité d'un ensemble sigma1

1 Ici U est l ensemble des tuples et Pr(T) est
la probabilité quun tuple soit dans J
9
Alignement automatique de 2 ontologies
  • Partitionnons l'ensemble ?
  • Puis1,2

1 Pour simplifier la notation, dans la suite on
écrira Si Tj (I , ?j,i) 2 Si ?j est formé par
les r sous-ensemble de règles
10
Alignement automatique de 2 ontologies
  • En conclusion
  • Pr(?, J, I) est fonction de Pr(SiJj)
  • Estimer la probabilité d'une règle1,2
  • Calculons les w(Si, Jj, CLk)

1 En utilisant le Théorème des Probabilités
Totales 2 Où CLk sont les classifieurs
11
Les classifieurs utilisés
  • Classifieur binaire
  • Même nom / même URI / même stem
  • Classifieur fonctionnant avec les individus
  • Classifieur naïf de Bayes
  • Classifieur kNN

12
Le classifieur structurel et sémantique
  • Si Rs et RT sont des noms de propriétés
  • Si AS et AT sont des noms de concepts1

1 Où D D(AS) D(AT)
13
Le classifieur structurel et sémantique
  • Soit CS(QR.C) et DT(QR.D), alors1
  • Si CS(op C1Cm) et DT(op D1Dm), alors2

1 Où Q,Q sont les quantifieurs, R,R sont des
noms de propriétés et C,D des expressions 2 Où
op, op sont des constructeurs de concepts et n,m
1
14
Le classifieur structurel et sémantique
  • Quelques valeurs possibles pour wop et wQ
  • Pour wop
  • Pour wQ

15
Le classifieur structurel et sémantique
  • Démonstration

16
Évaluation
  • De plus en plus d'outils et de méthodes très
    différentes pour aligner les ontologies KW
    D2.2.3, 2005
  • difficile à comparer dans l'absolu
  • pragmatisme campagne d'évaluation et
    compétition
  • I3CON sur le modèle de la NIST Text Retrieval
    Conference
  • EON tests complets et systématiques éprouvant
    tout OWL
  • OAEI http//oaei.inrialpes.fr
  • API d'alignement Euzenat, 2004
  • format commun pour représenter / échanger les
    alignements
  • outils pour évaluer ces alignements

17
Évaluation EON'2004
  • 4 compétiteurs Karlsruhe, INRIA, Fujitsu,
    Stanford
  • 3 groupes de tests sur les ontologies
    bibliographiques
  • tests simples identité, spécialisation/généralis
    ation du langage
  • tests systématiques des éléments de l'ontologie
    de référence sont enlevés ou modifiés un à un
  • test réels comparaison avec 4 ontologies
    réelles disponibles sur le web
  • Résultat 2 groupes mais des insuffisances
    dans les tests

18
Évaluation oPLMap
  • Test 101 205 comparaison d'une ontologie
    bibliographique avec son équivalente où chaque
    étiquette est remplacée par un synonyme

19
Conclusion
  • Introduction d'un cadre logique et probabiliste
    pour aligner automatiquement des ontologies OWL
  • Présentation d'un nouveau classifieur basé sur la
    sémantique des entités OWL définies
  • Évaluation empirique sur des ontologies réelles
  • critères classiques de recherche d'information
  • non prise en compte d'autres indicateurs temps
    machine, mémoire,

20
Perspectives
  • Participer à des campagnes complètes d'évaluation
    OAEI
  • Ajouter d'autres classifieurs à ce cadre
  • utilisant des ressources terminologiques
    (WordNet)
  • basés sur le texte kNN
  • Perfectionner le classifieur sémantique
  • prendre en compte les autres constructeurs OWL
  • prendre en compte d'autre langage de
    représentation des connaissances, des règles,
  • PB name firstName lastName ?
Write a Comment
User Comments (0)
About PowerShow.com