Corese Moteur de recherche s - PowerPoint PPT Presentation

About This Presentation
Title:

Corese Moteur de recherche s

Description:

1992 Acacia : acquisition des connaissances partir de documents structur s avec des graphes conceptuels ... Calcule une distance ontologique entre concept requ te et concept ... – PowerPoint PPT presentation

Number of Views:71
Avg rating:3.0/5.0
Slides: 67
Provided by: sou1
Category:

less

Transcript and Presenter's Notes

Title: Corese Moteur de recherche s


1
CoreseMoteur de recherche sémantique pour RDF
  • Olivier.Corby_at_sophia.inria.fr
  • Projet ACACIA
  • INRIA, Sophia Antipolis
  • http//www.inria.fr/acacia
  • Knowledge is Power

2
Corese
  • COnceptual REsource Search Engine
  • Moteur de recherche RDF en graphe conceptuel
  • Resource Description Framework (W3C)

3
Histoire
  • 1992 Acacia acquisition des connaissances à
    partir de documents structurés avec des graphes
    conceptuels
  • 1998 XML
  • 1999 RDF, 1er prototype de Corese
  • 2000 ICCS RDF et les graphes conceptuels
  • 2000-2001 Moteur Corese pour Comma, projet
    européen

4
Graphes conceptuels
  • Modèle de John Sowa
  • http//www.jfsowa.com/cg/cgexamp.htm
  • Réseau sémantique
  • Concept Person John
  • Relation (author)
  • Concepts et relations typés
  • Hiérarchies de types de concept et de relation

5
GC
  • Bookdoc-
  • -(author)-Personjr-
  • -(name)-LiteralJohn Rawls
  • -(title)-
  • -LiteralTheory of Justice

6
RDF
  • ltBook rdfaboutdocgt
  • ltauthorgt
  • ltPerson rdfaboutjrgt
  • ltnamegtJohn Rawlslt/namegt
  • lt/Persongt
  • lt/authorgt
  • lttitlegtTheory of Justicelt/titlegt
  • lt/Bookgt

7
GC - RDF
  • Concept ? ressource
  • Relation ? propriété
  • Type ? classe
  • Signature de relation ? domain, range
  • Projection pour retrouver des ressources
  • RDF comme format de GC

8
Différences
  • RDF relation binaire, CG n-aire
  • RDF ressources peuvent avoir plusieurs types
  • RDF distingue les littéraux et les ressources
  • RDF est multilingue (xmllang tag)

9
(No Transcript)
10
Corese
  • Construire une représentation
  • dun schema RDF et
  • dénoncés RDF
  • Rechercher des ressources
  • Classer des ressources par inférence de type
  • Compléter la base de ressources par des
    inférences
  • Serveur Web sémantique

11
Moteur de recherche
  • Projection dun graphe requête sur le graphe
    cible
  • Opérateurs de recherche
  • Projection approchée
  • Groupement des résultats

12
Requête à la OQL
  • select d.title, p.name
  • from d Document, p Person
  • where d.title likeXML and d.author p

13
Requête à la RQL
  • Select ?title, ?pname
  • From
  • ?doc rdftype exDocument
  • ?p rdftype exPerson
  • Where
  • ?doc extitle ?title
  • ?title like XML
  • ?doc exauthor ?p
  • ?p exname ?pname

14
Requête Corese
  • ltcDocument cTitleXMLgt
  • ltcauthorgt
  • ltcPerson cname?x/gt
  • lt/cauthorgt
  • lt/cDocumentgt

15
Projection
  • Query Document-(author)-Creator
  • Trouver des occurrences spécialisées
  • Réponse 1 Paper-(author)-Person
  • Paper lt Document Person lt Creator
  • Réponse 2 Report-(author)-Team
  • Report lt Document Team lt Creator

16
Résultat
  • Les graphes résultats sont traduits en RDF
  • Et traités par une feuille de style XSLT qui
    engendre du HTML

17
Projection approchée
  • Réponse tolère des concepts non spécialisés
  • Query
  • TechnicalReport(author)Person
  • Target
  • ResearchReport (author) Team

18
Projection approchée
  • Document
  • TechnicalReport ResearchReport
  • Creator
  • Person Team
  • Query
  • TechnicalReport(author)Person

19
Distance ontologique
  • Calcule une distance ontologique entre concept
    requête et concept cible
  • Distance longueur du plus court chemin le long
    de la relation de subsomption entre concept
    requête et cible, passe par le plus précis
    supertype commun
  • Distance entre réponse et requête somme des
    distances des concepts approchés

20
Distance ontologique
  • Distance entre des frères 2
  • Entre des cousins germains 4

21
Distance
  • De plus, la distance diminue avec la profondeur
  • La distance entre un père de profondeur n et un
    fils est de 1/2n
  • Ainsi Homme est plus proche de Chimpanzé que
    Vertébré de Invertébré !

22
Distance

23
Opérateurs de requête
  • contain
  • startWith
  • lt lt gt gt nombre ou string
  • ! negation ! !
  • boolean or XML RDF
  • lt lt gt gt type

24
Opérateurs
  • Trouver un document
  • ?doc rdftype exDocument
  • Le titre contient XML
  • ?doc extitle ?title XML
  • Le titre contient XML ou RDF
  • ?doc extitle ?title XML RDF
  • La date est antérieure à 2004
  • ?doc exdate ?date lt 2004-01-01

25
Opérateurs avec variable
  • Deux auteurs différents
  • ?doc exauthor ?p1
  • ?doc exauthor ?p2 ! ?p1
  • Deux personnes de même noms
  • ?p1 rdftype exPerson ?p1 exname ?x
  • ?p2 rdftype exPerson ?p2 exname ?x
  • ?p1 ! ?p2

26
Opérateurs de type
  • Un document de type égal à TechnicalReport
  • ?x rdftype exDocument exTechnicalReport
  • Un document qui ne soit pas un Rapport technique
  • ?x rdftype exDocument !lt exTechnicalReport
  • Documents différents, de même type
  • ?x rdftype exDocument
  • ?y rdftype exDocument ! ?x ?x

27
Négation
  • Trouver une personne qui nest pas lauteur dun
    document dont le titre contient XML
  • ?p rdftype exPerson
  • ?doc extitle XML
  • ?p not exauthor ?doc

28
Chemin de longueur variable
  • Trouver par quel chemin deux personnes sont
    reliées, chemin de longueur au plus n
  • ?x rdftype exPerson
  • ?y rdftype exPerson
  • ?x exrelation 2 ?y
  • Essaie
  • ?x exrelation ?y
  • ?x exrelation ?t exrelation ?y

29
Tous les chemins de longueur variable
  • Trouver par quels chemins deux personnes sont
    reliées, chemins de longueur au plus n
  • ?x rdftype exPerson
  • ?y rdftype exPerson
  • ?x exrelation all 2 ?y
  • Essaie
  • ?x exrelation ?y
  • ?x exrelation ?t exrelation ?y

30
Propriété générique
  • Ressources reliées par nimporte quelle propriété
  • ?x cosProperty ?y
  • Trouver un document dont le titre contient XML et
    retourner toutes ses propriétés
  • ?doc extitle XML
  • ?doc cosProperty ?p

31
XML Schema Datatypes
  • xsdstring
  • xsdfloat
  • xsdinteger
  • xsddate
  • Xsdboolean

32
RDF Datatype
  • lt!ENTITY xsd http//www.w3.org/2001/XMLSchema
    gt
  • ltcPersongt
  • ltcage rdfdatatypexsdintegergt44lt/cagegt
  • ltcname rdfdatatypexsdstringgtLaurent
  • lt/cnamegt
  • ltcdate rdfdatatypexsddategt1959-10-16
  • lt/cdategt
  • lt/cPersongt

33
RDF Datatype
  • RDF impose de préciser systématiquement le
    datatype, même si le range de la propriété est
    typé sur ce datatype
  • ltrdfProperty rdfaboutspeedgt
  • ltrdfsrange rdfresourcexsdfloat/gt
  • lt/rdfPropertygt
  • ltexCargt
  • ltexspeed rdfdatatypexsdfloatgt314lt/exspeedgt
  • lt/exCargt

34
RDF Datatype
  • Corese permet, en option, de ne pas répéter le
    datatype et de linférer à partir du schema RDFS
  • ltrdfProperty rdfaboutspeedgt
  • ltrdfsrange rdfresourcexsdfloat/gt
  • lt/rdfPropertygt
  • ltexCargt
  • ltexspeedgt314lt/exspeedgt
  • lt/exCargt
  • _1 rdftype exCar
  • _1 exspeed 314 xsdfloat

35
Groupement
  • Une requête a pour réponse G1 .. Gn
  • On peut grouper les graphes G1 .. Gn selon des
    critères
  • distinct x1 .. xn
  • group by x1 .. xn
  • group by connex x1 .. xn
  • count x (by y)

36
Distinct
  • Une requête a pour réponse G1 .. Gn
  • (select) distinct x1 x2
  • G1 x1Jules, x2Jim
  • G2 x1Jim, x2Jules
  • Ne garder quun seul graphe, par exemple G1

37
Group by
  • Une requête a pour réponse G1 .. Gn
  • group by x1 x2
  • Joindre les graphes qui ont même x1 et même x2
  • Ex grouper les documents par auteur et par année

38
Group by
  • ?doc rdftype exDocument
  • ?doc exauthor ?p
  • ?doc exyear ?y
  • D1 John 1990 D4 Jack 2000
  • D2 Jack 2000
  • D3 John 2004

39
Group by
  • Ex grouper les documents par auteur et par
    année
  • Group by ?p, ?y
  • John 1990 D1
  • John 2004 D2
  • Jack 2000 D2 D4

40
Group by connex
  • Une requête a pour réponse G1 .. Gn
  • group by connex x1 x2
  • Joindre les graphes qui ont même valeur pour x1
    et/ou x2

41
Group by connex
  • Trouver les compétences similaires et former les
    classes de compétences similaires
  • ?c1 exsimilar ?c2
  • Group by connex ?c1 ?c2
  • c1 similar c2 c4 similar c5
  • c6 similar c4 c3 similar c1

42
Group by connex
  • Trouver les compétences similaires et
  • former les classes de compétences similaires
  • Classe 1 c1 similar c2, c3 similar c1
  • Classe 2 c4 similar c5, c6 similar c4

43
Count
  • Une requête a pour réponse G1 .. Gn
  • Count x
  • Compter les occurrences différentes de x dans le
    graphe résultat
  • Ex compter les ouvrages dun auteur

44
Count
  • Ex compter les ouvrages des auteurs
  • ?doc exauthor ?p
  • Group by ?p
  • Count ?doc
  • John D1 D2 (2)
  • Jack D1 D4 D6 (3)

45
Extensions OWL
  • owlTransitiveProperty
  • owlSymmetricProperty
  • owlinverseOf
  • owlintersectionOf
  • owldisjointWith

46
Intersection
  • owlClass Woman
  • owlintersectionOf
  • owlClass Human
  • owlClass Female
  • Définit une équivalence entre Woman et
    lintersection de Human et Female
  • Human ? Female ? Woman

47
Inverse
  • p1 owlinverseOf p2
  • X p1 Y ? Y p2 X
  • hasParent owlinverseOf hasChild
  • John hasParent Jim ? Jim hasChild John

48
Symétrie
  • p rdftype owlSymmetricProperty
  • X p Y ? Y p X
  • exsibling rdftype owlSymmetricProperty
  • John exsibling Jack ?
  • Jack exsibling John

49
Transitivité
  • owlTransitiveProperty
  • X p Y ? Y p Z ? X p Z
  • expartOf rdftype owlTransitiveProperty
  • exaxis expartOf exengine
  • exengine expartOf excar
  • ?
  • exaxis expartOf excar

50
Règles
  • Si
  • une Personne est membre dune Equipe
  • qui participe à un Consortium
  • Alors
  • cette Personne est du type Participant et
  • elle participe au Consortium

51
Règles de graphe
  • CG1 ? CG2
  • Person?x
  • -(member)-Team-
  • -(participate)- -Consortium?c
  • ?
  • Participant?x (participate)-
    Consortium?c

52
Inférences
  • 1. Préciser le type dun concept
  • Person ?x -gt Participant ?x
  • 2. Créer une relation entre concepts
  • Participant ?x-(participate)-Consortium ?c

53
Inférences
  • Permet de définir des types de concepts
  • Un Patient est une personne qui a une maladie
  • IF
  • ?x rdftype exPerson
  • ?x exhasDesease ?d
  • THEN
  • ?x rdftype exPatient

54
Règle de graphe
  • Pour appliquer une règle C ? D
  • sur un graphe G
  • 1. Trouver par projection une occurrence de C
    dans G C? C
  • 2. Joindre la conclusion D au graphe G sur les
    concepts de C trouvés par projection

55
Syntaxe de règles RDF
  • ltcosrulegt
  • ltcosifgt
  • ltcPerson rdfabout?pgt
  • ltcmembergt
  • ltcTeamgt
  • ltcparticipategt
  • ltcConsortium rdfabout?c/gt
  • lt/cparticipategt
  • lt/cTeamgt
  • lt/cmembergt
  • lt/cPerson
  • lt/cosifgt

56
Syntaxe RDF
  • ltcosthengt
  • ltcParticipant rdfabout?pgt
  • ltcparticipate rdfresource?c/gt
  • lt/cParticipantgt
  • lt/costhengt
  • lt/cosrulegt

57
Serveur Web sémantique
  • Moteur Corese intégré dans un serveur tomcat,
    dans une servlet
  • Navigation dans les ontologies RDFS par des
    feuilles de style

58
Serveur Web sémantique
  • Interrogation du moteur via des formulaires
    HTML/JSP
  • Les formulaires sont construits en connexion avec
    le moteur en consultant lontologie

59
Applications
  • 2000-2001 Comma
  • 2002 Corese pour Samovar avec Renault
  • 2003-2004 Corese pour KMP, projet RNRT
    Cartographie des compétences sur Sophia Antipolis
  • Version de distribution
  • http//www.inria.fr/acacia/soft/corese
  • 2002-2004 ODL Inria

60
Comma
  • OComma Corporate Memory Management through
    Agents
  • Système multi agents (Jade)
  • Ontology en RDF Document, Entreprise, Domaine,
    Utilisateur
  • Moteur de recherche Corese RDF en graphe
    conceptuels
  • Règles de graphe

61
Comma
  • Méthode Recueil, Phase terminologique,
    Structuration, Validation, Formalisation en RDFS
  • Résultat 470 concepts, 80 relations,
  • 13 niveaux de profondeur

62
Comma
63
KMP
  • KMP Knowledge Management Platform
  • Cartographie des compétences en Télécom sur
    Sophia Antipolis
  • Serveur Web sémantique de compétence
  • Favoriser les partenariats
  • Ontologie en RDF Compétence, Organisation,
    Domaine

64
Projets Futurs
  • WebLearn Action CNRS, eLearning,
  • mémoire dentreprise,
  • génie civil,
  • document,

65
Références
  • http//www.inria.fr/acacia/cours/essi2004/corese.p
    pt
  • http//www.inria.fr/acacia/soft/corese

66
Démo
Write a Comment
User Comments (0)
About PowerShow.com