Introduction au Web smantique - PowerPoint PPT Presentation

1 / 54
About This Presentation
Title:

Introduction au Web smantique

Description:

Et plus g n ralement, trouver les bonnes ressources, analyser le contenu des ... bonnes informations, combiner les diff rents r sultats est co teux en temps ... – PowerPoint PPT presentation

Number of Views:220
Avg rating:3.0/5.0
Slides: 55
Provided by: nathal150
Category:

less

Transcript and Presenter's Notes

Title: Introduction au Web smantique


1
Introduction au Web sémantique
  • N. Aussenac-Gilles (IRIT) aussenac_at_irit.fr
  • Le site dun groupe de chercheur qui a fait le
    point en 2003
  • http//www.lalic.paris4.sorbonne.fr/stic/ -gt des
    tutoriels, un excellent rapport final
  • http//www.w3.org/2001/sw/Activity
  • Cours de Fabio Civaregna  Intelligent Web 
    http//www.dcs.shef.ac.uk/7Efabio/COM4280/
  • http//websemantique.org/

2
Le Web Sémantique profession de foi
  • The Semantic Web is an extension of the current
    web in which information is given well-defined
    meaning, better enabling computers and people to
    work in cooperation. The mix of content on the
    web has been shifting from exclusively
    human-oriented content to more and more data
    content.
  • The Semantic Web brings to the web the idea of
    having data defined and linked in a way that it
    can be used for more effective discovery,
    automation, integration, and reuse across various
    applications. For the web to reach its full
    potential, it must evolve into a Semantic Web,
    providing a universally accessible platform that
    allows data to be shared and processed by
    automated tools as well as by people.
  • W3C Semantic Web Activity Statement

3
Plan du cours
  • Introduction au web sémantique
  • Motivations, Définitions
  • Scenarios envisagés
  • Les défis technologiques
  • Solutions techniques prévues
  • Le modèle en couches
  • Ontologies, méta-données, services web
  • Les ontologies représentation du sens
  • Les ontologies définition
  • OWL
  • Intérêt de la formalisation
  • Difficulté de la construction
  • TAL et apprentissage

4
Plan du cours (suite)
  • Donner du sens aux documents du web
  • Des textes aux ontologies
  • Des ontologies et des méta-données aux pages web
  • Annotation
  • indexation,
  • Recherche dinformation et ontologies
  • Regard critique
  • Le web sémantique une utopie ou une réalité
    dans 5 ans ?
  • Les technologies du web sémantique que retenir ?

5
Cours 1 Introduction au web sémantique
  • Motivations, Définitions
  • Scenarios envisagés
  • Les défis technologiques
  • Solutions techniques prévues
  • Le modèle en couches
  • Ontologies
  • Méta-données
  • Services web

6
1 - Motivations
  • Le web a un énorme potentiel mal exploité
  • Aller vers un  web intelligent 
  • Utiliser des connaissances dans les applications
  • Rechercher des informations précises, mal
    formulées (au delà des mots clés)
  • Mieux exploiter des informations brutes
    (annotation, indexation)
  • Aider à la résolution de problème
  • Gestion des connaissances
  • Commerce ciblé
  • anticiper des besoins, combiner plusieurs
    ressources et applications, utiliser des
    heuristiques commerciales, des profils
    utilisateurs (Business rules
  • Offrir des services nouveaux, élaborés

7
1 Motivations le web aujourdhui
  • Données de formats hétérogènes
  • Applications incapables daccéder à ces données
  • Données brutes, et non connaissances
  • Organisation et utilisation
  • guidée par loffre, par celui qui met des
    informations à disposition,
  • et non par la demande, par les besoins des
    utilisateurs

8
1 Motivations Le Web aujourd'hui
  • Beaucoup d'informations mais la description de
    l'information (méta-données) est limitée
  • HTML ne donne que des liens sans sémantique (non
    utilisables par les machines)
  • Les moteurs de recherche par mots clés laissent
    beaucoup de travail à l'utilisateur
  • Et plus généralement, trouver les bonnes
    ressources, analyser le contenu des pages,
    dégager les bonnes informations, combiner les
    différents résultats est coûteux en temps et
    parfois fastidieux !
  • L'information et les services sur le Web sont
    aujourd'hui peu exploitables par des machines
    Et de moins en moins exploitables sans l'aide des
    machines

9
1 - Motivations Le Web de demain vu par le W3C
  • un vaste espace d'échanges de ressources entre
    machines permettant l'exploitation de grands
    volumes d'informations et de services variés,
    aidant les utilisateurs en les libérant d'une
    (bonne) partie de leur travail de recherche, et
    de combinaison de ces ressources
  • " Le Web sémantique n'est pas un Web séparé,
    mais une extension du Web actuel dans lequel
    l'information est munie d'une signification bien
    définie permettant aux ordinateurs et aux
    personnes de mieux travailler en coopération "
  • traduit de T. Berners-Lee , J. Hendler et
    O.Lassila, Scientific American 2001

10
1 Motivations  Sémantiser  le Web
  • Ajouter des connaissances
  • Associées aux pages du web  sur-couche 
    sémantique
  • Associées aux applications agents logiciels
    intelligents, capables de raisonner sur les
    descriptions
  • Définir autrement les applications
  • En terme de services web services
  • Mieux communiquer, échanger, sécuriser, accéder à
    des sources hétérogènes définir des standards
  • Infrastructures standards protocoles, langages,
    mécanismes, ...
  • Rôle d'une  couche sémantique 
  • Décrire les contenus (métadonnées)
  • Structurer les ressources (liens hypertextes
    étiquetés)
  • Anticiper les raisonnements formalisation

11
1 Motivations Sémantiser le Web
  • Les connaissances ajoutées
  • Ressources, données -gt documents, ontologies,
    données
  • Règles, heuristiques -gt axiomes, règles
  • Algorithmes, modèles de tâches et dinteraction
    -gt contrôle, modules de résolution de problème
  • Proposer des "vocabulaires" partagés pour
    différentes communautés
  • ontologies comme conceptualisations partagées,
    au cur du WS
  • Permettent dexprimer différents types de
    métadonnées

12
1 Motivations Méta-données, annotations et
ontologies
Le Web aujourd'hui
Le Web Sémantique
Software ontology
Person ontology
Les ontologies
W3C Semantic Web Activity, Koivunen and Miller,
2001
13
2 - Scénario (1) le moteur de recherche
sémantique
  • Trouver des informations sur des monuments à
    Paris restaurés par un architecte élève de
    Viollet le Duc
  • http//web.mit.edu/museum/ware/viollet_le_duc.html
  • Le site concerne Viollet le Duc
  • Viollet le Duc est un architecte
  • Viollet le Duc a comme élève Paul Boeswillwald
  • http//www.mediatheque-patrimoine.culture.gouv.fr/
    fr/biographies/boeswillwald_paul.html
  • Le site concerne Paul Boeswillwald
  • Paul Boeswillwald est un architecte
  • http//www.musee-moyenage.fr/pages/page_id18390_u1
    l2.htm
  • A comme nom Hotel de Cluny
  • Restauré par Paul Boeswillwald
  • A comme lieu Paris

Méta-données associées aux sites
Liens étiquetés entre sites
14
2 - Scénario (2) objets pédagogiques
  • Trouver des cours sur le Web sémantique, de
    niveau avancé, avec des exercices associés dans
    une université parisienne.
  • Chaque document ( cours, exercices, ), associé à
    une URL (cas particulier des URI), a ses
    méta-données et est relié aux autres ressources
    par certaines relations
  • Peut utiliser certains standards comme LOM
    (Learning object metadata)

15
2 - Scénario (3) lorganisation de la visite
dune ville
  • Un outil dédié exploite et combine les
    ressources pour une tâche donnée
  • Descriptions de ressources touristiques précises
    méta-données
  • Les différents musées, monuments,
  • Réutilisation dune ontologie des objets
    culturels et historiques
  • Connaissances générales sur le tourisme
    ontologie
  • Les différents moyens de transport sont
  • Connaissances sur les préférences de
    lutilisateur profil attaché à sa page Web
    personnelle comme un ensemble de méta-données
  • Art Baroque, Art nouveau, Le Gréco,
  • Connaissances sur les itinéraires

16
2 - Scénario Implications du scénario (3)
  • Loutil dédié
  • peut utiliser les mêmes langages de
    représentation des ontologies et de méta-données
    RDF, OWL
  • nécessite en plus lintégration de sources de
    données hétérogènes et la médiation de requêtes
    globales vers des structures locales
  • musées ayant chacun leur format de métadonnées
    ..
  • nécessite des capacités de raisonnement
    formalisation

17
2 - Scénario (4) les services Web ..
sémantiques
  • Un outil qui fait appel, exploite et combine des
    services
  • Réservation dun musée, dun guide, dun bateau
  • Commande de brochures
  • Accès aux services Web proposés par le portail du
    musée, de la compagnie de bateau
  • Accès aux services Web de réservation des guides
    de la ville

18
2 - Scénario (5) Aide à la navigation
sémantique
  • Voir le Web comme un vaste réseau interconnecté
    par des liens sémantiques
  • Utilisation dun portail de formation à distance
  • Navigation dans des ressources touristiques
  • Des liens étiquetés
  • utilisables par les êtres humains
  • utilisables par les machines
  • Nécessité de méthodes (et d'outils) pour
    présenter ou visualiser
  • localement
  • des parties du Web

19
3 Défis technologiques
  • Les langages pour le WS
  • Méta-données
  • Ontologies pour le WS
  • Logiciels dannotations associer ontologies et
    ressources (pages, BD, etc.)
  • Intégration de sources d'information hétérogènes
  • Services Web sémantiques
  • Sécurisation
  • Personnalisation et adaptation
  • http//rtp-doc.enssib.fr/
  • http//rtp-doc.enssib.fr/archiveas.html
  • http//www.lalic.paris4.sorbonne.fr/stic/

20
3 Défis  humains 
  • Les langages pour le WS utilisabilité
  • Méta-données consensus au sein de communautés
  • Ontologies pour le WS comment les construire ?
    Les utiliser ?
  • Logiciels dannotations associer ontologies et
    ressources (pages, BD, etc.) Qui va annoter ?
  • Intégration de sources d'information hétérogènes
    logique dusage
  • Services Web sémantiques logique dusage
  • Personnalisation et adaptation
  • http//rtp-doc.enssib.fr/
  • http//rtp-doc.enssib.fr/archiveas.html
  • http//www.lalic.paris4.sorbonne.fr/stic/

21
3 Défis  humains 
  • Le web sémantique a un coût
  • Développer des ontologies
  • Annoter des pages, des ressources
  • Modéliser des besoins dutilisateurs
  • Qui va le prendre en charge ?
  • Auteurs des pages
  • Utilisateurs
  • Gestionnaires du web
  • Développeurs dapplications innovantes (et
    rémunératrices)
  • http//rtp-doc.enssib.fr/
  • http//rtp-doc.enssib.fr/archiveas.html
  • http//www.lalic.paris4.sorbonne.fr/stic/

22
4 - Les solutions techniques
  • Un modèle en couches
  • Des langages standards
  • Des ontologies
  • Des méta-données

23
4 - Les solutions techniques le modèle en
couches du W3C
24
4 - Les solutions techniques Niveau 1 les URI
  • Uniform Resource Identifiers
  • Plusieurs sortes dURL, comme
  • URN Universal Resource Names noms uniques
  • URL Universal Resource Locators accès à des
    ressources
  • Unicode à la place de ASCII pour gérer le
    multi-linguisme

25
4 - Les solutions techniques Niveau 2 XML
  • Pourquoi XML ?
  • format standard pour sérialiser des données à
    laide de tags
  • Profiter du succès de HTML, dont il est proche
  • Ajouter de la rigueur
  • Profiter des nombreux outils
  • XSLT pour la transformation
  • Parsers
  • Langages de schémas pour la validation (comme XML
    schéma)
  • Interrogation grâce à Xquery
  • Les espaces de noms XML
  • Xmlns http//www.wireless-village.org/CSP1.0 
  • Qualifieur (vocabulaire) fragment (élément)
  • Ontologies concepts

26
4 - Les solutions techniques Niveau 2 XML
  • Exemple
  • ltWV-CSP-Message xmlns"http//www.wireless-village
    .org/CSP1.0"gt
  • ltTransactionContent xmlns"http//www.wireless-vi
    llage.org/TRC1.0"gt
  • ltCapabilityListgt
  • ltClientTypegtMOBILE_PHONElt/ClientTypegt
  • ltInitialDeliveryMethodgtPlt/InitialDeliveryMetho
    dgt
  • ltAcceptedContentLengthgt32767lt/AcceptedContentL
    engthgt
  • lt/CapabilityListgt
  • lt/TransactionContentgt
  • lt/WV-CSP-Messagegt

27
4 - Les solutions techniques Niveau 3 RDF
  • Resource Description Framework
  • Au départ standard de description de méta-données
    (97-99)
  • Utilisation de graphes étiquetés orientés
  • triplets sujet propriété (prédicat) - objet
  • ou ressource - propriété - valeur (ressource ou
    chaîne)
  • Utilise les URIs
  • utilisables pour les pages (et parties de pages)
  • mais aussi pour tout objet qui dispose d un
    schéma URI (documents, )
  • Dispose d'une syntaxe XML
  • et des espaces de nom XML
  • RDF Schema (98-2000)
  • modèle de classes . sur RDF

28
4 - Les solutions techniques Niveau 3 Le
modèle de base de RDF
  • Les triplets ( statements )
  • une propriété dune certaine ressource a telle
    valeur ou correspond à telle ressource

http//www.lalic.paris4.sorbonne.fr/laublet/coursR
epConnaissances
createur
illustréPar
http//www.lalic.paris4.sorbonne.fr/annuaire/laubl
et.html
http//.....// exercices
nom
e-mail
Philippe.Laublet_at_paris4.sorbonne.fr
Philippe Laublet
29
4 - Les solutions techniques Niveau 3 La
syntaxe XML de RDF
  • lt?xml version"1.0"?gt
  • ltrdfRDF
  • xmlnsrdf"http//www.w3.org/1999/02/22-rdf-synt
    ax-ns"
  • xmlnss"http// www.lalic.paris4.sorbonne.fr/sc
    hema"gt
  • ltrdfDescription about"http//www.lalic.paris4.so
    rbonne.fr/laublet/tutorielWS2002" gt
  • ltsrefAuteur resource"http//www.lalic.paris4
    .sorbonne.fr/annuaire/p.laublet" /gt
  • lt/rdfDescriptiongt
  • ltrdfDescription about "http//www.lalic.paris4.s
    orbonne.fr/annuaire/p.laublet" gt
  • ltsnomgtPhilippe Laubletgt lt/snomgt
  • ltse-mailgtPhilippe.Laublet_at_paris4.sorbonne.frgt
    lt/se-mailgt
  • lt/rdfDescriptiongt
  • lt/rdfRDFgt
  • Des syntaxes abrégées existent dans certains cas

30
4 - Les solutions techniques Niveau 3 Les
énoncés sur les énoncés
filiale
Société123-45
Société48
référence
http//www.catalogueSociétés.org
  • ltrdfDescription gt
  • ltrdfsubject resource "Société123-45" /gt
  • ltrdfpredicate resource "ecofiliale" /gt
  • ltrdfobject resource "Société48" /gt
  • ltrdftype resource "rdfProperty" /gt
  • ltecoréférence resource"http//www.catalogueSoc
    iétés.org" /gt
  • lt/rdfDescriptiongt

31
4 - Les solutions techniques Niveau 3
Avantages - limites de RDF
  • Par rapport aux BD
  • Représentation de données semi-structurées
  • Très coûteux en mémoire (graphe dont tous les
    nuds et les arcs sont indexés)
  • Format homogène
  • Mais fusion pas si simple risque de conflits, à
    automatiser si gros volume de données
  • Il existe une théorie des modèles de RDF
  • Définit linterprétation logique dun modèle
  • Les sérialisations sont multiples
  • Les parseurs XML standards ne fonctionnent pas
  • Les parseurs RDF sont lents passer de XML à RDF
  • RDF / XML est difficile à comprendre
  • À cause des espaces de noms utiliser des
    préfixes
  • myvocabsomeProperty rdfresourcehttp//example.
    com/someURIblah/gt

32
4 - Les solutions techniques Niveau 4 RDFS
  • À chaque domaine applicatif peut être associé un
    schéma identifié par un préfixe particulier et
    correspondant à une URI
  • Un schéma définit les termes qui seront utilisés
    par les descriptions RDF
  • RDF(S) propose des constructeurs très généraux
    permettant de construire ces schémas spécialisés
  • Ensemble de déclarations de classes et de
    propriétés contraintes par les classes
  • Peut être défini par raffinement du schéma du
    noyau RDFS
  • Les données instances sont ensuite décrites en
    utilisant ce nouveau vocabulaire
  • Représentation d'ontologies simples
  • Pas de capacités de raisonnement intégrées dans
    le modèle

33
4 - Les solutions techniques Niveau 4 Le
schéma de base de RDF(S)
  • cf. http//www.w3.org/TR/2000/CR-rdf-schema-2000
    0327

34
4 - Les solutions techniques Niveau 4
Contraintes de RDF(S)
cf. http//www.w3.org/TR/2000/CR-rdf-schema-2000
0327
35
4 - Les solutions techniques Niveau 4 RDF
Schema, exemple
  • Les classes spécifiques à un domaine sont
    déclarées comme instances de la ressource Class
  • Les propriétés spécifiques à un domaine comme des
    instances de la ressource Property
  • Les éléments reliés sont contraints
  • Ontologie  exemple 
  • ExemplehasEmailAddress (property)
  • Domain ExempleHuman , range
    exempleEmailAddress
  • RDF schéma a été défini pour produire des
    inférences

36
4 - Les solutions techniques Niveau 4 RDF
Schema, exemple
37
4 - Les solutions techniques Niveau 4
Utilisation de RDFS
  • Métadonnées aide à la recherche de documents,
    aide à la personnalisation
  • RDFPic pour la recherche d'images numériques
  • Collaboration
  • systèmes d'annotation - Annotea
  • bookmarks partagés
  • Cartes de sites, cartes de sujets aide à la
    navigation
  • Thesaurus Limber ( ELSST), ...
  • Catalogue de produits UNSPSC, commerce
    électronique
  • Grid computing

38
4 - Les solutions techniques Niveau 5
langages de définition dontologies
  • DAML standard DARPA
  • OIL proposition dun projet européen
  • OWL Ontology Web language
  • standard du W3C
  • Cf suite du cours
  • Langages de représentation des connaissances
    inspirés de lIA
  • Production dinférences
  • Validation formelle de propriétés (cardinalité,
    transitivité des relations, etc.)

39
4 - Les solutions techniques Niveau 5
Ontology Web Language (OWL)
  • Hiérarchies de Classes
  • Hiérarchies de Propriétés
  • Types de données simples
  • Propriétés objets (relations entre classes)
  • Descriptions de classes
  • Peuvent être utilisées au lieu de classes nommées
  • Énumérations
  • EstimationDeCrise oneOf (normal,
    dommagesMatériels, grave, trèsGrave
  • Restrictions
  • LieuGéo and atleast (3000, aCommeHabitants)
  • Enoncés logiques
  • RouteSecours and not RouteTerrestre

40
4 - Les solutions techniques Niveau 6 règles
  • Complément à OWL
  • Capacités dinférence sur les vocabulaires, les
    données structurées
  • Même objectif que celui poursuivi avec les BD
    déductives

41
4 - Les solutions techniques Niveau 7, 8, 9
logique, preuves et confiance
  • Encore non développés
  • FACT et dautres logiques de description
    permettent de formaliser les parties les plus
    simple de OWL (OWL lite)
  • Recherches en cours sur la confiance à accorder à
    des connaissances trouvées sur le web
  • comment lattester ?

42
4 - Les solutions techniques Résumé
  • OWL langage de représentation d'ontologies
    plus complexes
  • RDFS langage de classes, simple
  • représentation de structures et d'ontologies
    simples avec description hiérarchique des
    concepts et des propriétés
  • RDF réseau sémantique de base
  • métadonnées, ...
  • XML couche de transport syntaxique

43
4 - Les solutions techniques Méta-données et
annotations
  • Grande diversité
  • annotations documentaires
  • annotations structurelles
  • annotations sur les contenus
  • ...
  • Variété de leur rôles
  • catalogage
  • recherche d'information
  • aide à la navigation
  • construction dynamique de ressources adaptation
    et personnalisation
  • ...
  • De leurs conditions de productions
  • quels acteurs professionnels / usagers de
    "base"
  • statique / dynamique
  • ...

44
4 - Les solutions techniques Diversité des
méta-données exemple - CanCore
  • Générales attributs de lobjet pédagogique
  • titre, langue, sujet, description
  • Cycle de vie circonstances du développement de
    lobjet
  • nom, date de publication, information de
    publication et de version
  • Méta-métadonnées sur le dossier des
    métadonnées
  • contributeurs, langue, date, validation
  • Techniques et éducationnelles
  • format technique, taille, emplacement
  • Pédagogiques
  • type de ressources, contexte, niveau dage,
  • Droits
  • Relations avec dautres ressources
  • Classification place dans une classification
  • Canadian Core Learning Resource Metadata
    Application Profile

45
4 - Les solutions techniques Ontologies
  • Spécifications déclaratives des concepts et des
    rôles dans un domaine de discours
  • Fournissent des vues structurées et partageables
    des ressources
  • Donnent, entre autres, un vocabulaire pour les
    méta-données
  • Par leur formalisation, permettent
    l'automatisation de certains raisonnements
  • http//www.daml.org/ontologies/

46
4 - Les solutions techniques Les deux rôles
des ontologies
  • Définir / fournir une sémantique formelle pour
    linformation permettant son exploitation par un
    ordinateur
  • Définir / fournir une sémantique d'un domaine du
    monde réel fondée sur un consensus et permettant
    de lier le contenu exploitable par la machine
    avec sa signification pour les humains

47
4 - Les solutions techniques ex lontologie
CRM (CIDOC ICOM)
  • De très nombreux jeux de méta-données et même
    beaucoup de standards dans les institutions
    culturelles et historiques
  • Une solution lontologie du CRM
  • 80 classes et 130 propriétés
  • Deux hiérarchies par spécialisation
  • Standard ISO en 2004 ?

48
4 - Les solutions techniques Objectifs du CRM
  • La médiation de requêtes globales à des
    structures locales intégration de sources de
    données hétérogènes
  • Lextraction de faits précis à partir dunités
    documentaires plus importantes
  • La transformation de données pour migrer vers
    dautres systèmes
  • La fusion de données dans des entrepôts de
    données plus importants
  • Un point de départ pour de nouvelles
    modélisations conceptuelles

49
Types
The ICOM/CIDOC Conceptual Reference Model
refine
Making Sense of Cultural Infodiversity Tony Gill
Actors
Conceptual Objects
Physical Entities
participate in
affect
Temporal Entities
location
within
occur at
Places
50
(No Transcript)
51
4 - Les solutions techniques Laspect temporel
Extrait de la définition du Modèle Conceptuel de
Référence du CIDOC (CRM 3.4)
52
4 - Les solutions techniques Ontologies,
métadonnées, agents logiciels et utilisateurs
www.semanticweb.org
53
4 - Les solutions techniques Les services Web
1. Requête UDDI
2. Métadonnées pour des services
Client de Service wEB
Serveur UDDI
2. Requête initiale XML-SOAP
4.5..N Echanges XML-SOAP
Fournisseur de Service Web
54
4 - Les solutions techniques Sémantiser les
services Web
  • Applications accessibles en utilisant les
    protocoles Internet standard
  • effectuent certaines actions ou modifications sur
    l'état du monde
  • Les applications peuvent automatiquement
    découvrir et invoquer les e-services qui
    satisfont le mieux leur besoin
  • L'enchaînement (composition et interopérabilité)
    des services peut être géré par des outils
  • Les services Web auront besoin dune couche
    sémantique
  • vers une ontologie des services DAML-S
  • Web Services for Digital Libraries Thomas
    Hickey / ELAG 2003
Write a Comment
User Comments (0)
About PowerShow.com